最新消息:阿里云双12优惠,史上最低折扣。

阿里云云存储的概述以及储存系统的架构演进

云服务器 aliyun 228浏览

云计算大数据技术的发展推动了存储系统架构的不断演进。存储系统已经从最原始的基于主机的架构逐渐向网络化和虚拟化的方向发展。存储系统更注重性能、效率、灵活性和安全性。这些特性的提升需要一个好的存储架构来满足。

粗略分类,存储架构的演进可以分为以下两个阶段。

第一阶段:从离散化到中心化(从DAS到SAN/NAS)的演进。

互联网发展初期,存储需求比较简单,数据规模较小。存储系统架构主要基于存储介质的直连存储(DAS),将存储介质直接挂载在服务器的总线上,提供数据访问服务。 ,数据存储设备和服务器处于“生死同存”的状态。

这种方法可以简洁地解决数据存储需求,但也存在明显的弊端。

◆ 服务器之间的存储系统形成一个“孤岛”,限制了数据的共享访问;

◆ 随着CPU处理能力的逐步提升,SCSI连接通道将成为I/O的瓶颈,制约性能;

◆ 随着数据量的增长,存储安全(备份/恢复需求)和可扩展性问题日益突出。

基于上述症结,存储区域网络(Storage Area Network,SAN)架构和网络附加存储(Network Attached Storage,NAS)架构应运而生。

DAS、SAN、NAS在使用上的区别如图1-1所示。

图 1-1OAS、SAN、NAS使用方式示意




SAN 是为存储而建立的专用网络,独立于 TCP/IP 数据网络。它连接服务器和磁盘阵列设备以提供高速数据传输。存储设备在服务器端以块存储设备的形式展示。目前常见的SAN有IP-SAN和FC-SAN(FC指FibreChannel,Fibre Channel),其中IP-SAN

通过TCP协议转发SCS(I SmallComputerSystemInterface,小型计算机系统接口)协议,

FC-SAN采用光纤通道协议转发SCSI协议(光纤接口可以提供更高的带宽)。 SAN 的结构允许任何服务器连接到任何存储阵列,无论数据放在哪里,服务器都可以直接访问所需的数据。这种方式也便于系统的统一管理和集中控制。成本和复杂性是 SAN 存储架构的明显缺点。

NAS是一种连接网络的具有数据存储功能的设备,因此也被称为“网络存储”,可以提供跨平台的文件共享功能。 NAS以数据为中心,将存储设备与服务器完全分离,对数据进行集中管理。存储设备在服务器端以文件系统的形式显示。 NAS本身可以支持多种协议(如NFS、CIFS、FTP、HTTP等),可以支持多种操作系统。 NAS数据存储适用于需要通过网络将文件数据传输到多个客户端进行访问的用户,可以提供高效的文件共享服务。 NAS的缺点也很明显。扩展性受限于设备大小,只能提供文件级访问,不能满足块级应用的需求。

第二阶段:从集中化到虚拟化(从SAN/NAS到分布式存储系统)的演进。

SAN/NAS解决方案的出现,实现了存储系统集中建设、统一管理的需求,为大规模数据中心基础设施建设提供了便捷的途径。在数据中心建设过程中,必然会出现采购规格的多样化和设备型号的多样化。存储设备的兼容性问题和异构硬件的统一性问题,将给企业的数据运维带来棘手的挑战。存储虚拟化技术应运而生。其核心思想是将资源的逻辑映像与物理存储分离,抽象、隐藏和隔离存储系统或存储服务的内部功能,屏蔽不同物理设备的异构属性,实现数据服务和物理硬件的独立管理,如图1-2所示。

图 1-2 存储虚拟化示意

分布式存储系统是存储虚拟化技术的一种常见形式。分布式存储系统将数据存储在多个独立的设备中,提供统一的存储服务。分布式存储系统具有较高的可扩展性和可扩展性,强大的数据访问性能,以及对标准化硬件更好的支持,使得大规模存储系统能够以相对较低的成本构建和运行。

除了存储系统架构演进的萌芽阶段(DAS存储解决方案),存储系统架构可以分为传统的集中式存储系统和新兴的有两种主要类型的分布式存储系统。两者完全不同。它们显示在:

◆ 传统存储系统采用集中式存储服务器来存储所有数据,存储服务器成为系统性能、可靠性和安全性的瓶颈。焦点无法满足大规模存储应用的需求;

◆ 分布式存储系统采用可扩展的系统结构,使用多个存储服务器分担存储负载,并使用索引来定位数据存储位置信息,不仅提高了存储系统的可靠性、可用性和数据访问效率,而且更容易扩张。

1.1.1 集中存储系统

传统存储也称为集中式存储。从概念上可以看出它的架构是中心化的,即整个存储集中在一个系统中。但是,集中存储不一定只是单个设备,也可以是多个设备集中在一个系统中。

图1-3中的SAN存储方案使用多个机柜来存储数据。

集中式存储系统中有很多组件,如磁头(控制器)、磁盘阵列(JBOD)、交换机、管理设备等,如图1-4所示。

集中式存储系统中最为核心的部件是机头,机头中的控制器实现了集中式存储系统中绝大多数的高级功能,如对磁盘的管理、将磁盘抽象化为存储资源池、划分逻辑单元号

(LogicalUnitNumber,LUN)给客户端使用等,通常机头中包含两个控制器,互为主备,避免硬件故障导致整个存储系统的不可用。机头中包含前端端口以及后端端口,前端端口   对外连接,提供存储服务,后端端口为机头连接更多的存储设备,形成更大的存储资源池,扩充存储系统的容量。

机头作为集中式存储系统的统一入口,其处理能力及扩展能力决定了系统整体的定位,通常集中式存储系统只能提供有限的存储系统纵向扩展(scaleup)1能力,很难满足存储系统横向扩展(scaleout)2的需求。通常情况下,可以通过scaleup 方式来扩展单台服务器的性能,满足业务的需求;一旦遇到服务器性能的瓶颈上限后,就需要转而求助于scaleout方式来进一步满足要求。 图1-3    集中式存储系统示例
 

  图1-4集中式存储系统组件示意  

转载请注明:小猪云服务器租用推荐 » 阿里云云存储的概述以及储存系统的架构演进