公用存储 让你把握企业存储领域的发展远景
首先是存储虚拟化,然后就是公用存储--一种用于公用计算的简单、高效且可大规模扩展的分层存储方式。在公用计算和云计算逐渐拓展的背景下,公用存储正快步向我们走来。
首先是虚拟化,接下来是公用存储(utility storage)-当IT日益具有动态性,按需计算模式变得习以为常,这已经成为企业存储领域的发展远景。
存储虚拟化终于迎来了属于自己的时代: 服务器虚拟化取得了成功,加上早期采用者反映成效显著,这些都使得人们对存储虚拟化的兴趣日渐高涨。先行者们声称存储资源的利用率得到大幅提高,棘手的设备管理难题大大减少。在数据流量压力越来越大的情况下,这还能有效避免大把烧钱。
Drew Kreisa是威斯康星州丰迪拉克的娱乐推进发动机生产商Mercury Marine公司的存储管理员,他说: "我们后端系统上存储资源的利用率从40%提高到了85%以上; 有了虚拟化技术,我们就不必去购买远远超出实际需求的磁盘容量; 我们还实现了单点管理存储系统与主机之间的连接。"
不过,早期采用者也发现,存储虚拟化与公用存储这个理想目标之间还存在着巨大的差距,不可逾越的挑战似乎无处不在。由于一片混乱,数量众多的架构方案、不同厂商的产品彼此缺乏互操作性、面向虚拟环境的存储资源管理(SRM)工具差强人意,用户的预期目标因而显得扑朔迷离。IT主管们在等待行业理清头绪的同时,边享受存储虚拟化给自己带来的效益,边期盼宏伟的公用存储远景早日实现。
存储虚拟化热潮渐起
五年前Mercury Marine公司开始关注存储虚拟化方案时,选择还很有限。如今情况已经发生了很大变化。Kreisa说,现在为物理层的抽象构建架构的方案实在太多了,IT主管们应当慎重选择。
他说: "目前市场上一片混乱。太多的公司在提供全然不同的方法来构建网络架构,用户必须慎重行事,以免往网络上添加的新部件会妨碍你已经在开展的工作。"
从理论上来说,存储虚拟化可以为管理、备份、归档以及迁移集中起来的存储设备之间的数据减轻复杂性。有了这项技术,IT主管就没必要为物理设备方面的具体细节而操心。
选择正确的存储虚拟化方法至关重要。首先,公司必须确定自己希望存储虚拟化用在什么地方。比方说,公司可能会选择基于主机的系统,比如博科和赛门铁克等公司的这类系统。不过,随着这些环境日益庞大,它们需要自己的操作系统、主机虚拟化许可证以及维护和软件方面的开销。
公司也有可能使用专门设备(如IBM公司的SAN卷控制器),或者使用在交换机上运行的软件(如EMC公司的Invista),来部署存储虚拟化,作为光纤架构(fabric)的一部分。Taneja集团咨询公司的创办人Arun Taneja说,基于设备的方法眼下非常热门; 基于交换机的方法由于成本比较高,没有太大的吸引力。
如果公司决定采用基于光纤架构的策略,还要考虑准备采用带内、带外还是分离路径技术来实现虚拟化。带内产品(如DataCore软件、飞康软件和IBM等公司的产品)允许数据和控制信息在主机到控制器的直接路径上传输。如果使用带外解决方案(如LSI公司的产品),数据流与控制流是分开来传输的。
如果使用 EMC公司采用的分离路径技术,智能交换机可以把控制命令重定向至外部控制器,允许读写I/O数据流从主机进入到适当的物理存储阵列。公司可以使用类似日立数据系统公司采用的方法,对存储环境进行虚拟化: 数据流从交换机进入到存储池的过程中,控制器为信息流赋予元数据。
最后一种方法用到阵列。惠普和3PAR等厂商的产品能让IT团队能够在服务器和存储系统之间建立虚拟的逻辑单元号(LUN)。
深入数据块
而另一个重要因素-公司想在数据块级进行虚拟化还是想在文件级进行虚拟化也很关键,因为正如Kreisa指出的那样,两者之间的整
合非常少。作为数据整合项目的一部分,Mercury Marine公司部署了IBM公司的SAN卷控制器,实现了数据块级的虚拟化,Kreisa担任总设计师。数据块级方案首先迅速缓解了Mercury面临的几个主要压力: 难于管理及扩增存储卷、控制器上缺少空间、需要备份及恢复流程以实现适当的技术更新; 存储容量有限,满足不了发展的需要等等。
Scott Christiansen是内布拉斯加州奥马哈的国际建筑工程公司Leo A. Daly的首席安全官,他在决定整合来自该公司在全球10个办事处的数据时,选择了另一条路。网络附加存储设备使用寿命到期后,他用戴尔的 EqualLogic虚拟化存储阵列取代了这些设备,这些存储阵列连接到了每个办事处的思科千兆交换机。这样一来,他就能像管理单一资产那样来管理存储池。现在,如果用户需要存储空间来存放庞大的AutoCAD和三维建模文件,众多资源可供他利用。
Christiansen使用了戴尔产品的内置功能: 自动精简配置(thin provisioning)来自动分配网络上的资源。有了自动精简配置功能,只有应用程序把数据写入到磁盘上时,才需要保留存储容量,从而以最少成本保证了资源得到最大限度的利用。
Taneja 说: "过去,如果某个应用程序需要10 GB的存储空间,数据库管理员就会要求40 GB; 存储管理员就会提供100 GB,因为他希望数据库管理员好几个月不再麻烦自己。这100 GB是专门供该应用程序使用的,其他应用程序没法使用。"而自动精简配置让Christiansen 之类的IT主管可以合理规划存储容量的利用率。
弗雷斯特研究公司的高级分析师Andrew Reichman说,自动精简配置还能节省费用,因为它有助于避免如今的存储系统势必会出现的功率损耗。他说: "普通的资源配置会使磁盘一直旋转,从而消耗电力、产生热量。"
多亏了自动精简配置,Christiansen得以更有效地利用数据存储空间; 而且由于能够致力于整批数据而不是单个存储区,极大地节省了技术成本和管理时间。
Christiansen说,集中起来的存储资源还增强了容错功能,这有助于灾难恢复和电子证体系计划。他说: "如今存储是比较让我省心的一个方面。即便某个地方出了什么故障,我们也很容易在另一个地方重新运作起来,这种操作对用户来说是透明的。"
Michael Schaffer是位于加州埃默里维尔的在线图书、音乐和视频交换平台Alibris公司的首席技术官,他高度评价了3PAR托管存储阵列给他带来的容错功能,这些存储阵列与他的网络设备一起放在萨克拉门托的服务中心。
存储虚拟化技术有助于支持他那10万家厂商组成的全球网络每天对库存数据库所作的500万次更改。数据库的庞大规模和客户流失率势必需要庞大、动态的高性能存储系统。Schaffer说: "库存数据库是我们公司的立足之本-它既给我们带来了技术挑战,也带来了竞争优势。"
如今,Schaffer可以轻松为一个主机分配100 GB空间,为另一个主机分配1 TB空间,而不必担心设备级的具体细节。他说:"我不知道涉及了哪些驱动器,对此也不用特别关心。"
Schaffer 说,3PAR系统结合了高级技术附件(ATA)驱动器和快速光纤通道驱动器,可以在诸多存储层之间自动移动数据。"我可以把数据从光纤通道移到近线存储或者从RAID 5磁盘组移到RAID 10磁盘组,没有停机时间。"他补充说,这一切不需要详尽规划和LUN分割即可实现。
重复数据删除是存储虚拟化的另一个热门分支,因为它能够节省空间,所以也出现在了Schaffer的技术清单上。重复数据删除可清除类似的数据块,并用散列标记取而代之; 这个过程带来了诸多好处,比如延长了归档内容在磁盘上的存储时间、提供了更好的备份性能。不过弗雷斯特研究公司的Reichman说,这项技术需要企业的 IT经理们考虑存储的方式出现根本上的变化。他说: "多年来,人们用多个数据副本来确保数据的保护和可用性。现在钟摆向另一端摆动,即减少物理副本,从而整体上减少占用空间。"
专家们说,企业的IT经理们可以采用物理存储使用的一项流行技术-快照来简化虚拟化。企业战略集团(ESG)的分析师Mark Peters说: "虽然快照经常被人忽视,却是一项很好的功能,有助于简化虚拟备份、能够迁移数据,还适用于开发团队。开发团队在不断测试过程中可能会带来无数相同的生产数据副本。"
- 基于Linux的云计算PC CherryPal(06-22)
- 云计算和网格计算差别何在?(09-16)
- 网上有朵开放的“云”(09-17)
- 谷歌云计算8大关键问题:是否安全(01-05)
- 基于云计算的AGPS应用研究(08-01)
- 移动互联网的技术引擎(08-18)