是什么构成了云存储?
时间:11-01
来源:比特网
点击:
关于云计算和云存储的定义很多,人们一直试图针对云服务下一个统一的定义,而这却是徒劳的。什么是云服务,这取决于它如何被使用和谁将使用这些服务。谁会部署这些云存储的后端存储基础架构同样取决于上面这些变量。
现在认为有两个基本云服模式:云计算和云存储。云计算方面,数千名用户共享一个特定的应用程序,这些应用程序从金融服务到网络角色扮演游戏各有不同。根据目前我在纽约所看到的情况,虽然请求是通过云发送的,但是处理这些请求则是在提供商的数据中心内完成的。几乎在所有情况下,他们都需要高性能的存储来满足这些本地处理的需求。
在云存储方面,尽管性能仍然是一个主要因素,但却不如其他特性那么重要。云存储提供商需要能够提供比本地IT团队成本更低且更好的服务。云存储的价值主张对于用户来说就是只为能够满足他们需求的所需存储支付费用。换言之,其存储成本应该是具有颗粒性的,无论是向上还是向下扩展,不管他们耗费或者不耗费存储空间。此外,他们还必须增加例如搜索、存储服务或者归档服务等增值项目。
另外一方面就是如何从财务角度来看待这种存储技术。内部的开发和部署将被资本化。相反外部的实施则被作为一个开发项目来对待。资本支出与运营成本可能为组织机构增加效益,这应当作为一个考虑的因素。
在这种使用情况下,存储基础架构的提供者就变得至关重要。供应商面临两个选择。首先是设计自己内部的存储基础架构。从本质上讲,他们成为设计他们自己存储解决方案--一个通常运行在附加廉价磁盘的白盒服务器上的解决方案--的软件开发者。尽管他们可以因为垂直集成而宣称具备一定的优势,但是很难说单是一家公司是否能够做到所有这一切。除了维护存储解决方案的相关软件开始之外,这些公司还必须提供服务来吸引和留住这些用户。另外还包括设施维护、市场营销、软件前端服务以及为潜在数以千计客户管理存储等不容忽视的任务。让一家组织提供以上所有这些可能是有些过于苛刻了。
另外一个选择就是提供现有非现成存储解决方案的供应商。这使得供应商将重点放在了业务和增值项目上,而不是成为存储软件开发的专家。对于这些供应商来说,他们需要寻找的是可扩展以满足用户需求、保持他们价格竞争力和保持管理简化的存储系统。Permabit提供基于网格的存储归档基础架构就是一个很好的例子。而且它还可以配合来自于Mezeo公司的解决方案,提供基于网络服务API的解决方案。这种组合提供了完整的多租户解决方案,使供应商能够借助强大的解决方案快速进入市场,使他们能够专注于他们的主要增值项目。
扩展可能是一个云存储供应商存储基础架构最重要的一方面了,不仅是扩展的规模,还有管理这种扩展的简便性。供应商能够比客户自己更快速且在更低管理成本基础上扩展,这样才有可能盈利。理想情况下,合作伙伴选择的存储系统应该是类似于供应商提供给用户的"付费即增长"的形式提供。
对于这种类型的扩展,答案可以从基于网格的存储归档架构中找到。每一个节点的容量增加了,也就有了额外的存储处理能力和存储I/O带宽。与传统系统相比这种架构的挑战在于,系统添加更多容量与其他组件的增加是不成比例的。这导致了两个问题,首先,供应商不得不在初期就过量采购存储带宽和存储处理能力,为后续某些扩展保留余地。这一个问题,因为如果供应商可以选择等待的话,以后处理能力和存储I/O带宽的成本就会越来越低。第二个问题是,在某些时候,传统系统中容量的增加速度会超过其他方面。结果是留给用户的降低的性能、需要升级或者采购新的系统。
升级是有问题的,虽然有些系统不必迁移就可以升级。存储控制器或者NAS头很容易被替代。当然是成本很高的,特别是环境正在经历大多数云存储供应商期望的快速增长。第二个选择就是添加额外的系统,不过这也是存在挑战的,因为这样供应商就不得不管理多个存储系统。尽管据称全局文件系统可以解决这一问题,不过它是针对数据路径的,而不是管理路径。与配套结合的NAS头相比,单一的集群有一个进行配置和数据保护等存储管理操作的一个点。
在能够满足云存储供应商的扩展性需求之后,第二个最大问题就是保持费用在正常范围内。云存储供应商应该不断进行比较,以控制内部存储成本。云存储服务必须能够严密监测成本保证增值项超过任何价格差。
首先就是观察隐形成本,正如上面我们所讨论的,除此之外,保证供应商可以做到严格检查成本也是很重要的。云存储系统应该可以可靠地利用高容量驱动器,然后添加重复数据删除和压缩等技术来优化容量利用率。事实上,取决于供应商所提供的服务类型,压缩也可能是最重要的技术,因为重复数据删除提供的机会可能是有限的。根据定义,让重复数据删除有效的前提必须是有冗余数据。压缩提供了对所有数据集的优化,而不是根据有无数据冗余而定的。能够同时利用这两种空间优化技术最终将大大减少空间需求。
安全是大多数云存储新用户最关注的问题。云存储供应商应该确保以摸中加密或者安全的形式提供了从客户到设备的传输。存储本身设计应该运行加密而不会影响性能。而且它还应该能够处理云存储的搭建基础--多租户环境。最后,在标准环境中,它应该具有能够一次写入多次读取(WORM)存储的能力以满足法规要求。同样的,这种WORM技术也应该是可以识别多租户的,因为有些用户需要这种功能,而有些人是不需要的。针对每种要求部署独立的系统会打破这种成本模式。
最后一个需要考虑的关键因素,实际上可能是最重要的,可靠性。客户数据丢失是不能被接受的,如果发生的话可能会设计相关的惩罚。如果存储系统采用SATA接口技术来降低成本,那么这就更加重要了。标准RAID对存储供应商来说也许是不够的,单是部署一个完整的镜像成本太高,可能会打破价格模式。与标准RAID技术相比,较新的RAID 6技术存在的挑战是,驱动器容量不断增加,出错的可能性也随之增加,驱动器重建的时间也越来越长。Permabit的RAIN-EC提供的数据保护技术可以大规模地进行扩展,提供更全面的数据保护的同时,利用存储集群来缩短驱动器故障之后重建所需的时间,防止RAID环境典型的读取故障。
此外,存储系统应该能够复制来自多站点的数据,同时利用上面提到的重复数据删除和压缩功能来控制带宽成本。云存储是从用户那里提取的,数据中心故障的容忍度要比内部用户更低一些。而且,因为这种提取,切换服务的能力也是供应商必须承认的一个事实。在被寄予了过高期望的云存储环境中,数据中心停电要比简单的数据丢失更不能被接受。
云存储迅速增长和不断变化的性质意味着供应商必须集中精力在他们的最长处,用户需要考量供应商负责提供什么。虽然垂直整合的方式听起来不错,但它可能是不切实际的。对于供应商来说,扩展性更强的业务模式就是将重点放在用户面向的软件和设备,然后利用其他人提供的后端存储基础架构。
编辑:博子
现在认为有两个基本云服模式:云计算和云存储。云计算方面,数千名用户共享一个特定的应用程序,这些应用程序从金融服务到网络角色扮演游戏各有不同。根据目前我在纽约所看到的情况,虽然请求是通过云发送的,但是处理这些请求则是在提供商的数据中心内完成的。几乎在所有情况下,他们都需要高性能的存储来满足这些本地处理的需求。
在云存储方面,尽管性能仍然是一个主要因素,但却不如其他特性那么重要。云存储提供商需要能够提供比本地IT团队成本更低且更好的服务。云存储的价值主张对于用户来说就是只为能够满足他们需求的所需存储支付费用。换言之,其存储成本应该是具有颗粒性的,无论是向上还是向下扩展,不管他们耗费或者不耗费存储空间。此外,他们还必须增加例如搜索、存储服务或者归档服务等增值项目。
另外一方面就是如何从财务角度来看待这种存储技术。内部的开发和部署将被资本化。相反外部的实施则被作为一个开发项目来对待。资本支出与运营成本可能为组织机构增加效益,这应当作为一个考虑的因素。
在这种使用情况下,存储基础架构的提供者就变得至关重要。供应商面临两个选择。首先是设计自己内部的存储基础架构。从本质上讲,他们成为设计他们自己存储解决方案--一个通常运行在附加廉价磁盘的白盒服务器上的解决方案--的软件开发者。尽管他们可以因为垂直集成而宣称具备一定的优势,但是很难说单是一家公司是否能够做到所有这一切。除了维护存储解决方案的相关软件开始之外,这些公司还必须提供服务来吸引和留住这些用户。另外还包括设施维护、市场营销、软件前端服务以及为潜在数以千计客户管理存储等不容忽视的任务。让一家组织提供以上所有这些可能是有些过于苛刻了。
另外一个选择就是提供现有非现成存储解决方案的供应商。这使得供应商将重点放在了业务和增值项目上,而不是成为存储软件开发的专家。对于这些供应商来说,他们需要寻找的是可扩展以满足用户需求、保持他们价格竞争力和保持管理简化的存储系统。Permabit提供基于网格的存储归档基础架构就是一个很好的例子。而且它还可以配合来自于Mezeo公司的解决方案,提供基于网络服务API的解决方案。这种组合提供了完整的多租户解决方案,使供应商能够借助强大的解决方案快速进入市场,使他们能够专注于他们的主要增值项目。
扩展可能是一个云存储供应商存储基础架构最重要的一方面了,不仅是扩展的规模,还有管理这种扩展的简便性。供应商能够比客户自己更快速且在更低管理成本基础上扩展,这样才有可能盈利。理想情况下,合作伙伴选择的存储系统应该是类似于供应商提供给用户的"付费即增长"的形式提供。
对于这种类型的扩展,答案可以从基于网格的存储归档架构中找到。每一个节点的容量增加了,也就有了额外的存储处理能力和存储I/O带宽。与传统系统相比这种架构的挑战在于,系统添加更多容量与其他组件的增加是不成比例的。这导致了两个问题,首先,供应商不得不在初期就过量采购存储带宽和存储处理能力,为后续某些扩展保留余地。这一个问题,因为如果供应商可以选择等待的话,以后处理能力和存储I/O带宽的成本就会越来越低。第二个问题是,在某些时候,传统系统中容量的增加速度会超过其他方面。结果是留给用户的降低的性能、需要升级或者采购新的系统。
升级是有问题的,虽然有些系统不必迁移就可以升级。存储控制器或者NAS头很容易被替代。当然是成本很高的,特别是环境正在经历大多数云存储供应商期望的快速增长。第二个选择就是添加额外的系统,不过这也是存在挑战的,因为这样供应商就不得不管理多个存储系统。尽管据称全局文件系统可以解决这一问题,不过它是针对数据路径的,而不是管理路径。与配套结合的NAS头相比,单一的集群有一个进行配置和数据保护等存储管理操作的一个点。
在能够满足云存储供应商的扩展性需求之后,第二个最大问题就是保持费用在正常范围内。云存储供应商应该不断进行比较,以控制内部存储成本。云存储服务必须能够严密监测成本保证增值项超过任何价格差。
首先就是观察隐形成本,正如上面我们所讨论的,除此之外,保证供应商可以做到严格检查成本也是很重要的。云存储系统应该可以可靠地利用高容量驱动器,然后添加重复数据删除和压缩等技术来优化容量利用率。事实上,取决于供应商所提供的服务类型,压缩也可能是最重要的技术,因为重复数据删除提供的机会可能是有限的。根据定义,让重复数据删除有效的前提必须是有冗余数据。压缩提供了对所有数据集的优化,而不是根据有无数据冗余而定的。能够同时利用这两种空间优化技术最终将大大减少空间需求。
安全是大多数云存储新用户最关注的问题。云存储供应商应该确保以摸中加密或者安全的形式提供了从客户到设备的传输。存储本身设计应该运行加密而不会影响性能。而且它还应该能够处理云存储的搭建基础--多租户环境。最后,在标准环境中,它应该具有能够一次写入多次读取(WORM)存储的能力以满足法规要求。同样的,这种WORM技术也应该是可以识别多租户的,因为有些用户需要这种功能,而有些人是不需要的。针对每种要求部署独立的系统会打破这种成本模式。
最后一个需要考虑的关键因素,实际上可能是最重要的,可靠性。客户数据丢失是不能被接受的,如果发生的话可能会设计相关的惩罚。如果存储系统采用SATA接口技术来降低成本,那么这就更加重要了。标准RAID对存储供应商来说也许是不够的,单是部署一个完整的镜像成本太高,可能会打破价格模式。与标准RAID技术相比,较新的RAID 6技术存在的挑战是,驱动器容量不断增加,出错的可能性也随之增加,驱动器重建的时间也越来越长。Permabit的RAIN-EC提供的数据保护技术可以大规模地进行扩展,提供更全面的数据保护的同时,利用存储集群来缩短驱动器故障之后重建所需的时间,防止RAID环境典型的读取故障。
此外,存储系统应该能够复制来自多站点的数据,同时利用上面提到的重复数据删除和压缩功能来控制带宽成本。云存储是从用户那里提取的,数据中心故障的容忍度要比内部用户更低一些。而且,因为这种提取,切换服务的能力也是供应商必须承认的一个事实。在被寄予了过高期望的云存储环境中,数据中心停电要比简单的数据丢失更不能被接受。
云存储迅速增长和不断变化的性质意味着供应商必须集中精力在他们的最长处,用户需要考量供应商负责提供什么。虽然垂直整合的方式听起来不错,但它可能是不切实际的。对于供应商来说,扩展性更强的业务模式就是将重点放在用户面向的软件和设备,然后利用其他人提供的后端存储基础架构。
编辑:博子
- 深入探究内部云存储的特别之处(01-03)
- 如何利用基于云的归档解决备份难题(01-18)
- 文件虚拟化为云存储奠定坚实基础(01-21)
- 深度剖析云存储(01-23)
- 走访存储厂商谈云存储的应用(02-03)
- 实现云存储的必要条件(05-29)