数据虚拟化:数据整合问题的解决方案?
时间:08-18
来源:IT168
点击:
数据整合是一个非常困难的问题,但是据专家称,一种相对新颖的信息管理方法可以帮助人们解决这个问题,即数据虚拟化。
马萨诸塞州剑桥的Forrester Research Inc.的IT分析专家Noel Yuhanna说,现在典型的企业都会采用多种数据库管理系统(DBMSs),如Oracle和SQL Server,而这些系统在最初设计上并不兼容。另外,企业越来越经常利用这些系统存储非传统型信息,比如非结构化数据和半结构化数据。
除了这些因素以外,由于有更多像撒班尼斯-奥克斯莱法案(Sarbanes-Oxley Act)这样的数据保留章程,企业需要储存的数据数量达到前所未有的高度,因此数据整合的问题迫在眉睫。
"数据整合问题总是越来越困难,我们相信(其中一个原因)就是数据量一直在不断增长。"Yuhanna说,"(但是)你又确实需要数据整合,因为对于商业、客户和合作伙伴来说,这有很重要的价值。他们需要高质量的数据来做出更好的商业决策。"
数据虚拟化,也被称为"将信息作为服务"(Information-as-a-Service)和"将数据作为服务"(Data-as-a-Service),能够通过把数据从应用程序中分离出来并存储到中间件层来减少数据整合上的障碍。
Yuhanna说,数据虚拟化从本质上来说可以作为一个数据服务导向架构(SOA)。但是,传统的SOA方法把重点放在商业程序,而数据虚拟化的重点则是在这些商业程序所运用的信息上。
"Data-as-a-Service的重要性越来越大,因为如果你有10000个数据库,这10000个数据库中唯一正确的数据又在哪里?应用程序知道吗?答案大概是否定的。所以你会想要知道唯一正确的数据。如果应用程序与虚拟化层互相作用,这就表明你的数据一致--你有高质量的数据可供程序使用。"
不过说到要让应用程序在中间件层与虚拟化数据完全连续地相互作用并不容易,这要求企业在数据质量和程序性能上多费心思。
Yuhanna解释说,典型的企业里运作多种DBMSs,信息常常因为复制和extract transform and load(ETL)等操作而产生重复。因此,要把正确的数据放入中间件层中,则需要在中间件层中建立确保数据质量的功能性。
"数据质量是一个很大的因素,因为你需要有一致的数值,"他说,"从传统意义上来讲,数据质量更加是一项离线的工作,或直接创建进应用程序里。但是现在我们要把它创建到中间件层中。中间件层将会进行数据质量分析的工作。
Yahunna说,把数据从应用程序中分离出来并存储到中间件层这个做法同样引起人们对应用程序性能的担忧。正因如此Forrester认为能够最小化磁盘I/O的in-memory数据高速缓存软件将会越来越重要。
"在未来的几年里,绝大部分的应用程序的第一存取层将会是高速缓冲存储器。"他说,"就像Google一样。Google缓存大量的数据,而现在Google应用程序拥有比许多的企业应用程序更快的运行速度。"
开始研究数据虚拟化
根据Forrester的资料统计,现在没有一家软件供应商能够提供一个完整的数据虚拟化服务包,但是Oracle、微软、IBM、BEA和Red Hat的 MetaMatrix等公司都在往这个方向发展。
Yuhanna说,有兴趣研发数据虚拟化的公司需要明白,要完成这项工作可能需要很多年的时间,而且最好能够循序渐进。
"我认为首先要看为大家共享的最平常的数据。可以是地址、电话号码或者一些财务数据,"他说,"观察共享数据的共通点,再将其载入虚拟化的进程,这样这些数据能够保持一致性并应用到应用程序中。那时你就可以随着进程的发展再添加更多的值或数据。"
马萨诸塞州剑桥的Forrester Research Inc.的IT分析专家Noel Yuhanna说,现在典型的企业都会采用多种数据库管理系统(DBMSs),如Oracle和SQL Server,而这些系统在最初设计上并不兼容。另外,企业越来越经常利用这些系统存储非传统型信息,比如非结构化数据和半结构化数据。
除了这些因素以外,由于有更多像撒班尼斯-奥克斯莱法案(Sarbanes-Oxley Act)这样的数据保留章程,企业需要储存的数据数量达到前所未有的高度,因此数据整合的问题迫在眉睫。
"数据整合问题总是越来越困难,我们相信(其中一个原因)就是数据量一直在不断增长。"Yuhanna说,"(但是)你又确实需要数据整合,因为对于商业、客户和合作伙伴来说,这有很重要的价值。他们需要高质量的数据来做出更好的商业决策。"
数据虚拟化,也被称为"将信息作为服务"(Information-as-a-Service)和"将数据作为服务"(Data-as-a-Service),能够通过把数据从应用程序中分离出来并存储到中间件层来减少数据整合上的障碍。
Yuhanna说,数据虚拟化从本质上来说可以作为一个数据服务导向架构(SOA)。但是,传统的SOA方法把重点放在商业程序,而数据虚拟化的重点则是在这些商业程序所运用的信息上。
"Data-as-a-Service的重要性越来越大,因为如果你有10000个数据库,这10000个数据库中唯一正确的数据又在哪里?应用程序知道吗?答案大概是否定的。所以你会想要知道唯一正确的数据。如果应用程序与虚拟化层互相作用,这就表明你的数据一致--你有高质量的数据可供程序使用。"
不过说到要让应用程序在中间件层与虚拟化数据完全连续地相互作用并不容易,这要求企业在数据质量和程序性能上多费心思。
Yuhanna解释说,典型的企业里运作多种DBMSs,信息常常因为复制和extract transform and load(ETL)等操作而产生重复。因此,要把正确的数据放入中间件层中,则需要在中间件层中建立确保数据质量的功能性。
"数据质量是一个很大的因素,因为你需要有一致的数值,"他说,"从传统意义上来讲,数据质量更加是一项离线的工作,或直接创建进应用程序里。但是现在我们要把它创建到中间件层中。中间件层将会进行数据质量分析的工作。
Yahunna说,把数据从应用程序中分离出来并存储到中间件层这个做法同样引起人们对应用程序性能的担忧。正因如此Forrester认为能够最小化磁盘I/O的in-memory数据高速缓存软件将会越来越重要。
"在未来的几年里,绝大部分的应用程序的第一存取层将会是高速缓冲存储器。"他说,"就像Google一样。Google缓存大量的数据,而现在Google应用程序拥有比许多的企业应用程序更快的运行速度。"
开始研究数据虚拟化
根据Forrester的资料统计,现在没有一家软件供应商能够提供一个完整的数据虚拟化服务包,但是Oracle、微软、IBM、BEA和Red Hat的 MetaMatrix等公司都在往这个方向发展。
Yuhanna说,有兴趣研发数据虚拟化的公司需要明白,要完成这项工作可能需要很多年的时间,而且最好能够循序渐进。
"我认为首先要看为大家共享的最平常的数据。可以是地址、电话号码或者一些财务数据,"他说,"观察共享数据的共通点,再将其载入虚拟化的进程,这样这些数据能够保持一致性并应用到应用程序中。那时你就可以随着进程的发展再添加更多的值或数据。"
- NetApp NAS存储系统 助力金融保险行业实现数据整合(01-25)
- 三维渲染引擎编辑器的研究(09-21)
- x86服务器虚拟化在数据中心遇到的8个问题(02-19)
- IBM存储虚拟化产品进行SPC测试(06-18)
- 如何用虚拟化解决数据安全问题(03-09)
- 没有面向服务的虚拟化SOA就很难取得成功(03-21)