微波EDA网,见证研发工程师的成长!
首页 > 通信和网络 > 通信网络业界新闻 > Eclipse Europa:SOA测试和性能

Eclipse Europa:SOA测试和性能

时间:06-12 来源:IT专家网 点击:
数据质量,作为一项规则,经常下列三种环境类型下被使用。第一种是在移动项目中,不管那些是纯粹的数据移动还是被嵌入在更大的应用移动项目中。在任何一种情况下,要求都是保证载入新的系统中的数据的质量足够高以适合于应用目的。换句话说,这种环境在传统上被誉为基于项目的,而且数据质量本身因此也被假设为基于项目的:使新系统运转起来是唯一一件重要的事,而且数据以每月2%左右恶化(在缺乏防范措施的情况下),出现既不是这里也不是那里的情况。

  第二种数据质量程序的环境经常使用,放置在传统ETL工具的旁边与数据仓库上载相联系。从历史上来说,这是一个批量处理程序,能以一个常规的基础重复。结果数据质量经常应用于最初的分析然后是相同的程序应用于一个正在进行的基础,基于在原数据中出现的错误将会在新的批量数据发生的假设。不幸的是,这并不是必要的情况。

  前面介绍的两种数据质量的用途都是基于事件驱动的。尽管如此,正如所说的,最好在发生之前就去防止错误而不是试图在其发生之后去检查它(这意味着你不需要收回你的钱)最好是在第一个地方就防止数据里的错误;其引导我到第三种类型的数据质量,其应用于基于持续进行的资源,而不是通过在传统方法中使用基于项目的方法类型。比如说,如果你打算实现主数据管理(MDM)以保证多个CRM系统的同步,接着所有数据持续在一个持续进行的基础上都是属于高质量的:否则你将失去你的整个事件价值中一部分。这只能通过基于实时基础的数据质量的使用来完成。

  加之,实时数据质量不是在进入点应用这个的简单事情,还是在数据生命周期中的其他步骤,其不值任何东西。如无论何时数据都能在系统之间同步或是能被不同的系统、数据库或是应用所共享:比如说,在一个联合查询中。

  对于这个实时数据质量你所需要的而在基于项目的数据质量中所不需要的?好的,第一件事很明显是当需要时配置数据质量的能力。在今天的世界中,这意味着在面向服务的架构(SOA)中你需要Web服务的支持,所以数据质量可被嵌入任何需要使用这项技术的程序。第二,数据质量软件需要具有灵活性:你不能假设当你在实际操作中设置MDM系统所遇到的问题和你所遇到的数据质量问题一样。举个例子来说,如果你在为产品信息管理应用MDM,而且你开始与一个新的供应商合作,接着可能要求新类型的配对,比如说,这个供应商是German,而其以那种语言提供产品细节,这个可能你以前没有处理过。实际上你开始将提供数据作为一项服务。

  第三件你需要的事情就是软件能尽可能自动化数据质量程序。这是因为实时、持续的数据质量是关于在数据进入点清洁和配对:换句话说,这个更可能在用户域而不是IT部门发生。因此这里必然存在用户需要做的一些事情,更进一步来说,用户所需要做的必须尽可能简单。

  将目标市场定位于持续而不是基于项目的数据质量的公司就是Zoomix。我在之前已经写过关于这家公司的东西了,而且我将其描述成为数据质量市场带来自动化的公司。它通过对数据质量应用一个以数据为中心(而不是以规则为中心)的方法来实现这个。接着Zoomix应用了大量的语言的、语法的以及统计上的规则,它们为不同类型的数据质量决策以优化的方式(自动地)组合起来。换句话说,Zoomix能识别数据的内容,也就是说它将解析(包括信息所使用的语言之类的东西)作为数据质量程序的一部分而不是仅仅将所有数据同样处理(而这正式大多数传统产品的情况),这就是允许其优化它的各种法则的方式。

  而且Zoomix使用了其称之为自我学习的词典。这意味着如果软件识别了一个潜在的配对,比如说65%,而用户认同其的确是一个配对,接着Zoomix将据此更新它的知识库。随之而来的是,软件将在类似的情况发生中自动应用这个配对,而不需要用户的请求。所以,比如说,系统将获悉EDT和Eau de Toilette是同一件东西,而oz与盎司等同,而blau是蓝色。而且,当相似时,与同样对待相反,Zoomix的情形聪明到(它调整它的内部规则和知识)能识别这种情形,并运用相关的一套规则来详细阐述这些情形。随着时间的演进,这项技术允许软件变得越来越精确并且能自动化,而且其所要求的人工输入越来越少。

  回到Zoomix所使用的法则,他值得对其产品的语法能力进行进一步评价,因为其通过刚刚描述的自我学习能力在不断的改进。尤其是,当其他的工具可能有处理数据结构的语法能力。Zoomix扩展了这些,所以他们能在考虑的情况下将实体的属性相关联(如容量--盎司/oz,颜色等等)。不幸的是,和它的组合那些语法法则和统计与语言规则的能力,加上它能阐述数据的动态属性的自我学习能力,Zoomix能在较短的时间中提供改进的结果。

  另一个值得一提的是Zoomix适合于所有类型的数据。当然,所有供应商都声称具有此项功能,但是却往往不是真的。市场上的其他产品都是开发用于名称配对和在第一个例子中进行清洁的,而且他们在配对和清洁产品类型并不擅长于配对和清洁,尤其是当数据很复杂时。换句话说Zoomix是被开发用于所有类型的数据但是相当的复杂和高度变化的数据。

  当Zoomix理所当然的用于所有类型的数据质量实现,包括基于项目环境,企业(其是以色列的,并在英国和美国开设有办公室)专注于在它的软件嵌入和相关的商业流程的持续环境中使用这项技术,尤其是,其目标市场为MDM。随着MDM被逐渐认为是一个跨环境的扩展了所有类型的数据(客户、供应商、位置、产品、金融数据、合约等等),而其要求在实时基础上的高质量数据的持续维护,Zoomix名列前茅。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top