微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 模拟电路设计 > 面向中小企业智能数据处理工具

面向中小企业智能数据处理工具

时间:03-17 来源:互联网 点击:

    1. 这需要用户的背景知识,同时也应该根据实际的任务确定清理规则。

      模型的确定:通过对数据的分析选择一个初始的模型。模型定义一般分为三个步骤:数据分隔,模型选择和参数选择。在我们的系统中,主要引入了关联规则模型和分类模型。

      数据分析:对选中的模型进行详细定义,确定模型的类型及有关属性;通过对相关数据的计算,计算模型的有关参数,得到模型的各属性值;通过测试数据对得到的模型进行测试和评价;根据评价结果对模型进行优化。

      输出结果生成:数据分析的结果一般都比较复杂,很难被人理解,将结果以文档或图表形式表现出来则易于被人接受。

      在KDD过程中,最重要的是其中的数据挖掘部分,即模型和相关属性的确定。我们计划采用其中应用最广泛的两个模型,分别是关联规则和分类规则,以下作详细的介绍。

      关联规则是形式如下的一种规则,“在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”(面包+黄油=>牛奶 )。用于关联规则发现的主要对象是事务型数据库,其中最典型的应用则是售货数据,一个事务一般由如下几个部分组成:事务处理时间,一组顾客购买的物品,有时也有顾客标识号(如信用卡号)。如果对这些历史事务数据进行分析,则可对顾客的购买行为提供极有价值的信息。例如,可以帮助如何摆放货架上的商品(如把顾客经常同时买的商品放在一起),帮助如何规划市场(怎样相互搭配进货)。由此可见,从事务数据中发现关联规则,对于改进零售业等商业活动的决策非常重要。随着应用的推广,关联规则已经在许多领域发挥作用,成为最典型的数据挖掘应用。

      分类也是数据挖掘中的一项非常重要的任务。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类的应用实例也很多,比较典型的由保险公司的保费设置。保险公司成功的一个关键因素是在设置具有竞争力保费和覆盖风险之间选择一种平衡。保险市场竞争激烈,设置过高的保费意味着失去市场,而保费过低又会影响公司的赢利。保费通常是通过对一些主要的因素(如驾驶员的年龄、车辆的类型等)进行多种分析和直觉判断来确定。由于投资组合的数量很大,分析方法通常是粗略的。采用分类进行数据挖掘以后,就可以利用计算机处理海量数据的能力来进行合理的分类,定出合理的保费,使保险公司得到最大收益。

      六、结束语

      面向企业应用的智能决策支持工具是很有前途的研究开发方向,在我国随着市场经济的确立和发展,中小企业对企业信息化决策支持工具的需求会越来越强烈,本文提出的智能决策支持工具的设计方案旨在与广大同行交流共同推进智能决策支持工具的开发和研究,最终开发出适合国内中小企业应用需求的软件。


      面向中小企业智能数据处理工具一文由蓝之韵www.21blue.com搜集整理,版权归作者所有,转载请注明出处!

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top