一种RFID数据压缩算法的研究
0 引言
所谓物联网就是物物相连的互联网,是指通过射频识别、红外感应器等信息传感设备把物品与互联网相连接,进行信息交互和通信的一种网络[1-3]。物联网这个概念在1999年被提出之后,并没有引起人们广泛的关注,由于其包含技术的复杂性,社会普遍质疑物联网大规模实施的可行性。但随着构建物联网的电子芯片费用的不断降低与电子标签(Electronic Product Code, EPC)技术的日渐成熟[4-5],物联网的普及逐渐变得切实可行。
普遍认为,射频识别(Radio Frequency IDentification, RFID)的特性为:时空关联性、海量性、不确定性、实时性等[6-7]。随着物联网技术的日益发展,如何有效并快速地存储与查询RFID数据逐渐引起人们的重视。如果电子标签被放置在每个物品上,那么类似于沃尔玛这样的大型超市将会在一天之内得到7TB左右的数据,所以像Oracle、IBM、Teradata和一些其他的数据库公司不得不考虑将RFID信息整合到企业级数据库中[8]。
在物联网被广泛应用的背景下,RFID数据存储与管理逐渐成为物联网技术的研究方向之一[9-10]。之前的研究工作主要采用单一数据层的方式存储RFID数据,较少涉及压缩存储与历史数据的处理。如文献[11]首次给出了一般意义上的RFID数据存储结构与数据管理的体系结构,但是其结构并不能完全适应当前的RFID应用系统;文献[12]提出了一个以位置为关键字的RFID数据存储模型,并给出了在这个模型之上的查询语句,但是对于历史数据却并没有进行处理;文献[8]提出了一个简单的RFID数据压缩方法,其主要思想是将一个固定的编号来代表一连串情境相关的EPC编号(如一箱牛奶等),但是对于这个编号的尚未完成的划分方式却是实施这一方法的阻碍;文献[13]提出了一个RFID数据压缩方法,该方法的主要思想是通过合并与连接那些用户不感兴趣的路径片段进行路径的语义压缩,但是如何确定哪些路径用户不感兴趣是一个很大的难题。
故本文根据RFID数据的特点,提出了RFID三层数据存储模型,并给出了相应数据层的数据汇总算法。
1 RFID数据压缩存储模型
为了更好地区别与阐述当前数据与历史数据,给出RFID历史数据的定义。
定义1RFID历史数据。RFID历史数据为在某一特定事件驱动前的RFID数据,该特定事件与具体的RFID系统应用相关。
例如在一个超市RFID系统之中,一个物品在被卖给消费者之后,它之前被阅读器扫描得到的数据被称为历史数据。而在一个物流监控系统当中,在物品离开物流系统最终到达零售商店中之后,之前它在物流中产生的数据称为历史数据。如图1所示。
图1RFID历史数据的产生
本文采用了三层存储结构,并给出了相应的数据汇总方法,以达到数据压缩的目的。本文的存储模型结构如图2所示。
图2三层存储模型结构
图2中各层之间通过相应的数据汇总算法进行数据的汇总。本文RFID数据流的传递顺序是:阅读器层→当前数据层→临时数据层→历史数据层,并且高层数据层的数据量比低层数据层的数据量小。
在一个RFID系统中,将从阅读器得到的原始数据的集合称为观测数据集。其数据形式为Observation{E,L,T},其中E表示被扫描的物品的EPC编码,L表示物品被扫描的地点,T表示物品被扫描的时间。其具体形式如表1所示。
随着时间的推移,观测数据集中的数据量将异常庞大,这时需要将观测数据向当
前数据层进行汇总。当前数据层的数据形式为CurrentData{EL,LocID,TS,TE,Count},其中TS与TE分别表示该物品在这个位置第一次被扫描到的时间与最后一次被扫描到的时间,Count代表该物品在TS到TE这个时间段内在该位置出现的次数。
当观测数据集向当前数据集进行汇总时,首先会进行EPC编号的匹配。如果在CurrentData集中不存在这个EPC编号,则将这条信息存入CurrentData集中;否则将会进行位置信息的匹配,即查找该信息的LocID是否存在于CurrentData集中,如果存在则将计数增加,否则同样将这条信息存入CurrentData集中。
下面给出当前数据层的汇总算法:
算法1当前数据集(Current Data Gather, CDG)汇总算法。
输入最低粒度集Observation{E,L,T}。
输出当前数据集CurrentData{EL,LocID, TS, TE,Count}。
例1在一个物联网系统中,实体epc1的标签在分别在时刻t1、t2、t3在loc1被读取到,t4、t5、t6在loc2被读取到,epc2的标签在时刻t7、t8在loc1被读取到,此时Observation集的内容如表1所示。则当运行完CDG算法之后,CurrentData集合中的内容如表2所示。
通过这个例子可看出:经过CDG算法之后
- Mesh、ZigBee、RFID让网络无处不在(11-24)
- RFID标签在超高频全球标准的认证之路(11-09)
- RFID相关技术专利分析(一)(11-09)
- RFID工厂仓储物流解决方案(12-21)
- 美国室内水上乐园采用RFID提升游客体验(04-22)
- Sirit RFID解决方案追踪代阿布洛峡谷核电站重要资产(04-07)