在I允许接入的监控设备包oT-ClusterDB中,括物联网系统中所管理的各类传感器设备、视频与音频监控设备、部署在某个区域的无线传感器网络(等.此外,WSN)IoT-ClusterDB还允许以人工的方式输入感知数据.所有这些方式获得的数据,我们均传感器采样数据”统一地称之为“.
通常情况下,传感器的采样数据是数值型的,如温度传感器、压力传感器、无线传感器GPS传感器、但是,网络等所获得的数据.IoT-ClusterDB也允许多媒体设备(如视频监控设备、遥感成像设备、高空成像设备等)接入系统,通过相应的多媒体分析,可
6期丁治明等:面向物联网海量传感器采样数据管理的数据库集群系统框架
1179
以从这些设备所获得的多媒体数据(如交通摄像头采集的视频数据流)中提取出有意义的数值型数据(如道路交通流的平均速度、车辆密度、交通流量因此,多媒体设备连同传感器接入处理器(见等).)图2中相应的多媒体分析模块,可以达到与普通传感器一样的效果,所以在本文中我们也将它们统一地纳入传感器的范畴.
通过上述分析可以看出,本文所说的“传感器数事实上是一个广义的概念,包括任意类型带有时据”
反映物理世界状态的数据.例如,在发生空特性的、
每一个病例登记即可看成一个传感SARS疫情时,
器采样数据,该数据反映了病例发生的时间、地点、规模等信息.又如,在大面积布设的WS系统N中,本身即可根据多个传感器个体的采样值获得汇总数,据(如污染带的面积、位置等)这些汇总数据也可以在这种情况下,可以将整个看成传感器采样数据(
而不需要对其中的单个传WSN看成一个传感器,感器进行管理).
传感器将采样数据上传给传感器接入处理器(,的方式可分为SensorConnectinProcessorSCP) g
主动上传与被动上传.其中,主动上传是根据两种:
预先定义的条件,由传感器自身进行计算和判断,只有当规定的条件满足时才上传数据,这种方式具有较好的数据传输效率,但需要传感器具备一定的计而被动上传则是以一定的频率周期性地上传算能力;
这种方式虽然具有较大的通信代价,但对传感数据,
器的计算能力要求很小,因此也得到了广泛的应用.
在I传感器采样数据是以“原oT-ClusterDB中,)”子监控对象(为单位进行atomicmonitoredobect j组织的,而不是以传感器为单位.同一个监控对象的所有传感器采样值按照时间序列组织在一起,形成,该监控对象的“采样数据序列”并作为一个属性存放在该监控对象的元组记录中.
在绝大多数情况下,一个监控对象即对应于一个传感器(如太湖中的一个温度传感器可看成是一个监控对象,对应于一个具体的温度监测点,因此太;湖中可包含大量的监控对象)但某些时候两者并不具有一一对应的关系,例如RFID传感器与所监控——带有的车辆或货物之间并没有固定的对应关系—RFID标签的监控对象的采样数据序列是由整个系统中的多个RFID传感器所采集的数据汇总而成的.
根据监控对象的位置是否移动,我们可以将它们分为两大类:静止监控对象(如太湖中固定布设的温度传感器、车库中的剩余车位计数器、无线传感器网络
等)和移动监控对象(如带G条形码的PS、RFID标签、车辆与货物、浮动车上布设的视频交通流传感器等).
传感器接入处理器可以实现大量传感器的接实现对传感器原始采样数据的分析、过滤与转入,
换,完成原始采样数据的本地存储,并将处理后的数值型关键采样数据上传到IoT-ClusterDB数据库集传感器接入处理器分担了整群中做进一步的处理.
个系统的很大一部分数据处理与存储任务,使得带有语义信IoT-ClusterDB只需处理相对较少的、图2给出了传感器接入息的数值型关键采样数据.处理器的工作过程
.
图2 传感器接入处理器的主要工作过程
如图2所示,传感器接入处理器的主要工作过程如下:
()非数值型采样数据的数值化.对于多媒体1
原始采样数据,传感器接入处理器需要进行相关的获得能够反映监控对象物理状态多媒体数据分析,
的数值型导出数据,如通过对交通摄像头视频图像的分析,可以提取出监控地点的车辆密度、平均车速、交通流量等参数信息;通过对高空遥感图像的分析,可以提取出污染区域及火灾区域的地理几何形状等空间数据信息.
()密集采集数据的稀疏化.无论是通过多媒2
体数据分析所获得的数值型导出数据,还是直接从它们仍然存在传感器获得的数值型原始采样数据,
如果将这些数据全部传入着采样频率过高的缺陷.
则会导致数据中心数据IoT-ClusterDB进行管理,量的急剧膨胀.为此,传感器接入处理器需要通过关键数据的提取操作,从原始数据流中抽取出能够反映监控目标物理状态变化的关键采样数据,仅将关键采样数据上传给IoT-ClusterDB进行处理.
1180
计 算 机 学 报2012年
在关键数据的提取方面,一种简单的方法是基——对于每一于状态变化阈值的关键数据提取方法—
种传感器可以定义一个状态变化阈值,如果新的采样数据与上次上传的关键采样数据之间的差值没有则不需要进行任何处理;仅当它们之间超过该阈值,
的差值超过规定的阈值时,新的采样数据才成为需此外,我们还可以采取其它要上传的关键采样数据.
的更加智能化的数据提取方法,在保证关键数据上过滤掉大量的冗余数据(注意,如果传传的前提下,
则采样数据已经进行了感器采用主动上传的方式,
稀疏化处理,SCP不需要再进行相应的处理).()条形码阅读器采样数据的提取.对于3RFID、
条形码阅读器等所采集的数据,传感RFID传感器、
并器接入处理器需要提取出移动监控对象的标识,连同相关的采样时间与采样地点组成采样记录,然后将该采样记录发送给IoT-ClusterDB进行处理.来自于IoT-ClusterDB将同一个移动监控对象的、不同RFID传感器或条形码阅读器的采样数据集中可以获得该监控对象的采样数据序列,该数据起来,
序列反映了其完整的时空移动过程.