2. 苏州大学 计算机科学与技术学院, 苏州 215009
2. School of Computer Science and Technology, Soochow University, Suzhou 215009, China
随着科技的快速发展, 智慧城市概念被越来越多的引入到人们生活中. 2012年住建部发布了《关于开展国家智慧城市试点工作的通知》, 2013年国家首批智慧城市试点区域共计90个城区, 第二批试点103个, 2015年第三批试点84个城市, 至2016年全国累计达500多城市启动了智慧城市项目, 超过全球其他国家数量总和[1]. 智慧照明监控系统作为智慧城市系统中的重要一员, 运用4G、WiFi、Zigbee等信息化和物联网技术, 实现了远程照明设备调控、数据采集管理, 改变了传统照明管理模式[2,3].
2016年, 华为发布了多级智能控制照明物联网解决方案; 随后中兴公司发布了集路灯杆、充电桩、4G/5G基站和摄像头监控等功能的智慧路灯方案. 2018年, 深圳亿兆提出智能灯控解决方案: 智慧城市智能灯控系统. 杭州时域电子科技公司针对城市路灯用电大、管理难的问题提出了智慧路灯解决方案. 随着智慧照明的市场越来越大, 智能化程度要求越来越高, 智慧照明的学术研究也越来越深入. 李今[2]提出了基于大数据分析技术的应用方法, 对海量运行数据进行聚类分析, 实时监测过程中的动态数据, 从而判别当前设备运行状况; 王敏等[3]提出的基于物联网架构的智能照明系统实现了常见通信协议间的转换, 综合了多种传感器, 系统通用性更强. 余建波等[4]提出了完整的现代城市智慧照明控制系统解决方案, 集成智慧照明领域先进的控制策略, 包括地理信息系统、灯具实时监测、终端控制、故障诊断与报警、统计和决策支持功能子模块. 目前对于智慧照明的研究主要集中在如下几个方面: (1)通信协议的优化; (2)故障信息的分析; (3)集成方案的设计. 对于提高系统控制效率的研究较少. 目前智慧照明监控系统控制方式为自动控制与人工控制两种模式. 自动控制方式结合设备所在区域, 光照度, 人流量等环境因素进行控制, 自动化程度较高; 人工控制方式在如设备测试、检修、重大活动等情况下使用, 需要管理人员根据需求, 通过软件手动进行开关灯及调光操作, 该方法过度依赖于经验值, 效率低下, 容易造成能源浪费. 因此, 为进一步提高智慧照明监控系统的智能化控制效率及节能效果, 利用关联规则挖掘控制模式中的隐藏关系, 考虑到传统Apriori算法需要多次扫描数据集, 执行效率较低[5], 对算法进行改进, 减少搜索数据集的次数, 最终得到强关联规则, 在人工控制过程中给予控制方式的智能关联提醒, 降低了经验依赖度, 提高智慧照明的智能化程度及节能效果.
2 系统架构设计智慧照明监控系统具有照明设备数据采集、故障监测报警、设备控制和系统管理等功能. 系统分为三层结构: 数据采集层、网络传输层和数据应用层, 系统结构如图1所示[6].
数据采集层是智慧照明监控系统的感知器官, 通过对终端设备状态数据的采集, 可实时获取电流、电压、功率等各类照明设备数据.
网络传输层为三层架构中的中间部分, 主要实现数据采集层和数据应用层之间的数据双向传输.
数据应用层控制整个监控系统的运行. 对各类采集数据进行分析管理, 可实现照明设备控制、状态数据管理、能耗管理、故障报警、各类日志管理等功能. 数据应用层的管理平台功能结构图如图2所示. 平台功能包括: 故障报警模块、GIS模块、维护模块、运行模块、管理模块、系统设置模块等6个模块. 故障报警模块实现对故障数据的声光及短信报警管理; GIS模块根据经纬度实现设备定位显示, 用户可在地图上定位查看或控制照明设备; 维护模块实现操作日志及工单管理, 对系统的设备维护数据进行管理; 运行模块处理各类控制策略及状态数据的管理; 管理模块实现各类数据展示、运行质量管理、系统能耗管理和设备数据管理等; 系统设置模块完成权限管理、用户信息管理及系统中的各类参数进行管理配置.
数据应用层的控制模块主要分为自动控制和人工控制. 自动控制模式受照明设备所在区域, 光照度, 人流量等环境参数影响, 自动化程度较高. 人工控制主要在一些特殊情况下进行临时控制操作, 如设备测试、检修、重大活动等情况下使用. 由于人工控制模式需要管理人员通过软件单独控制照明设备, 而无论是设备测试、检修还是重大活动都需要有较高的效率来完成整个控制流程, 但此环节由于人为因素的存在, 依赖于经验值, 降低了系统自动化的程度. 因此, 在此环节中利用关联规则寻找控制动作之间的相关性, 在人工操作过程中给予一定的关联提示, 减少手动控制设备对于经验值的依赖程度, 提高手动控制的效率, 从而提升照明控制的智慧化程度.
3 关联规则
关联规则为数据挖掘技术中的一个重要分支, 是搜索数据项之间隐含关系、对数据之间的密切程度进行描述的一种方法[7,8].
3.1 关联规则设有事务类型的数据库
1)支持度
如关联规则“
$ Support(A \Rightarrow B) = \frac{{(A,B).count}}{{T.count}} $ | (1) |
2)置信度
关联规则“
$ Confidence(A \Rightarrow B) = \frac{{(A,B).count}}{{A.count}} $ | (2) |
支持度和置信度越高, 说明规则的关联强度越强. 关联规则要求项集必须满足的最小支持阈值, 称为项集的最小支持度. 满足最小支持度的项集称为频繁项集, 同时满足最小置信度和最小支持度的关联规则被称为强关联规则[10–12].
3.2 Apriori算法Apriori算法是搜索关联规则的频繁项集的重要算法, 其挖掘关联规则可分为两个步骤: 1)利用迭代方式获取频繁项集, 通过计算得到1-频繁项集L1, 利用L1生成候选集C1, 判断是否满足最小支持度, 获取2-频繁项集L2, 依次类推, 直至获取最大频繁项集; 2)利用最小置信度, 挖掘频繁项集, 构造关联规则[13–15].
Apriori算法核心步骤如图3所示.
4 基于关联规则的控制模型设计
将关联规则应用于智慧照明控制模型中, 通过对数据库中各类控制命令进行关联分析, 可以挖掘到控制命令之间存在的隐含关联性. 关联规则挖掘概念模型如图4所示.
Apriori算法计算复杂度主要受如下因素影响:
1)支持度阈值: 低支持度阈值产生更多的频繁项集, 算法的扫描次数将随之增多; 高支持度阈值降低频繁项集数, 但候选集数量降低一定程度上降低了Apriori算法的稳定性.
2)项数(维度): 项数的增加将提高算法的空间复杂度.
3)事务数: 随着事务数的增加, Apriori算法扫描次数增加, 时间复杂度也随之增加.
4)事务的平均宽度: 事务的平均宽度的增加将导致频繁项集的最大长度的增加, 因此也增加了遍历次数.
由于智慧控制系统中控制项数比较大, 传统Apriori算法需要多次扫描每条数据记录, 产生候选集的执行效率低, 对频繁项集Lk–1进行连接得到候选集Ck的时间复杂度为
步骤1. 实际控制过程中会存在一些重复控制命名, 为排除此类数据对搜索的影响, 根据操作时间的关联性, 对控制模式数据集进行筛选, 排除干扰项, 产生数据项集T.
步骤2. 根据照明设备控制方式将控制模式数据分为四类: 单灯级别控制T1, 回路级别控制T2, 主控箱级别控制T3, 综合级别控制T4. 初始化控制模式数据集
$ Support(A \Rightarrow B) = \frac{{(A,B).Weight}}{{{G_i}.count}} $ | (3) |
步骤3. 遍历图Gj, 删除支持度小于支持度阈值的边及度为0的节点, 生成满足最小支持度的2-频繁集L2, 设i=2.
步骤4. 遍历Gj, 生成i+1-候选集Ci+1, , 对于不满足支持度阈值项进行剪枝操作, 生成满足最小支持度的i+1-频繁项集, 记为Li+1. 重复步骤4, 直至搜索到最大频繁项集.
步骤5. 重复步骤3, 4分别完成T2、T3及T4的频繁项集搜索.
步骤6. 计算频繁项集中的置信度, 如式(4)所示, 若该项集的置信度大于最小置信阈值则为符合条件的关联规则.
$Confidence(A \Rightarrow B) = \frac{{(A,B).count}}{{A.count}}$ | (4) |
算法流程如图6所示.
5 系统的实现及分析本系统经过大量的数据测试后已成功运用在实际应用中, 系统首页界面如图7所示, 系统可以实现对于每个照明设备的监控, 故障及状态信息在界面中以实时显示. 表1所示为系统数据库中的控制命令集合, 由表中数据可发现相关联的动作发生的间隔时间比较短, 因此在数据处理时将时间间隔在1分钟内的控制数据作为一条记录. 对部分数据列表进行筛选处理后, 形成
为减少传统的Apriori算法遍历数据集的次数, 遍历控制数据集生成命令节点的无向加权图, 如图8(a)所示, 图中共计10个顶点代表数据集中10项控制命令, 顶点之间的权值代表支持数, 设最小支持度为2/10=0.2, 即最小支持数为2, 初始化加权图即为2-候选集. 遍历C2删除所有小于支持度阈值的边, 删除由此产生的度为0的顶点, 形成如图8(b)所示的2-频繁项, 删除无回路节点形成如图8(c)所示3-候选集, 最终形成如图8(d)所示的频繁项.
图9为传统Apriori算法的执行过程, 与传统算法相比改进算法利用无向加权图的形式保存了节点之间的支持度, 无需多次扫描原始数据集, 只需遍历当前加权图, 利用权值筛选出满足最小支持度阈值的频繁项集, 效率明显优于传统Apriori算法.
表3记录了关联规则及其置信度.
在系统应用环境中, 经多次测试, 将最小置信度为0.6时, 关联规则用户体验效果最好. 根据设置的最小置信度, 筛选出强关联规则如表4所示.
由此可推出3号, 4号及5号灯在开灯的时候具关联性, 系统提示开灯关联提醒, 提醒界面如图10所示, 用户可利用此界面直接设置控制命令, 或微调后设置, 减少用户手动选择操作的步骤及经验依赖值, 提高工作效率.
在实际应用中, 对历史控制数据中的进行分类处理, 得出关联规则后的照明控制模型, 工作效率明显优于传统的手工操作, 控制执行效率比较图如图11所示.
6 总结智慧照明监控系统可实现对于照明设备的实时监测及控制管理, 基于关联规则的控制模块可减少系统对管理人员经验的依赖程度, 利用关联规则挖掘出控制命令之间的隐藏联系, 在人工操作过程中对于强关联规则给予一定的智能提示, 提高工作人员操作的效率, 进一步提高了整个智慧照明监控系统的智能化程度. 鉴于Apriori算法多次搜索数据集效率低下, 利用加权图给出改进算法, 将控制命令设置为图中节点, 权值设置为节点间的支持数, 通过遍历图的方式对数据集进行扫描, 最终找出控制命令之间的强关联规则, 该算法减少数据集搜索次数, 提高挖掘效率, 应用在智慧照明监控系统中具有一定的社会推广价值.
[1] |
李德仁, 姚远, 邵振峰. 智慧城市中的大数据. 武汉大学学报·信息科学版, 2014, 39(6): 631-640. |
[2] |
李今. 大数据分析在城市照明管理系统中的应用. 软件导刊, 2015, 14(5): 1-4. |
[3] |
王敏, 武阳, 王宁, 等. 基于物联网架构的智能照明系统的设计与实现. 电工技术学报, 2015, 30(S1): 110-114. |
[4] |
余建波, 宗卫周, 王涛, 等. 城市智慧照明控制系统研究与实现. 计算机工程与设计, 2018, 39(3): 836-841. |
[5] |
Hand D, Mannila H, Smyth P. 数据挖掘原理. 张银奎, 廖丽, 宋俊, 译. 北京: 机械工业出版社, 2003. 271–283.
|
[6] |
李宁, 王晓东, 吴建德, 等. 遗传算法在高速公路隧道照明智能优化中的应用. 中南大学学报(自然科学版), 2013, 44(S1): 342-345. |
[7] |
高新勤, 马强华, 张艳平. 数控机床故障诊断关联规则挖掘方法研究. 制造业自动化, 2016, 38(10): 14-19. DOI:10.3969/j.issn.1009-0134.2016.10.004 |
[8] |
刘莉萍, 章新友, 牛晓录, 等. 基于Spark的并行关联规则挖掘算法研究综述. 计算机工程与应用, 2019, 55(9): 1-9. DOI:10.3778/j.issn.1002-8331.1811-0425 |
[9] |
王志超, 孙建斌, 秦瑞丽. 基于分词的关联规则预测系统研究. 计算机应用与软件, 2018, 35(12): 140-143. |
[10] |
刘军煜, 贾修一. 一种利用关联规则挖掘的多标记分类算法. 软件学报, 2017, 28(11): 2865-2878. DOI:10.13328/j.cnki.jos.005341 |
[11] |
张海涛, 汪佩佩, 张波波, 等. 快照查询匿名集关联规则的概率化挖掘方法. 南京邮电大学学报(自然科学版), 2017, 37(5): 68-73. |
[12] |
于守健, 周羿阳. 基于前缀项集的Apriori算法改进. 计算机应用与软件, 2017, 34(2): 290-294. DOI:10.3969/j.issn.1000-386x.2017.02.052 |
[13] |
陈碧云, 丁晋, 陈绍南. 基于关联规则挖掘的电力生产安全事故事件关键诱因筛选. 电力自动化设备, 2018, 38(4): 68-74. |
[14] |
黄俊杰, 谭波, 陈孝明, 等. 用Apriori关联规则挖掘算法发现湖北电网雷击灾害的时空分布规律. 应用科学学报, 2017, 35(1): 31-41. DOI:10.3969/j.issn.0255-8297.2017.01.004 |
[15] |
连雁平. 基于关联规则的海量重复数据消除系统设计. 现代电子技术, 2018, 41(23): 27-31. |