Application of Data Mining in Value-Added Measurement Services
-
摘要: 计量业务管理信息化、证书报告数字化为各级计量技术机构积累了海量数据,这些数据大多用于检定或校准结果的合法性判定,其潜在价值没有得到充分挖掘。本文通过分类分析、聚类分析和关联分析等方法,分析了数据挖掘在计量增值服务中的应用途径和意义,并以实例的形式证明计量大数据挖掘可为客户提供优质高效的增值服务,产生良好的社会效益和经济效益。Abstract: In activities associated with measurement information management, institutions have accumulated a large amount of data in the process of digitalization of certificates and reports. The data are generally used to verify that calibrated parameters of instruments conform to legal requirements. The potential value of these data is often be ignored. This paper is concerned with mining the potential value of the measurement big data for value-added customer services. Methods of classification analysis, cluster analysis and association analysis are applied in this paper. It shows that data mining is an efficient method for digging measurement big data for social and economic benefits.
-
Key words:
- measurement data /
- value-added services /
- data mining /
- cluster analysis
-
表 1 基于计量数据挖掘的增值服务
Table 1. Value-added services based on measuring data mining
客户分类 增值服务 计量行政管理 辖区内计量标准地理分布,计量标准运行状态 强制检定计量器具工作量 支柱产业对新建计量标准的需求 计量器具制造 区域销售量 首轮检定合格率 水电气表集团用户组网方案 新产品研发摸底试验和标准验证 工作计量器具用户 产品选型 测量方案可靠性 计量标准器具用户 功能与计量特性 长期稳定性 计量技术机构 研究测量方法 研制专用测量仪器 科研成果转化 表 2 客户与水表关联关系表
Table 2. Relationship between customer and water meter
类别 客户 与水表的关系 A A1、A2、A3 研制满足市场需要的合格产品 B B1、B2 摸底试验、型式评价实验,出具合格报告 C C1、C2 首次检定合格率 D D1、D2、D3 水务公司、小区物业公司选表组网,抄表收费 E E1、E2、… 家庭用户用水交费 表 3 电能表电磁兼容性能与故障关联关系表
Table 3. Relationship between electromagnetic compatibility performance and fault of electric energy meter
试验项目 故障模块 置信度 高频脉冲 电源模块 0.51 计量模块 0.71 显示模块 0.43 通信模块 0.32 时钟模块 0.44 静电放电 电源模块 0.61 计量模块 0.74 显示模块 0.31 通信模块 0.22 时钟模块 0.13 射频辐射电 电源模块 0.15 计量模块 0.53 显示模块 0.51 通信模块 0.41 时钟模块 0.11 雷电 电源模块 0.41 计量模块 0.77 显示模块 0.61 通信模块 0.44 时钟模块 0.31 表 4 水表远程协议及基表接口聚类分析结果
Table 4. Cluster analysis results of water meter remote protocol and base meter interface
分析项目 类别 聚类数量 远程协议 GPRS 11 CDMA 13 LoRa 17 NB-IOT 8 其他 3 基表类型 卡式 16 光电直读 33 其他 3 表 5 协调创新仪器测量参数聚类分析结果
Table 5. Cluster analysis results of measurement parameters of coordinated and innovative instruments
分析项目 类别 聚类数量 专业分类 几何量 537 热学 165 力学 388 电磁学 232 电子学 732 时间频率 573 电离辐射 139 声学 108 光学 577 化学 1033 -
[1] 全国法制计量管理计量技术委员会. 法定计量检定机构考核规范: JJF1069-2012[S]. 北京: 中国标准出版社, 2012. [2] 琚会婧. 数据挖掘技术在客户关系管理(CRM)中的应用研究[D]. 唐山: 华北理工大学, 2019. [3] 卢永才. 数据挖掘在电信增值业务中的应用[J]. 现代经济信息, 2019(11): 419. [4] 姜海洋, 田锋, 智峰, 等. 基于爬虫和深度学习的计量信息数据推送系统[J]. 计量科学与技术, 2021, 65(9): 35-39. doi: 10.12338/j.issn.2096-9015.2020.9030 [5] 崔伟群, 田锋, 李颖. 数字计量学导论[M]. 北京: 中国质检出版社, 2014: 3-112. [6] 朱美娜. 浅析“度万物 量天地 衡公平”[J]. 中国计量, 2016(8): 61. [7] 李雄飞, 董元方, 李军. 数据挖掘与知识发现[M]. 第2版. 北京: 高等教育出版社, 2010. [8] 张博. 大数据时代的数据挖掘技术与应用[J]. 数字技术与应用, 2020, 38(12): 35-37. [9] 邵芬娟, 侯真威. 数据挖掘在服装领域的应用分析[J]. 纺织科技进展, 2021(2): 1-5. [10] 程一芳. 数据挖掘中的数据分类算法综述[J]. 数字通信世界, 2021(2): 136-137,140. doi: 10.3969/J.ISSN.1672-7274.2021.02.060 [11] 李安香, 沈庆飞, 周鑫, 等. 基于能源计量提高数据中心PUE准确性的方法[J]. 计量科学与技术, 2021, 65(9): 44-47. doi: 10.12338/j.issn.2096-9015.2020.9010 [12] 吴锦池, 余维杰. 融合知识库语义的文本聚类研究[J/OL]. 情报杂志: 1-9[2021-05-09]. http://kns.cnki.net/kcms/detail/61.1167.G3.20210415.1409.026.html. [13] 郝一凡. 关联分析的方法及应用[J]. 大学数学, 2003(4): 12-16. [14] 卜乐平, 毛骁峰, 陈鹏辉, 等. 基于数学模型算法预测计量标准稳定性的方法探讨[J]. 计量技术, 2020(6): 50-52. [15] 陈岳飞, 徐学林, 朱美娜, 等. 国家现代先进测量体系的基本内涵、生成逻辑及实现路径[J]. 中国测试, 2021, 47(2): 1-5. doi: 10.11857/j.issn.1674-5124.2020110146