2. 河北省气象局, 石家庄 050021
2. Meteorological Bureau of Hebei Province, Shijiazhuang 050021 China
2013年, 杨来青等以青岛市档案馆为例提出了智慧档案馆建设的总体构想[1]. 此后全国范围内关于“智慧档案馆”的研究和实践日趋增多. 青岛[2]、张家港[3]、威海[4]、丽水[5]、珠海[5]等市以及阳泉矿区[5]的档案部门已经开展了智慧档案馆建设实践. 行业方面, 张磊波等以电力企业档案馆为例, 介绍了企业智慧档案馆的内涵及建设路径[6]. 吴新宇就“大数据”时代建设医院“智慧档案”的必要性和主要思路提出了若干思考[7]. 系统建设方面, 李欣设计一种基于数字水印技术的医院电子档案管理系统[8], 曲丹秋设计了基于物联网的图书与档案智能管理系统[9], 于英香分析了人工智能嵌入档案管理的特征[10], 蔡志强基于云计算技术设计一种电子档案辅助信息查询系统[11], 容依媚等2019年对我国智慧档案馆研究的167篇文献进行了梳理, 研究的范围包含智慧档案馆的概念和特点、结构和功能、关键技术、建设方案、信息服务等多个方面[12]. 国外, 相关国家正在政策推动人工智能嵌入到档案管理中, 英国国家档案馆发布的《数字战略》强调通过机器学习技术开展数据收集工作[13]. 芬兰国家档案馆签署人工智能合作协议, 推动数据系统互操作性与开放性[14]. 目前, 以物联网、人工智能、大数据、云计算等信息技术来设计和建设档案业务系统, 提升档案的管理和利用能力逐步在业界得到共识.
气象档案种类丰富, 分为8个基本类目, 包括党务、气象事业管理、气象观测记录、气象业务技术、气象科学研究、气象基本建设、气象仪器装备和气象标准计量[15], 其中气象观测记录、气象仪器装备和气象标准计量为气象行业特有. 气象档案不仅是研究气候变化不可或缺的重要资源, 也是国家重要的科技资源. 目前安徽省档案馆馆藏的纸质档案超过千万页, 电子档案每年以10 TB级以上增加. 如何改变气象档案的管理模式, 推进气象档案的共享利用能力是气象档案业务的重要内容.
2018年, 中国气象局为提升气象行业档案业务现代化能力, 要求安徽、河北、山东和湖北4省开展数字(智慧)气象档案馆试点建设, 重点建设面向气象现代化需求的气象档案业务系统, 满足本行业及社会部门对气象档案的利用需求.
2 总体设计思想安徽省气象档案业务系统主要承担安徽省气象档案的收集、整理、保管和利用任务, 气象档案业务系统内容实体是档案, 需要解决的核心问题是档案从收集端到用户端业务流程的规范性和可操作性问题, 主要目的是如何保护好档案并为用户提供高效快捷的档案服务. 因此系统的设计理念为以档案为核心, 以业务流程为主线, 以需求为导向, 以信息技术为支撑, 深入分析各类档案的特点和规格. 在梳理气象档案现有流程的基础上, 重点开展物联网、大数据等信息技术改进业务流程的应用研究[16], 理顺流程和功能之间的关系, 分析不同阶段用户对档案收集、整理、保管和利用需求, 设计规范的安徽省气象档案业务系统, 业务系统省级部署, 面向全省应用.
3 系统的结构和功能 3.1 系统功能结构安徽省气象档案业务系统主要包括档案收集、整理、保管、利用和鉴定5个子系统建设. 功能结构见图1. 档案收集子系统包含移交任务创建、移交申请、移交审批、移交检查和移交预处理模块. 移交任务创建、移交申请提交、移交审批流程和电子档案接收检查直接在档案业务系统中完成, 实体档案接收检查只需在系统中登记检查结果.
档案整理子系统不仅包含案卷级、卷内文件和RFID标签元数据整理, 也包含档案知识库整理和相应的质量检查模块. 负责对收集到的档案进行分类、组合、编号和编目, 使之有序化, 电子档案的有序化过程由系统直接完成, 实体档案只以元数据的形式在系统登记有序化的结果.
档案保管子系统主要包含档案定期检查、备份管理、变更、盘点统计、保管环境管理和消毒登记模块. 不仅负责档案保管中的定期质量检查、备份、内容和元数据变更、盘点和统计工作, 也负责保管环境中温度、湿度、空气质量、安防和消防系统的管理以及档案定期消毒登记等工作.
档案利用子系统主要包含档案元数据查询和全文检索、实体档案出馆和不出馆借阅、电子档案跨馆检索、专题档案检索和档案编研模块. 面向部门内、行业和社会公众用户, 提供包括档案借阅申请、审批和查询检索等服务方式.
档案鉴定子系统主要包含档案价值、密级、保存时间、保存方式和销毁等鉴定模块. 负责按照鉴定流程对档案定级定密, 价值鉴定重点选出本行业内国家级或省级珍贵气象档案. 密级鉴定按照气象档案保密级别进行, 保存时间鉴定按照中期、长期或永久来鉴定. 保存方式鉴定主要鉴定档案是否需要数字化、数据化或是否需要双套制备份. 销毁鉴定模块主要鉴定超过保存期限的档案是否销毁及销毁流程和方式.
3.2 系统总体设计安徽省气象档案业务系统总体架构层次上按照基础设施平台层、智能物联层、档案资源层和业务应用层的模型设计, 总体架构见图2. 基础设施平台层主要为业务系统提供基础设施资源, 主要包括计算资源、存储资源和网络资源. 计算资源主要为服务器和虚拟机. 网络资源包括气象业务内网、智能传感器局域网和无线射频网, 其中气象业务网直接依赖安徽省气象信息中心现有的业务网络来设计和建设, 主要实现气象档案业务系统与其它业务系统之间的数据交换; 智能传感器局域网和无线射频网需结合智能物联系统来新建, 主要实现温度、湿度、空气质量、烟感和漏水检测等传感器与业务系统之间的内部数据交换. 存储资源主要包括光盘库、移动硬盘库、气象私有云存储系统等离线和在线存储系统.
智能物联层主要包括智能安防管理、环境感知和控制、实体档案管理和可视化展示利用. 智能物联网设备实时收集档案馆环境信息和档案资源状态信息, 为档案保管、安防、环境监控和利用提供技术支持.
数据资源层建立在基础设施平台层和智能物联设备层之上, 为应用层提供数据资源, 主要包括馆藏档案整理著录而成的元数据库、纸质档案数字化形成的文件库、原生电子类档案库、知识图谱构建形成的知识库、档案编研形成的专题档案资源库、档案馆智能物联系统运行形成的温、湿、空气质量、视频监控等环境管理数据和业务系统正常运行需要的后台管理数据.
应用层直接面向用户提供包括档案收集、整理、保管、查询利用和档案鉴定等服务.
标准规范体系是安徽省气象档案业务系统建设的依据, 也是实现档案资源共享和交换的基础, 需要根据安徽省数字气象档案业务系统建设需求建立相应的标准体系.
安全保障体系是构建符合分级、等级保护的信息安全体系.
3.3 系统总体信息流程气象档案业务系统流程按照档案收集、整理、保管和利用顺序依次展开. 档案收集按照档案移交和审核顺序开展, 档案整理形成档案描述数据(元数据)库和档案库, 档案保管对象为档案库、元数据库、知识库和管理信息库, 档案利用就是对保管的档案开展借阅、查询和浏览, 系统信息流程图见图3.
4 关键技术 4.1 气象档案标准化体系
安徽省气象档案业务系统是全国省级气象档案业务的先行试点系统, 需要联合其他试点省共同制定气象档案业务标准体系, 主要包括业务流程、保管环境监测技术、档案资源, 气象档案服务接口等标准规范. 其中业务流程类规范规定了气象档案生命周期中档案收集、整理、保管和利用业务流程. 保管环境监测类技术规范定义了实体(主要是纸质)和电子档案保管环境中温度、湿度、光线、安防等方面的要求. 档案资源类标准规范是档案生命周期中与档案资源相关的标准规范, 该类标准与档案本质属性密切相关, 主要包括气象档案资源的案卷级元数据、卷内文件级元数据、电子标签元数据、质量检测以及数字化等标准规范. 气象档案服务接口规范定义了访问档案业务系统的接口.
通过系统性建立(或应用)气象档案标准体系框架, 安徽省气象档案业务系统全面规范了气象档案生命周期的流程和环境技术要求, 实现业务系统的标准化和规范化, 为跨省或跨行业档案资源的互访提供了基础.
4.2 元数据应用元数据是描述数据的数据, 气象数据管理中多将元数据技术应用于对数据资源的描述[17-19]. 气象档案业务系统设计了三类元数据用于气象档案的存储管理和共享服务, 包括案卷级、卷内文件级和RFID电子标签元数据. 案卷级元数据以卷为最小著录实体形成元数据, 元数据内容主要包含但不限于: 档案馆编码、全宗号、档案名称、分类号、地域号、档案产生单位、档案起止时间、档号、关键词、立卷单位、立卷时间、组卷方式、每卷件数、每卷页数、容量大小、密级、保管期限、存放位置、盒号、信息化情况、存档介质等数据元素. 卷内文件级元数据以页纸或单个文件为最小著录实体形成元数据, 著录内容与案卷级元数据大多相同, 部分字段有所调整. RFID电子标签元数据主要描述每卷档案电子标签的内容, 目前共定义或预留了7个数据元素, 由必备项、可选项和预留项组成. 必选项包括: 标签版本、档案馆编码、位置信息、缩写的档号. 可选项包括: 保密等级、保管期限. 预留项暂时不定义内容, 可方便业务实践中的需要扩充.
4.3 知识图谱技术应用近几年, 为提升数据智能利用能力, 不少行业都在探索构建适合本领域的知识图谱[20-23]. 查询公开的技术论文, 气象或档案行业知识图谱构建论文鲜有发表, 基于气象档案查询需求, 需要构建气象档案中蕴含的知识单元及其语义关系. 具体技术路线是以安徽省馆藏气象记录档案资源和档案元数据为基础, 通过自顶向下的方式设计概念层及层次关系来构建本体库, 选择“气象记录档案”作为最顶层核心概念, 次核心概念为“气象档案文件”、“气象记录档案形成”和“气象记录档案管理”3类, 核心概念的归纳整理注意本体中类的设计秉承独立性、共享性原则[24], 最终从顶向下定义了气象记录档案领域的28个核心概念. 设计了物理、空间、观测、时间和事件6种本体关系模型, 将档案的来源、收集、整理、保管和利用中产生的概念和属性都归属到6种关系模型中. 基于本体库对接馆藏档案实体构建知识模型, 分别采取D2RQ、图像识别和定制包装器对不同存储格式的档案和档案元数据进行知识抽取构建数据层, 通过建立气象档案同义词库和敏感词库等来完成知识融合, 利用MySQL和Neo4j数据库分别完成气象记录档案知识库建设. 概念—实体—属性映射关系样例如图4所示.
4.4 智能物联技术应用物联网技术在档案馆建设中的应用研究是近几年档案业务的一个热点应用[25]. 物联网技术与档案业务的深度结合正在深刻地影响或改变着档案的管理和服务模式. 物联网技术在档案管理中的应用是指通过无线射频识别技术、红外感应技术、定位技术、环境感知传感设备、视频监控设备和运算设备, 按照约定的协议, 实现档案管理员与借阅人、馆藏档案实体和智能设备之间的协同工作[26].
4.4.1 档案馆环境智能管理技术基于物联网技术, 开发环境监控系统, 实现了馆区环境监控设备之间的协调联动工作. 通过监控视频发现活体运动轨迹、人脸识别设备控制门禁、温度传感器控制空调、湿度传感器控制加湿机抽湿机、光线传感器控制光线控制器、空气质量传感器控制空气净化器、烟雾报警器控制烟雾报警开关等物联网技术实现了活体抓拍、门开关、温度、湿度、空气质量、光线强弱、烟雾报警等设备的自动监控管理. 通过在环境监控系统设置各种环境感知信息的阈值范围和设备联动机制, 实现了温度、湿度、漏水检测、光线等环境信息、视频监控信息和语言告警信息在不同设备之间、设备和档案管理员之间的互动和协同工作. 大大提高了档案管理员对档案环境的感知和管控能力. 当漏水检测传感器报警时, 摄像头联动拍照部分代码如下:
//设置摄像头拍摄角度, 其中xyz为坐标
int wPanPos = Integer.parseInt(x, 16);
int wTiltPos = Integer.parseInt(y, 16);
int wZoomPos = Integer.parseInt(z, 16);
moveCamera.wPanPos = (short) wPanPos;
moveCamera.wTiltPos = (short) wTiltPos;
moveCamera.wZoomPos = (short) wZoomPos;
Pointer lpInBuffer =
moveCamera.getPointer();
moveCamera.write();
//转动摄像头到拍摄角度
boolean lHandle =
hCNetSDK.NET_DVR_SetDVRConfig(lUserID,
HCSDK.NET_DVR_SET_PTZPOS, chanle,
lpInBuffer, lpInBuffer.SIZE);
System.out.println("lHandle: " +
lHandle);
………
//设置图片分辨率
HCSDK.NET_DVR_JPEGPARA m_jPEGPARA = new
HCSDK.NET_DVR_JPEGPARA();
m_jPEGPARA.wPicSize = 5;
m_jPEGPARA.wPicQuality = 2;
//摄像头拍摄并保存拍摄照片
result =
hCNetSDK.NET_DVR_CaptureJPEGPicture(l
UserID, chanle, m_jPEGPARA, path);
……
//回复摄像头原来的位置
result = CameraUtil.setCameraLocation(ip, port,
username, password,
String.valueOf(Integer.toHexString(ol
d_wPanPos)),
String.valueOf(Integer.toHexString(ol
d_wTiltPos)), z);
4.4.2 实体档案自动识别及管理技术射频识别(RFID)是一种无线通信技术, 可以通过无线电讯号识别特定目标并读写相关数据, 而无需在识别系统与特定目标之间建立机械或者光学接触[27].
每个密集架架位布设RFID架位标签, 每卷气象档案均贴有RFID标签. 通过室内定位技术与电子射频RFID技术联合使用, 档案管理员在借阅和归还档案的过程中, 通过系统提示或者扫描RFID, 获取档案位置, 借助密集柜上的位置提示灯亮起, 能快速找到密集柜的位置和档案所在柜内位置. 对于归还的档案通过扫描档案RFID标签, 档案业务系统自动补充登记档案归还信息, 实现档案的快速归还. 在档案库房门禁处增加了RFID读取设备, 当贴有RFID标签的档案通过门禁时, 读取设备自动判识出库档案是否获得出入授权, 并对非法出库档案进行现场语音告警或短信通知档案管理员.
5 应用示例 5.1 首页气象档案业务系统首页主要分为检索区、信息展示区、特色服务区、专题资源区、快捷功能区和顶部常用菜单等6个区域. 检索区提供类别和区域等关键词检索; 信息展示区显示最新工作动态及热搜点击率排名前列的信息; 特色服务提供包括档案馆简介、资源导航、可视化档案、科技展览及知识图谱等档案特色服务内容; 专题档案提供中国气象百年站、珍贵档案、重大气象活动等内容服务. 快捷功能区根据用户角色提供了需要处理和关注的功能入口; 顶部常用菜单分别显示了“首页”、“资源导航”、“研学中心”、“登录”、“使用说明”、“业务流程图”等常用的菜单链接. 首页部分画面如图5所示.
5.2 档案元数据整理
档案管理人员登陆系统后, 菜单展开后点击“档案登记”, 右侧显示已归档登记的档案信息页面(见图6). 页面上部区域为查询区, 选择查询条件后点击“查询”, 在页面的下部区域列出符合查询条件的档案元数据信息. 档案管理人员可进行档案元数据的新增、修改、删除、查看等. 可以通过模板批量导入元数据信息, 批量导入功能需要使用系统提供的模块, 先点击“模板下载”下载模板维护好数据信息再回传.
5.3 档案保管环境集成监控借助安徽省气象局业务内网, 将相隔5 km的省气象档案主库房(第一库房)、文书档案库房和财务档案库房环境信息集成到业务系统中集中显示(见图7), 实时监控可以集中展示档案馆库房中温度、湿度、水浸、烟雾、光照等实时数据信息, 采用图形化的展示方式, 便于管理员进行查看、调控.
5.4 档案利用
档案经过案卷级和文件级元数据整理, 形成条目数据, 条目数据与档案图像挂接, 用户在查询元数据时可实现对档案元数据及图像文件的查询与检索. 档案利用人员登录后进入首页, 通过查询找到要检索的档案, 点击查看(见图8).
6 小结
本文研究和设计了智慧档案馆建设背景下安徽省气象档案业务系统的功能、总体架构和数据流程及关键技术. 通过物联网和知识图谱等信息技术的应用, 改变了传统气象档案的管理和服务模式, 为丰富气象档案资源, 开展气象档案的智能化利用打下了良好的基础. 目前, 该系统已在安徽省气象部门实际业务环境中投入业务运行, 提高了安徽省气象档案服务水平和效率. 后续将重点开展知识图谱技术架构下的档案编研能力, 进一步推动气象档案的分析挖掘、价值发现和社会化应用能力, 更大程度实现档案资源的价值.
[1] |
杨来青, 徐明君, 邹杰. 档案馆未来发展的新前景: 智慧档案馆. 中国档案, 2013(2): 68-70. |
[2] |
青岛市档案局. 青岛市智慧档案馆投入试运行. http://www.qingdao.gov.cn/n172/n24624151/n24631595/n24631609/n24631637/150605161439540514.html, (2015-06-05).
|
[3] |
蒋建峰, 金怿. 智慧档案馆建设的实践与探索. 档案与建设, 2019(2): 46-50. DOI:10.3969/j.issn.1003-7098.2019.02.014 |
[4] |
林永茂, 于荧荧. 威海市智慧档案馆建设探索与实践. 中国档案, 2020(5): 40-41. |
[5] |
贺奕静, 杨智勇. 智慧档案馆的智慧服务功能及其实现. 档案与建设, 2019(11): 28-32. |
[6] |
张磊波, 刘迁, 吴品才. 智慧城市视域下企业智慧档案馆的内涵及建设路径——以电力企业为例. 档案与建设, 2019(3): 45-48. DOI:10.3969/j.issn.1003-7098.2019.03.012 |
[7] |
吴新宇. “大数据”时代公立医院“智慧档案”建设之思考. 档案与建设, 2019(10): 53-55, 46. DOI:10.3969/j.issn.1003-7098.2019.10.016 |
[8] |
李欣. 基于数字水印技术的医院电子档案管理系统设计. 现代电子技术, 2020, 43(5): 78-81. |
[9] |
曲丹秋. 基于物联网的图书与档案智能管理系统. 现代电子技术, 2018, 41(1): 165-168. |
[10] |
于英香, 赵倩. 人工智能嵌入档案管理的逻辑与特征. 档案与建设, 2020(1): 4-8. |
[11] |
蔡志强. 基于云计算的电子档案辅助信息查询系统设计. 现代电子技术, 2019, 42(11): 108-112. |
[12] |
容依媚, 肖秋会. 我国智慧档案馆研究综述. 北京档案, 2019(8): 15-18. DOI:10.3969/j.issn.1002-1051.2019.08.005 |
[13] |
The national archives digital strategy. https://www.nationalarchives.gov.uk/documents/the-national-archives-digital-strategy-2017-19.pdf, (2017-03-01).
|
[14] |
The National Archives of Finland. National archives, national library of Finland and CSC to use artificial intelligence. https://www.arkisto.fi/news/2237/3728/, (2018-06-11).
|
[15] |
中国气象局. QX/T 223-2013 气象档案分类与编码. 北京: 中国气象出版社, 2014.
|
[16] |
田雷. 物联网技术在智慧档案馆建设中的应用研究. 档案学通迅, 2015(1): 60-64. |
[17] |
祝婷, 李湘. WMO信息系统中气象元数据的设计与实现. 应用气象学报, 2012, 23(2): 238-244. DOI:10.3969/j.issn.1001-7313.2012.02.013 |
[18] |
魏亮, 刘士彬, 王杰生. 基于元数据目录服务的地理空间数据共享. 遥感技术与应用, 2005, 20(6): 616-619. DOI:10.3969/j.issn.1004-0323.2005.06.015 |
[19] |
王国复, 徐枫, 吴增祥. 气象元数据标准与信息发布技术研究. 应用气象学报, 2005, 16(1): 114-121. DOI:10.3969/j.issn.1001-7313.2005.01.013 |
[20] |
刘家玮, 刘波, 沈岳. 知识图谱在农业信息服务中的应用进展. 软件, 2015, 36(3): 26-30. DOI:10.3969/j.issn.1003-6970.2015.03.006 |
[21] |
张德政, 谢永红, 李曼, 等. 基于本体的中医知识图谱构建. 情报工程, 2017, 3(1): 35-42. |
[22] |
陈亚东, 鲜国建, 寇远涛, 等. 我国苹果产业知识图谱构建研究. 中国农业资源与区划, 2017, 38(11): 40-45. DOI:10.7621/cjarrp.1005-9121.20171106 |
[23] |
王巍巍, 王志刚, 潘亮铭, 等. 双语影视知识图谱的构建研究. 北京大学学报(自然科学版), 2016, 52(1): 25-34. |
[24] |
刘宇松. 本体构建方法和开发工具研究. 现代情报, 2009, 29(9): 17-24. |
[25] |
杨靖, 朋礼青. 人工智能对智慧档案馆的驱动作用研究. 北京档案, 2019(1): 9-13. |
[26] |
杨辉, 王毅. 物联网与嵌入式系统的关系研究. 计算机与现代化, 2011(8): 126-129. DOI:10.3969/j.issn.1006-2475.2011.08.035 |
[27] |
何志俊. 基于物联网RFID技术的智慧图书馆研究. 图书情报导刊, 2016, 1(6): 33-35. DOI:10.3969/j.issn.1005-6033.2016.06.011 |