一份老旧纸质档案,经过OCR图像识别转换后,瞬间自动生成为一份可编辑、可检索、可智能分析的数字档案,智能技术让“沉睡”的档案“活”起来了。
近日,由南方新闻网自主研发的“档案数字化管理系统”上线,面向机关、企事业单位提供档案数字化转换、存储及管理服务。该产品将OCR图像识别技术和自然语言处理技术应用到档案管理工作中,使档案管理工作实现数字化、智能化、智慧化。
今年3月,《中华人民共和国档案法实施条例》施行,要求“开展传统载体档案数字化工作,保证档案数字化成果的质量和安全”。“档案数字化管理系统”精准对标国家档案管理的政策要求,符合机关、企事业单位档案工作标准规范。该产品具备OCR图像识别能力,可将pdf、png、jpg等图片格式转换为文字,即将纸质档案经扫描或拍照形成图片后,自动生成数字文档,实现历史档案“存量数字化”。该产品还可批量导入excel、word、zip等格式电子文件,实现新档案“增量数字化”。为满足用户快速获取档案信息的需求,产品还配备了全文检索功能,用户可按照门类、关键词、日期等条件进行组合检索,在海量的数字化档案中迅速找到所需信息,极大地提高档案使用效率。
南方新闻网自主研发的“档案数字化管理系统”
“档案数字化管理系统”档案检索功能界面
数据安全和技术安全是档案信息化的重中之重。南方新闻网“档案数字化管理系统”集成了自主研发的图像智能识别、文本语义识别等关键核心技术,获得了“一种文字识别方法及装置”等多项国家发明专利,实现国产化操作系统适配,确保档案数字化转换、存储和管理过程中的技术安全、数据安全。
产品获得“一种文字识别方法及装置”“一种内容校对方法、装置、移动终端及存储介质”“一种文本纠错数据的构造方法、装置和存储介质”三项国家发明专利
“档案数字化管理系统”是南方新闻网“南方云助”系列产品之一。近年来,南方新闻网围绕“媒体迫切需要、市场迫切需求”的领域大力开展核心技术攻关,形成“南方云安”“南方云媒”“南方云数”“南方云助”四大产品服务矩阵,服务领域从媒体传统业务拓展至政务服务、信息系统开发、软件平台租赁、大数据挖掘分析、网络安全运维等领域,已为广东全省逾6000家党政机关、人大政协机关、群团组织、企事业单位提供数字化技术服务,并部分应用于中直机关和部分省外单位。
接下来,南方新闻网将持续探索运用信息化、智能化技术助力档案数字化工作转型升级,使档案工作更好地融入数字政府建设中并发挥应有的重要作用。
南方网、粤学习记者 马丹楠