2021年11月,國務院辦公廳頒發《關于全面加強新時代語言文字工作的意見》,提出推進語言文字基礎能力和服務能力建設等五項重要任務。現階段,語言文字在人們生產生活中的應用以知識密集型的文檔形式居多,如何借助自然語言處理、知識圖譜、光學字符識別等人工智能關鍵技術實現文檔處理的自動化、數字化、智能化,近年備受學術界和產業界關注。
為促進智能文檔處理技術和產品的標準化及規范化發展,中國信息通信研究院(以下簡稱“中國信通院”)聯合多家核心參編單位,共同編制標準《自然語言處理技術及產品評估方法 第8部分:智能文檔處理系統》。標準總體分為技術能力、產品能力和應用能力三個模塊,聚焦產品技術性能優越度、功能完備度和應用成熟度提出技術要求和評估方法。
目前,中國信通院已參考上述標準完成首輪智能文檔出處理產品評測,累計為4家企業提供8個模塊的產品評測。10月25日至28日,衛士通人工智能數據安全分析服務平臺參與中國信通院組織的第二輪“可信AI”智能文檔處理測評工作,并順利完成技術能力模塊測評。此次測評,共涉及2個能力域、10個能力項和20余項關鍵指標,全方位評估智能文檔處理通用技術和專用技術的性能指標。
本次參測的衛士通人工智能數據安全分析服務平臺在智能文檔處理的通用能力和AI核心能力方面均表現優異。在通用能力方面,該平臺在信息抽取、表格文字識別、表格結構識別、版面分析、文檔分類等文檔處理能力均有較高的支持度。在AI核心能力方面,該平臺在文本分類、實體識別、關系抽取、事件抽取、光學字符識別等指標上的準確率、召回率、F1值總體較高。
由于業務量不斷增長,企業對智能化處理文檔的需求也在不斷增加,隨之產生的數據堆積和安全等問題亟待解決。在此背景下,衛士通融合自然語言處理、知識圖譜、光學字符識別等人工智能關鍵技術打造人工智能數據安全分析服務平臺,支持解決多場景下的文檔信息處理、數據安全問題。該平臺依托先進的深度學習算法和海量的數據積累,提供文檔智能處理、敏感數據檢測、數據智能分級分類等一體化服務,實現企業文檔流程化、自動化、智能化處理,并全面保障企業文檔數據內容安全,助力金融、交通、醫療、政務等多種領域業務場景智能升級。
新聞延伸
AI工程化推進委員會:2017年10月初,工業和信息化部正式批復中國信息通信研究院承建人工智能關鍵技術和評測工業和信息化部重點實驗室(以下簡稱“部重點實驗室”)。
中國信通院為進一步推動我國人工智能的工程化進程,依托部重點實驗室成立了AI工程化推進委員會。委員會聚焦人工智能開發工具和平臺,AI研發運營和管理,大模型應用,知識計算應用和AI數據集治理等技術方向,以產業活動、研究報告、標準和評測、最佳實踐等手段,推動人工智能工程化相關的工具、系統、流程和治理體系的完善。