檔案管理方案解決政府紙質(zhì)檔案管理困境
作者:admin
更新時間:2022-03-22
點擊數(shù):
近年來隨著我國電子政務(wù)發(fā)展迅速,國家大力推進(jìn)政務(wù)信息化建設(shè)。根據(jù)最新修訂的《中華人民共和國檔案法》,要求各級人民政府將檔案信息化納入信息化發(fā)展規(guī)劃,保障電子檔案、傳統(tǒng)載體檔案數(shù)字化成果等檔案數(shù)字資源的安全保存和有效利用。如何將海量的政府文檔數(shù)據(jù)結(jié)構(gòu)化,構(gòu)建每個字符文字都可分析、可檢索、可相互關(guān)聯(lián)的大數(shù)據(jù),成為政府亟待解決的課題。 應(yīng)對這一難題,最有效的方式就是完善檔案資料管理系統(tǒng),而涉及到檔案錄入、紙質(zhì)信息讀取存儲的任務(wù)幾乎都離不開OCR技術(shù)。為此,在OCR領(lǐng)域深耕多年的廈門推出了檔案管理系統(tǒng),幫助政府企業(yè)建立獨立的檔案電子數(shù)據(jù)庫。 檔案管理解決政府紙質(zhì)檔案管理困境 政府傳統(tǒng)的紙質(zhì)檔案管理模式無法解決各個部門文件的統(tǒng)一管理問題,導(dǎo)致了檢索查找非常不便捷,檢索不到、檢索不準(zhǔn)、編研利用不方便、沒有全文本無法做大數(shù)據(jù)等都是一個個數(shù)據(jù)利用難題。同時,全國檔案數(shù)量巨大,一直以來,檔案文本內(nèi)容數(shù)字化都面臨著成本高、效率低、周期長的困境。 運(yùn)用OCR文字識別技術(shù)和大數(shù)據(jù)等互聯(lián)網(wǎng)技術(shù)手段,可以為政府檔案數(shù)據(jù)由“圖像化”向“文本化”轉(zhuǎn)換提供了實現(xiàn)路徑。研發(fā)的檔案管理系統(tǒng)在傳統(tǒng)OCR技術(shù)研發(fā)基礎(chǔ)上,加入了大數(shù)據(jù)和深度學(xué)習(xí)的算法,識別率高、速度快,抗干擾能力強(qiáng)。 檔案管理系統(tǒng)通過的OCR全文識別技術(shù),可以實檔案自動全文識別、全文數(shù)據(jù)快速檢索、文檔美化、智能糾錯等功能,并幫助政府建立檔案大數(shù)據(jù),在節(jié)省政府人力的同時,提高了政府的運(yùn)行效率。 檔案管理系統(tǒng)核心模塊介紹 OCR全文識別:利用先進(jìn)的OCR技術(shù),對圖片中的所有文字信息數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。支持印刷體、手寫體及定制化場景的圖片文字識別,有效提升信息錄入效率。 快速全文檢索:圖片全文識別后,可以利用檢索引擎進(jìn)行圖片內(nèi)容的全文檢索,以字搜圖。支持全文內(nèi)容模糊檢索以及關(guān)鍵詞檢索,并在原圖中高亮顯示檢索內(nèi)容位置。 圖像美化處理:對上傳圖像,系統(tǒng)可以進(jìn)行自動切邊、傾斜校正、增強(qiáng)美化、壓縮存儲等美化處理。去污、糾偏、去黑邊,提高掃描圖像質(zhì)量。 文本信息導(dǎo)出:隨時隨地,進(jìn)行文檔導(dǎo)出分享,導(dǎo)出格式包含pdf、word、txt、純文檔圖片,提高團(tuán)隊文檔的高效協(xié)作。