電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
在檔案數(shù)字化加工過程中,想要完成紙質(zhì)檔案數(shù)字轉(zhuǎn)化,提高檔案查詢效率,實現(xiàn)檔案信息共享,離不開檔案數(shù)字化整理步驟。
檔案數(shù)字化整理步驟
1、檔案整理
檔案工作人員拿到檔案后,首先要對檔案進行分類整理,包括對檔案進行統(tǒng)一編號,核對檔案頁碼,粘貼頁撕開,頁號編寫有誤的重新編號,對可拆訂的做拆訂處理,以便掃描時的批次處理。
如果發(fā)現(xiàn)折皺不平影響后期掃描質(zhì)量的文件,應(yīng)進行相應(yīng)處理;如果文件存在破損,應(yīng)先進行技術(shù)修復(fù)并做好標注;對于文件破損嚴重不能修復(fù)的應(yīng)做好區(qū)分標注。
2、著錄標引
將整理后的檔案,按照國家標準《檔案著錄規(guī)則》結(jié)合用戶檔案著錄的具體要求,將案卷目錄和卷內(nèi)目錄的原始數(shù)據(jù)、主題標引、分類標引錄入到軟件數(shù)據(jù)庫里。要求人工錄入結(jié)合校對,校對以軟件校對和打印輸出、對比較對相結(jié)合。按照原件實體檔案條目,對錯誤檔案目錄數(shù)據(jù)修改和補充的數(shù)據(jù),須填寫更改資料并放入案卷內(nèi),卷內(nèi)目錄不全的需補充完整。
檔案著錄標引,即檔案前處理工作,是建立手工和機讀檢索系統(tǒng)的基礎(chǔ),是實現(xiàn)檔案檢索工作的中心環(huán)節(jié)。
3、檔案掃描
檔案掃描是紙質(zhì)檔案實現(xiàn)數(shù)字轉(zhuǎn)化的關(guān)鍵步驟。原件的掃描與存儲格式應(yīng)完全按照國家檔案管理的統(tǒng)一標準要求掃描,對實際掃描卷數(shù)、每卷的頁數(shù)要做好登記。
檔案數(shù)字化掃描質(zhì)量標準
原檔案每頁掃描形成的電子必須完整齊全。
掃描形成的電子不能傾斜,必須平整。
掃描形成的電子不能有黑邊,不能有噪點。
原檔案頁不缺邊不殘邊,掃描形成的電子不能缺邊不能殘邊。
掃描前錄入的檔案電子信息必須與原檔案信息一致,避免錄入錯字、別字。
保持掃描儀玻璃面潔凈無粉塵,鍵盤要及時清理碎屑。
掃描影像要保持字跡清晰、不失真、不留文字版面外的陰影、無干擾信息。
掃描留下的墨跡寬度不得超過0.5厘米,并且指印和黑色不能覆蓋或影響正文內(nèi)容。
4、圖像檢查和處理
掃描完成后,應(yīng)采用自動化處理和人工處理相結(jié)合的方式,逐張檢查圖像質(zhì)量,包括圖像順序與檔案原件是否一致,有無漏掃、重張等情況,圖像有無黑邊、折角以及圖像偏斜度、清晰度、失真度等,發(fā)現(xiàn)不符合圖像質(zhì)量要求時及時進行調(diào)整改正,確保圖像順序正確、質(zhì)量完美。
5、全文OCR識別
如果項目要求實現(xiàn)全文檢索,在掃描圖像處理完成后,需將數(shù)字圖像利用專業(yè)的識別軟件進行全文OCR。
如果用戶對識別成功率有嚴格要求,還需另外進行人工校對,校對結(jié)束后將版式還原及轉(zhuǎn)換成雙層PDF文件格式,可實現(xiàn)無障礙的全文檢索。
6、數(shù)據(jù)掛接
借助系統(tǒng)軟件對數(shù)據(jù)庫中的目錄數(shù)據(jù)與對應(yīng)的紙質(zhì)檔案數(shù)字圖像進行匹配掛接,并逐條對掛接結(jié)果進行檢查,包括目錄數(shù)據(jù)與紙質(zhì)檔案數(shù)字圖像對應(yīng)的準確性、已掛接數(shù)字圖像與實際掃描數(shù)量的一致性、數(shù)字圖像是否能正常打開等,以實現(xiàn)目錄數(shù)據(jù)與數(shù)字圖像的準確關(guān)聯(lián)。
掛接到檔案管理系統(tǒng)中后,進行再次的成品驗收并做好還卷及數(shù)據(jù)備份提交。
檔案工作是國家“十四五”規(guī)則的重點產(chǎn)業(yè),《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》明確指示,新一代信息技術(shù)廣泛應(yīng)用,檔案工作環(huán)境、對象、內(nèi)容發(fā)生巨大變化,迫切要求創(chuàng)新檔案工作理念、方法、模式,加快全面數(shù)字轉(zhuǎn)型和智能升級。