電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
紙質(zhì)檔案在進行檔案數(shù)字化作業(yè)時,除了遵循《紙質(zhì)檔案數(shù)字化規(guī)范DA/T31-2017》規(guī)范外,一般作為檔案部門需要再做些具體的技術(shù)控制措施以保證檔案數(shù)字化質(zhì)量,下面就部分具體情況做具體描述。
1)掃描時應(yīng)根據(jù)紙質(zhì)檔案的材質(zhì)選擇相應(yīng)的掃描設(shè)備和掃描方式,避免紙張褶皺、撕裂、破損等情況的發(fā)生,保證檔案不受損。
2)對紙張脆化、較古老、超薄的和不可拆卷的檔案需要采用專業(yè)不拆卷非接觸冷光源掃描儀進行掃描。
3)檔案掃描圖像色彩模式采用24位真彩式,采用TIFF格式存儲,按照統(tǒng)一標準對圖像文件命名,以目錄數(shù)據(jù)庫內(nèi)該文件檔號對掃描圖像進行分文件夾命名,標準以太和縣檔案館提供的技術(shù)標準為準。A4紙張大小檔案掃描的原始圖像文件和修圖后的圖像文件,必須是TIFF格式,采取適當比例壓縮,圖像文件容量大小控制在500KB至1.5MB,A3紙張大小的圖像文件控制在500KB至2MB。遇到大圖紙類型的特殊情況最大不超過5M。壓縮后的圖像文件應(yīng)清晰、完整,顏色無異常,放大100%比例時圖像不失真、無鋸齒點。
4)掃描分辨率為300DPI,對于案卷中出現(xiàn)字跡較小、較密集、貼有照片以及珍貴檔案等情況,分辨率提高到600DPI。掃描后的圖像應(yīng)清晰、不失真、完整、不影響圖像的利用效果和打印后的效果,掃描圖像的打印效果不能低于對應(yīng)的復(fù)印效果。
5)對于檔案中的“筒子頁”,一般應(yīng)平攤開后進行整幅掃描。大幅頁面可分頁掃描后,拼接成一頁。
6)掃描時應(yīng)認真核對實際掃描頁碼、頁數(shù)與前處理時填寫的頁碼、頁數(shù)是否一致,不一致時應(yīng)注明具體原因和處理方法。掃描時要保證放紙端正、不壓邊、不漏掃、錯掃,嚴格確保圖像質(zhì)量,漏掃、壓邊的要及時補全、補正。圖像順序要與原檔案中頁碼順序一致,不可顛倒錯亂,不可出現(xiàn)多頁、重復(fù)頁或漏頁現(xiàn)象。
7)圖像處理后保證圖像信息與原檔案內(nèi)容完全一致,不刪除頁面任何有用信息,包括正文內(nèi)容、頁眉、頁腳、手寫注釋和印鑒等,不裁切紙張部分。掃描的頁面內(nèi)容基本居中顯示,不出現(xiàn)明顯偏左或偏右現(xiàn)象。不準出現(xiàn)頁面內(nèi)容殘缺或?qū)⑵渌撁嫘畔呷氡卷摰默F(xiàn)象。
8)圖像處理后左右偏斜度控制在2度以內(nèi),視覺上基本無偏差。對方向不正確的圖像進行旋轉(zhuǎn)還原,以符合閱讀習(xí)慣。
9)對圖像頁面中四邊、四點由于掃描儀硬件、掃描軟件、人為原因等而出現(xiàn)的影響圖像質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等應(yīng)進行去污處理。殘缺頁、破損頁需用相應(yīng)大小白紙裱糊后方可進行掃描。處理過程中應(yīng)遵循在不影響可讀性和可理解性的前提下展現(xiàn)檔案原貌的原則,由于檔案本身因陳舊、破損或不潔等造成頁面上有污點的,如果在頁面視圖下無法看清,或該污點嵌在文本行中無法清除,可不予清除。
10)保證掃描圖像字跡清晰、顏色恰當,不宜過淺或過深,不出現(xiàn)字跡筆畫殘缺或字跡筆畫疊合而影響閱讀的情況。檔案原件存在斑跡變質(zhì)、顏色過淺、過深或深淺不一致時,保證檔案原件能辨認的掃描圖像也必須可以辨認。紙張?zhí)』蜃煮w顏色過濃,掃描時倒映反面文字,文字上的污點無法去污時,采取措施保證正文文字可以看清楚。
11)同一份文件如果紙張長寬尺寸一致,掃描后的圖像大小也需要基本保持一致,合并成PDF文件后,不允許出現(xiàn)明顯寬度、高度偏差(標準A4紙尺寸是21.0厘米*29.7厘米,掃描后電子圖片后為2480像素×3508像素。同一份紙質(zhì)檔案如果長寬尺寸一致,掃描后的電子圖像的像素誤差不能超過20像素)。
同一份文件,如果紙質(zhì)檔案材質(zhì)基本一樣,掃描后的圖片明暗度、色澤也需要基本保持一致。
同一份文件原則上采取同一型號同樣設(shè)置掃描儀進行掃描,如遇特殊情況,需要高掃、平板同時掃描,也需要保持掃描圖像分辨率、亮度、大小尺寸等一致。
檔案數(shù)字化圖像處理的要點
檔案數(shù)字化圖像處理是一個復(fù)雜的過程,需要關(guān)注多個重點方面,以確保最終的數(shù)字化檔案質(zhì)量和可靠性。以下是檔案數(shù)字化圖像處理的重點:
1.圖像采集:在數(shù)字化處理中,最重要的一環(huán)是圖像采集。高質(zhì)量的圖像采集設(shè)備和技術(shù)能夠直接影響數(shù)字化檔案的質(zhì)量。因此,確保采集設(shè)備的穩(wěn)定性、清晰度和色彩還原能力是非常重要的。
2.圖像清晰度和細節(jié)保留:清晰度和細節(jié)保留是數(shù)字化處理的重點之一。通過合適的分辨率和圖像處理算法,保證文本和細節(jié)信息在數(shù)字化后能夠被完整保留,以便后續(xù)的檢索和利用。
3.顏色準確性:對于彩色檔案,準確還原原始顏色是非常重要的。采用準確的色彩校正和還原技術(shù),確保數(shù)字化的檔案能夠呈現(xiàn)出與實際檔案相近的色彩,提供更真實的視覺體驗。
4.噪點和污漬去除:紙質(zhì)檔案常常受到污漬、斑點和折痕等問題的影響,這些對數(shù)字化圖像的質(zhì)量造成負面影響。因此,采用有效的圖像處理算法和技術(shù),去除這些噪點和污漬,是數(shù)字化處理的重點之一。
5.標準化格式和元數(shù)據(jù):選擇標準化的圖像格式,并添加適當?shù)脑獢?shù)據(jù)信息,有助于確保數(shù)字化檔案的長期保存和可管理性。同時,標準化的格式也有利于不同系統(tǒng)之間的互操作性。
總結(jié)來說,檔案數(shù)字化圖像處理的重點在于圖像采集質(zhì)量、清晰度和細節(jié)保留、顏色準確性、噪點和污漬去除,以及標準化格式和元數(shù)據(jù)管理。通過重點關(guān)注這些方面,可以確保數(shù)字化檔案的質(zhì)量和可靠性,為后續(xù)的檔案管理和利用提供良好的基礎(chǔ)。
檔案數(shù)字化圖像處理的流程
影像處理
旋轉(zhuǎn)及糾偏對不符合閱讀方向的影像應(yīng)進行旋轉(zhuǎn)還原。對出現(xiàn)偏斜的影像應(yīng)進行糾偏處理,以達到視覺上基本不感覺偏斜為準。
去污
應(yīng)對數(shù)字影像進行去污處理,以去除在數(shù)字化過程中產(chǎn)生的污點、污線、黑邊等影響影像質(zhì)量的雜質(zhì),應(yīng)遵循展現(xiàn)檔案原貌的原則,檔案數(shù)字化處理時不應(yīng)去除實物檔案保管過程中所形成的痕跡。
影像拼接
對分幅掃描形成的多幅影像,應(yīng)進行拼接處理,合并為一個完整的影像,以保證檔案數(shù)字化影像的整體性。拼接時應(yīng)確保拼接處平滑地融合,拼接后整幅影像無明顯拼接痕跡。
裁剪處理
對數(shù)字影像進行合理的裁剪處理,去除影像多余的部分,以有效縮小影像文件的容量,節(jié)省存儲空間。
降噪
去除三維掃描點云中由于外界因素(如光線、震動等)以及三維掃描儀本身的因素造成的無效點。
數(shù)據(jù)平滑
為了得到平滑模型及提高輪廓識別度,應(yīng)對三維掃描結(jié)果進行平滑處理,提高數(shù)據(jù)的平滑度,以更加接近實物檔案的幾何特征。
影像質(zhì)量檢查
由數(shù)字化處理人員對數(shù)字文件的質(zhì)量情況,如影像偏斜度、清晰度、失真度等進行檢查。對不符合質(zhì)量要求、數(shù)字化成果不完整或不清晰的應(yīng)重新數(shù)字化;數(shù)字文件整理秩序與實物檔案不一致的,應(yīng)及時進行調(diào)整。
數(shù)據(jù)掛接
應(yīng)借助相關(guān)軟件對數(shù)據(jù)庫中的目錄數(shù)據(jù)與其對應(yīng)的實物檔案數(shù)字影像進行掛接,以實現(xiàn)目錄數(shù)據(jù)與數(shù)字影像的關(guān)聯(lián)。
對掛接結(jié)果進行逐條檢查,包括目錄數(shù)據(jù)與實物檔案數(shù)字影像對應(yīng)的準確性、已掛接數(shù)字影像與實際掃描數(shù)量的一致性、數(shù)字影像是否能正常打開等,發(fā)現(xiàn)錯誤及時進行糾正。
最后進行數(shù)字化成果驗收與移交;驗收合格的數(shù)字化成果應(yīng)按照實物檔案數(shù)字化工作方案及時移交,并履行交接手續(xù)。
檔案歸還入庫
按照實物檔案入庫相關(guān)要求對完成數(shù)字化處理的檔案原件進行處理和清點,并履行檔案入庫手續(xù)。