電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
紙質(zhì)檔案數(shù)字化有哪些基本要求
紙質(zhì)檔案是以紙張作為載體的一種檔案,如保存?zhèn)洳榈墓膱D紙、信札、電報、戶籍、帳冊、契約、證書、書稿、日記、筆記、家譜的原本和原稿。以下我為大家整理了紙質(zhì)檔案數(shù)字化有哪些基本要求的詳細內(nèi)容,希望對大家有所幫助!
紙質(zhì)檔案數(shù)字化基本要求
1、基本原則
紙質(zhì)檔案數(shù)字化的基本原則是使檔案信息資源準確方便快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會對檔案利用的需求。
2、數(shù)字化對像的確定原則
應(yīng)當(dāng)對所要進行數(shù)字化的對象按照一定的原則和方法進行確認,只有符合一定要求的紙質(zhì)檔案文獻才能進行數(shù)字化。
1)符合國家法律法規(guī)的原則
紙質(zhì)檔案的數(shù)字化,必須符合國家檔案開放規(guī)定以及有關(guān)規(guī)定。
2)價值性原則屬于歸檔范圍且應(yīng)永久或長期保存的、社會利用價值高的'檔案可列入數(shù)字化加工的范圍。
3、基本環(huán)節(jié)
紙質(zhì)檔案數(shù)字化的基本環(huán)節(jié)主要包括:檔案整理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份、成果管理等。
檔案掃描
1、掃描方式
1)根據(jù)檔案幅面的大?。ˋ4、A3、A0等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可采用0號圖紙掃描儀)進行掃描。大幅面檔案可采用大幅面數(shù)碼平臺,或者縮微拍攝后的膠片數(shù)字化轉(zhuǎn)換設(shè)備等進行掃描,也可以采用小幅面掃描后的圖像拼接方式處理。
2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應(yīng)采用平板掃描方式;紙張狀況好的檔案可采用高速掃描方式以提高工作效率。
2、掃描色彩模式
1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。
2)頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進行掃描。
3)頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可采用灰度模式掃描。
4)頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進行掃描。
3、掃描分辨率
1)掃描分辨率參數(shù)大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。
2)采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均建議選擇≥200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當(dāng)提高分辨率。
3)需要進行OCR漢字識別的檔案,掃描分辨率建議選擇≥300dpi。
檔案數(shù)字標(biāo)準化是實現(xiàn)互聯(lián)互通、資源共享、業(yè)務(wù)協(xié)同的基石,檔案數(shù)字化建設(shè)同樣需要堅持標(biāo)準化原則。
我國 1998 年提出了信息化建設(shè)的二十四字方針(統(tǒng)籌規(guī)劃、國家主導(dǎo)、統(tǒng)一標(biāo)準、聯(lián)合建設(shè)、互聯(lián)互通、資源共享),其中第三條就是統(tǒng)一標(biāo)準,由此可見標(biāo)準化對于檔案數(shù)字化建設(shè)的重要作用和意義。
檔案數(shù)字化一般分兩塊,一部分是紙質(zhì)的“老檔案”,這部分檔案是過去計算機技術(shù)未大面積普及的情況下,手工書寫、紙質(zhì)化保存、庫房存儲。
采用人工方法進行查閱無需計算機就可以直接查看的紙質(zhì)檔案形式。
一部分是現(xiàn)在不斷生成的“新檔案”,這部分檔案是在當(dāng)前計算機技術(shù)、通信技術(shù)、網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)以及多媒體技術(shù)等新技術(shù)日益普及的情況下。
由計算機生成、各種存儲介質(zhì)保管存儲、采用數(shù)據(jù)庫+專用檔案管理軟件進行日常管理,只有在計算機條件下才可以查看的電子檔案形式。
對于“老檔案”而言,我們是通過掃描、拍照等方式,轉(zhuǎn)換成為計算機可以識別的圖片文件,再對其建立電子目錄來實現(xiàn)傳統(tǒng)檔案的數(shù)字化,故要對其生產(chǎn)的掃描型電子文件進行統(tǒng)一。
而對于“新檔案”而言,由于文件的生成階段就是電子文件信息,就要對其文字型電子文件、視頻和多媒體電子文件、音頻電子文件等文件格式進行統(tǒng)一。
所以說但不管是紙質(zhì)的“老檔案”還是當(dāng)前的電子文件形的“新檔案”,都應(yīng)該堅持標(biāo)準化原則,制定相應(yīng)的標(biāo)準和規(guī)范,按照統(tǒng)一的規(guī)范、標(biāo)準,使傳統(tǒng)介質(zhì)檔案數(shù)字化,電子文件歸檔,數(shù)字化檔案的保管、傳遞、利用等工作都實現(xiàn)有序化、標(biāo)準化和規(guī)范化,避免出現(xiàn)各自為政,互不兼容,重復(fù)建設(shè)等現(xiàn)象。
信息化建設(shè)必須有標(biāo)準化的支持,尤其要發(fā)揮標(biāo)準化的導(dǎo)向作用,以確保其技術(shù)上的協(xié)調(diào)一致和整體效能的實現(xiàn)。
本期主編:橙子
話不多說,進入正題了!
(1)紙質(zhì)檔案數(shù)字化需要相應(yīng)的設(shè)備和場所,數(shù)字化處理場所應(yīng)具有足夠的空間和合理的布局,并可配備門禁、防盜、視頻監(jiān)控等消防系統(tǒng)和安防系統(tǒng)。
(2)數(shù)字處理設(shè)備需要計算機、掃描儀、錄音機和存儲介質(zhì)。如果可以配置服務(wù)器、 備份設(shè)備、數(shù)碼相機等則更好。
(3)數(shù)字處理工作還需要相應(yīng)的軟件系統(tǒng)支持,如操作系統(tǒng)、文件管理軟件、掃描程序、錄音軟件、備份軟件、殺毒軟件等。 確保數(shù)字處理工作的安全和保障 。
要先將掃描儀連接到計算機,安裝驅(qū)動程序和掃描軟件后即可使用。工作人員應(yīng)能掌握和使用掃描儀的操作方法和掃描儀參數(shù)設(shè)置。
掃描動作并不復(fù)雜,就是把紙質(zhì)文件放入掃描儀,掃描,把文件取出掃描儀。
在掃描之前,我們必須設(shè)置掃描模式、掃描顏色模式、掃描分辨率和圖像存儲格式。
目前有手持式掃描儀、平板掃描儀、鼓式掃描儀、高射掃描儀、大幅面掃描儀、 膠片掃描儀等。根據(jù)需要和檔案的紙張質(zhì)量進行選擇。
顏色常常又和圖像存儲格式相關(guān)聯(lián),彩色圖像通常以JPG格式存儲,如果以TIFF格式存儲,占用空間比較大;
掃描分辨率是影響檔案直觀效果的重要參數(shù),通常的規(guī)定分辨率在300dpi以上。 具體要根據(jù)以上參數(shù)的確定,再進行亮度、對比度的微調(diào)。
標(biāo)準要求掃描圖像盡可能反映文件的原貌,但在掃描過程中,由于文件紙張寬度、紙張粗糙度、字跡散亂、顏色不均勻等因素。
在這些情況下,需要進行圖像處理操作,一般需要通過專門 的圖像處理軟件來實現(xiàn)。它要能夠?qū)崿F(xiàn)圖像拼接、圖像去污、修剪、旋轉(zhuǎn)、校正等圖像處理,確保圖像完整、正確 。
檢查員必須掌握紙質(zhì)文件數(shù)字化處理的標(biāo)準要求,檢查人員要盡職盡責(zé),要求做到100%檢查,并且合格率應(yīng)達到100%。
檢查的事項有圖像是否清晰、畫質(zhì)是否色彩失真、圖像是否傾斜、圖像上是否有陰影或黑點,圖片大小和格式是否符合規(guī)定等。
使用數(shù)字文件的方法基本上是通過目錄搜索數(shù)據(jù),要仔細的檢查目錄能否與圖像和數(shù)字 復(fù)印一一對應(yīng),檢查合格率應(yīng)為100%,發(fā)現(xiàn)問題時,必須重新修改完善。
將通過檢查的數(shù)據(jù)可以離線保存。應(yīng)根據(jù)數(shù)字檔案管理系統(tǒng)的設(shè)計模板建立包括圖像文件命名方法在內(nèi)的存儲結(jié)構(gòu),并 盡可能完整地描述相關(guān)文檔 。
包括人員登記表、數(shù)字化處理文件登記表、統(tǒng)計表、質(zhì)量檢查表、編碼描述文件、數(shù)據(jù)描述等。
這是掃描和處理工作完成之前的最后一項。將檔案數(shù)字化的成果移交檔案管理部門,移交內(nèi)容由檔案管理部門規(guī)定。
交接過程包括交接前的驗收和辦理交接手續(xù)。 交接手續(xù)時經(jīng)雙方蓋章確認后方才生效。
這期就說到這里,歡迎在評論區(qū)留下你的看法,覺得有用可以分享給身邊的人,我們下期再見。
在掃描之前,根據(jù)檔案管理情況,按下述步驟對檔案進行適當(dāng)整理,并視需要作出標(biāo)識,確保檔案數(shù)字化質(zhì)量。
?、倌夸洈?shù)據(jù)準備:按照《檔案著錄規(guī)則》等的要求,規(guī)范檔案中的目錄內(nèi)容。包括確定檔案目錄的著錄項、字段長度和內(nèi)容要求。如有錯誤或不規(guī)范的案卷題名、文件名、賈任者、起止頁號和頁數(shù)等,應(yīng)進行修改。
?、诓鸪b訂:在不去除裝訂物情況下,影響掃描工作進行的檔案,應(yīng)拆除裝訂物。拆除裝訂物時應(yīng)注意保護檔案不受損害。
?、蹍^(qū)分掃描件和非掃描件:按要求把同一案卷中的掃描件和非掃描件區(qū)分開。普發(fā)性文件區(qū)分的原則是:無關(guān)的重份的文件要剔除,有正或件的文件可以不掃描原稿。
紙制品 ?、茼撁嫘拚浩茡p嚴重、無法直接進行掃描的檔案,應(yīng)先進行技術(shù)修復(fù),折皺不平影響掃描質(zhì)量的原件應(yīng)先進行相應(yīng)處理<壓平或燙平等后再進行掃描。
?、輽n案整理登記:制作并填寫紙質(zhì)檔案數(shù)字化加工過程交接登記表單,詳細記錄檔案整理后每份文件的起始頁號和頁數(shù)。
⑥裝訂:掃描工作完成后,拆除過裝訂物的檔案應(yīng)按檔案保管的要求重新裝訂?;謴?fù)裝訂時,應(yīng)注意保持檔案的排列順序不變,做到安全、準確、無遺漏。