電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
在當(dāng)今數(shù)字化信息時代,檔案整理和數(shù)字化變得愈發(fā)重要和必要。隨著技術(shù)的進(jìn)步,許多組織和個人開始意識到將紙質(zhì)檔案轉(zhuǎn)換為數(shù)字形式的優(yōu)勢,如便捷性、可持續(xù)性和安全性。下面將為您介紹檔案整理數(shù)字化的流程:
上海數(shù)字化檔案掃描整理
?。ㄒ唬n案整理
在掃描之前,根據(jù)檔案管理情況,按下述步驟對檔案進(jìn)行適當(dāng)整理,并視需要作出標(biāo)識,確保檔案數(shù)字化質(zhì)量。
1、目錄數(shù)據(jù)準(zhǔn)備
按照《檔案著錄規(guī)則》(DA/T 18)等的要求,規(guī)范檔案中的目錄內(nèi)容,包括確定檔案目錄的著錄項、字段長度和內(nèi)容要求。如有錯誤或不規(guī)范的案卷題名、文件名、責(zé)任者、起止頁號和頁數(shù)等,應(yīng)進(jìn)行修改。
2、拆除裝訂
在不去除裝訂物情況下,影響掃描工作進(jìn)行的檔案,應(yīng)拆除裝訂物;將檔案原件的裝訂線拆除,排好順序,不得出現(xiàn)任何漏缺頁及順序差錯,更不能對檔案原件有任何損壞。
3、區(qū)分掃描件和非掃描件
按要求把同一案卷中的掃描件和非掃描件區(qū)分開。普發(fā)性文件區(qū)分的原則是:無關(guān)的重份的文件要剔除,有正式件的文件可以不掃描原稿。
4、頁面修整
對破損嚴(yán)重、無法直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、裱糊;
折皺不平影響掃描質(zhì)量的原件應(yīng)先進(jìn)行相應(yīng)處理(壓平或燙平等)后再進(jìn)行掃描。
5、檔案整理登記
制作并填寫紙質(zhì)檔案數(shù)字化加工過程登記表,詳細(xì)記錄檔案整理后每份文件的起始頁號和頁數(shù)。
?。ǘn案掃描
1、掃描方式(掃描前必須準(zhǔn)備一臺專業(yè)的平板掃描儀)
根據(jù)檔案幅面的大小(A4、A3、AO等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)擔(dān)描儀,如
工程圖紙可采用0號圖紙掃描儀進(jìn)行掃描。
普通A4紙質(zhì)文件,采用高速掃描儀的自動進(jìn)紙方式掃描;
紙質(zhì)過薄、透明的(如信紙、便簽紙)采用高速掃描儀的平板掃描;
紙質(zhì)過厚、照片等檔案采用高速掃描儀的平板掃描;
對文件頁面貼有附屬小頁面、紙張時,將大小頁面單獨在平板中掃描;2、掃描模式(紙質(zhì)檔案掃描一般采用黑白、灰度和彩色三種模式)
頁面為黑白兩色,字跡清晰的、不帶圖片的檔案材料,采用黑白方式;
頁面為黑白兩色,清晰度較差或者帶有圖片的檔案材料,以及頁面多為彩色文字的檔案,采用彩色或灰度模式(因情況而定);
頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,采用彩色模式掃描。
3、分辨率選擇
采用黑白、256級灰度模式掃描的文件,其分辨率選擇為不小于300DPI;
采用24位為彩色模式掃描的文件,其分辨率選擇為不小于200DPI。(以上模式分辨率的設(shè)定以A4紙張為標(biāo)準(zhǔn),其他規(guī)格紙張酌情處理)
掃描的線數(shù)、閥值、亮度、灰度、對比度等值可根據(jù)所掃描文件材料的清晰度進(jìn)行適當(dāng)?shù)恼{(diào)整;
需要時可根據(jù)原件的清晰度適當(dāng)調(diào)整掃描分辨率。如原件質(zhì)量較差且尺寸較小,可適當(dāng)提高分辨率;反之也可相應(yīng)減少分辨率,增減的多少以掃描后圖像按原尺寸顯示后是否清晰為準(zhǔn);
粘貼折頁與表格,對于粘貼折頁,可用大幅面掃描儀掃描,或先部分掃描后拼接;對部分字體很小、字跡密集的情況,可適當(dāng)提高掃描分辨率,選擇灰度掃描或彩色掃描,采用局部深化技術(shù)解決;對字跡與表格顏色深度不同的,采用局部淡化技術(shù)解決。
4、掃描登記
填寫交接登記表,登記掃描的頁數(shù)。核對每份文件的實際掃描頁數(shù)與檔案整理時填寫的文件頁數(shù)是否一致,不一致時應(yīng)注明具體原因和處理方法。
?。ㄈ﹫D像處理
對圖像進(jìn)行處理,以獲得最好的圖像質(zhì)量,保證圖像完整、端正、無扭區(qū)、版面無暗影、無干擾信息,主要完成圖像處理包括:去黑邊、去污點、糾偏等,處理完的圖像保存格式為PDF。
糾偏:對掃描過程中出現(xiàn)的偏斜圖像進(jìn)行整體糾正,包括自校和手校,保證數(shù)字圖像的偏斜角度小于1度(圖像偏斜不超過頁面內(nèi)半個文字);
旋轉(zhuǎn):按方字方向?qū)D片旋轉(zhuǎn)至正確方向,沒有文字的圖片,判斷其方向后進(jìn)行左旋、右旋、翻轉(zhuǎn)、旋轉(zhuǎn)等工具;
去污:對圖像頁面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì),去除數(shù)字圖像中影響可懂度的雜質(zhì),如去除黑邊、多余邊、污點;
裁邊:采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲空間。
刪除空白頁:將掃描后頁面之間的空白頁進(jìn)行刪除;
斷字修補:對部分文字不清楚可進(jìn)行修補;
反白字修正:將部分反白文字可進(jìn)行描述;
分割:將A3幅面的文件分割為兩份A4幅面的文件;
拼接:對大幅面檔案進(jìn)行分區(qū)掃描形成的多幅圖像,應(yīng)進(jìn)行拼接處理,合并為一個完整的圖像,以保證檔案數(shù)字化圖像的整體性。
?。ㄋ模﹫D像處理質(zhì)檢
主要對完成圖像深處理的檢查,不合要求的返回上一環(huán)節(jié)重新處理,如以下問題:
由于操作不當(dāng),造成掃描的圖像文件不完整或無法清晰識別時,應(yīng)重新掃描;
對圖像偏斜度、清晰度、失真度等進(jìn)行檢查。發(fā)現(xiàn)不符合圖像質(zhì)量要求時,應(yīng)重新進(jìn)行圖像的處理;
圖像處理的是否得當(dāng),嚴(yán)重的應(yīng)重掃,處理不當(dāng)?shù)膽?yīng)重新處理;
掃描圖像頁碼順序是否與原文件一致,有無漏掃、多掃(重復(fù))、紙張倒置等情況;
順序:如果頁碼不連續(xù),與原文不一致,需對頁面進(jìn)行排序;
漏掃:將漏掃的頁面重新掃描,并插入到正確的位置;
多掃:將多掃頁面刪除;
倒置:不符合要求的需進(jìn)行調(diào)整,保持與原文一致。
?。ㄎ澹﹫D像存儲
紙質(zhì)檔案目錄數(shù)據(jù)庫中的每一份文件,都有一個與之相對應(yīng)的唯一檔號,以該檔號為這份文件掃描后的圖像文件命名。多頁文件要合并為一個PDF,保存到指定的路徑,便于準(zhǔn)確掛接入庫,與檔案管理軟件中的目錄建立一一對應(yīng)的關(guān)系。再將所有文檔批量轉(zhuǎn)換為可以復(fù)制、檢索利用的雙層PDF格式,然后進(jìn)行光盤刻錄,確??啼浐玫墓獗P能正確地讀出,并做好標(biāo)識標(biāo)簽。
注:禁止用Word文檔保存掃描圖像。
?。┠夸浗◣?/p>
按照《檔案著錄規(guī)則》(DA/T 18)的要求進(jìn)行著錄,建立檔案目錄數(shù)據(jù)庫。目錄建庫應(yīng)選擇通用的數(shù)據(jù)格式。所選定的數(shù)據(jù)格式應(yīng)能直接或間接通過XML文檔進(jìn)行數(shù)據(jù)交換。
注:采用人工校對或軟件自動校對的方式,對目錄數(shù)據(jù)庫的建庫質(zhì)量進(jìn)行檢查。核對著錄項目是否完整、著錄內(nèi)容是否規(guī)范、準(zhǔn)確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進(jìn)行修改或重錄。
?。ㄆ撸?shù)據(jù)掛接
1、掛接前的數(shù)據(jù)關(guān)聯(lián)檢查
以紙質(zhì)檔案目錄數(shù)據(jù)庫為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應(yīng)文件夾時,要認(rèn)真核查每一份圖像文件的名稱與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖像文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否一致,圖像文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。通過每一份圖像文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的一致性和唯一性,建立起一一對應(yīng)的關(guān)聯(lián)關(guān)系,為實現(xiàn)檔案目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。
2、匯總掛接
檔案數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫,通過質(zhì)檢環(huán)節(jié)確認(rèn)為"合格"后,通過網(wǎng)絡(luò)及時加載到數(shù)據(jù)服務(wù)器端匯總。通過編制程序或借助相應(yīng)軟件,可實現(xiàn)目錄數(shù)據(jù)對相關(guān)聯(lián)的數(shù)字圖像的自動搜索、加入對應(yīng)的電子地址信息等,實現(xiàn)批量、快速掛接。
(八)數(shù)據(jù)驗收
一個全宗的檔案,數(shù)字化轉(zhuǎn)換質(zhì)量抽檢的合格率達(dá)到95%以上(含95%)時,給予以驗收“通過”。目錄數(shù)據(jù)庫與圖像文件掛接錯誤,或目錄數(shù)據(jù)庫、圖像文件之一出現(xiàn)不完整、不清晰、有錯誤等質(zhì)量問題時,抽檢標(biāo)記為"不合格"。
驗收"通過"的結(jié)論,必須經(jīng)分管領(lǐng)導(dǎo)審核、簽字后方有效。
填寫紙質(zhì)檔案數(shù)字化交接登記表。
?。ň牛?shù)據(jù)備份
經(jīng)驗收合格的完整數(shù)據(jù)應(yīng)及時進(jìn)行備份。著錄條目和全文數(shù)據(jù)進(jìn)行一式兩份DVD光盤刻錄。移交前檢測光盤讀取性能,抽查刻錄好的光盤影像質(zhì)量,主要包括備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完整、文件數(shù)量是否準(zhǔn)確等。不合格的需重新刻錄。數(shù)據(jù)備份后應(yīng)在備份介質(zhì)上標(biāo)注好盤內(nèi)文件內(nèi)容、類別、存入日期及光盤編號等,以便查找和管理。對保密的需標(biāo)明密級。
(十)裝訂
掃描工作完成后,拆除過裝訂物的檔案應(yīng)按檔案保管的要求重新裝訂?;謴?fù)裝訂時,應(yīng)注意保持檔案的排列順序不變,做到安全、準(zhǔn)確、無遺漏。
裝訂不能損害檔案原件。裝訂時應(yīng)按原有順序裝訂,案卷不掉頁、左邊和底邊整齊,保持拆卷前的原貌,并認(rèn)真做好檔案頁碼、頁數(shù)的檢查對較。
?。ㄊ唬呙枳⒁馐马?/p>
掃描前必需對文檔進(jìn)行拆除裝訂物,并檢查文檔內(nèi)是否藏有干擾物(如釘書釘、碎紙等),以免產(chǎn)生卡紙、損壞掃描儀,務(wù)必保持文檔干凈送入掃描儀中;
對破損嚴(yán)重、無法進(jìn)行掃描的原件要先進(jìn)行修復(fù)、裱糊;
褶皺不平影響掃描質(zhì)量的原件應(yīng)先壓平再進(jìn)行掃描;
對紙質(zhì)過薄、透明的(如信紙、便簽紙)、紙質(zhì)過厚、照片等采用高速掃描儀的平板掃描;
對文件頁面貼有附屬小頁面、紙張時,將大小頁面單獨在平板中掃描;
掃描完每一份文件,要對照原文仔細(xì)檢查掃描是否清晰、完整;
按要求使用掃描儀、清洗,并對每次使用完掃描儀進(jìn)行保潔,檢查是否關(guān)閉電源;
紙質(zhì)檔案數(shù)字化成果提供網(wǎng)上檢索利用時,應(yīng)有制作單位的電子標(biāo)識,并根據(jù)具體情況分別采用可下載或不可下載的數(shù)據(jù)格式。
總之,檔案整理數(shù)字化不僅是一項技術(shù)進(jìn)步的體現(xiàn),更是信息管理與保護(hù)的重要策略。通過合理規(guī)劃和實施數(shù)字化流程,我們不僅能夠提高信息獲取和利用的效率,還能為后續(xù)數(shù)據(jù)分析和業(yè)務(wù)決策提供可靠的基礎(chǔ)。
檔案整理數(shù)字化注意事項
在進(jìn)行檔案整理數(shù)字化的過程中,確保遵循一系列重要的注意事項是至關(guān)重要的。數(shù)字化檔案不僅有助于保護(hù)和保存重要文件,還能提高文件檢索的效率,確保信息的長期可用性。然而,要確保數(shù)字化過程的質(zhì)量和可持續(xù)性,需要注意以下幾點。
第一,采用科學(xué)的技術(shù)指標(biāo)。熟悉掌握檔案數(shù)字化相關(guān)的規(guī)范文件。例如,紙質(zhì)檔案掃描加工的主要技術(shù)參數(shù)要求涉及色彩模式、分辨率、存儲格式和壓縮率等。其中掃描色彩模式一般有黑白二值、灰度、彩色等。建議掃描分辨率不小于300dpi。
第二,采用規(guī)范的加工流程。檔案數(shù)字化加工的流程主要包括檔案整理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份、成果管理等。不可遺漏任何一個工作環(huán)節(jié),否則可能導(dǎo)致數(shù)字化成果不合格、不可用。
第三,采用嚴(yán)謹(jǐn)?shù)倪^程管理。在數(shù)字化加工過程中,建立問題反饋機制,階段性對數(shù)字化成果進(jìn)行檢驗和修正,加強對質(zhì)量的檢測和過程的監(jiān)控。
總之,檔案整理的數(shù)字化過程不僅僅是將紙質(zhì)文件轉(zhuǎn)化為數(shù)字格式,更是一個綜合性的項目,涵蓋了技術(shù)、管理和合規(guī)性等多個方面。遵循以上注意事項能夠確保數(shù)字化項目的成功實施和長期運行。
檔案整理數(shù)字化標(biāo)準(zhǔn)
在當(dāng)今數(shù)字化時代,檔案整理數(shù)字化已成為組織和機構(gòu)管理信息的重要組成部分。標(biāo)準(zhǔn)化的檔案數(shù)字化過程不僅能夠提升信息的可訪問性和長期保存的可靠性,還能有效支持歷史研究、文化傳承以及決策制定。
1.物理檔案準(zhǔn)備
確保檔案材料的完整性和安全性。
進(jìn)行清理、分類、編號和目錄化。
2.數(shù)字化設(shè)備和技術(shù)選擇
選擇適合的掃描設(shè)備,考慮分辨率、自動化程度和掃描速度。
確定最佳的文件格式,例如PDF/A、TIFF等。
3.數(shù)字化過程
制定詳細(xì)的數(shù)字化流程和操作標(biāo)準(zhǔn)。
考慮保護(hù)原件和合理使用自動化技術(shù)。
4.元數(shù)據(jù)管理
規(guī)劃和創(chuàng)建適當(dāng)?shù)脑獢?shù)據(jù),包括描述、版權(quán)和訪問控制信息。
確保元數(shù)據(jù)與檔案內(nèi)容的一致性和準(zhǔn)確性。
5.質(zhì)量控制和審核
設(shè)立質(zhì)量控制標(biāo)準(zhǔn)和審核機制,確保數(shù)字化成果的質(zhì)量和可靠性。
進(jìn)行周期性的質(zhì)量評估和技術(shù)更新。
6.長期保存和訪問
選擇適當(dāng)?shù)臄?shù)字存儲介質(zhì)和存儲環(huán)境,考慮數(shù)據(jù)安全和長期可訪問性。
制定長期保存策略和應(yīng)急計劃,確保檔案的持久性和可持續(xù)性。
總之,檔案整理數(shù)字化的標(biāo)準(zhǔn)化不僅涉及技術(shù)和操作流程,更關(guān)乎信息管理的長遠(yuǎn)發(fā)展和文化遺產(chǎn)的保護(hù)。通過遵循上述標(biāo)準(zhǔn),機構(gòu)可以更有效地管理和利用檔案資源,為社會提供更加開放和透明的信息服務(wù)。
檔案整理數(shù)字化的目的
檔案整理數(shù)字化是許多組織和個人的重要工作。數(shù)字化檔案不僅能有效管理信息,提高工作效率,還能保護(hù)文化遺產(chǎn),促進(jìn)知識傳承。
1.提高信息檢索效率
數(shù)字化檔案可以通過關(guān)鍵詞搜索和索引功能,快速準(zhǔn)確地找到需要的信息,避免了傳統(tǒng)檔案需要大量時間手動查找的問題。
2.有效保護(hù)檔案信息
數(shù)字化檔案具備數(shù)據(jù)備份和安全控制功能,能夠防止檔案遺失、損壞或被篡改的風(fēng)險。
3.促進(jìn)信息共享與傳播
數(shù)字化檔案可以輕松在網(wǎng)絡(luò)上共享,促進(jìn)全球范圍內(nèi)的信息傳播和學(xué)術(shù)研究合作。
4.節(jié)約存儲空間與成本
數(shù)字化檔案不再需要大量的實體存儲空間,節(jié)約了管理和維護(hù)成本。
綜上所述,檔案整理數(shù)字化不僅是信息管理現(xiàn)代化的重要步驟,也是保護(hù)和傳承文化遺產(chǎn)的重要手段。隨著技術(shù)的進(jìn)步和應(yīng)用范圍的擴大,數(shù)字化檔案將在更廣泛的領(lǐng)域發(fā)揮重要作用。因此,各個組織和個人應(yīng)當(dāng)意識到數(shù)字化檔案的價值,積極推動這一進(jìn)程,為未來的信息社會奠定堅實基礎(chǔ)。