電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
一、術(shù)語和定義1、數(shù)字化用計算機技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。2、紙質(zhì)檔案數(shù)字化采用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數(shù)字圖像或數(shù)字文本的處理過程。3、數(shù)字圖像表示實物圖像的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的連續(xù)圖像產(chǎn)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣——連續(xù)函數(shù),并在采樣點上將值最小化后的陣列。4、黑白二值圖像只有黑白兩級灰度的數(shù)字圖像。它對應(yīng)于黑白兩種狀態(tài)的文字稿、線條圖等。5、連續(xù)色調(diào)靜態(tài)圖像以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖像。在紙質(zhì)檔案數(shù)字化過程中,通常表現(xiàn)為灰度掃描和彩色掃描兩種模式。6、分辨率單位長度內(nèi)圖像包含的點數(shù)或像素數(shù),一般用每英時點數(shù)(dpi)表示。7、失真度對檔案進行數(shù)字化轉(zhuǎn)換后,數(shù)字圖像與檔案原件在色彩、幾何等方面的偏離程度。8、可懂度數(shù)字圖像向人或機器提供信息的能力。9、圖像壓縮清除圖像冗余或圖像近似的任一種過程,其目的是對圖像以更緊湊的形式表示。二、紙質(zhì)檔案數(shù)字化基本要求1、基本原則紙質(zhì)檔案數(shù)字化的基本原則是使檔案信息資源準確方便快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會對檔案利用的需求。2、數(shù)字化對像的確定原則應(yīng)當對所要進行數(shù)字化的對象按照一定的原則和方法進行確認,只有符合一定要求的紙質(zhì)檔案文獻才能進行數(shù)字化。1)符合國家法律法規(guī)的原則紙質(zhì)檔案的數(shù)字化,必須符合國家檔案開放規(guī)定以及有關(guān)規(guī)定。2)價值性原則屬于歸檔范圍且應(yīng)永久或長期保存的、社會利用價值高的檔案可列入數(shù)字化加工的范圍。3、基本環(huán)節(jié)紙質(zhì)檔案數(shù)字化的基本環(huán)節(jié)主要包括:檔案整理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份、成果管理等。4、 過程管理1)應(yīng)加強紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密管理機制,確保檔案原件和數(shù)字化檔案信息的安全.2 )紙質(zhì)檔案數(shù)字化的各個環(huán)節(jié)均應(yīng)進行詳細的登記,并及時整理、匯總,裝訂成冊,在數(shù)字化工作完成的同時建立起完整、規(guī)范的記錄。三、檔案整理在掃描之前,根據(jù)檔案管理情況,按下述步驟對檔案進行適當整理,并視需要作出標識,確保檔案數(shù)字化質(zhì)量。1 目錄數(shù)據(jù)準備2 拆除裝訂3 區(qū)分掃描件和非掃描件4 頁面修整5 檔案整理登記6 裝訂四、檔案掃描1、掃描方式1)根據(jù)檔案幅面的大小(A4、A3、A0等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可采用0號圖紙掃描儀)進行掃描。大幅面檔案可采用大幅面數(shù)碼平臺,或者縮微拍攝后的膠片數(shù)字化轉(zhuǎn)換設(shè)備等進行掃描,也可以采用小幅面掃描后的圖像拼接方式處理。2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應(yīng)采用平板掃描方式;紙張狀況好的檔案可采用高速掃描方式以提高工作效率。2、掃描色彩模式1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。2)頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進行掃描。3)頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可采用灰度模式掃描。4)頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進行掃描。3 、掃描分辨率1)掃描分辨率參數(shù)大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。2)采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均建議選擇≥100dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。3)需要進行OCR漢字識別的檔案,掃描分辨率建議選擇≥200dpi。4、掃描登登記認真填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)換過程交接登記表單,登記掃描的頁數(shù),核對每份文件的實際掃描頁數(shù)與檔案整理量填寫的文件頁數(shù)是否一致,不一致時應(yīng)注明具體原因和處理方法。五、圖像處理1 、圖像數(shù)據(jù)質(zhì)量檢查1)對圖像偏斜度、清晰度、失真度進行檢查。發(fā)現(xiàn)不符合圖像質(zhì)量要求時,應(yīng)重新進行圖像的處理。2)由于操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應(yīng)重新掃描。3)發(fā)現(xiàn)文件漏掃時,應(yīng)及時補掃并正確插入圖像。4)發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時,應(yīng)及時進行調(diào)整。5)認真填寫相關(guān)表單,記錄質(zhì)檢結(jié)果和處理意見。2、糾偏對出現(xiàn)偏斜的圖像應(yīng)進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的圖像應(yīng)進行旋轉(zhuǎn)還原,以符合閱讀習(xí)慣。3、去污對圖像頁面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等應(yīng)進行去污處理。處理過程中應(yīng)遵循在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。4、圖像拼接對大幅面檔案進行分區(qū)掃描形成的多幅圖像,應(yīng)進行拼接處理,合并為一個完整的圖像,以保證檔案數(shù)字化圖像的整體性。5、裁邊處理采用彩色模式掃描的圖像應(yīng)進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲空間。六、圖像存儲1、存儲格式1)采用黑白二值模式掃描的圖像文件,一般采用TIFF(G4)格式存儲。采用灰度模式和彩色模式掃描的文件,一般采用JPEG格式存儲。存儲時的壓縮率的選擇,應(yīng)以保證掃描的圖像清晰可讀的前提下,盡量減小存儲容量為準則。2)提供網(wǎng)絡(luò)查詢的掃描圖像,也可存儲為CEB、PDF或其他格式。2、圖像文件的命名1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每一份文件,都有一個與之相對應(yīng)的唯一檔號,以該檔號為這份文件掃描后的圖像文件命名。2)多頁文件可采用該檔號建立相應(yīng)文件夾,按頁碼順序?qū)D像文件命名。七、目錄建庫1、數(shù)據(jù)格式選擇目錄建庫應(yīng)選擇通用的數(shù)據(jù)格式。所選定的數(shù)據(jù)格式應(yīng)能直接或間接通過XML文檔進行數(shù)據(jù)交換。2、檔案著錄按照《檔案著錄規(guī)則》(DA/T18)的要求進行著錄,建立檔案目錄數(shù)據(jù)庫。3、目錄數(shù)據(jù)質(zhì)量檢查采用人工校對或軟件自動校對的方式,對目錄數(shù)據(jù)庫的建庫質(zhì)量進行檢查。核對著錄項目是否完整、著錄內(nèi)容是否規(guī)范、準確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進行修改或重錄。八、數(shù)據(jù)掛接1、匯總掛接檔案數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫,通過質(zhì)檢環(huán)節(jié)確認為“合格”后,通過網(wǎng)絡(luò)及時加載到數(shù)據(jù)服務(wù)器端匯總。通過編制程序或借助相應(yīng)軟件,可實現(xiàn)目錄數(shù)據(jù)對相關(guān)聯(lián)的數(shù)字圖象的自動搜索、加入對應(yīng)的電子地址信息等,實現(xiàn)批量、快速掛接。2、數(shù)據(jù)關(guān)聯(lián)以紙質(zhì)檔案目錄數(shù)據(jù)庫為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應(yīng)文件夾時,要認真核查每一份圖象文件的名稱與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖像文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否一致,圖像文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。通過每一份圖像文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的一致性和唯一性,建立起一一對應(yīng)的關(guān)聯(lián)關(guān)系,為實現(xiàn)檔案目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。3、認真填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)換過程交接登記表單,記錄數(shù)據(jù)關(guān)聯(lián)后的頁數(shù),核對每一份文件關(guān)聯(lián)后的頁數(shù)與檔案整理、掃描時填寫的頁數(shù)是否一致,不一致時應(yīng)注明具體原因和處理辦法。九、數(shù)據(jù)驗收1、數(shù)據(jù)抽檢1)以抽檢的方式檢查已完成數(shù)字化轉(zhuǎn)換的所有數(shù)據(jù),包括目錄數(shù)據(jù)庫、圖像文件及數(shù)據(jù)掛接的總體質(zhì)量。2)一個全宗的檔案,數(shù)據(jù)驗收時抽檢的比率不得低于5%。2、驗收指標1)目錄數(shù)據(jù)庫與圖像文件掛接錯誤碼,或目錄數(shù)據(jù)庫、圖像文件之一出現(xiàn)不完整、不清晰、有錯誤等質(zhì)量問題時,抽檢標記為“不合格”。2)一個全宗的檔案,數(shù)字化轉(zhuǎn)換質(zhì)量抽檢的合格率達到95%以上(含95%)時,給予以驗收“通過”。合格率:抽檢合格的文件數(shù)/抽檢文件總數(shù)×100%3、驗收審核驗收“通過”的結(jié)論,必須經(jīng)分管領(lǐng)導(dǎo)審核、簽字后方有效。4、驗收登記認真填寫紙質(zhì)檔案數(shù)字化驗收登記表單。十、數(shù)據(jù)備份1、備份范圍經(jīng)驗收合格的完整數(shù)據(jù)應(yīng)及時進行備份。2、備份方式為保證數(shù)據(jù)安全,備份載體的選擇應(yīng)多樣化,可采用在線、離線相結(jié)合的方式實現(xiàn)多套備份,并注意異地保存。3、數(shù)據(jù)檢驗備份數(shù)據(jù)也應(yīng)進行檢驗。備份數(shù)據(jù)的檢驗的內(nèi)容主要包括備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完整、文件數(shù)量是否準確等。4、備份標簽數(shù)據(jù)備份后應(yīng)相應(yīng)的備份介質(zhì)上做好標簽,以便查找和管理。5、備份登記填寫紙質(zhì)檔案數(shù)字化備份管理登記表單。十一、數(shù)字化成果管理1、應(yīng)加強對紙質(zhì)檔案數(shù)字化成果的管理,確保其安全、完整和長期可用。2、紙質(zhì)檔案數(shù)字化成果提供網(wǎng)上檢索利用時,應(yīng)有制作單位的電子標識,并根據(jù)具體情況分別采用可下載或不可下載的數(shù)據(jù)格式。
任何一個有一定存在歷史的機構(gòu),都有一定數(shù)量的紙質(zhì)檔案,將這些紙質(zhì)檔案數(shù)字化,有利于管理與利用。
下面,將以檢察院的紙質(zhì)檔案數(shù)字化為例,對檔案數(shù)字化處理的基本程序與方法予以介紹。
創(chuàng)建檔案管理分類架構(gòu)
檢察院的綜合檔案管理,分類架構(gòu)一般為:
文書檔案、財務(wù)檔案、聲像檔案、實物檔案、基建檔案、設(shè)備檔案、司法鑒定檔案、訴訟檔案和電子檔案等九大類,訴訟檔案是檢察院最為專業(yè)、也最為重要的檔案類型。
各級檢察院可根據(jù)自身管理需要,進行更詳細的檔案分類管理。
取卷
從庫房拿取需要數(shù)字化的紙質(zhì)實體案卷,取卷時注意:
準確記錄所取案卷的物理存放位置。
依次拿取,不要丟卷,確保案卷的完整。
檔案定義
檔案定義,是3Hmis的專用術(shù)語,實際上就是確定檔案的最底層分類的相關(guān)屬性,或稱案卷的相關(guān)屬性。3Hmis可同時管理紙質(zhì)檔案和數(shù)字化檔案,如果3Hmis已存在相關(guān)案卷信息,此步驟可省略。
關(guān)于檔案定義的具體操作,前面已詳細介紹,這里不再重復(fù)。
拆卷
拆卷的含義是手工拆除案卷裝訂,如果紙質(zhì)實體案卷信息已保存在3Hmis系統(tǒng)中,還應(yīng)執(zhí)行取消注冊功能,相當于在3Hmis中執(zhí)行拆卷操作。
拆卷的注意事項:
保證案卷的完整,檢查是否有缺頁、漏頁及其它錯誤,正、副卷標注是否正確。
保持案卷的清潔。
拆開案卷,將案卷背面的封條小心撕干凈,剪開裝訂線。
取掉案卷中的金屬物。
將卷內(nèi)文件一頁頁分開,對單面、雙面等情況進行標注,以提醒掃描人員注意。
為了方便掃描及時與掃描人員溝通。
注明每卷(包括正、副卷)的頁數(shù)及其他的特殊情況。
如有疑問,應(yīng)及時向檔案管理員進行咨詢和溝通,不得擅自違規(guī)處理。
錄入卷內(nèi)文件信息
一份案卷,一般都由多份性質(zhì)相同或相似的文件組成,即所謂卷內(nèi)文件。
如果系統(tǒng)中已存在卷內(nèi)文件目錄,不必在錄入,若無,則采用新建文件的方法,錄入卷內(nèi)文件屬性信息。
掃描
對已錄入相關(guān)屬性的卷內(nèi)文件進行掃描,并將掃描結(jié)果文件引入(上傳)檔案系統(tǒng)。
3Hmis的圖片管理器內(nèi)嵌掃描處理程序,可在錄入卷內(nèi)文件信息的同時直接調(diào)用掃描模塊進行掃描(支持高速掃描儀),用戶亦可使用其它掃描程序掃描文件(但使用3Hmis提供的圖片管理器更為簡單方便),然后,再通過引入功能將掃描文件引入檔案系統(tǒng),3Hmis還提供了專門的批量引入工具。
如果檢察院有更嚴格的數(shù)字化檔案安全管理要求,并有專門用于歸檔的電子印章,可在掃描文件上加蓋歸檔專用的電子印章。
掃描時的注意事項如下:
根據(jù)需要設(shè)置掃描文件的格式和分辨率,3Hmis可對各種常用格式的數(shù)字化文件進行管理。
對于封面、內(nèi)頁、手寫訴狀或是發(fā)票等各類不同證據(jù)材料,需用不同的比例或掃描方法進行掃描。
根據(jù)規(guī)則設(shè)置掃描文件的存放位置和掃描結(jié)果文件的文件名(采用3Hmis圖片管理器掃描時,將自動上傳,股不需要存放在客戶端)。
將掃描頁數(shù)和拆卷人所注明的頁數(shù)核對,確保不重掃、漏掃、多掃,同時保證案卷的清晰度,對掃描結(jié)果不佳的頁面進行專門處理。
韋俊榮 張興霞 陳青
(中海油渤海石油管理局)
摘要 隨著油田信息技術(shù)應(yīng)用的逐步深化,企業(yè)地質(zhì)資料信息化的要求在傳統(tǒng)地質(zhì)資料信息化的基礎(chǔ)上,進一步延伸到地質(zhì)工作資料源頭、業(yè)務(wù)流轉(zhuǎn)過程、資料綜合利用全領(lǐng)域的企業(yè)數(shù)據(jù)治理,實現(xiàn)從傳統(tǒng)實體檔案管理、地質(zhì)樣品管理、電子文件管理上升到企業(yè)數(shù)據(jù)管理的更高水平。本文結(jié)合渤海油田地質(zhì)資料信息化實踐,闡述了油田地質(zhì)資料信息化建設(shè)的總體思路、發(fā)展歷程及取得成果,對其他領(lǐng)域的地質(zhì)資料信息化建設(shè)實踐具有一定的借鑒意義。
關(guān)鍵詞 地質(zhì)資料 信息化 數(shù)據(jù)資源
1 概述
中海油渤海油田油氣產(chǎn)量從21世紀初不足1000×104t 跨越到2010年的3000×104t,2015年將實現(xiàn)3500×104t,2020年計劃上產(chǎn)到4000×104t。隨著油氣田勘探、開發(fā)數(shù)量的日漸增加,館藏地質(zhì)資料中成果地質(zhì)檔案已達30余萬件,巖心7289m,巖屑59.8萬包,原油樣品6.2×104L,且每年正以數(shù)以萬計的速度快速增長。同時,隨著數(shù)字油田技術(shù)的不斷發(fā)展,人們在地質(zhì)資料利用的細粒度、結(jié)構(gòu)化、服務(wù)模式方面產(chǎn)生了更高的需求,這給油田地質(zhì)資料管理帶來了前所未有的挑戰(zhàn)。為此,渤海油田近6年來針對地質(zhì)資料管理業(yè)務(wù)中存在的客觀問題和應(yīng)用需求,以及結(jié)合國土資源部“地質(zhì)資料信息服務(wù)集群化產(chǎn)業(yè)化”的要求,在中海油勘探部及信息管理部的領(lǐng)導(dǎo)下,以國土資源部《地質(zhì)資料管理條例》精神為指導(dǎo),開展了不同層次、多種形式的信息化工作,特別是通過多個專題項目的實施,地質(zhì)資料信息化建設(shè)得到了空前的快速發(fā)展。不僅在地質(zhì)資料數(shù)據(jù)資源建設(shè)和應(yīng)用綜合管理平臺建設(shè)上取得了豐碩的成果,而且在地質(zhì)資料的管理方法、技術(shù)手段、體系建設(shè)上也有了很大的提高,扎實推進了地質(zhì)資料信息服務(wù)集群化產(chǎn)業(yè)化工作,使地質(zhì)資料信息的應(yīng)有價值得到進一步發(fā)揮,更好地實現(xiàn)了地質(zhì)資料信息服務(wù)于企業(yè)和社會的功能。
2 渤海油田地質(zhì)資料信息化建設(shè)
2.1 總體目標
渤海油田地質(zhì)資料信息化建設(shè)工作以“資料信息服務(wù)集群化產(chǎn)業(yè)化”為原則,全面提高地質(zhì)資料數(shù)字化信息化程度,不僅滿足企業(yè)和社會對各類地質(zhì)資料集中目錄檢索、全文檢索的利用需求,而且要全面提升地質(zhì)檔案信息化管理的整體水平,實現(xiàn)地質(zhì)資料管理從傳統(tǒng)實體管理上升到企業(yè)數(shù)據(jù)治理的更高水平,持續(xù)滿足后續(xù)數(shù)據(jù)專業(yè)應(yīng)用需求,為實現(xiàn)地質(zhì)資料專業(yè)數(shù)據(jù)集中管理、文檔一體化管理、數(shù)據(jù)資源整合挖掘和數(shù)據(jù)共享利用奠定堅實基礎(chǔ),從而為渤海油田科研生產(chǎn)、經(jīng)營管理等提供更有效的服務(wù),在真正意義上實現(xiàn)檔案管理工作為企業(yè)經(jīng)濟效益最大化服務(wù)。
2.2 信息化建設(shè)情況
根據(jù)油田地質(zhì)資料信息化建設(shè)的總體目標,渤海油田地質(zhì)資料信息化建設(shè)主要完成了數(shù)據(jù)資源建設(shè)、應(yīng)用系統(tǒng)平臺建設(shè)以及地質(zhì)資料信息化技術(shù)研究等工作。
2.2.1 地質(zhì)資料資源建設(shè)
渤海油田地質(zhì)資料資源建設(shè)是為地質(zhì)資料管理應(yīng)用平臺提供非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)以及元數(shù)據(jù)。渤海油田通過地質(zhì)資料資源建設(shè)基礎(chǔ)工作大幅度提高了地質(zhì)資料數(shù)字化信息化程度。目前油田地質(zhì)資料數(shù)字化程度已達到97%,為地質(zhì)資料深度綜合開發(fā)利用和數(shù)據(jù)共享打下了堅實的基礎(chǔ)。同時,在地質(zhì)資料資源建設(shè)過程中,渤海油田檔案管理部門還開展了地質(zhì)資料信息化標準規(guī)范體系研究,建立了支撐地質(zhì)資料信息化建設(shè)的規(guī)范制度體系。
2.2.2 應(yīng)用系統(tǒng)平臺建設(shè)
渤海油田在開展地質(zhì)資料資源建設(shè)的基礎(chǔ)上,開發(fā)了“地質(zhì)資料管理應(yīng)用平臺”,涉及“數(shù)字文檔中心”、“地質(zhì)檔案綜合管理系統(tǒng)”、“油田專業(yè)數(shù)據(jù)庫系統(tǒng)”等子系統(tǒng)。通過地質(zhì)資料管理和應(yīng)用平臺的建設(shè),不僅實現(xiàn)了多源頭地質(zhì)資料數(shù)據(jù)標準、格式規(guī)范化管理,同時實現(xiàn)了地質(zhì)資料數(shù)據(jù)的多層次應(yīng)用和系統(tǒng)間的互聯(lián)互通與信息共享。
2.2.3 地質(zhì)資料信息化技術(shù)研究和應(yīng)用
為了更好地推進地質(zhì)資料資源建設(shè)和系統(tǒng)平臺建設(shè)的工作,渤海油田還加強了地質(zhì)資料信息化技術(shù)研究,內(nèi)容主要包括地質(zhì)檔案數(shù)字化、地質(zhì)樣品數(shù)字化、石油地質(zhì)專業(yè)數(shù)據(jù)管理三大領(lǐng)域的研究,在開發(fā)實體檔案數(shù)字化、智能化管理的同時,研究地質(zhì)資料專業(yè)數(shù)據(jù)管理、石油數(shù)據(jù)模型、庫體結(jié)構(gòu)、非結(jié)構(gòu)化文檔分類、存儲及元數(shù)據(jù)管理標準等。隨著這些方面信息技術(shù)的積累和提升,不僅拓寬了渤海油田地質(zhì)資料深度綜合開發(fā)和利用的廣度,而且延伸了地質(zhì)資料信息服務(wù)的深度。
2.3 信息化實施歷程
2.3.1 第一階段(2009~2011年)
自2008年底開始,在渤海油田統(tǒng)一部署下,開展了以“資料電子化”、“勘探成果資源建設(shè)”、“開發(fā)生產(chǎn)井資源建設(shè)”3個專題為核心的信息化資源建設(shè)工作。項目實施以館藏歷史資料電子化掃描、文本OCR識別、文檔規(guī)范化整理為基礎(chǔ),開展地震、鉆井、錄井、測井、測試、分析實驗、油氣生產(chǎn)各專業(yè)資料的結(jié)構(gòu)化數(shù)據(jù)采集、規(guī)范化整理工作。
2.3.2 第二階段(2012~2013年)
自2011年底開始,在前期數(shù)據(jù)資源建設(shè)的基礎(chǔ)上,渤海油田開展了以資源管理、利用為目的的“數(shù)字文檔中心”、“勘探成果數(shù)據(jù)與資料數(shù)據(jù)系統(tǒng)”、“開發(fā)生產(chǎn)信息系統(tǒng)”等專題平臺建設(shè)和后續(xù)新增資料的資源建設(shè)工作。項目實施以油田個人工作文檔、公司電子文件、檔案資料3 級綜合管理體系建設(shè)為核心,面向油田勘探、開發(fā)、生產(chǎn)各業(yè)務(wù)領(lǐng)域,開展地質(zhì)資料移交、接收、整理、著錄、編目、管理、利用、匯交全過程信息化平臺建設(shè)工作。
2.3.3 第三階段(2013~2014年)
針對渤海油田實物地質(zhì)資料管理的信息化工作,渤海油田檔案管理部門重點開展了館藏設(shè)施建設(shè)、數(shù)字化專用設(shè)備試制等工作,特別是巖心巖屑高分辨率巖心巖屑影像采集設(shè)備的成功研制,有力推動巖心巖屑影像高分辨率數(shù)字化采集工作的開展,滿足了用戶遠程觀樣、遠程取心等需求,進一步拓展了地質(zhì)資料信息服務(wù)產(chǎn)業(yè)鏈。
3 取得的成果
3.1 原始與成果地質(zhì)資料管理及信息化
渤海油田大規(guī)模的資源建設(shè)工作歷時3年多,投入了大量的人力、物力和財力,累計處理館藏歷史資料合計923萬頁(折合A4大小),其中完成圖件163萬頁、報告760萬頁及相關(guān)資料的結(jié)構(gòu)化數(shù)據(jù)采集等工作。通過多年的信息化建設(shè),地質(zhì)資料檔案管理具備了良好的基礎(chǔ)設(shè)施、先進的技術(shù)手段,更是培養(yǎng)了一支業(yè)務(wù)精、素質(zhì)高的專業(yè)化隊伍。目前館藏資料電子化程度已達97%以上,不僅可以滿足不同層次資料細粒度、結(jié)構(gòu)化利用需求,而且在項目實施過程中,渤海油田還建立了中海油地質(zhì)資料數(shù)字化相關(guān)技術(shù)規(guī)范,標準延伸到了文本識別、數(shù)據(jù)校對、成果組織環(huán)節(jié),切實填補了中海油相關(guān)企業(yè)標準的空白,并開發(fā)了自主版權(quán)的地質(zhì)資料電子化加工管理系統(tǒng)平臺,全面實現(xiàn)了地質(zhì)資料數(shù)據(jù)加工的流程化、標準化。
3.2 實物樣品地質(zhì)資料管理及信息化
目前渤海油田巖心、巖屑等樣品數(shù)字化已達90%的水平,通過地質(zhì)資料管理和應(yīng)用平臺。不但實現(xiàn)了對地質(zhì)樣品基礎(chǔ)數(shù)據(jù)、圖像數(shù)據(jù)、專業(yè)報告、鑒定數(shù)據(jù)以及業(yè)務(wù)流程的綜合管理,而且更實現(xiàn)了對地質(zhì)樣品全生命周期的動態(tài)跟蹤,并主導(dǎo)編寫了中海油《巖心壁心巖屑圖像采集技術(shù)規(guī)范》。
3.3 實物檔案數(shù)字化設(shè)備研制
圍繞落實國土資源部《推進地質(zhì)資料信息服務(wù)集群化產(chǎn)業(yè)化工作方案》(國土資發(fā)〔2010〕113號)精神,創(chuàng)新地質(zhì)資料信息服務(wù)新模式,渤海油田研發(fā)了一套高分辨率巖心巖屑實物影像采集設(shè)備,設(shè)備集巖心、巖屑、壁心等多種樣品白光、熒光高分辨率掃描和顯微掃描功能于一體,很好地實現(xiàn)了設(shè)備系統(tǒng)自檢、激光自動測距、自動采集控制、自動幾何校正、自動圖像拼接、自動切割、自動命名、自動存儲的全過程自動化采集。尤其特有的定點高分辨率實時顯像技術(shù),為專業(yè)技術(shù)人員提供了遠程巖心巖屑觀樣和相關(guān)技術(shù)研究的信息服務(wù)新模式,并整體提高了渤海油田實物檔案信息化水平和檔案服務(wù)能力。該技術(shù)研究獲得了新型實用專利2項,軟件著作權(quán)3項。
3.4 地質(zhì)資料數(shù)據(jù)集成應(yīng)用
渤海油田通過“數(shù)字文檔中心”、“地質(zhì)檔案綜合管理系統(tǒng)”、“油田專業(yè)數(shù)據(jù)庫系統(tǒng)”形成了系統(tǒng)化、多層次的地質(zhì)資料管理與應(yīng)用,不僅拓寬了地質(zhì)資料數(shù)據(jù)利用深度和廣度,同時通過渤海油田“地質(zhì)資料管理應(yīng)用平臺”與國土資源部的“石油天然氣地質(zhì)資料委托管理系統(tǒng)”、“全國地質(zhì)資料匯交監(jiān)管平臺”、“油氣鉆井數(shù)據(jù)庫”有效對接,實現(xiàn)了數(shù)據(jù)互通和共享,進一步做實做強了委托保管工作。
4 總結(jié)與思考
4.1 渤海油田地質(zhì)資料信息化建設(shè)存在的問題
1)由于歷史原因、技術(shù)能力限制、機構(gòu)變動等眾多因素,渤海油田油氣地質(zhì)資料保管部門掌握的資料和數(shù)據(jù),還沒有達到理想的完整和準確,特別是當前油田地質(zhì)資料的生產(chǎn)者、管理者、保管者、利用者、監(jiān)管者被分割在不同管理體系下,條塊分割,給地質(zhì)資料管理和協(xié)調(diào)工作帶來了較大的挑戰(zhàn)。
2)渤海油田油氣地質(zhì)資料信息化專業(yè)隊伍建設(shè)、信息化標準建設(shè)需要進一步加強和完善,這樣才能與渤海油田快速發(fā)展保持一致,從而更好地為油田勘探開發(fā)提供優(yōu)質(zhì)服務(wù)。
3)當前地質(zhì)資料數(shù)據(jù)資源的分布式存儲,多系統(tǒng)、多平臺、多頭管理部門,給地質(zhì)資料的統(tǒng)一、規(guī)范化管理帶來了巨大挑戰(zhàn)。更為重要的是,渤海油田內(nèi)部還缺乏一個長效工作機制,以確保地質(zhì)資料從產(chǎn)生到最終歸檔所經(jīng)歷跨專業(yè)、跨部門、跨系統(tǒng)的漫長流程中,能夠得到全面、可靠、有效的控制。
4.2 渤海油田地質(zhì)資料信息化建設(shè)的思考
1)渤海油田通過地質(zhì)資料信息化建設(shè)實踐,深刻認識到油田地質(zhì)資料信息化必須加強資料源頭管理,建立健全資料產(chǎn)生部門、業(yè)務(wù)管理部門、檔案管理部門的歸檔制度及規(guī)范流程體系,把現(xiàn)場地質(zhì)資料收集與現(xiàn)場地質(zhì)監(jiān)督崗位考核相關(guān)聯(lián),并且責(zé)任落實到人,以確保地質(zhì)資料歸集的全、準性。同時,還要利用油田數(shù)字文檔中心系統(tǒng)平臺,以便對油氣地質(zhì)資料流轉(zhuǎn)過程涉及的部門人員進行專業(yè)資料收集與歸檔培訓(xùn),使他們明確資料的收集范圍、歸檔時間及歸檔標準,并與年度考核指標相關(guān)聯(lián),從而推動油氣地質(zhì)資料文檔一體化管理。
2)隨著渤海油田的快速發(fā)展,需要進一步加強地質(zhì)資料管理的技術(shù)研究工作,提升軟實力。在專題平臺建設(shè)過程中,我們深刻地認識到地質(zhì)資料的多層次利用需求。我們對 POSC(Petrotechnical Open Standards Consortium)、PPDM(Public Petroleum Data Model Association)等標準石油數(shù)據(jù)模型、ISO的OAIS(開放檔案信息系統(tǒng))參考模型、油氣勘探開發(fā)一體化計算平臺進行了深入研究,為未來地質(zhì)資料數(shù)據(jù)的深層應(yīng)用和信息綜合服務(wù)打下了基礎(chǔ)。
3)對地質(zhì)資料實物樣品管理利用的再認識。實物地質(zhì)資料是中海油企業(yè)巨資投入獲得的寶貴財富。樣品具有原始性、唯一性、不可再生性和易毀性,又具有可重復(fù)利用,并包含豐富的地質(zhì)信息。因此,為其建立電子副本,利用數(shù)字化技術(shù)開展相關(guān)的樣品處理、保管保護、分析利用則具有非常重要的積極意義。通過前期的科研工作,我們掌握了巖心巖屑高分辨率、高清晰的圖像采集技術(shù),實現(xiàn)了實物樣品及其相關(guān)成果資料、原始資料的集成關(guān)聯(lián),為企業(yè)、社會科研人員提供了方便、快捷的資料利用途徑,也為未來利用圖像模式識別技術(shù)開展熒光面積統(tǒng)計、含油產(chǎn)狀鑒定、孔洞裂縫定量統(tǒng)計、粒度分析等深化應(yīng)用和集成服務(wù)奠定了堅實基礎(chǔ)。
5 工作拓展及前景展望
5.1 工作拓展
為了提高勘探、開發(fā)、實驗、綜合研究各業(yè)務(wù)系統(tǒng)地質(zhì)資料源頭數(shù)據(jù)管理水平,圍繞渤海油田地質(zhì)資料信息化業(yè)務(wù),必須建立起一套與企業(yè)發(fā)展模式相適應(yīng)的規(guī)范和保障機制,以確保今后所有地質(zhì)工作中形成的文檔數(shù)據(jù),能在各環(huán)節(jié)按照相應(yīng)的業(yè)務(wù)流程、操作規(guī)范及時、有效地被地質(zhì)資料管理者所捕獲。尤其重點需要加強從各業(yè)務(wù)系統(tǒng)到油田電子文件系統(tǒng)的資料歸集和自動推送研究,強化電子文件系統(tǒng)對地質(zhì)資料歸集業(yè)務(wù)的主通道作用,從而實現(xiàn)電子文件系統(tǒng)到地質(zhì)檔案系統(tǒng)的文檔一體化管理,最終達到整個油田全領(lǐng)域地質(zhì)資料完整性、及時性的管理。
5.2 前景展望
渤海油田地質(zhì)資料管理將繼續(xù)以數(shù)字化檔案管理為核心,以信息技術(shù)為基礎(chǔ),以國土資源部《推進地質(zhì)資料信息服務(wù)集群化產(chǎn)業(yè)化工作方案》(國土資發(fā)〔2010〕113號)文件為指導(dǎo),堅持統(tǒng)一部署、分步實施的原則,最終將建設(shè)成業(yè)務(wù)系統(tǒng)、電子文件系統(tǒng)、地質(zhì)檔案系統(tǒng)3層體系架構(gòu)模型,實現(xiàn)地質(zhì)資料檔案實體管理與專業(yè)數(shù)據(jù)管理高度融合,從傳統(tǒng)的實體保護保管為主,轉(zhuǎn)向數(shù)字化在線檢索、自動推送為主,并且提供目錄與內(nèi)容、實體與電子、文檔與數(shù)據(jù)多層次細粒度的信息化管理模式,最大限度地發(fā)揮地質(zhì)資料在油氣勘探、開發(fā)、科研、生產(chǎn)和決策中的重要作用,更有效地服務(wù)于企業(yè)和社會。
6 結(jié)語
當今時代,知識創(chuàng)新已經(jīng)成為社會進步的主要推動力,信息技術(shù)的發(fā)展和計算機網(wǎng)絡(luò)的普及也為實現(xiàn)油氣地質(zhì)檔案信息資源的知識集成提供了重要的技術(shù)手段。渤海油田地質(zhì)資料信息化建設(shè)工作正方興未艾。當我們孜孜以求、卓有成效地加快地質(zhì)資料信息化建設(shè)時,地質(zhì)檔案資料管理整體水平與綜合效益這棵大樹就會結(jié)出豐碩的果實,為渤海油田地質(zhì)檔案工作的創(chuàng)新發(fā)展開辟更為廣闊的天地,進而為渤海油田生產(chǎn)和管理發(fā)揮其應(yīng)有的價值和作用。
參考文獻
[1]楊中營.構(gòu)建檔案數(shù)字化地方標準體系[J].中國檔案,2014(3).
[2]蔡盈芳.企業(yè)檔案信息的知識管理研究[J].檔案學(xué)研究,2014(2).
[3]牛力,韓小汀.云計算環(huán)境下的檔案信息資源整合與服務(wù)模式研究[J].檔案學(xué)研究,2013(5).
[4]李向群,穆雷.中央企業(yè)檔案信息平臺一體化建設(shè)的現(xiàn)狀分析[J].中國檔案,2013(12).
[5]程妍妍,王靜婷.數(shù)字檔案館采集功能的標準化研究[J].檔案學(xué)研究,2013(6).
樓主你好,紙質(zhì)檔案數(shù)字化之后,同樣需要遵循檔案管理的有關(guān)要求管理,例如檔案使用的權(quán)限管理,檔案資料的定義,分類,立卷,歸檔等等。當然,電子檔案和紙質(zhì)檔案也可以實現(xiàn)統(tǒng)一管理,檔案管理系統(tǒng)容許紙質(zhì)檔案、實物檔案與數(shù)字化檔案在同一系統(tǒng)中實施同步管理,并且,可提供實體檔案的存放位置地圖顯示,以方便管理與利用。數(shù)字化檔案集中統(tǒng)一管理,實體紙質(zhì)檔案則可根據(jù)需要,實施分布式管理,即可對設(shè)置于不同地點的檔案庫房實施管理。而電子文件管理,就沒有立卷與歸檔等要求,相對管理較為靈活。
我們可以這樣說,紙質(zhì)的文件數(shù)字化之后可以形成電子文件,如果需要歸為檔案進行管理,則需要遵循檔案管理的要求進行管理;如只作為電子文件進行管理,則管理比較靈活,沒有太多的條條框框,電子文件本身的管理亦同理。所以,檔案管理與文件管理在很多企業(yè)都是分開管理的,在檔案系統(tǒng)中,一般都將文件和檔案分開兩個大類進行管理,這些都可以統(tǒng)稱之為知識管理。
樓主可以參考一下知識管理系統(tǒng),可以有效幫助企業(yè)進行知識管理:
紹林科技開發(fā)的匯博通是一個綜合知識管理平臺,前身是3Hmis綜合知識管理系統(tǒng),它把門戶網(wǎng)站,內(nèi)外信息管理以及溝通與協(xié)作,有機的結(jié)合到一起,使得整條業(yè)務(wù)鏈條上的信息管理,傳遞,共享,協(xié)作與溝通變得更加容易,有序與方便。
應(yīng)用范圍涵蓋辦公自動化,文件管理,檔案管理,內(nèi)容管理,證照管理,綜合知識資源整合以及大數(shù)據(jù)應(yīng)用等以知識文檔為基礎(chǔ)的眾多領(lǐng)域。
同時,系統(tǒng)提供論壇中心、知識問答、微博等知識共享平臺,在管理企業(yè)顯性知識的基礎(chǔ)下,有效促進隱性知識的沉淀。
另外,企業(yè)內(nèi)部的知識管理應(yīng)該照顧到知識的全生命周期管理,從知識的產(chǎn)生到再利用以及自我發(fā)酵、完善各個生命周期階段中都應(yīng)該有對應(yīng)的功能進行管理支持。
并且,匯博通將知識管理的應(yīng)用進一步擴展到手機和平板電腦,可實現(xiàn)公文審批,移動協(xié)作,移動考勤,即時溝通,信息查閱以及只是共享等功能,隨時隨地把企業(yè)知識庫帶在身邊。
總的來說,可以應(yīng)用到知識管理的各個方面,通用性較強,同時也是一套OA系統(tǒng),可以推進黨校知識文檔的一體化管理,不論顯性或隱性知識都有相應(yīng)的功能模塊,實用性較強。樓主可以參考一下他們官網(wǎng)的解決方案吧。
檔案數(shù)字化收費標準:
1、文書檔案:簡易整理方法:6元/件。傳統(tǒng)整理方法:50元/件
2、專業(yè)檔案:30-35元/件(每件200頁含200頁的收費30-35元,每件增加50頁收費增加15元,每件增加51-100頁的收費增加30元,以此類推)。
3、掃描:A4每面0.50-0.60元;A3每面0.90元;超過A3,按照圖紙收費每面1.5元。
4、會計檔案:6元每件/卷。(每件200頁含200頁的收費6元,每件增加50頁收費增加3元,每件增加51-100頁的收費增加6元,以此類推)。
5、科技檔案、基建檔案、工程及規(guī)劃檔案:60元/卷(每卷200頁含200頁的收費60元,每卷增加50頁收費增加20元,每卷增加51-100頁的收費增加35元,以此類推)。
6、聲像檔案:每冊/每盤/每件8元。
7、實物檔案:每件8元。
8、資料匯編:每卷按目錄條數(shù)收費,每條4元;整理加錄入每條8元。
9、銷毀檔案目錄錄入:每條4元。10、人事檔案:按照簡易方法整理,每人30元;按照組織部十大類整理,每人120元。
檔案數(shù)字化單價怎么算
1、檔案類型
文書檔案、財務(wù)檔案、人事檔案、科技檔案等等,不同的檔案類型因形式不同、裝訂方式不同等等,自然檔案數(shù)字化加工收費標準也不同。
2、檔案紙張的受損程度
紙張的受損程度直接決定著數(shù)字化加工的難度、數(shù)字化加工的設(shè)備、數(shù)字化加工的時間。
1)數(shù)字化加工的難度。不同加工難度需要不同的技術(shù)和專業(yè)團隊支持,就會產(chǎn)生不同的成本,進而影響檔案數(shù)字化加工收費標準。
2)數(shù)字化加工的設(shè)備。受損程度不同的紙張需要不同的掃描或拍照設(shè)備,那么就涉及到是否有設(shè)備的采購或租賃、設(shè)備價格的高低,都會直接影響檔案數(shù)字化加工收費標準。
3)數(shù)字化加工的時間。受損紙張程度高的紙張必然比受損程度低的紙張耗時久,那么相應(yīng)的人工成本也將增加,即hi影響到檔案數(shù)字化加工收費標準。
3、檔案加工地域
檔案數(shù)字化加工收費標準也會受當?shù)亟?jīng)濟發(fā)展的水平的影響。經(jīng)濟發(fā)展水平高的地方和低的地方相比,檔案數(shù)字化加工收費標準也是不同的。
總而言之,檔案數(shù)字化加工是一項嚴謹?shù)姆?wù),專業(yè)的數(shù)字化服務(wù)商將會安排檔案老師上門評估,對您的檔案容量、材質(zhì)、所需設(shè)備、場地等要素進行評估之后,制定出全方位的數(shù)字化方案,才能確定檔案數(shù)字化加工收費標準。
所以,檔案人在有數(shù)字化需求時,需要請檔案公司上門評估,才可獲取最權(quán)威的檔案數(shù)字化加工收費標準。
實物相關(guān)資料數(shù)字化是對實物相關(guān)的文字、圖件、表格等文件的數(shù)字化以及電子文件的制作。目的是配合實物數(shù)字化,形成完整的實物地質(zhì)資料圖文圖像系統(tǒng),進而建立數(shù)字化實物地質(zhì)資料閱覽室,提高實物地質(zhì)資料利用率,并有效地保護館藏圖文資料,為實物地質(zhì)資料信息共享提供基礎(chǔ)。
實物地質(zhì)資料相關(guān)的圖文資料包括文本資料和圖紙資料,數(shù)字化工作也是針對這兩類資料而言的。
(一)文本資料數(shù)字化
1.工作流程及方法
文本資料數(shù)字化是通過掃描的方法把以紙介質(zhì)為載體的地質(zhì)資料轉(zhuǎn)變?yōu)橐噪娮訛榻橘|(zhì)的電子文件,并進行文件組織的過程。主要工作過程包括資料準備、掃描、圖像處理、生成電子文件、文檔組織與保存等幾個方面(圖7-25)。
圖7-25 文本資料數(shù)字化工作流程
(1)掃描前的準備工作:做好文本資料的準備工作是十分必要的。資料的單冊厚度影響著文本的掃描質(zhì)量,越厚越不利于掃描,有些文本裝訂得比較厚時,應(yīng)將文本拆開進行掃描,掃描工作結(jié)束后再按照檔案管理的要求進行重新裝訂。在進行若干份單頁的文件掃描時,掃描前要做好資料的登記工作,以免丟失。利用文檔掃描儀進行多頁文件掃描之前,要對文本資料進行除靜電處理。
(2)圖像掃描:對于文本資料紙質(zhì)較好,又不超過標準A4版面的時候,為節(jié)省掃描時間,提高工作效率可以采用專用的多頁文檔掃描儀進行連續(xù)掃描,其他的文本資料使用平板掃描儀逐頁進行掃描。掃描類型的選擇是完成文本數(shù)字化工作的重要環(huán)節(jié)。正確地選擇掃描類型,是提高掃描質(zhì)量的保證。掃描類型的選擇是由原件的類型來確定的。常用文本資料的掃描類型有黑白二值、RGB、灰階3種:①黑白二值方式,當文字或表格質(zhì)量都非常高時,采用這種方式掃描,掃描效果較好;②灰階方式,當文本資料字跡不清楚或是表格時,使用黑白二值方式產(chǎn)生的圖像效果較差,表格線會斷斷續(xù)續(xù),此時可選用灰階方式掃描,但這種方式掃描的圖像有較多的灰色印跡,需在后期進行圖像處理時,使圖像達到最佳效果;③RGB方式,對文本資料中的彩色圖件一般采用這種方式進行掃描,用這種方式掃描產(chǎn)生的文件占用的磁盤空間較大,在掃描時應(yīng)進行亮度、對比度及色度的調(diào)整,通過反復(fù)對比,使圖件色彩達到最佳的效果。在掃描前應(yīng)進行預(yù)掃描,目的是選擇掃描分辨率及調(diào)整亮度和對比度。掃描分辨率、亮度及對比度調(diào)整與文本資料的質(zhì)量有一定的關(guān)系,當一冊文本資料質(zhì)量變化不大時,選擇一頁或幾頁進行掃描實驗,結(jié)合掃描工作經(jīng)驗選擇適合的分辨率、亮度及對比度;當文本質(zhì)量有明顯變化時,每頁資料的亮度及對比度都要分別進行調(diào)整。每次掃描時若不進行掃描區(qū)域的選擇,掃描區(qū)域就與上次的掃描區(qū)域相同,這樣有可能漏掉文本內(nèi)容。掃描區(qū)域過大,掃描時間就延長,文件所占的空間增大,增加后期圖像處理的工作量。根據(jù)選擇掃描類型的不同,文件存儲格式也有所不同。黑白二值方式掃描產(chǎn)生的圖像不能進行糾斜和旋轉(zhuǎn),存儲格式為 TIFF;灰階和RGB方式掃描存儲格式均為JPG,這種格式是經(jīng)過壓縮的。當掃描參數(shù)調(diào)整完成時,就要選擇路徑將掃描文件進行保存。掃描文件最好是放置在一個獨立的位置上,以免與其他文件混淆。文件的名稱能反映其中文本資料的主題內(nèi)容。與此同時,還要給每頁文件確定一個適當?shù)拿Q,最好以文件的頁碼為文件的名稱,以便對文件進行排版時不會出順序上的錯誤。同時保證以后再對文件進行處理時能很快識別此文件是屬于哪個類別的、哪個地區(qū)的、哪個鉆孔的等。如圖7 26所示。在掃描方式、掃描參數(shù)、存儲格式、存儲路徑和文件名都已設(shè)定好之后,就可以進行掃描了。當頁面大于A4幅面時,可以用A3大幅面掃描儀進行掃描,對于超過A3 幅面的文本資料可以分次掃描,掃描完成后再進行拼接。掃描是整個數(shù)字化工作中最基礎(chǔ)、最關(guān)鍵的環(huán)節(jié),好的掃描質(zhì)量,能夠使電子文件獲取清晰度較高的效果,投入最少的整飾工作量,從而節(jié)省大量的時間、人力和物力。
圖7-26 文件存儲結(jié)構(gòu)示意
(3)圖像處理:當完成一冊文本資料的掃描工作后,此文本資料以一系列圖像形式的文件保存在一個固定的文件夾內(nèi)。這些圖像需調(diào)整處理,才能達到文本數(shù)字化的要求。在Photoshop中打開掃描圖像,逐個進行糾斜、旋轉(zhuǎn)、剪裁、去污、亮度/對比度等的調(diào)整。經(jīng)過幾次這樣的調(diào)整,使圖像達到真實反映文本資料原貌。
(4)生成電子文件:將調(diào)整好的單個圖像文件逐個插入到Word文檔中,形成Word格式的文檔,然后再轉(zhuǎn)化成PDF格式文件,文件名要與每冊文本資料的名稱相同或相近,如大巴山地應(yīng)力孔的《巖礦心接收登記表》,電子文件命名為“巖礦心接收登記表.PDF”。
(5)文檔組織與保存:當完成了一個礦區(qū)的所有文本資料的掃描工作以后,將形成的PDF文件按一定的順序重新組織編排,生成具有目錄索引特征的單個PDF文件,其格式見圖7-27。
圖7-27 PDF電子文件界面
2.影響文本資料掃描效果的主要因素
將文本資料平放在掃描儀的掃描區(qū)域中,有的文本資料裝訂得比較規(guī)范,一般情況下在掃描前不需拆開,進行掃描時掃描人員用手緊壓文本資料,盡可能地緊貼掃描面板,以保證有較好的掃描效果。如果文本資料較薄,則可用掃描儀的蓋板壓緊即可。這個環(huán)節(jié)的操作要輕拿輕放,避免文本資料在掃描板上滑動,劃傷掃描板,直接影響掃描的效果。
目前收集來的一些實物相關(guān)資料是20世紀80年代初期產(chǎn)生的,隨著時間的推移,許多文本資料字跡已經(jīng)很模糊,這些資料又多以復(fù)印件為主,特別是野外記錄本和一些整理資料多數(shù)都是手寫資料,字體不一,書寫也不規(guī)范,資料內(nèi)容就更為模糊了,這樣的資料掃描難度較大,效果也不理想。
有的文本資料的厚度大又不宜拆開,直接影響了掃描質(zhì)量,文本資料越厚在掃描過程中就越不容易壓平,掃描后非常不清楚。因此在掃描較厚的文本資料時,需要掃描人員用手使勁壓平文本,才能保證掃描的質(zhì)量。顯而易見,這樣掃描會降低掃描的效率,因此在掃描這種較厚的文本資料時,要求工作人員必須有耐心,將每一頁資料都能充分地擺正放平,使每一部分信息都能掃描得非常清晰。
(二)圖紙的掃描
在實物地質(zhì)資料中,有一部分資料是地形圖、剖面圖、地質(zhì)圖、柱狀圖等,其幅面一般都超過A3。這部分圖紙使用A0工程掃描儀掃描。
1.掃描儀參數(shù)的設(shè)定
通過實驗,圖紙掃描分辨率采用200dpi,掃描方式采用灰度,圖像保存格式為tif,基本能夠滿足資料利用的需要。
2.影響圖紙掃描效果的幾個因素及處理方法
(1)掃描儀的校準:在試掃描過程中發(fā)現(xiàn),在每張圖紙的左側(cè),總是有一條直線,有上下錯位的現(xiàn)象發(fā)生,為了不影響圖像的質(zhì)量,筆者請教了熟悉掃描儀操作的同志,之所以出現(xiàn)這種現(xiàn)象,是由于掃描儀的3個鏡頭在掃描過程中發(fā)生了錯位,導(dǎo)致一條直線出現(xiàn)“折斷”的現(xiàn)象。為了解決這一問題,每次掃描前,首先進行掃描校準。
(2)圖紙的質(zhì)量:有的柱狀圖由于太長,在平常的保存過程中一直是卷成筒狀的,并用棉線輕輕捆綁著。因此在圖紙的邊緣部分,常出現(xiàn)磨痕或裂口。這樣的圖紙在滾動掃描時,稍不注意就會出現(xiàn)不同步現(xiàn)象,使掃描圖像發(fā)生偏斜扭曲。處理這種情況的方法是對圖紙進行修復(fù),方法是在圖紙的邊緣用乳膠粘上一層薄紙,再用熨斗熨平。