電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
傳統(tǒng)檔案管理升級(jí)為電子檔案管理的過程中,我們經(jīng)常要將檔案進(jìn)行檔案數(shù)字化信息化。那么,什么是數(shù)字化?什么是信息化?數(shù)字化和信息化是一回事嗎?
01、什么是數(shù)字化?
檔案管理術(shù)語中的“數(shù)字化”
《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》(DA/T 31—2017)中,數(shù)字化指的是利用計(jì)算機(jī)技術(shù)將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的處理過程。
檔案管理工作中的“數(shù)字化”
檔案數(shù)字化就是把紙質(zhì)文化通過掃描、錄入等方式將信息存儲(chǔ)到計(jì)算機(jī)數(shù)據(jù)庫中,以實(shí)現(xiàn)檢索快捷方便、同步備份快速簡單、存儲(chǔ)空間小、維護(hù)方便、安全等功效。
02、什么是信息化?
檔案管理術(shù)語中的“信息化”
《企業(yè)檔案工作規(guī)范》(DA/T 42-2009)中,信息化是指運(yùn)用信息技術(shù)對(duì)歸檔文化、數(shù)據(jù)信息資源及檔案進(jìn)行采集、整合、維護(hù)、處置和提供利用服務(wù)的檔案管理提升過程和工作方式。
檔案管理工作中的“信息化”
檔案信息化是在檔案管理中全面應(yīng)用現(xiàn)代信息技術(shù),對(duì)檔案信息資源進(jìn)行數(shù)字化管理和提供利用。
檔案信息化建設(shè)需要結(jié)合現(xiàn)有的OA系統(tǒng)和業(yè)務(wù)系統(tǒng),搭建電子化、信息化、現(xiàn)代化的檔案管理系統(tǒng),實(shí)現(xiàn)檔案的收、管、存、用。
03、數(shù)字化≠信息化
從上述信息中,我們可以發(fā)現(xiàn),數(shù)字化并不等同于信息化,在檔案管理工作中,數(shù)字化建設(shè)也并不等同于信息化建設(shè)。
廣義上的“數(shù)字化、信息化”
信息化包含了數(shù)字化,數(shù)字化是信息化的一種表現(xiàn)形式。
檔案管理工作中的“數(shù)字化、信息化”
檔案數(shù)字化是傳統(tǒng)檔案管理模式向現(xiàn)代化電子檔案管理模式升級(jí)過程中,實(shí)現(xiàn)全面信息化建設(shè)的一個(gè)重要環(huán)節(jié)。
從智慧和信息的區(qū)別來看,信息基本相當(dāng)于數(shù)據(jù)。數(shù)據(jù)的含義是進(jìn)行各種統(tǒng)計(jì)、計(jì)算、科學(xué)研究和技術(shù)設(shè)計(jì)所依據(jù)的數(shù)值,是事實(shí)或觀察的結(jié)果,是用于表示客觀事物的未經(jīng)加工的原始素材,并被認(rèn)為是信息的表現(xiàn)形式和載體。
所以,數(shù)據(jù)基本上跟信息是一樣的東西。隨著大數(shù)據(jù)技術(shù)的出現(xiàn),現(xiàn)在數(shù)據(jù)一詞很流行,幾乎和信息一詞在20世紀(jì)80年代的流行程度一樣。彼時(shí)是無事物無信息,現(xiàn)今則是無事物無數(shù)據(jù);彼時(shí)是信息一詞泛化,而現(xiàn)今又是數(shù)據(jù)一詞泛化。
智慧檔案館首先要把檔案數(shù)據(jù)化或信息化。檔案數(shù)據(jù)化是相對(duì)于之前的檔案數(shù)字化而言的,是我在2019年的一次講話中為了區(qū)別于此前人們常說的檔案數(shù)字化而提出來的。其實(shí),它的意思就是把紙質(zhì)檔案或紙質(zhì)檔案數(shù)字化圖像中的每個(gè)字都轉(zhuǎn)換成電腦可以處理的數(shù)據(jù)或信息,并輸入電腦,進(jìn)入數(shù)據(jù)庫,供人們通過大數(shù)據(jù)技術(shù)進(jìn)行挖掘和處理。
數(shù)據(jù)是智慧檔案館的基礎(chǔ)。沒有數(shù)據(jù),特別是沒有檔案內(nèi)容的所有數(shù)據(jù),就不能把數(shù)據(jù)或信息變成智慧。也可以說,智慧檔案館是基于數(shù)據(jù)的,有了數(shù)據(jù)和各種數(shù)據(jù)處理技術(shù),才有智慧檔案館。所以,沒有數(shù)據(jù)就談不上建設(shè)智慧檔案館。
智慧檔案館的數(shù)據(jù)應(yīng)包括電腦可檢索的檔案全文數(shù)據(jù),即:信息流數(shù)據(jù);檔案實(shí)體、檔案裝具、檔案設(shè)備等方面的數(shù)據(jù),即物流數(shù)據(jù);檔案工作者、檔案利用者、檔案參觀者等方面的數(shù)據(jù),即人流數(shù)據(jù);
檔案庫房溫度、濕度及各種有毒有害氣體濃度,水、火、菌、蟲、鼠等各種環(huán)境或條件的數(shù)據(jù),即環(huán)境數(shù)據(jù)。也就是說,“智慧檔案館的數(shù)據(jù)=檔案全文數(shù)據(jù)+物流數(shù)據(jù)+人流數(shù)據(jù)+環(huán)境數(shù)據(jù)”。在這些數(shù)據(jù)中,檔案全文數(shù)據(jù)是最關(guān)鍵、最重要、最根本、具有決定性的部分。
建設(shè)智慧檔案館,最重要的是運(yùn)用各種手段盡快地把紙質(zhì)檔案和紙質(zhì)檔案數(shù)字化圖像及錄音錄像檔案等全部轉(zhuǎn)化為電腦可以檢索的電子文檔,把檔案里的前人智慧挖掘出來,轉(zhuǎn)化為今人的智慧,這就是檔案數(shù)據(jù)化,即檔案的數(shù)據(jù)轉(zhuǎn)化工作。檔案數(shù)據(jù)化是智慧檔案館建設(shè)的要義和核心。
目前,檔案數(shù)據(jù)化或是把檔案由文字、聲音轉(zhuǎn)化為數(shù)據(jù)的途徑至少有以下幾種:第一種,對(duì)原件上文字為鉛排、打印的紙質(zhì)檔案以及原件上文字雖然手寫但又十分工整的檔案,用OCR識(shí)別技術(shù)進(jìn)行轉(zhuǎn)化,其準(zhǔn)確率可在99%以上;
第二種,對(duì)原件上文字為手寫且OCR技術(shù)不易識(shí)別的檔案,用特殊的手寫字識(shí)別技術(shù)進(jìn)行轉(zhuǎn)化,其準(zhǔn)確率目前最高可達(dá)95%左右;
第三種,用人工錄入電腦的辦法轉(zhuǎn)化;
第四種,用人工朗讀文字并通過音頻技術(shù)把聲音轉(zhuǎn)換成文字,其準(zhǔn)確率也可達(dá)95%左右。需要指出的是,目前這4種轉(zhuǎn)化方式都需要人工進(jìn)行校核,都不能100%準(zhǔn)確。在轉(zhuǎn)化過程中,文字能全部準(zhǔn)確轉(zhuǎn)化出來最好,如不能也不要緊。
因?yàn)闄n案中并不是每個(gè)字都具有數(shù)據(jù)意義或檢索價(jià)值的,有的虛詞、連接詞、形容詞、裝飾詞、重復(fù)強(qiáng)調(diào)語等,即使這些字轉(zhuǎn)化不出來或不準(zhǔn)確,也并不會(huì)太大影響整份檔案的實(shí)際應(yīng)用。對(duì)全文數(shù)據(jù)來說,當(dāng)然是越多越好,但也不是每個(gè)字都不能少,或少一個(gè)字就不行。
舉一個(gè)例子:“張建國,他出生于一九四九年,也就是新中國成立的那一年?!边@句話共24個(gè)字,但真正具有實(shí)際檢索意義的,只有“張建國,一九四九年出生”這10個(gè)字。
只要把這10個(gè)關(guān)鍵的字轉(zhuǎn)化出來了,這句話的基本意思或基本要素、主要信息、核心要義就有了,其他14個(gè)字,也就是一半以上的部分,能轉(zhuǎn)化出來當(dāng)然更好,即使不能轉(zhuǎn)化出來也不太影響全句主要意思和基本信息的表達(dá)。因此,現(xiàn)有的各種數(shù)據(jù)轉(zhuǎn)化技術(shù)都可以先進(jìn)行應(yīng)用,并在應(yīng)用中不斷提高其轉(zhuǎn)化準(zhǔn)確率,而不必等到某種技術(shù)完全成熟了再去用。
智慧檔案館,光有數(shù)據(jù)還不行,還必須有數(shù)據(jù)挖掘和主動(dòng)推送技術(shù)。數(shù)據(jù)挖掘就是通過算法從數(shù)據(jù)庫的大量數(shù)據(jù)中展開搜索,找出隱含的、先前未知的、有潛在價(jià)值的信息。
由此看來,數(shù)據(jù)挖掘技術(shù)實(shí)際上就是對(duì)大數(shù)據(jù)進(jìn)行智慧性處理的技術(shù),是把信息變成智慧的技術(shù),是讓蘊(yùn)含在檔案里的智慧更加顯性、更加集中、更加智慧的技術(shù)。通過數(shù)據(jù)挖掘技術(shù),能夠挖掘出檔案的潛在價(jià)值和潛在用戶,挖掘出用戶的潛在需求,從而大大提高檔案的價(jià)值。
檔案數(shù)字化信息化管理
檔案數(shù)字化信息化管理是一項(xiàng)龐大的系統(tǒng)工程,數(shù)字化工作涉及需要數(shù)字化檔案、人員、數(shù)字化設(shè)備與技術(shù)等,最終的產(chǎn)品是高質(zhì)量的電子檔案數(shù)據(jù)。檔案數(shù)字化系統(tǒng)工程需要大量的人力、物力和財(cái)力的投入,同時(shí)需要對(duì)數(shù)字化的流程、質(zhì)量實(shí)施有效的組織、監(jiān)控和管理等工作。
1、明確檔案數(shù)字化信息化內(nèi)容及標(biāo)準(zhǔn)
確實(shí)數(shù)字化信息化處理的檔案范圍、數(shù)量和數(shù)字化工作任務(wù)的時(shí)間周期。根據(jù)檔案數(shù)字化相關(guān)規(guī)范要求及實(shí)際情況,制定出詳細(xì)可行的紙質(zhì)檔案整理分類、分級(jí)、編號(hào)、編頁、掃描與處理等工作規(guī)范。
2、確定數(shù)字化信息化實(shí)施技術(shù)途徑及質(zhì)量管控制標(biāo)
紙質(zhì)檔案介質(zhì)多種多樣,有打印紙、硫酸紙、繪圖紙等,記錄方式有打印、書寫等。要有效完成檔案數(shù)字化工作,除了具備相關(guān)掃描設(shè)備的圖像處理軟件外,同時(shí)必須具體分析檔案特性。確定切實(shí)可行的實(shí)施技術(shù)途徑,根據(jù)工作標(biāo)準(zhǔn)和個(gè)流程,確定好數(shù)字化信息化過程中每個(gè)環(huán)節(jié)的質(zhì)量管控指標(biāo)。
3、數(shù)字化加工環(huán)境搭建與工作計(jì)劃
數(shù)字化加工場所組建局域網(wǎng)便于集中作業(yè)、相互協(xié)調(diào)配合,高效管理掃描、圖像處理及文件收發(fā)等工作。進(jìn)行數(shù)字化加工前需要制定一個(gè)合理的工作計(jì)劃,管理者利用該計(jì)劃結(jié)合項(xiàng)目管理類軟件動(dòng)態(tài)地管理數(shù)字化工作進(jìn)程,兵進(jìn)行合理的調(diào)整,同時(shí)讓參與數(shù)字化工作的人員了解自己的工作量和整個(gè)數(shù)字化進(jìn)度,確保數(shù)字化工作進(jìn)展順利。
4、數(shù)字化加工環(huán)境搭建與工作計(jì)劃
檔案數(shù)字化加工工作人員必須通過嚴(yán)格的面試、考試合格后才能錄用,同時(shí)提供個(gè)人簡歷及相關(guān)證件,雙方簽訂保密協(xié)議。工作人員由檔案數(shù)字化加工公司經(jīng)驗(yàn)豐富的項(xiàng)目經(jīng)理進(jìn)行統(tǒng)一上崗培訓(xùn),具備檔案數(shù)字化加工的相關(guān)知識(shí)。檔案數(shù)字化工作涉及環(huán)節(jié)多、工作量大。往往需要大量工作人員來協(xié)同完成,這種情況下尤其需要明確工作內(nèi)容與職責(zé),否則人多反而協(xié)調(diào)困難,差錯(cuò)多。
5、現(xiàn)場設(shè)備管理
檔案數(shù)字化加工過程中現(xiàn)場所使用的掃描儀設(shè)備、服務(wù)器、存儲(chǔ)介質(zhì)等,應(yīng)當(dāng)嚴(yán)格按照涉密設(shè)備進(jìn)行管理和使用,不使用無保密保障的設(shè)備。
6、實(shí)時(shí)監(jiān)控
按照信息安全管理體系ISO270001的要求,對(duì)加工現(xiàn)場實(shí)施24小時(shí)監(jiān)控,及時(shí)掌握現(xiàn)場加工狀態(tài),保證現(xiàn)場加工信息安全。
(全國總部)河南省鄭州市金水區(qū)農(nóng)業(yè)路71號(hào)中州國際飯店1617-1618
+18937133779
zboao@qq.com
中博奧技術(shù)有限公司& 版權(quán)所有
工信部備案號(hào):豫ICP備11015869號(hào)-8