智慧檔案管理與大數(shù)據(jù)解決方案的領(lǐng)航者,讓信息價(jià)值超越期待
電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
一、聲像檔案數(shù)字化處理與保存的必要性
對(duì)聲像檔案進(jìn)行數(shù)字化處理與保存是由其特性決定的,是聲像檔案管理的必然選擇。首先,聲像檔案的載體材料容易受到溫度、濕度、光照等因素的影響,與紙質(zhì)材料相比不具有足夠的穩(wěn)定性,想要長(zhǎng)久保存需要更高的條件要求。尤其是錄像、錄音帶等具有磁性的檔案載體,不僅要防高溫、防潮濕、防光照,還必須要防磁,一旦受到上述外部因素的影響,聲像檔案就容易損壞,甚至造成檔案報(bào)廢。比如,錄像、錄音帶會(huì)出現(xiàn)消磁、斷裂、變形、磁粉脫落等現(xiàn)象;照片保存久了會(huì)發(fā)黃褪色,底片還容易變質(zhì)粘連。其次,在科學(xué)技術(shù)不斷發(fā)展的背景下,各種聲像設(shè)備也層出不窮,更新?lián)Q代的速度非常快,而那些老舊的聲像檔案資料就難以被保管利用。尤其是錄像、錄音檔案,常常需要與之相匹配的設(shè)備支持,檔案管理人員需要利用特定型號(hào)的錄像機(jī)、錄音機(jī)對(duì)錄像帶、錄音帶進(jìn)行檢查,當(dāng)需要播放的時(shí)候也要相應(yīng)的錄像機(jī)與錄音機(jī)支持。然而,隨著聲像設(shè)備的更新?lián)Q代,一些老舊型號(hào)的設(shè)備將逐漸被淘汰,如果原來(lái)的設(shè)備出現(xiàn)故障,也將難以維修,這也是聲像檔案難以長(zhǎng)期管理保存的重要原因之一。所以,傳統(tǒng)的聲像檔案不易長(zhǎng)久保存與管理,對(duì)聲像檔案進(jìn)行數(shù)字化處理是當(dāng)前較為有效的保護(hù)傳統(tǒng)聲像檔案的措施。對(duì)聲像檔案進(jìn)行數(shù)字化處理,不僅可以把原有的模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)從而方便備份、保存,還可以實(shí)現(xiàn)快速的數(shù)字化檢索從而便于利用與管理。總之,對(duì)聲像檔案進(jìn)行數(shù)字化處理對(duì)于聲像檔案的管理與保存具有重要意義,也是聲像檔案管理的必然選擇。
二、聲像檔案數(shù)字化處理的主要技術(shù)
?。ㄒ唬?duì)視頻、音頻檔案資料的數(shù)字化格式轉(zhuǎn)換
對(duì)視頻、音頻檔案資料的數(shù)字化格式轉(zhuǎn)換,就是把以前的模擬信號(hào)轉(zhuǎn)換為計(jì)算機(jī)可以識(shí)別出的離散型信號(hào),這種格式轉(zhuǎn)換需要利用計(jì)算機(jī)軟件來(lái)實(shí)現(xiàn),如A/D轉(zhuǎn)化器、WindowsWaveCN等。當(dāng)我們需要采集新的視頻、音頻資料時(shí),可以直接把錄像機(jī)、錄音機(jī)等設(shè)備連接到計(jì)算機(jī)上,將所錄信息直接存儲(chǔ)到電腦的硬盤(pán)里面,這一信息資料的采集過(guò)程即為數(shù)字化的轉(zhuǎn)換處理過(guò)程。
?。ǘ?duì)圖片檔案資料的數(shù)字化處理
當(dāng)前檔案館中的圖片檔案資料包括電子文檔形式的電子檔案、紙質(zhì)檔案。對(duì)于電子文檔形式的電子檔案可以直接儲(chǔ)存到檔案管理的軟件中,利用軟件程序?qū)n案實(shí)現(xiàn)自動(dòng)化管理。如果想要借閱或輸出圖片檔案資料,用戶可以進(jìn)入檔案管理程序中進(jìn)行檢索,然后利用打印機(jī)把需要的圖片打印出來(lái)。對(duì)于紙質(zhì)的圖片檔案,如果內(nèi)容較為豐富、數(shù)量較多,可以分批次對(duì)其進(jìn)行電子掃描,并及時(shí)對(duì)掃描的文件進(jìn)行說(shuō)明注釋,主要是把圖片的拍攝地點(diǎn)、時(shí)間以及其所呈現(xiàn)的基本事件說(shuō)清楚,以便后期對(duì)圖片檔案資料的分類、歸檔。對(duì)于一些由于年代久遠(yuǎn)而磨損、發(fā)黃的圖片,可以對(duì)其電子掃描后利用PS等軟件來(lái)修復(fù),使其恢復(fù)到最佳效果。
(三)對(duì)數(shù)字化的聲像檔案進(jìn)行統(tǒng)一管理
對(duì)于數(shù)字化的聲像檔案可以利用AdobeAudition、AdobePremiere等軟件對(duì)其進(jìn)行編輯壓縮,對(duì)壓縮后的聲像檔案文件及時(shí)編制獨(dú)立檔案號(hào)、分類號(hào)等,再通過(guò)設(shè)定搜索關(guān)鍵詞方便用戶今后對(duì)這些聲像檔案的查找應(yīng)用,同時(shí)也方便了檔案管理人員的工作,提升了工作效率。
三、數(shù)字化處理后的聲像檔案保存方法
數(shù)字化的聲像檔案與紙質(zhì)檔案相比具有極大的優(yōu)勢(shì),而且與先前的模擬聲像檔案資料相比,其在保質(zhì)、保真、高壓縮率等方面也遙遙領(lǐng)先。然而數(shù)字化的聲像檔案具有特殊性的運(yùn)行機(jī)制與技術(shù)手段,這使得其在保存方面存在諸多需要解決的問(wèn)題。所以,我們不僅要關(guān)注數(shù)字化聲像檔案的體制機(jī)制建設(shè)等宏觀問(wèn)題,還要使得數(shù)字化聲像檔案便于存儲(chǔ)、查閱、利用。當(dāng)前,數(shù)字化的聲像檔案保存方法主要包括以下幾種:
1、保存好聲像檔案的讀取設(shè)備。在對(duì)聲像檔案進(jìn)行數(shù)字化處理后,其不再具備人工直接讀識(shí)性,必須依靠一定的讀取設(shè)備才能對(duì)聲像檔案進(jìn)行讀取。所以,數(shù)字化聲像檔案的重要保存方法之一便是保存好其讀取設(shè)備。
2、仿真法。這是一種對(duì)即將淘汰的信息進(jìn)行保存的重要方法。這種方法主要是利用仿真器在一個(gè)電腦系統(tǒng)中模擬另一個(gè)電腦系統(tǒng)來(lái)保護(hù)那些即將被淘汰的重要信息。
3、數(shù)據(jù)信息遷移法。這種方法主要是把數(shù)字化的聲像檔案定期從一個(gè)過(guò)時(shí)的技術(shù)環(huán)境向一個(gè)新的技術(shù)環(huán)境遷移,從而避免數(shù)據(jù)信息在技術(shù)更新?lián)Q代中造成的損壞、丟失,保證其可用性、可讀性及完整性。這種方法是當(dāng)前保存數(shù)字化聲像檔案最有效的方法之一。
4、完善數(shù)字化聲像檔案的保存條件,建立科學(xué)、安全的保存環(huán)境,加強(qiáng)對(duì)硬件保存設(shè)施、基礎(chǔ)設(shè)施建設(shè),比如防磁柜、防磁庫(kù)建設(shè)。
北京市首批重要建筑的檔案電子數(shù)據(jù)入庫(kù)重慶市城建檔案館專用庫(kù)房保管。
北京市城市建設(shè)檔案館,辦公室地址位于交通便利的北京西城北京市西城區(qū)復(fù)興門(mén)外二七劇場(chǎng)路5號(hào),我單位主要提供收集保管借閱城建檔案,為城市建設(shè)服務(wù),城建檔案收集,管理,鑒定,借閱,保護(hù),城建檔案資料編輯和研究,城建檔案數(shù)字化處理,相關(guān)業(yè)務(wù)指導(dǎo)和培訓(xùn),相關(guān)社會(huì)服務(wù)。
找點(diǎn)通數(shù)據(jù)吧,我們單位跟點(diǎn)通有合作,我覺(jué)得他們公司不錯(cuò),是大公司,挺專業(yè)的。
檔案數(shù)字化加工具體過(guò)程
前期檔案整理檔案借出
從檔案室接件,填寫(xiě)檔案移交清冊(cè),一式兩份。拿到檔案后,開(kāi)始核對(duì)檔案數(shù)量,數(shù)量核對(duì)無(wú)誤后簽字確認(rèn),將檔案拿回加工現(xiàn)場(chǎng)。
目錄數(shù)據(jù)準(zhǔn)備
按照各類檔案整理規(guī)定的要求,在檔案管理系統(tǒng)著錄目錄數(shù)據(jù)。如有錯(cuò)誤或不規(guī)范的案卷題名、文件名、責(zé)任者、日期、起止頁(yè)號(hào)等,應(yīng)進(jìn)行修改。
拆除裝訂
在不去除裝訂物情況下,會(huì)影響掃描工作進(jìn)行的檔案,應(yīng)拆除裝訂物。拆除裝訂物時(shí)應(yīng)注意保護(hù)檔案不受損害。
頁(yè)面修整
破損嚴(yán)重、無(wú)法直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù),折皺不平影響掃描質(zhì)量的原件應(yīng)先進(jìn)行相應(yīng)處理(壓平或熨平等)后再進(jìn)行掃描。
檔案掃描
掃描方式
?。?)根據(jù)檔案幅面的大小(A4、A3、A0等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可采用0號(hào)圖紙掃描儀)進(jìn)行掃描。大幅面檔案可采用大幅面數(shù)碼平臺(tái),或者縮微拍攝后的膠片數(shù)字化轉(zhuǎn)換設(shè)備等進(jìn)行掃描。
?。?)紙張狀況較差,以及過(guò)薄、過(guò)軟或超厚的檔案,應(yīng)采用平板掃描方式;紙張狀況好的檔案,可采用高速掃描方式以提高工作效率。
掃描色彩模式
(1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用彩色。
(2)頁(yè)面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進(jìn)行掃描。
(3)頁(yè)面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁(yè)面為多色文字的檔案,可采用灰度模式掃描。
?。?)頁(yè)面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可采用彩色模式進(jìn)行掃描。
掃描分辨率
?。?)掃描分辨率參數(shù)大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準(zhǔn)。
?。?)采用黑白二值、灰度、彩色幾種模式對(duì)檔案進(jìn)行掃描時(shí),其分辨率一般應(yīng)設(shè)為200-300dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當(dāng)提高分辨率。
圖像處理
圖像數(shù)據(jù)質(zhì)量檢查
?。?)對(duì)圖像偏斜度、清晰度、失真度等進(jìn)行檢查。發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像的處理。
(2)由于操作不當(dāng),造成掃描的圖像文件不完整或無(wú)法清晰識(shí)別時(shí),應(yīng)重新掃描。
(3)發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確插入圖像。
(4)發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。
糾偏、去污、圖像拼接、裁邊處理
?。?)對(duì)出現(xiàn)偏斜的圖像應(yīng)進(jìn)行糾偏處理,以達(dá)到視覺(jué)上基本不感覺(jué)偏斜為準(zhǔn)。對(duì)方向不正確的圖像應(yīng)進(jìn)行旋轉(zhuǎn)還原,以符合閱讀習(xí)慣。
(2)對(duì)圖像頁(yè)面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì),如黑點(diǎn)、黑線、黑框、黑邊等應(yīng)進(jìn)行去污處理。處理過(guò)程中應(yīng)遵循在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。
?。?)對(duì)大幅面檔案進(jìn)行分區(qū)掃描形成的多幅圖像,應(yīng)進(jìn)行拼接處理,合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性。
?。?)采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲(chǔ)空間。
圖像存儲(chǔ)
存儲(chǔ)格式
?。?)采用黑白二值模式掃描的圖像文件,一般采用PDF格式存儲(chǔ)。
?。?)采用灰度模式和彩色模式掃描的文件,一般采用PDF格式存儲(chǔ)。
圖像文件命名
?。?)紙質(zhì)檔案目錄數(shù)據(jù)庫(kù)中的每一份文件,都有一個(gè)與之相對(duì)應(yīng)的檔號(hào),以該檔號(hào)為這份文件掃描后的圖像文件命名。如圖像文件較大,不便于網(wǎng)絡(luò)瀏覽,可拆分為多個(gè)圖像文件,文件名后增加A、B、C等區(qū)別。
?。?)分別建立文件夾,以文件檔號(hào)命名,并存儲(chǔ)對(duì)應(yīng)圖像文件。
數(shù)據(jù)掛接
將每一份紙質(zhì)檔案掃描所得的圖像存儲(chǔ)到相應(yīng)檔號(hào)的文件夾后,認(rèn)真核查每一份圖像文件的名稱與檔案目錄數(shù)據(jù)庫(kù)中該份文件的檔號(hào)是否相同,圖像文件的頁(yè)數(shù)與檔案目錄數(shù)據(jù)庫(kù)中文件的總頁(yè)數(shù)是否相同等。通過(guò)每一份圖像文件所在文件夾的名稱與檔案目錄數(shù)據(jù)庫(kù)中該份文件的檔號(hào)的一致性,建立起一一對(duì)應(yīng)的關(guān)聯(lián)關(guān)系,為實(shí)現(xiàn)檔案目錄數(shù)據(jù)庫(kù)與圖像文件的批量掛接提供條件。
還是看你需求,檔案館的資料很多是有價(jià)值并不對(duì)外公開(kāi)。對(duì)于做專項(xiàng)研究來(lái)講,就有其價(jià)值。另外,針對(duì)網(wǎng)絡(luò)檔案館要根據(jù)自己需求做檢索策略,即在分析檢索課題內(nèi)容實(shí)質(zhì)基礎(chǔ)上,選擇檢索路徑和關(guān)鍵詞,這樣會(huì)快。舉例:北京檔案館 自其成立以來(lái),共完成800萬(wàn)條案卷級(jí)及文件級(jí)目錄錄入和8000萬(wàn)頁(yè)檔案數(shù)字化工作,本身就是海量信息。核心利用網(wǎng)絡(luò)檢索查詢數(shù)字化檔案?這樣可以節(jié)約時(shí)間,提高效率。 請(qǐng)參考~