電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
電子檔案憑借完整性、共享性、便于傳輸、便于利用等優(yōu)勢(shì),已成為國(guó)家檔案資源的重要組成部分。隨著信息技術(shù)的進(jìn)步和檔案數(shù)字化工作的開展,電子檔案的存儲(chǔ)量大幅增加。如何長(zhǎng)期安全有效地存儲(chǔ)電子檔案成為檔案部門亟待解決的問題。鑒于此,國(guó)家檔案局檔案科學(xué)技術(shù)研究所成立課題組,對(duì)國(guó)內(nèi)多家綜合檔案館進(jìn)行調(diào)研,了解其在存儲(chǔ)格式、載體選擇、技術(shù)應(yīng)用和數(shù)據(jù)組織等方面的工作,分析電子檔案存儲(chǔ)技術(shù)的特點(diǎn)和存在問題,并提出相關(guān)建議。
概況
1.數(shù)據(jù)特點(diǎn)
電子檔案數(shù)據(jù)來(lái)源廣泛,主要包括檔案數(shù)字化、電子政務(wù)平臺(tái)、內(nèi)部辦公軟件、通用字處理軟件、業(yè)務(wù)軟件等數(shù)據(jù),其中通過(guò)掃描、數(shù)字照相、攝像等數(shù)字化后產(chǎn)生的數(shù)據(jù)所占比例較大;電子檔案存儲(chǔ)量大幅增加,各地綜合檔案館的電子檔案存儲(chǔ)容量已經(jīng)從GB級(jí)達(dá)到TB級(jí),甚至PB級(jí);各種文件類型特點(diǎn)鮮明,圖像類文件較大、數(shù)量較多、占用的存儲(chǔ)空間最大,文本類文件較小、數(shù)量最多、占用的存儲(chǔ)空間較小,音頻和視頻類文件最大、數(shù)量較少、占用存儲(chǔ)空間較大。
2.存儲(chǔ)情況
在存儲(chǔ)載體方面,使用的存儲(chǔ)介質(zhì)主要是光盤、磁帶、磁盤。存儲(chǔ)設(shè)備主要是磁盤陣列、磁帶庫(kù)及光盤庫(kù)。存儲(chǔ)介質(zhì)的類型主要是DVD-R、LTO磁帶、SATA盤和SAS盤,使用的主要品牌有索尼、JVC、萊德、紫光、昆騰、惠普、IBM、希捷、西部數(shù)據(jù)等。
在存儲(chǔ)技術(shù)方面,在線存儲(chǔ)和離線存儲(chǔ)是電子檔案存儲(chǔ)的主要方式,主要使用的存儲(chǔ)技術(shù)是SAN技術(shù),以及少量的NAS和DAS技術(shù)??紤]到數(shù)據(jù)安全、施工難度以及技術(shù)成熟度等問題,云存儲(chǔ)技術(shù)的應(yīng)用普及度不高。
3.標(biāo)準(zhǔn)規(guī)范
在電子檔案存儲(chǔ)方面具有統(tǒng)一適用性的標(biāo)準(zhǔn)規(guī)范較少,主要是推薦性標(biāo)準(zhǔn),如《電子文件歸檔與管理規(guī)范》和《磁性載體檔案管理與保護(hù)規(guī)范》對(duì)存檔載體的選擇和使用提出了建議;缺乏存儲(chǔ)載體使用方面的標(biāo)準(zhǔn),如《電子文件歸檔光盤技術(shù)要求和應(yīng)用規(guī)范》是目前唯一在介質(zhì)層面對(duì)數(shù)據(jù)可靠性進(jìn)行系統(tǒng)規(guī)范的標(biāo)準(zhǔn)性文件。
問題
1.存儲(chǔ)格式種類繁多,非結(jié)構(gòu)化數(shù)據(jù)量比重較大
根據(jù)調(diào)研,檔案部門所使用的存儲(chǔ)格式近20種,使用比例較高的存儲(chǔ)格式有:TXT、DOC、XML、PDF、TIFF、JPEG、DBF、XLS、WAV、MP3、AVI、MP4等文件格式,這些不方便用數(shù)據(jù)庫(kù)二維邏輯表來(lái)表現(xiàn)的數(shù)據(jù)都是非結(jié)構(gòu)化的數(shù)據(jù),大量的非結(jié)構(gòu)化數(shù)據(jù)給電子檔案存儲(chǔ)的性能、安全和穩(wěn)定性等提出了很高的要求。此外,非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)多采用文件系統(tǒng)進(jìn)行保存,雖然這種方式實(shí)現(xiàn)簡(jiǎn)單,但無(wú)法實(shí)現(xiàn)文件的事務(wù)性訪問,不便于數(shù)據(jù)的備份、恢復(fù)、遷移等。
2.存儲(chǔ)介質(zhì)的可靠性難以確定
存儲(chǔ)介質(zhì)無(wú)明確使用壽命。電子檔案存儲(chǔ)介質(zhì)的使用年限由外部因素和內(nèi)部因素2個(gè)方面決定:外部因素由保存環(huán)境(溫濕度、磁場(chǎng)、塵埃、光照、有害氣體等)、使用頻度和使用方法等因素決定;內(nèi)部因素由存儲(chǔ)設(shè)備自身各項(xiàng)指標(biāo)決定,如,光盤盤基的材料、記錄層和染料層的材料,磁帶帶基的材料、磁層記錄介質(zhì)的穩(wěn)定性,磁盤盤片、磁頭的材料等。目前,存儲(chǔ)介質(zhì)出現(xiàn)問題的比例較高,種類多樣,沒有明確特征和趨勢(shì),其中數(shù)據(jù)無(wú)法讀取的情況較多。
3.技術(shù)標(biāo)準(zhǔn)和管理規(guī)范不完善
在調(diào)研過(guò)程中我們發(fā)現(xiàn),存儲(chǔ)載體選擇、使用、保存、維護(hù)等方面的標(biāo)準(zhǔn)很少,除光盤以外,磁帶、磁帶庫(kù)、磁盤、磁盤陣列都沒有形成系統(tǒng)的標(biāo)準(zhǔn)體系來(lái)規(guī)范存儲(chǔ)工作,部分標(biāo)準(zhǔn)需要修訂。由于存儲(chǔ)設(shè)備在使用過(guò)程中問題多樣,預(yù)見性差,沒有確定的維護(hù)周期和檢測(cè)方法,這種情況持續(xù)下去必然成為電子檔案安全存儲(chǔ)的巨大隱患。
4.已有技術(shù)標(biāo)準(zhǔn)未得到及時(shí)應(yīng)用
目前,國(guó)家已經(jīng)頒布了一些關(guān)于電子檔案存儲(chǔ)方面的標(biāo)準(zhǔn),但由于宣傳力度不夠、技術(shù)水平較低、資金相對(duì)短缺等原因,相關(guān)標(biāo)準(zhǔn)并沒有被廣泛采納。如,在存儲(chǔ)格式方面,《電子文件歸檔與管理規(guī)范》中規(guī)定了文字型電子文件、掃描型電子文件、音頻類電子文件、視頻類和多媒體電子文件的通用格式,而在調(diào)研中我們發(fā)現(xiàn),除了掃描類和音頻類電子文件與規(guī)范要求相一致以外,文字型和視頻類電子文件大多采用了規(guī)范要求以外的多種存儲(chǔ)格式;在存儲(chǔ)載體使用方面,《電子文件歸檔光盤技術(shù)要求和應(yīng)用規(guī)范》中詳細(xì)介紹了光盤的選擇、使用、保存、維護(hù)和檢測(cè)等方面的內(nèi)容,而在調(diào)研中我們發(fā)現(xiàn),很多單位在使用光盤存儲(chǔ)時(shí)并沒有依照該標(biāo)準(zhǔn)。
5.核心技術(shù)被國(guó)外廠商控制
調(diào)查顯示,電子檔案的存儲(chǔ)介質(zhì)和存儲(chǔ)設(shè)備多為國(guó)外品牌,國(guó)產(chǎn)品牌僅占很小份額,同時(shí),生產(chǎn)存儲(chǔ)設(shè)備的核心技術(shù)基本由外國(guó)公司掌握。在這種情況下,不僅是存儲(chǔ)設(shè)備的市場(chǎng)受到外國(guó)控制,更重要的是電子檔案保性和安全性受到嚴(yán)重威脅。近年來(lái),美國(guó)“棱鏡門”事件、海康威視設(shè)備被境外IP地址控制事件以及勒索病毒爆發(fā)事件等為電子檔案安全存儲(chǔ)工作敲響了警鐘。為了保證電子檔案的安全可靠,要盡快建立安全保障體系,防止信息泄露的情況發(fā)生。
建議
1.政策方面
(1)建立電子檔案存儲(chǔ)的綜合決策與信息反饋機(jī)制
電子檔案的存儲(chǔ)工作必須加強(qiáng)統(tǒng)一領(lǐng)導(dǎo)與協(xié)調(diào)。一是要建立全國(guó)電子檔案存儲(chǔ)綜合決策機(jī)構(gòu),統(tǒng)一組織全國(guó)電子檔案存儲(chǔ)攻關(guān)工作,為電子檔案存儲(chǔ)工作制定規(guī)劃,并為相關(guān)科研機(jī)構(gòu)提供決策服務(wù);二是要建立全國(guó)統(tǒng)一的電子檔案存儲(chǔ)信息網(wǎng)絡(luò),不但可以了解全國(guó)各級(jí)檔案館的電子檔案存儲(chǔ)狀況,也可以收集電子檔案存儲(chǔ)方面的數(shù)據(jù)信息;三是要加強(qiáng)電子檔案存儲(chǔ)部門間的合作和技術(shù)交流,尤其要學(xué)習(xí)引進(jìn)國(guó)外先進(jìn)存儲(chǔ)技術(shù)和網(wǎng)絡(luò)技術(shù),及時(shí)交流成果,并在技術(shù)、設(shè)備和人員等方面達(dá)成共享。
(2)制定電子文件存儲(chǔ)工作流程和管理辦法
為了使電子檔案存儲(chǔ)工作順利進(jìn)行,必須實(shí)行制度化和規(guī)范化管理,電子檔案存儲(chǔ)的各個(gè)部門要保持統(tǒng)一和協(xié)調(diào),使存儲(chǔ)工作正常有序地運(yùn)行。關(guān)于存儲(chǔ)工作的管理可以參考以下幾個(gè)方面:制定適宜的存儲(chǔ)策略,采用在線存儲(chǔ)、離線存儲(chǔ)等管理方式,實(shí)現(xiàn)電子檔案在不同存儲(chǔ)系統(tǒng)中的遷移和轉(zhuǎn)換;所使用的電子檔案存儲(chǔ)系統(tǒng)應(yīng)經(jīng)過(guò)檢測(cè);電子檔案應(yīng)定期進(jìn)行數(shù)據(jù)讀取和檢驗(yàn);根據(jù)實(shí)際需求,制定電子檔案管理工作制度。
(3)加大宣傳力度,擴(kuò)大已有成果的影響力
加強(qiáng)對(duì)現(xiàn)有文件、標(biāo)準(zhǔn)、技術(shù)等成果的宣傳和貫徹力度,提高其推廣和實(shí)施效果。通過(guò)網(wǎng)絡(luò)、報(bào)刊等媒體擴(kuò)大宣傳,同時(shí),組織編寫相關(guān)指南、手冊(cè)及教材等指導(dǎo)性材料,為用戶解難答疑,促進(jìn)現(xiàn)有文件和標(biāo)準(zhǔn)的執(zhí)行。另外,還可以組織專門培訓(xùn)班,開展各種類型的學(xué)術(shù)活動(dòng),深化交流,有效擴(kuò)大已有成果的影響力。
2.標(biāo)準(zhǔn)規(guī)范方面
(1)制定存儲(chǔ)設(shè)備的技術(shù)標(biāo)準(zhǔn)
為了保證電子檔案存儲(chǔ)的長(zhǎng)期性、安全性和有效性,存儲(chǔ)設(shè)備檢測(cè)標(biāo)準(zhǔn)的制定和檢測(cè)設(shè)備的研制成為電子檔案存儲(chǔ)標(biāo)準(zhǔn)化的趨勢(shì)。此類標(biāo)準(zhǔn)的制定可以從性能參數(shù)、使用要求、存儲(chǔ)壽命、檢測(cè)標(biāo)準(zhǔn)、數(shù)據(jù)遷移策略等方面入手,通過(guò)數(shù)據(jù)直觀反映存儲(chǔ)設(shè)備的運(yùn)行情況和存儲(chǔ)數(shù)據(jù)的保存情況,使電子檔案存儲(chǔ)有法可依、有據(jù)可查。
(2)制定存儲(chǔ)介質(zhì)的使用規(guī)范
由于存儲(chǔ)介質(zhì)結(jié)構(gòu)復(fù)雜,其許多制造技術(shù)和檢測(cè)方法國(guó)內(nèi)并沒有完全掌握,因此制定一套完善的標(biāo)準(zhǔn)體系比較困難。但是,我們可以從存儲(chǔ)介質(zhì)使用方面入手,制定相應(yīng)的使用規(guī)范,如在數(shù)據(jù)遷移、檢測(cè)標(biāo)準(zhǔn)、檢測(cè)周期、保存環(huán)境等方面提出要求,減少存儲(chǔ)介質(zhì)在使用過(guò)程中受到的損害。
(3)制定數(shù)據(jù)遷移的技術(shù)標(biāo)準(zhǔn)
數(shù)據(jù)遷移是電子檔案長(zhǎng)期存儲(chǔ)工作的重要組成部分。更換存儲(chǔ)載體、系統(tǒng)升級(jí)、數(shù)據(jù)備份等情況都需要進(jìn)行數(shù)據(jù)遷移。數(shù)據(jù)遷移工作的重點(diǎn)就是要保證遷移數(shù)據(jù)的完整性、準(zhǔn)確性、一致性和安全性。然而,數(shù)據(jù)遷移工作種類多樣、情況復(fù)雜,在數(shù)據(jù)遷移過(guò)程中容易出現(xiàn)問題。為了保證數(shù)據(jù)遷移工作的順利進(jìn)行,必須實(shí)現(xiàn)數(shù)據(jù)遷移的標(biāo)準(zhǔn)化和規(guī)范化。目前,常用的數(shù)據(jù)遷移類型包括:基于主機(jī)的數(shù)據(jù)遷移、數(shù)據(jù)備份及恢復(fù)、基于存儲(chǔ)的數(shù)據(jù)遷移、應(yīng)用軟件遷移等。我們可以根據(jù)數(shù)據(jù)遷移類型的特點(diǎn),制定相應(yīng)的標(biāo)準(zhǔn),從而規(guī)范操作,解決一些實(shí)際問題。
3.技術(shù)方面
(1)開展存儲(chǔ)介質(zhì)的可靠性研究
檔案部門在注重存儲(chǔ)介質(zhì)性能的同時(shí),更加注重存儲(chǔ)介質(zhì)的可靠性,只有了解存儲(chǔ)介質(zhì)使用壽命或數(shù)據(jù)存儲(chǔ)性能,才能從技術(shù)上保證電子檔案的長(zhǎng)期存儲(chǔ)。目前,有關(guān)存儲(chǔ)介質(zhì)可靠性方面的研究較少,應(yīng)加大開展存儲(chǔ)介質(zhì)可靠性的研究力度,探索影響電子檔案存儲(chǔ)的關(guān)鍵指標(biāo),開展存儲(chǔ)介質(zhì)的相關(guān)試驗(yàn)和測(cè)試工作,為檔案部門合理使用電子檔案存儲(chǔ)介質(zhì)提供依據(jù)。
(2)研究適合檔案部門使用的海量數(shù)據(jù)存儲(chǔ)技術(shù)
近年來(lái),隨著電子檔案數(shù)據(jù)量的大幅增加,海量數(shù)據(jù)存儲(chǔ)技術(shù)需求突顯。從調(diào)研結(jié)果來(lái)看,圖像類及視頻類電子檔案存儲(chǔ)量增長(zhǎng)幅度較大。這就要求檔案部門跟蹤研究海量數(shù)據(jù)(視頻類、圖像類文件)的存儲(chǔ)技術(shù),研究不同存儲(chǔ)載體的工作原理、性能參數(shù)、技術(shù)特點(diǎn)、市場(chǎng)因素等,做好海量數(shù)據(jù)存儲(chǔ)的技術(shù)儲(chǔ)備工作。
(3)開展電子文件長(zhǎng)期保存數(shù)據(jù)格式的研究
數(shù)據(jù)格式直接影響電子檔案的原始性、憑證性和價(jià)值性。調(diào)研顯示,數(shù)據(jù)格式存在種類繁多、非結(jié)構(gòu)化數(shù)據(jù)量比重較大等問題,我們必須掌握國(guó)家標(biāo)準(zhǔn)規(guī)定的數(shù)據(jù)格式,了解相關(guān)行業(yè)通用的、開放的格式標(biāo)準(zhǔn),選擇適合電子檔案長(zhǎng)期保存的數(shù)據(jù)格式,開展其在檔案行業(yè)的應(yīng)用研究。
參考文獻(xiàn):
1.馮惠玲.電子文件管理教程[M].中國(guó)人民大學(xué)出版社,2001.
2.劉家真.電子文件管理理論與實(shí)踐[M].科學(xué)出版社,2003.
3.方雷江.存儲(chǔ)技術(shù)應(yīng)用現(xiàn)狀調(diào)查[D].長(zhǎng)江理工大學(xué),2014.
4.顏曉棟.電子文件的長(zhǎng)期保存研究[D].武漢大學(xué),2004.
5.唐躍進(jìn),萬(wàn)麗娟.數(shù)字檔案信息存儲(chǔ)與災(zāi)難恢復(fù)研究[J].檔案學(xué)通訊,2011(2).
6.馮麗偉.電子檔案存儲(chǔ)技術(shù)前期研究[J].中國(guó)檔案,2015(1).
作者單位:國(guó)家檔案局科研所
(全國(guó)總部)河南省鄭州市金水區(qū)農(nóng)業(yè)路71號(hào)中州國(guó)際飯店1617-1618
+18937133779
zboao@qq.com
中博奧技術(shù)有限公司& 版權(quán)所有
工信部備案號(hào):豫ICP備11015869號(hào)-8