国产超清无码e片内射免费_亚洲成a人片毛片在线_91在线国自产拍_夜夜天天噜狠狠爱_无码人妻丰满熟妇88Av_男女性爱小说乱伦亚洲不卡_亚洲性春暖花开贴吧_免费a级毛片无码a∨免费软件_欧美日韩精品第1页_久热国产vs视频在线

歡迎來(lái)到中博奧技術(shù)有限公司官網(wǎng)

什么是“檔案數(shù)據(jù)”?檔案數(shù)據(jù)與傳統(tǒng)檔案有哪些不同?一文探析檔案數(shù)據(jù)內(nèi)涵與特征

時(shí)間:2022-04-02 作者: 來(lái)源:網(wǎng)絡(luò) 點(diǎn)擊量:

檔案數(shù)據(jù)

本文看點(diǎn)

1.檔案數(shù)據(jù)是在什么樣的時(shí)代背景下形成的?

2.檔案數(shù)據(jù)與傳統(tǒng)檔案有哪些不同?

3.檔案數(shù)據(jù)的含義是什么?檔案數(shù)據(jù)有哪些特征?

摘 要:檔案數(shù)據(jù)作為大數(shù)據(jù)時(shí)代檔案領(lǐng)域出現(xiàn)的新概念,雖被檔案界普遍使用,但其概念內(nèi)涵并不明朗。對(duì)檔案數(shù)據(jù)形成的時(shí)代背景進(jìn)行分析,從存在粒度、開(kāi)發(fā)方式和價(jià)值特性三個(gè)方面探討檔案數(shù)據(jù)與傳統(tǒng)檔案的差異,提出檔案數(shù)據(jù)是數(shù)據(jù)化的檔案信息及具備檔案性質(zhì)的數(shù)據(jù)記錄,具有廣源性、共生與互生性、累積性、擴(kuò)展性和易算性等新的特征形態(tài)。

關(guān)鍵詞:大數(shù)據(jù);檔案數(shù)據(jù);檔案信息

基金項(xiàng)目:國(guó)家社科基金重點(diǎn)項(xiàng)目“大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理研究”(19ATQ007)。

1 檔案數(shù)據(jù)形成的時(shí)代背景

1.1 數(shù)據(jù)化浪潮:檔案形成生態(tài)環(huán)境的變化

社會(huì)數(shù)據(jù)化程度的加深。數(shù)據(jù)化“是人類(lèi)在信息傳播、人際交往乃至日常生活的過(guò)程中,為了便于溝通、傳播與保存,將一切客觀存在均處理為數(shù)據(jù),進(jìn)而使得整個(gè)人類(lèi)社會(huì)成為了一個(gè)龐大的數(shù)據(jù)庫(kù)?!?/p>

[3]數(shù)據(jù)化社會(huì)不僅帶來(lái)了空前的信息技術(shù)革新,更創(chuàng)造了全新的生產(chǎn)模式、工作業(yè)態(tài)和生活方式,在物理世界之上構(gòu)筑起數(shù)據(jù)世界,進(jìn)而深刻塑造著檔案工作的社會(huì)生態(tài)環(huán)境,推動(dòng)著檔案工作與數(shù)據(jù)的關(guān)聯(lián)和融合。

檔案形成生態(tài)正在由“模擬態(tài)”“數(shù)字態(tài)”向“數(shù)據(jù)態(tài)”轉(zhuǎn)變。檔案是社會(huì)背景的真實(shí)反映和社會(huì)活動(dòng)的真實(shí)記錄,數(shù)據(jù)化浪潮從源頭上改變了檔案信息的記錄、讀取、存儲(chǔ)和傳播方式,檔案數(shù)據(jù)大量產(chǎn)生,“原生環(huán)境數(shù)據(jù)化、形成方式數(shù)據(jù)化、來(lái)源形態(tài)數(shù)據(jù)化”的檔案形成生態(tài)逐漸形成,檔案資源形態(tài)從模擬態(tài)、數(shù)字態(tài)向數(shù)據(jù)態(tài)“質(zhì)變”,檔案數(shù)據(jù)將成為數(shù)據(jù)時(shí)代檔案信息資源的主體,檔案工作正在經(jīng)歷一個(gè)從管理檔案實(shí)體到管理檔案數(shù)據(jù)的應(yīng)變過(guò)程。

1.2 檔案事業(yè)的“數(shù)據(jù)革命”:檔案工作從“數(shù)字化”向“數(shù)據(jù)化”轉(zhuǎn)型

檔案政策話(huà)語(yǔ)的數(shù)據(jù)化理念。在全面促進(jìn)大數(shù)據(jù)的布局和發(fā)展中,檔案數(shù)據(jù)也成為檔案管理工作的重要內(nèi)容,“檔案數(shù)據(jù)”一詞在國(guó)家相關(guān)政策標(biāo)準(zhǔn)條文中頻繁呈現(xiàn)(見(jiàn)圖1)。由此可見(jiàn),檔案數(shù)據(jù)管理已納入國(guó)家檔案事業(yè)發(fā)展頂層設(shè)計(jì)之中。

檔案數(shù)據(jù)

圖1 含“檔案數(shù)據(jù)”概念的相關(guān)政策標(biāo)準(zhǔn)條文

檔案管理部門(mén)的數(shù)據(jù)化實(shí)踐。檔案信息化工作開(kāi)展以來(lái),檔案部門(mén)進(jìn)行的以數(shù)字化掃描、數(shù)字檔案館(室)建設(shè)、數(shù)字化利用服務(wù)為主的檔案“數(shù)字化”管理實(shí)踐,雖然解決了傳統(tǒng)檔案信息的載體轉(zhuǎn)換、數(shù)字存儲(chǔ)和便于利用等問(wèn)題,但只是改變了檔案的描述、呈現(xiàn)和利用方式,對(duì)檔案信息內(nèi)容控制的層級(jí)、深度、力度有限,難以挖掘和充分實(shí)現(xiàn)檔案的價(jià)值,迫切需要從“數(shù)字化”向“數(shù)據(jù)化”演進(jìn)。當(dāng)前,檔案部門(mén)正在積極探索和開(kāi)展檔案“數(shù)據(jù)化”管理實(shí)踐,將管理對(duì)象和管理方式向數(shù)據(jù)和數(shù)據(jù)化延伸。

如上海自貿(mào)區(qū)在全國(guó)率先推行電子檔案“單套制”管理模式,將OA辦公流程與電子文件歸檔、電子檔案管理流程對(duì)接,通過(guò)電子文件歸檔與電子檔案管理原型系統(tǒng)實(shí)現(xiàn)對(duì)電子檔案內(nèi)容數(shù)據(jù)、目錄數(shù)據(jù)、元數(shù)據(jù)和管理利用數(shù)據(jù)的有效管理。

[9]浙江省通過(guò)構(gòu)建自動(dòng)化的電子文件管理體系,制定大數(shù)據(jù)歸檔范圍與標(biāo)準(zhǔn)、公共數(shù)據(jù)管理辦法、電子文件歸檔數(shù)據(jù)規(guī)范以及智能化的檔案信息服務(wù)網(wǎng)等開(kāi)展智慧檔案和檔案管理智慧化建設(shè),建立檔案數(shù)據(jù)共享、傳輸和交換機(jī)制,推動(dòng)檔案數(shù)據(jù)向各部門(mén)和社會(huì)共享利用,實(shí)現(xiàn)“讓群眾少跑腿,讓數(shù)據(jù)多跑路”的檔案服務(wù)。

[10]智慧檔案館建設(shè)的數(shù)據(jù)化基因。智慧檔案館是數(shù)字檔案館的高級(jí)形態(tài),必須基于檔案數(shù)據(jù)資源、依靠檔案數(shù)據(jù)管理、輔以智能數(shù)據(jù)技術(shù)才能充分挖掘檔案數(shù)據(jù)資源價(jià)值,實(shí)現(xiàn)智能化管理、知識(shí)化服務(wù)、精細(xì)化服務(wù)、個(gè)性化服務(wù),將檔案“資源庫(kù)”變成“知識(shí)庫(kù)”“思想庫(kù)”“智庫(kù)”。從技術(shù)層面看,大數(shù)據(jù)、人工智能等數(shù)據(jù)技術(shù)的應(yīng)用是智慧檔案館的技術(shù)表征;從管理對(duì)象看,數(shù)據(jù)化的檔案信息資源是智慧檔案館的根基命脈;從管理方式看,細(xì)顆粒度的檔案數(shù)據(jù)管理是智慧檔案館的支撐手段;從服務(wù)理念上看,智慧化的知識(shí)服務(wù)是智慧檔案館的價(jià)值目標(biāo)。由此可見(jiàn),數(shù)據(jù)化是智慧檔案館發(fā)育成長(zhǎng)的基因,齊全完整、質(zhì)量上乘的檔案數(shù)據(jù)是智慧檔案館的核心生態(tài)因子,是智慧檔案館生存和發(fā)展的基石?!安渴鸷腿嫱七M(jìn)檔案數(shù)據(jù)化工作,正是數(shù)字檔案館建設(shè)向智慧檔案館建設(shè)的基調(diào)和縮影?!?/p>

[11]數(shù)據(jù)科學(xué)的興起:檔案管理與數(shù)據(jù)管理的融合

從數(shù)據(jù)出發(fā),讓數(shù)據(jù)說(shuō)話(huà),用數(shù)據(jù)導(dǎo)控。數(shù)據(jù)科學(xué)的概念于1974年由圖靈獎(jiǎng)獲得者彼得·諾爾(Peter Naur)首次明確提出,經(jīng)歷了一段“沉默期”以后,隨著大數(shù)據(jù)的發(fā)展成為新興的研究領(lǐng)域,它將“數(shù)據(jù)現(xiàn)象”和“數(shù)據(jù)問(wèn)題”從信息科學(xué)中獨(dú)立和凸顯出來(lái),“使信息科學(xué)不再直接受限于信息論、控制論和系統(tǒng)論等底層基礎(chǔ)理論,而更加依賴(lài)于數(shù)據(jù)科學(xué)層次的理論創(chuàng)新。”

[12]檔案學(xué)屬于信息科學(xué)研究范疇,數(shù)據(jù)科學(xué)的興起促使對(duì)檔案管理對(duì)象的認(rèn)知進(jìn)一步向檔案數(shù)據(jù)延伸,有利于揭示檔案數(shù)據(jù)的本質(zhì)特征和運(yùn)行規(guī)律,并在此基礎(chǔ)上探索數(shù)據(jù)科學(xué)中數(shù)據(jù)加工、數(shù)據(jù)計(jì)算、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)產(chǎn)品開(kāi)發(fā)的理論、技術(shù)、方法在檔案管理領(lǐng)域中的應(yīng)用,建立檔案數(shù)據(jù)科學(xué)管理體系,促進(jìn)檔案學(xué)與計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)科學(xué)等的交叉融合。

數(shù)據(jù)管理激活檔案數(shù)據(jù)?!皵?shù)據(jù)管理是指將數(shù)據(jù)視為重要的信息資源,運(yùn)用云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)、智慧工程等現(xiàn)代技術(shù)對(duì)數(shù)據(jù)資源進(jìn)行有效的收集、處理、存儲(chǔ)、挖掘和利用,保障數(shù)據(jù)長(zhǎng)期可用,實(shí)現(xiàn)數(shù)據(jù)價(jià)值,提高組織運(yùn)行效率和核心競(jìng)爭(zhēng)力?!?/p>

[15]檔案數(shù)據(jù)作為國(guó)家和社會(huì)重要的信息資源,恰恰是數(shù)據(jù)管理的對(duì)象和特定場(chǎng)域,數(shù)據(jù)管理必將對(duì)檔案管理理論、管理方法、管理模式產(chǎn)生變革性的影響。數(shù)據(jù)管理能夠有效激活檔案數(shù)據(jù),從中提取價(jià)值、探求知識(shí)、啟迪智慧,“構(gòu)建人的關(guān)聯(lián)、物的關(guān)聯(lián)、人與人的關(guān)聯(lián)、人與物的關(guān)聯(lián)、時(shí)空的關(guān)聯(lián),形成彼此連接、相互交錯(cuò),網(wǎng)絡(luò)狀數(shù)據(jù)連接格局”

[16],使檔案數(shù)據(jù)在管理中發(fā)揮更大的能量和價(jià)值,讓“啤酒和尿布”的故事繼續(xù)演繹。

1.4 “大檔案觀”:檔案數(shù)據(jù)是檔案學(xué)研究的熱點(diǎn)

“大檔案觀”促進(jìn)檔案數(shù)據(jù)“應(yīng)歸盡歸、應(yīng)收盡收、應(yīng)管盡管”?!按髾n案”觀不僅潛含著從社會(huì)發(fā)展的角度思考檔案工作范圍、拓展檔案事業(yè)社會(huì)空間的工作思維,同時(shí)也潛含著對(duì)檔案構(gòu)成的重新理解和認(rèn)識(shí),要求跳出傳統(tǒng)官方‘小檔案’的認(rèn)識(shí)思維,擴(kuò)大檔案的構(gòu)成和成分,強(qiáng)化對(duì)社會(huì)各類(lèi)檔案資源的認(rèn)知和管理?!?/p>

[17]在當(dāng)前的大數(shù)據(jù)環(huán)境下,“數(shù)據(jù)、信息、文件、檔案等概念之間沒(méi)有共識(shí)的邊界”[18],檔案的邊界逐漸擴(kuò)展,信息存儲(chǔ)能力極大增強(qiáng),擴(kuò)大了檔案的保存范圍,盡可能收集多元數(shù)據(jù)、全面數(shù)據(jù)、完整數(shù)據(jù)和綜合數(shù)據(jù),關(guān)注底層化、碎片化、復(fù)雜化的數(shù)據(jù)信息,能夠?qū)崿F(xiàn)檔案數(shù)據(jù)“應(yīng)歸盡歸、應(yīng)收盡收、應(yīng)管盡管”,全面完整地保存社會(huì)記憶,從而構(gòu)建一幅大數(shù)據(jù)時(shí)代反映國(guó)家和社會(huì)變遷的實(shí)時(shí)全景圖,真正建立覆蓋人民群眾的、滿(mǎn)足社會(huì)發(fā)展長(zhǎng)遠(yuǎn)需要的檔案資源體系。

2 檔案數(shù)據(jù)內(nèi)涵解讀

2.1 檔案數(shù)據(jù)與傳統(tǒng)檔案信息的差異

檔案數(shù)據(jù)既反映了檔案形態(tài)的客觀變化和拓展,也推動(dòng)著檔案管理范式由信息管理向數(shù)據(jù)管理轉(zhuǎn)型,表征了檔案工作的發(fā)展變革。相對(duì)于傳統(tǒng)檔案信息,檔案數(shù)據(jù)的不同之處突出表現(xiàn)在以下三個(gè)方面。

第一,存在粒度。傳統(tǒng)檔案信息一次信息居多,依附于傳統(tǒng)介質(zhì),信息索引方式單一,粗粒度明顯;即便是經(jīng)數(shù)字化后的檔案信息,也只是中粒度水平,內(nèi)容檢索困難。檔案數(shù)據(jù)形成于數(shù)據(jù)化的技術(shù)環(huán)境,相對(duì)于“文件”形式的粗顆粒度的傳統(tǒng)檔案信息,檔案數(shù)據(jù)組織粒度細(xì)化,是一個(gè)個(gè)可以獨(dú)立存在的數(shù)據(jù)單元,具有基于文本的數(shù)據(jù)拆分、組合、關(guān)聯(lián)、交互等細(xì)顆粒特性,能夠通過(guò)計(jì)算機(jī)進(jìn)行內(nèi)容檢索和提取,運(yùn)用大數(shù)據(jù)處理技術(shù)對(duì)檔案數(shù)據(jù)進(jìn)行分析、集成和可視化,挖掘檔案數(shù)據(jù)中的隱性知識(shí)、“弱”信息、“暗”數(shù)據(jù),形成檔案知識(shí)元,并對(duì)其進(jìn)行連接、組合,充分挖掘檔案數(shù)據(jù)價(jià)值。

第二,開(kāi)發(fā)方式。數(shù)字時(shí)代傳統(tǒng)檔案信息的“數(shù)字化”一直是檔案信息資源建設(shè)的重要內(nèi)容,將依附在傳統(tǒng)載體上的檔案信息變?yōu)榭蓹C(jī)讀和在線傳輸?shù)摹皵?shù)字態(tài)”,改變記錄和存儲(chǔ)方式,便于檔案信息的流動(dòng)與傳播,屬于“形式控制”。而檔案數(shù)據(jù)則是通過(guò)“數(shù)據(jù)化”,將檔案信息變?yōu)榭删珳?zhǔn)定位和識(shí)別的“數(shù)據(jù)態(tài)”,方便利用計(jì)算機(jī)進(jìn)行數(shù)據(jù)單元的讀取、關(guān)聯(lián)、重組和提煉,有利于檔案資源的整合集成、挖掘分析、知識(shí)組織,滿(mǎn)足社會(huì)精準(zhǔn)化、個(gè)性化、知識(shí)化的利用需求,屬于“內(nèi)容控制”。

第三,價(jià)值特性。首先,在價(jià)值形態(tài)上,檔案數(shù)據(jù)除了兼有傳統(tǒng)檔案最基本的憑證和參考價(jià)值以外,還突出表現(xiàn)在數(shù)據(jù)價(jià)值上,即通過(guò)數(shù)據(jù)技術(shù)處理、挖掘和應(yīng)用獲得衍生的價(jià)值,如決策價(jià)值、預(yù)測(cè)價(jià)值、資產(chǎn)價(jià)值、情報(bào)價(jià)值等,是檔案在數(shù)據(jù)時(shí)代的價(jià)值新發(fā)現(xiàn)。其次,在價(jià)值活性上,不同于傳統(tǒng)檔案信息難以被計(jì)算機(jī)直接進(jìn)行內(nèi)容識(shí)別和處理,檔案數(shù)據(jù)作為一種數(shù)據(jù)資源,便于計(jì)算、分析、顯現(xiàn)和關(guān)聯(lián),價(jià)值活性較強(qiáng)。最后,在價(jià)值實(shí)現(xiàn)上,傳統(tǒng)檔案信息側(cè)重于通過(guò)信息查考和信息整合實(shí)現(xiàn)其信息價(jià)值,滿(mǎn)足檔案用戶(hù)的信息需求,如檔案查閱、證明、咨詢(xún)、展覽等方式比較機(jī)械化和表層化;檔案數(shù)據(jù)由于其數(shù)據(jù)特性,可以通過(guò)數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)挖掘,建立檔案知識(shí)庫(kù),構(gòu)建知識(shí)地圖,使檔案信息資源管理和利用的場(chǎng)景從簡(jiǎn)單的“檢索與查閱”轉(zhuǎn)向深層的“洞見(jiàn)與增值”,滿(mǎn)足多樣化、差異化、精細(xì)化、深層化的檔案信息需求,提供知識(shí)輸出和智慧服務(wù)。

2.2 檔案數(shù)據(jù)的含義

目前,對(duì)檔案數(shù)據(jù)的定義也較少。如馬海群將檔案數(shù)據(jù)理解為“檔案機(jī)構(gòu)收集保存的所有原始數(shù)據(jù)?!盵19]于英香認(rèn)為“從內(nèi)涵看,檔案數(shù)據(jù)是一種具備檔案屬性的數(shù)據(jù);從外延看,檔案數(shù)據(jù)包括電子文檔、數(shù)字資源等?!盵20]劉慶悅等將檔案數(shù)據(jù)界定為“承載檔案信息的數(shù)據(jù)以及在檔案信息管理利用活動(dòng)中產(chǎn)生的數(shù)據(jù)?!本C上,大多學(xué)者只是對(duì)檔案數(shù)據(jù)進(jìn)行了描述,沒(méi)有一個(gè)明確的概念內(nèi)涵。通過(guò)檔案數(shù)據(jù)與傳統(tǒng)檔案信息的比較,將檔案數(shù)據(jù)定義為:“數(shù)據(jù)化的檔案信息及具備檔案性質(zhì)的數(shù)據(jù)記錄?!睓n案數(shù)據(jù)應(yīng)滿(mǎn)足以下基本要求:

第一,從內(nèi)涵上看,檔案數(shù)據(jù)首先屬于檔案信息,具備檔案性質(zhì),滿(mǎn)足檔案的所有基本要求?!皺n案數(shù)據(jù)”是一個(gè)偏正短語(yǔ),“檔案”為“本”,“數(shù)據(jù)”為“形”,對(duì)于檔案數(shù)據(jù)的定義應(yīng)該以檔案作為邏輯起點(diǎn),切合檔案管理范圍,故而,“檔案數(shù)據(jù)”一要具備檔案的基本屬性,包括原始記錄性、歷史性、社會(huì)性;二要具備檔案的基本價(jià)值,包括憑證價(jià)值、參考價(jià)值,具有保存意義。

第二,從外延上看,“檔案數(shù)據(jù)”是一個(gè)廣義的數(shù)據(jù)集合。由于檔案數(shù)據(jù)來(lái)源構(gòu)成的廣泛、表現(xiàn)形式的多元,檔案數(shù)據(jù)的外延比較廣泛,不僅包括檔案部門(mén)已經(jīng)掌握和積累的各類(lèi)數(shù)字化檔案資源、電子檔案等,還包括具有長(zhǎng)久保存價(jià)值但還沒(méi)有納入檔案部門(mén)保管范圍的數(shù)據(jù);不僅包括內(nèi)容、結(jié)構(gòu)、背景等檔案元數(shù)據(jù),還包括檔案部門(mén)在檔案管理業(yè)務(wù)過(guò)程中產(chǎn)生的檔案管理數(shù)據(jù)、檔案利用數(shù)據(jù)、檔案用戶(hù)數(shù)據(jù)等累積性數(shù)據(jù)。

第三,從形式上看,“檔案數(shù)據(jù)”在滿(mǎn)足檔案性質(zhì)的同時(shí)也滿(mǎn)足數(shù)據(jù)的一般屬性?!皺n案數(shù)據(jù)”是數(shù)據(jù)化的檔案信息資源,以數(shù)據(jù)形式記錄和保存,能夠?yàn)閿?shù)據(jù)設(shè)備、數(shù)據(jù)技術(shù)識(shí)別和處理,這是檔案數(shù)據(jù)區(qū)別于傳統(tǒng)檔案信息的關(guān)鍵所在。

當(dāng)然,定義一個(gè)新興術(shù)語(yǔ)總是一件容易引起學(xué)術(shù)爭(zhēng)論的事情,隨著數(shù)據(jù)社會(huì)的深入推進(jìn),以及檔案學(xué)與數(shù)據(jù)科學(xué)、檔案工作與大數(shù)據(jù)的融合發(fā)展,檔案數(shù)據(jù)的內(nèi)涵可能還會(huì)出現(xiàn)新的闡釋。

3 檔案數(shù)據(jù)的特征形態(tài)及其影響

理清檔案數(shù)據(jù)的基本特征,無(wú)論從理論上還是實(shí)踐上都意義重大,不僅能夠加深對(duì)于大數(shù)據(jù)時(shí)代檔案資源的認(rèn)知,也是探索檔案數(shù)據(jù)管理和治理的基礎(chǔ)。檔案數(shù)據(jù)除了具有檔案的原始記錄性、歷史性、社會(huì)性等固有特性以外,還具有廣源性、共生與互生性、累積性、擴(kuò)展性與易算性等新特征。

3.1 廣源性


信息時(shí)代,對(duì)于檔案存在范圍和存在形態(tài)的認(rèn)知不斷刷新,檔案數(shù)據(jù)符合多元開(kāi)放的時(shí)代特征,其來(lái)源具有廣泛性,即廣源性。

第一,產(chǎn)生環(huán)境的廣泛性。過(guò)去,檔案主要產(chǎn)生于現(xiàn)實(shí)的物理業(yè)務(wù)環(huán)境,檔案文件生成方式單一,數(shù)量有限;現(xiàn)在,檔案數(shù)據(jù)廣泛地產(chǎn)生于網(wǎng)絡(luò)環(huán)境下的電子辦公、電子業(yè)務(wù)、信息系統(tǒng)、網(wǎng)站網(wǎng)頁(yè)、新媒體及傳感設(shè)備等新環(huán)境中,更傾向于網(wǎng)絡(luò)化、虛擬化和數(shù)據(jù)化,檔案文件生成方式多樣,生成內(nèi)容多維,生成形態(tài)多種,生成速度迅捷,數(shù)量巨大。

第二,覆蓋范圍的廣泛性。傳統(tǒng)檔案資源的收集管理由于受到管理體制、檔案館舍、技術(shù)條件、人員配備等限制,主要收集立檔單位的檔案,檔案資源的行政色彩濃厚、覆蓋范圍有限、結(jié)構(gòu)不合理,社會(huì)檔案資源、民生檔案資源、特色檔案資源稀缺。如今,伴隨著辦公業(yè)務(wù)環(huán)境的電子化網(wǎng)絡(luò)化、在線歸檔方式和技術(shù)的不斷發(fā)展,以及檔案工作正朝著建立實(shí)現(xiàn)覆蓋人民群眾和社會(huì)生活的檔案資源體系的目標(biāo)不斷推進(jìn),檔案數(shù)據(jù)愈加關(guān)注社會(huì)發(fā)展中的全景數(shù)據(jù),無(wú)論檔案工作體制內(nèi)體制外、無(wú)論宏觀微觀、無(wú)論官方民間、無(wú)論正式組織非正式組織形成的檔案信息資源,都在檔案數(shù)據(jù)范疇。而且,現(xiàn)代信息存儲(chǔ)技術(shù)的發(fā)展使檔案數(shù)據(jù)存儲(chǔ)能力極大提升,未來(lái)檔案數(shù)據(jù)無(wú)論在存量增量,還是在反映社會(huì)面貌的完整程度上都會(huì)達(dá)到新的歷史水平。

3.2 共生與互生性

檔案數(shù)據(jù)就其來(lái)源而言雖然泛在而離散,但相關(guān)的檔案數(shù)據(jù)本身卻構(gòu)成了一個(gè)共生共在的檔案數(shù)據(jù)生態(tài)群落和生態(tài)圈。

一方面,正如“傳統(tǒng)數(shù)據(jù)源通常在最開(kāi)始就被嚴(yán)格地定義。數(shù)據(jù)的每一個(gè)比特都有重要的價(jià)值,否則就不會(huì)包含這個(gè)數(shù)據(jù)比特”[25],檔案數(shù)據(jù)百分之百是具有保存價(jià)值的數(shù)據(jù)信息記錄,但是單條檔案數(shù)據(jù)的價(jià)值度往往較小,不足以反映問(wèn)題全貌,發(fā)揮整體價(jià)值?!霸诖髷?shù)據(jù)時(shí)代,無(wú)論是大數(shù)據(jù)還是所謂的小數(shù)據(jù),以及各種各樣不同來(lái)源的數(shù)據(jù),彼此之間往往會(huì)存在互相依存和彼此驗(yàn)證的關(guān)系,彼此通過(guò)互相印證而實(shí)現(xiàn)各自的數(shù)據(jù)價(jià)值”[26]。所以,檔案數(shù)據(jù)應(yīng)當(dāng)關(guān)注以數(shù)據(jù)集為單位的價(jià)值度較高的多元累積數(shù)據(jù),特別在數(shù)據(jù)顆粒度較細(xì)、離散性較大的大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)的這種共生性特點(diǎn)將體現(xiàn)得更為明顯。

另一方面,在共生之上,每一條檔案數(shù)據(jù)其價(jià)值都與其他檔案數(shù)據(jù)的價(jià)值以及其所在檔案數(shù)據(jù)群落的整體價(jià)值相關(guān)聯(lián),每一個(gè)基于同一歷史活動(dòng)形成的檔案數(shù)據(jù)在檔案數(shù)據(jù)群落里進(jìn)行著價(jià)值共享和互補(bǔ),所有的檔案數(shù)據(jù)群落又共同構(gòu)成了檔案數(shù)據(jù)生態(tài)圈,每一個(gè)獨(dú)立分散的檔案數(shù)據(jù)和分割的檔案數(shù)據(jù)群落在檔案數(shù)據(jù)生態(tài)圈中都發(fā)揮著獨(dú)特的作用,相互關(guān)聯(lián)、相互依存。

3.3 累積性

所謂累積性,即在累積達(dá)到一定程度后而產(chǎn)生狀態(tài)改變、規(guī)模遞增、程度加深及價(jià)值回饋等現(xiàn)象的演變過(guò)程。

第一,從數(shù)據(jù)資源形態(tài)上看,在數(shù)據(jù)化時(shí)代社會(huì)活動(dòng)當(dāng)中形成的檔案數(shù)據(jù)碎片化和細(xì)顆粒化明顯,每一條檔案數(shù)據(jù)都是反映數(shù)據(jù)時(shí)代真實(shí)活動(dòng)面貌的組成部分,在同一活動(dòng)當(dāng)中形成的具有有機(jī)聯(lián)系的數(shù)據(jù)經(jīng)過(guò)不斷累積從而形成數(shù)據(jù)群組,構(gòu)成檔案數(shù)據(jù)庫(kù)。

第二,從數(shù)據(jù)資源規(guī)模上看,由“數(shù)據(jù)”到“小數(shù)據(jù)”再到“大數(shù)據(jù)”的躍升,取決于數(shù)據(jù)累積,海量檔案數(shù)據(jù)資源也正是通過(guò)對(duì)存量檔案信息的數(shù)據(jù)化,以及有保存價(jià)值增量數(shù)據(jù)的不斷采集、積累和沉淀而形成的,檔案數(shù)據(jù)長(zhǎng)期連續(xù)累積才能達(dá)到檔案大數(shù)據(jù)的效果。

第三,從數(shù)據(jù)資源價(jià)值上看,由檔案數(shù)據(jù)全集中挖掘出的檔案數(shù)據(jù)價(jià)值遠(yuǎn)大于單個(gè)檔案數(shù)據(jù)價(jià)值之和,檔案數(shù)據(jù)的累積性也就成為檔案數(shù)據(jù)價(jià)值得以展現(xiàn)和提升的重要特性。此外,檔案數(shù)據(jù)的累積性還從某個(gè)側(cè)面暗示了檔案數(shù)據(jù)的即時(shí)性和易逝性?!按髷?shù)據(jù)時(shí)代的數(shù)據(jù)具有‘實(shí)時(shí)性’,世界被實(shí)時(shí)記錄的特征使得檔案界不得不重視這些稍瞬即逝的具有社會(huì)價(jià)值的數(shù)據(jù)的長(zhǎng)久保存?!盵28]由于數(shù)據(jù)記錄的實(shí)時(shí)變化、社會(huì)活動(dòng)的不斷拓展、技術(shù)環(huán)境的更新?lián)Q代及業(yè)務(wù)職能的更替轉(zhuǎn)型等,檔案數(shù)據(jù)生成變化加劇,如果不及時(shí)累積保存,便會(huì)造成檔案數(shù)據(jù)流失和消逝,影響檔案數(shù)據(jù)的完整性。

3.4 擴(kuò)展性


傳統(tǒng)檔案信息由于受技術(shù)條件、存儲(chǔ)空間和管理方式等因素的制約,可擴(kuò)展性有限,檔案信息價(jià)值難以充分發(fā)揮。而作為新的檔案資源形態(tài)的檔案數(shù)據(jù),擴(kuò)展性已成為其重要特質(zhì)。

第一,檔案數(shù)據(jù)體量的擴(kuò)展性。存量檔案數(shù)字化的不斷推進(jìn)、電子文件的大量生成,以及網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)檔案資源的爆發(fā)增長(zhǎng),使得檔案數(shù)據(jù)無(wú)論從數(shù)量還是增速上都呈現(xiàn)出極強(qiáng)的擴(kuò)展性。

第二,檔案數(shù)據(jù)結(jié)構(gòu)的擴(kuò)展性。檔案數(shù)據(jù)的產(chǎn)生環(huán)境更趨網(wǎng)絡(luò)化、數(shù)據(jù)化、立體化,半結(jié)構(gòu)化、非結(jié)構(gòu)化的檔案數(shù)據(jù)越來(lái)越多,如各種格式的文檔、圖片、網(wǎng)頁(yè)、社交媒體文件、圖像和聊天記錄及音視頻等,“超文本性”愈發(fā)顯著。

第三,檔案數(shù)據(jù)價(jià)值的擴(kuò)展性。數(shù)據(jù)管理的發(fā)展和數(shù)據(jù)技術(shù)的應(yīng)用推動(dòng)產(chǎn)生了新一代的信息增值方式,一方面?zhèn)鹘y(tǒng)檔案信息經(jīng)數(shù)據(jù)化處理和加工后,其價(jià)值能夠得到新的發(fā)現(xiàn)、挖掘和展示;另一方面檔案數(shù)據(jù)資源也能得到進(jìn)一步的組織、賦能和激活,使檔案的知識(shí)屬性和特征在數(shù)據(jù)管理實(shí)踐中得到切實(shí)的揭示和彰顯。

檔案數(shù)據(jù)的擴(kuò)展性映射出檔案新的生成、存儲(chǔ)和處理生態(tài),需要檔案工作向更高層次擴(kuò)展。

一是檔案管理思維方式的擴(kuò)展。檔案數(shù)據(jù)的擴(kuò)展性要求檔案工作樹(shù)立數(shù)據(jù)化思維、信息化思維、技術(shù)性思維、共享性思維,以大數(shù)據(jù)思維而非館藏檔案的小數(shù)據(jù)思維去思考檔案管理工作的發(fā)展,營(yíng)造數(shù)據(jù)文化環(huán)境和組織秩序。

二是檔案數(shù)據(jù)管理技術(shù)的擴(kuò)展?!坝捎诩夹g(shù)環(huán)境變遷,導(dǎo)致文檔管理工作從模擬態(tài)的相對(duì)單純的載體管理,轉(zhuǎn)換到數(shù)字態(tài)對(duì)文件尺度信息的整體管理,再過(guò)渡到數(shù)據(jù)態(tài)對(duì)數(shù)據(jù)尺度信息的關(guān)聯(lián)管理”[29],所以技術(shù)發(fā)展既是檔案數(shù)據(jù)管理的動(dòng)因,也是手段。檔案部門(mén)要加強(qiáng)檔案數(shù)據(jù)管理技術(shù),包括數(shù)據(jù)存儲(chǔ)技術(shù)、數(shù)據(jù)安全技術(shù)、數(shù)據(jù)關(guān)聯(lián)技術(shù)等的引進(jìn)與應(yīng)用,提升技術(shù)管理能級(jí),適應(yīng)現(xiàn)代信息技術(shù)的發(fā)展。

三是檔案人員素質(zhì)能力和檔案管理隊(duì)伍的擴(kuò)展。一方面,檔案數(shù)據(jù)的擴(kuò)展性要求檔案人員從“信息工作者”向“數(shù)據(jù)工作者”轉(zhuǎn)變,培養(yǎng)兼有數(shù)據(jù)技術(shù)素養(yǎng)和檔案管理能力的技術(shù)型、復(fù)合型人才。另一方面,改變檔案管理隊(duì)伍結(jié)構(gòu),吸納數(shù)據(jù)管理專(zhuān)家、信息技術(shù)專(zhuān)家,強(qiáng)化檔案數(shù)據(jù)管理能力。

3.5 易算性


檔案數(shù)據(jù)因其具有數(shù)據(jù)態(tài)的技術(shù)屬性,使得“信息的處理由相對(duì)冗余和龐雜的文件尺度開(kāi)始降維到更容易解析和處理的數(shù)據(jù)尺度”[30],相對(duì)于傳統(tǒng)檔案信息具有易算性。根據(jù)傳統(tǒng)的DIKW層級(jí)模型

[31],作為基礎(chǔ)層的數(shù)據(jù),其意義和價(jià)值是比較小的。大數(shù)據(jù)時(shí)代,“數(shù)據(jù)-信息-知識(shí)-智慧”的線性?xún)r(jià)值鏈遞進(jìn)關(guān)系遭受質(zhì)疑,數(shù)據(jù)的價(jià)值被重新發(fā)現(xiàn),“數(shù)據(jù)已成為我們這個(gè)時(shí)代承載人類(lèi)藝術(shù)創(chuàng)意、信息、知識(shí)、經(jīng)驗(yàn)和智慧的基本符號(hào)集,是疆域正在急劇擴(kuò)展的虛擬世界的首選建筑材料?!?/p>

[32]而這種變化的根源之一,就在于數(shù)據(jù)具有較強(qiáng)的可編程計(jì)算性,在數(shù)據(jù)技術(shù)的支撐下可使其直接跨越信息和知識(shí)走向智慧,擁有較強(qiáng)的價(jià)值活性,如圖2所示。檔案數(shù)據(jù)也具備一般數(shù)據(jù)所具有的易算性,集中表現(xiàn)在易于被現(xiàn)代算法技術(shù)所加工處理,進(jìn)行信息分析、價(jià)值挖掘、知識(shí)發(fā)現(xiàn),捕捉潛在、精細(xì)、微妙、未知的關(guān)系和知識(shí),激活檔案數(shù)據(jù)的一切可能價(jià)值。

檔案數(shù)據(jù)

圖2 DIKW層級(jí)模型

檔案數(shù)據(jù)的易算性是提升檔案資源價(jià)值、促進(jìn)檔案利用和檔案信息消費(fèi)的重要保障。檔案數(shù)據(jù)易算性?xún)?yōu)勢(shì)的發(fā)揮,一方面需要開(kāi)展檔案數(shù)據(jù)的結(jié)構(gòu)化處理,將檔案文件信息轉(zhuǎn)換成獨(dú)立于系統(tǒng)與軟件、開(kāi)源兼容、不帶格式的純凈檔案數(shù)據(jù),方便“計(jì)算”時(shí)數(shù)據(jù)項(xiàng)的讀取、遷移和關(guān)聯(lián);另一方面需要提高“計(jì)算力”,引入本體、模型、規(guī)則、算法等數(shù)據(jù)處理領(lǐng)域的理論方法,充分借助數(shù)據(jù)技術(shù)開(kāi)展靈活多樣的數(shù)據(jù)組織和數(shù)據(jù)分析,加強(qiáng)內(nèi)容管理,通過(guò)對(duì)復(fù)雜、多元、分散的檔案數(shù)據(jù)進(jìn)行關(guān)聯(lián)、聚類(lèi)和展示,總結(jié)規(guī)律、發(fā)現(xiàn)知識(shí)、洞悉需求、預(yù)測(cè)趨勢(shì),使檔案管理走向集成化、科學(xué)化與智能化,改變傳統(tǒng)檔案館“資源豐富、利用有限、知識(shí)貧乏”的格局,為決策者謀劃“滿(mǎn)意解”“最優(yōu)解”,為組織機(jī)構(gòu)輸出知識(shí)產(chǎn)品,為社會(huì)公眾提供增值服務(wù),全面提升檔案服務(wù)品質(zhì)。

檔案數(shù)據(jù)

注:本文全文詳見(jiàn)《檔案學(xué)通訊》2020年第三期

撰文:金 波  添志鵬 / 圖片:檔案學(xué)通訊 / 編輯:安新宇

轉(zhuǎn)自:檔案那些事兒

標(biāo)簽

|
本文網(wǎng)址:http://oaoy.cn/cgal/1566.html
我是中博奧客服:小奧
中博奧技術(shù)有限公司& 版權(quán)所有工信部備案號(hào):豫ICP備11015869號(hào)-8 Copyright ? 2023-2024

檔案整理檔案數(shù)字化

檔案掃描檔案管理軟件系統(tǒng)

TEL:18937133779

To Top