電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
元數(shù)據(jù)著錄、檔案信息數(shù)字化加工工作結(jié)束之后,就需要進(jìn)行數(shù)據(jù)掛接,將目錄數(shù)據(jù)導(dǎo)入到檔案管理系統(tǒng)中,將數(shù)字化原文與目錄數(shù)據(jù)進(jìn)行關(guān)聯(lián),使之成為可以查詢檢索的數(shù)字化成果。本文主要談?wù)剶?shù)據(jù)掛接相關(guān)內(nèi)容。
檔案信息數(shù)字化加工
《紙質(zhì)檔案數(shù)字化規(guī)范》對(duì)數(shù)據(jù)掛接的要求
1、應(yīng)借助相關(guān)軟件對(duì)數(shù)據(jù)庫中的目錄數(shù)據(jù)與其對(duì)應(yīng)的紙質(zhì)檔案數(shù)字圖像進(jìn)行掛接,以實(shí)現(xiàn)目錄數(shù)據(jù)與數(shù)字圖像的關(guān)聯(lián)。
2、逐條對(duì)掛接結(jié)果進(jìn)行檢查,包括目錄數(shù)據(jù)與紙質(zhì)檔案數(shù)字圖像對(duì)應(yīng)的準(zhǔn)確性、已掛接數(shù)字圖像與實(shí)際掃描數(shù)量的一致性、數(shù)字圖像是否能正常打開等,發(fā)現(xiàn)錯(cuò)誤及時(shí)進(jìn)行糾正。
數(shù)據(jù)掛接的形式
1.手工上傳掛接
現(xiàn)在的檔案管理軟件一般都提供手工上傳原文進(jìn)行掛接的形式,元數(shù)據(jù)著錄完畢即形成一條目錄數(shù)據(jù),通過點(diǎn)擊“上傳”按鈕將數(shù)字化掃描原文與目錄數(shù)據(jù)進(jìn)行關(guān)聯(lián)對(duì)應(yīng),即為掛接。此種方式,數(shù)據(jù)關(guān)聯(lián)的準(zhǔn)確性高,對(duì)數(shù)字化掃描件的要求不高,數(shù)據(jù)存儲(chǔ)管理即使不是很科學(xué),也可以實(shí)現(xiàn)數(shù)據(jù)關(guān)聯(lián)。
手工掛接的缺點(diǎn)也很明顯,就是手工操作效率較為低下,單位時(shí)間內(nèi)完成工作量及其低下,一般很少工作量,或者需要修改更正的情況下可以使用手工掛接。
2.批量原文掛接
檔案管理軟件一般都有批量原文掛接的功能,批量掛接的前提是嚴(yán)格按照《紙質(zhì)檔案數(shù)字化規(guī)范》進(jìn)行原文存儲(chǔ)管理、圖像命名。既要符合國標(biāo)標(biāo)準(zhǔn),又需要檔案管理部門自身制定詳細(xì)的管理方案,具體的存儲(chǔ)路徑,如磁盤怎么區(qū)分、門類、全宗、年度、期限怎么在磁盤路徑中體現(xiàn);具體的圖像命名,單頁掃描件怎么命名,多頁掃描件怎么命名,是都保存,還是只保存一部分等等。
檔案管理軟件的批量原文掛接功能,一般是以檔號(hào)為基準(zhǔn)來實(shí)現(xiàn)目錄數(shù)據(jù)和原文數(shù)據(jù)的關(guān)聯(lián)。這就要求,首先要有準(zhǔn)確的“檔號(hào)”目錄數(shù)據(jù),按照檔案整理方案、檔案著錄規(guī)則,錄入元數(shù)據(jù)后,生成“檔號(hào)”;其次數(shù)字化掃描過程中,文件夾以檔號(hào)命名,數(shù)字圖像以檔號(hào)為基礎(chǔ)命名,只有這樣才能有實(shí)現(xiàn)批量原文掛接的可能。
批量原文掛接的實(shí)現(xiàn)途徑,主要是原文文件名或者原文文件夾名和目錄數(shù)據(jù)庫中的關(guān)鍵字段(一般為檔號(hào)),進(jìn)行匹配,匹配成功即傳輸原文到相應(yīng)磁盤位置,同時(shí)將磁盤路徑位置寫入對(duì)應(yīng)目錄數(shù)據(jù)庫中,完成原文掛接操作。批量掛接可以自動(dòng)化實(shí)現(xiàn)成千上萬條數(shù)據(jù)的關(guān)聯(lián)工作,工作效率高,出錯(cuò)概率底。目前,基本上采用這種形式進(jìn)行數(shù)據(jù)掛接。
元數(shù)據(jù)掛接的要求
1.元數(shù)據(jù)著錄的規(guī)范性
需要按照《檔案著錄規(guī)則》(DA/T18-1999)、《文書檔案文件級(jí)目錄數(shù)據(jù)庫結(jié)構(gòu)與著錄細(xì)則》(DB34/T450-2004)等標(biāo)準(zhǔn)規(guī)范,確定檔案數(shù)據(jù)庫的結(jié)構(gòu)標(biāo)準(zhǔn)、元數(shù)據(jù)字段、著錄的規(guī)則等。項(xiàng)目開展前進(jìn)行技能培訓(xùn),合格才能上崗,著錄過程中嚴(yán)格按照標(biāo)準(zhǔn)規(guī)范進(jìn)行,遇到特殊情況及時(shí)反饋,確保著錄的準(zhǔn)確性、規(guī)范性。
?、贆n號(hào)組成項(xiàng)需要著錄規(guī)范。
如全宗號(hào)、歸檔年度、保管期限、檔案門類代碼、實(shí)體分類號(hào)、項(xiàng)目號(hào)、卷/件號(hào)等。一般在檔案管理軟件中“全宗號(hào)、歸檔年度、保管期限、檔案門類代碼、實(shí)體分類號(hào)、項(xiàng)目號(hào)”可以設(shè)置為自動(dòng)繼承,“卷/件號(hào)”要能夠自動(dòng)加一。在具體的著錄過程中,“保管期限、歸檔年度”的更迭要注意“卷/件號(hào)”是否對(duì)應(yīng)調(diào)整。
?、凇绊摂?shù)、頁碼”需要填寫準(zhǔn)確。
優(yōu)秀的檔案管理軟件不僅僅要有批量掛接原文的能力,同時(shí)需要具有檢測(cè)原文的能力?,F(xiàn)在的檔案整理規(guī)范,無論是以件為單位的檔案,還是以卷為單位的檔案,都要求編寫頁碼,一方面便于查找利用,另一方面是對(duì)檔案規(guī)范管理的要求。元數(shù)據(jù)著錄的過程,需要將“頁數(shù)、頁碼”手工著錄進(jìn)入系統(tǒng)中,由于手工著錄,此兩碼常常會(huì)有錯(cuò)誤,而且不容易發(fā)現(xiàn)錯(cuò)誤,如何解決就是個(gè)難題。原文掛接的過程中,增加統(tǒng)計(jì)、匹配能,將原文的數(shù)量與著錄的數(shù)量進(jìn)行對(duì)比,很容易發(fā)現(xiàn)問題,進(jìn)而解決問題。
有的數(shù)字化加工企業(yè),還使用了先掃描,后統(tǒng)計(jì)頁數(shù),再將頁數(shù)反向?qū)肽夸浽獢?shù)據(jù)的“頁數(shù)”中。
2.數(shù)字化掃描的規(guī)范性
按照《紙質(zhì)檔案數(shù)字化規(guī)范》(DA/T31—2017)選擇合適的存儲(chǔ)格式,以檔號(hào)為基礎(chǔ)對(duì)數(shù)字圖像命名,科學(xué)建立紙質(zhì)檔案數(shù)字圖像的存儲(chǔ)路徑。
3.提高批量掛接的準(zhǔn)確性
我們常常會(huì)遇到原文和目錄不對(duì)應(yīng),所見非所得,都在抱怨是掛接的錯(cuò)誤,手工掛接或許會(huì)有錯(cuò)誤,自動(dòng)化的批量掛接是不會(huì)有錯(cuò)誤的,如果有錯(cuò)誤要么是著錄元數(shù)據(jù)時(shí)出錯(cuò)了,要么是數(shù)字化掃描的過程出錯(cuò)了。需要規(guī)范著錄、掃描的全過程,做到有人做、有人查、有人管。
無論是軟件的開發(fā)方還是數(shù)字化的參與方,都應(yīng)該想方設(shè)法提高數(shù)據(jù)的準(zhǔn)確性。檔案數(shù)字化是個(gè)技術(shù)含量較低的行業(yè),但是處理的數(shù)據(jù)量較為龐大,而且大多是手工操作,錯(cuò)誤率一致居高不下,如何解決這個(gè)問題,需要將管理與技術(shù)相結(jié)合,一方面嚴(yán)格按照操作流程進(jìn)行實(shí)施,另一方面將現(xiàn)代化的技術(shù)手段融入其中,用軟件來檢測(cè)成果,提高準(zhǔn)確性。
(全國總部)河南省鄭州市金水區(qū)農(nóng)業(yè)路71號(hào)中州國際飯店1617-1618
+18937133779
zboao@qq.com
中博奧技術(shù)有限公司& 版權(quán)所有
工信部備案號(hào):豫ICP備11015869號(hào)-8