電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
原創(chuàng) 李寶玲 李珂 中國檔案雜志 1周前
河南省數(shù)字檔案館經(jīng)過需求調(diào)研、立項、設計、建設、應用,完成了建設任務,實現(xiàn)了數(shù)字檔案館的基本功能,滿足了電子政務背景下政府對信息系統(tǒng)及信息資源互聯(lián)互通、共建共享、安全高效的要求。
建設思路與任務
1.河南省數(shù)字檔案館建設的整體思路
河南省檔案館依據(jù)國家檔案局《數(shù)字檔案館建設指南》及《數(shù)字檔案館系統(tǒng)測試辦法》,充分借鑒先進省市數(shù)字檔案館建設的經(jīng)驗,明確了河南省數(shù)字檔案館建設的思路。一是堅持統(tǒng)一規(guī)劃、頂層設計。河南省數(shù)字檔案館立足于滿足省館本身的需要,又考慮到省直立檔單位數(shù)字檔案室建設和市、縣級數(shù)字檔案館建設的需要,特別是考慮到全省數(shù)字檔案資源的共建共享需要,從網(wǎng)絡、系統(tǒng)、規(guī)范、資源、培訓等方面加強頂層規(guī)劃和設計。二是一體兩翼,整體推進。以省數(shù)字檔案館建設為主體,以省直單位電子檔案管理應用及市、縣級數(shù)字檔案館應用為兩翼,統(tǒng)籌兼顧,整體推進,逐步實現(xiàn)數(shù)字檔案館、室建設一體化,省、市數(shù)字檔案館建設一體化。三是“借船出?!保ヂ?lián)互通。在電子政務背景下,業(yè)務系統(tǒng)和信息資源通過政府網(wǎng)絡實現(xiàn)了深度整合與共享,河南省電子政務網(wǎng)(包括省電子政務外網(wǎng)和省電子政務內(nèi)網(wǎng))成為各層級、各單位業(yè)務互聯(lián)互通、資源共享的主要通道。河南省數(shù)字檔案館依托省電子政務外網(wǎng)部署數(shù)字檔案室系統(tǒng)、電子檔案移交接收系統(tǒng)和資源共享系統(tǒng),實現(xiàn)省直單位電子檔案的在線移交接收,各級檔案館異地查閱、跨館出證和資源共享。四是夯實基礎,循序漸進。河南省立足于數(shù)字檔案館基本功能,融入智慧理念,在系統(tǒng)設計、平臺建設、技術應用方面具有先進性、兼容性和擴展性;在資源建設上,按照“存量數(shù)字化、增量電子化”原則,在規(guī)范化、多元化、特色化上下功夫。
2.河南省數(shù)字檔案館建設的主要任務
河南省數(shù)字檔案館建設任務主要包括標準規(guī)范建設、檔案應用平臺建設、基礎支撐體系建設、標準機房建設、信息安全保障體系建設、數(shù)字資源建設以及人員培訓等,概括起來就是“一庫”“兩中心”“三個服務平臺”“四個保障體系”。
“一庫”指河南省數(shù)字檔案館資源總庫,通過硬件設施、軟件系統(tǒng)、數(shù)字資源建設,把數(shù)字檔案館建成長期保存的數(shù)字檔案資源總庫。
“兩中心”指通過新館、老館兩個機房進行同城備份,建成數(shù)字檔案備份中心和數(shù)字檔案查詢利用中心。
“三個服務平臺”指基于局域網(wǎng)的館藏數(shù)字檔案資源服務平臺、基于省電子政務外網(wǎng)的全省數(shù)字檔案資源共享服務平臺、基于互聯(lián)網(wǎng)的公開檔案數(shù)字資源服務平臺。三個服務平臺能夠滿足檔案館、立檔單位、社會各類用戶對數(shù)字檔案資源的利用需求,實現(xiàn)全省各綜合檔案館開放數(shù)字檔案資源在互聯(lián)網(wǎng)上的共享利用、民生檔案在省電子政務外網(wǎng)上的跨館查閱以及各單位對本單位數(shù)字檔案資源在省電子政務外網(wǎng)上的自助利用服務。
“四個保障體系”指通過對基礎設施、標準規(guī)范、安全體系、人才隊伍建設,為數(shù)字檔案館建設提供全面的保障。
建設成效
1.建立了一套適用的標準規(guī)范
依據(jù)國家檔案局關于數(shù)字檔案館及電子文件、電子檔案管理的標準規(guī)范,結(jié)合河南省數(shù)字檔案館建設的實際,河南省檔案館建立和完善了一套數(shù)字檔案館建設和應用的標準規(guī)范體系。如:制定了河南省標準《政務服務網(wǎng)電子文件歸檔數(shù)據(jù)規(guī)范》(DB41/T 1700.5—2019);以省“兩辦”名義印發(fā)了《河南省電子文件歸檔與電子檔案管理暫行辦法》;制定了《河南省檔案館紙質(zhì)檔案數(shù)字化成果接收暫行辦法》《河南省檔案館數(shù)字檔案資源共享管理暫行辦法》《河南省數(shù)字檔案館應急預案及災難恢復方案》《河南省檔案館文書、照片、音視頻檔案目錄數(shù)據(jù)庫結(jié)構規(guī)范》《河南省檔案館紙質(zhì)、照片、音視頻檔案數(shù)字化技術規(guī)范》《河南省數(shù)字檔案館數(shù)據(jù)交換接口技術規(guī)范》《河南省檔案館光盤、硬盤管理規(guī)范》等一套標準規(guī)范,使數(shù)字檔案館建設和應用有規(guī)可依,有規(guī)能依。
2.實現(xiàn)了數(shù)字檔案館的基本功能
河南省數(shù)字檔案館邏輯架構圖
河南省檔案館在對網(wǎng)絡、用戶、信息流、業(yè)務流充分調(diào)研的基礎上,明確了網(wǎng)絡應用、業(yè)務流程、信息類型與數(shù)量、并發(fā)用戶與響應速度、安全等級與策略等功能需求,確定了可行的技術路線和技術架構,做到需求明確、邏輯清晰、功能齊全、技術先進、安全可靠,實現(xiàn)了對館藏檔案的數(shù)字化管理、電子檔案的在線接收和長期保存及區(qū)域數(shù)字檔案資源的共建共享。
(1)邏輯架構
局域網(wǎng)的數(shù)據(jù)中心采用虛擬架構,由基礎設施層、數(shù)據(jù)資源層、支撐平臺層、應用系統(tǒng)層、用戶接入層共五大層次,以及標準規(guī)范體系、實施保障體系、安全保障體系三大體系組成。河南省數(shù)字檔案館邏輯架構如圖所示。
基礎設施層:①網(wǎng)絡服務層次:提供局域網(wǎng)、省電子政務外網(wǎng)和互聯(lián)網(wǎng)3種系統(tǒng)訪問途徑,其中,省電子政務外網(wǎng)與局域網(wǎng)物理隔離,互聯(lián)網(wǎng)與局域網(wǎng)物理隔離,省電子政務外網(wǎng)和互聯(lián)網(wǎng)邏輯隔離。②平臺基礎設備層次:包括虛擬化服務器、存儲、光纖交換機、防火墻、路由器。③虛擬化服務平臺:采用虛擬化軟件虛擬出各檔案應用服務器、備份服務器、數(shù)據(jù)庫服務器、數(shù)據(jù)交換服務器,用于部署上層平臺系統(tǒng)。
數(shù)據(jù)資源層:數(shù)字資源是數(shù)字檔案館建設的重點,根據(jù)檔案信息資源體系的規(guī)劃,建立目錄數(shù)據(jù)庫、電子檔案庫、數(shù)字化成果庫、多媒體數(shù)據(jù)庫、標準規(guī)范庫和系統(tǒng)維護庫6個資源庫。根據(jù)檔案“收、管、存、用”的業(yè)務要求,對接收庫、管理庫、保存庫和利用庫進行邏輯劃分和數(shù)據(jù)同步。
支撐平臺層:按照SOA服務的理念,構建應用基礎平臺與工具軟件。支撐平臺包括:基礎組件平臺、系統(tǒng)管理平臺、系統(tǒng)配置平臺、工作流平臺、信息發(fā)布平臺、報表平臺。工具軟件包括:Web文檔控件、格式轉(zhuǎn)換工具、四性檢測工具、全文檢索工具、OCR識別工具、通用瀏覽工具、流媒體服務等,為應用系統(tǒng)的建設提供支撐。
應用系統(tǒng)層:根據(jù)檔案業(yè)務管理、資源管理、用戶管理的需求,開發(fā)部署館藏檔案綜合管理系統(tǒng)等15個業(yè)務系統(tǒng)。
用戶接入層:面向省、市、縣三級檔案館,省直立檔單位和社會公眾等系統(tǒng)終端用戶,提供服務。
(2)應用系統(tǒng)功能及部署
應用系統(tǒng)建設是數(shù)字檔案館功能實現(xiàn)的核心。河南省數(shù)字檔案館應用系統(tǒng)建設在滿足數(shù)字檔案的“收、管、存、用”等基本功能的基礎上,充分體現(xiàn)了前端控制、全流程管理、面向服務、安全高效的理念,建成了基于局域網(wǎng)、省電子政務外網(wǎng)、互聯(lián)網(wǎng)3個網(wǎng)絡平臺的15套業(yè)務系統(tǒng),并按照業(yè)務、用戶、數(shù)據(jù)的特性,對各業(yè)務系統(tǒng)進行歸類管理,提供3個入口地址,其中:局域網(wǎng)平臺以館藏檔案綜合管理系統(tǒng)為入口,省電子政務外網(wǎng)平臺以河南檔案業(yè)務網(wǎng)站為入口,互聯(lián)網(wǎng)平臺以共享系統(tǒng)前臺部分為入口。
基于3個網(wǎng)絡平臺的15套業(yè)務系統(tǒng)包括:
依托局域網(wǎng)的應用系統(tǒng)共有7個:
①館藏檔案綜合管理系統(tǒng),面向檔案館內(nèi)部工作人員提供應用,實現(xiàn)數(shù)字資源的采集、接收、整理、保管、鑒定、編研、統(tǒng)計等全過程規(guī)范化管理。
②多媒體檔案管理系統(tǒng),以多媒體檔案為管理對象,滿足照片、音頻、視頻等檔案的收集、管理、保存、利用。
③檔案數(shù)字化加工系統(tǒng),實現(xiàn)對紙質(zhì)檔案的前處理、著錄、掃描、掛接、質(zhì)檢、驗收等全過程管理。
④智能庫房管理系統(tǒng),通過RFID技術的應用,實現(xiàn)輔助人工對庫房和實體檔案的智能化管理。
⑤電子閱覽室系統(tǒng),面向來館用戶,實現(xiàn)自助查詢、接待服務、閱覽服務和調(diào)卷服務等功能。
⑥海量數(shù)字檔案安全保存系統(tǒng),通過四性檢測、元數(shù)據(jù)設計、數(shù)據(jù)封裝、電子文件長期保存、安全保護等多種功能,實現(xiàn)對數(shù)字化加工成果、電子檔案數(shù)據(jù)等的長期安全保存。
⑦智能檢索系統(tǒng),通過OCR、NLP數(shù)據(jù)管理技術的應用,實現(xiàn)對數(shù)字資源的智能挖掘、智能歸類、智能檢索、智能學習。
依托省電子政務外網(wǎng)部署的應用系統(tǒng)共有6個:
①數(shù)字檔案室系統(tǒng),通過“數(shù)據(jù)物理集中、權限邏輯分離”的方式,為各立檔單位提供對電子文件與數(shù)字化成果的“收、管、存、用”平臺。
②電子檔案移交接收系統(tǒng),為各立檔單位提供數(shù)據(jù)封裝、四性檢測、系統(tǒng)接口、數(shù)據(jù)格式轉(zhuǎn)換等工具,實現(xiàn)電子檔案的在線檢查、在線指導、在線移交接收。
③全省數(shù)字檔案信息資源共享系統(tǒng),以統(tǒng)一平臺、分級管理為原則,面向各立檔單位以及省、市、縣級檔案館,提供檔案數(shù)字資源的共建共享服務。
④辦公自動化系統(tǒng),作為檔案館協(xié)同辦公平臺,提供了公文流轉(zhuǎn)、人事管理、會議管理、日程安排等功能。
⑤家譜檔案管理系統(tǒng),以河南省各級檔案館中的家譜檔案為管理對象,通過家譜檔案元數(shù)據(jù)著錄、內(nèi)容管理、動態(tài)呈現(xiàn),搭建起全省的家譜檔案共建共享平臺。
⑥河南檔案業(yè)務網(wǎng)站作為河南省數(shù)字檔案館在省電子政務外網(wǎng)的業(yè)務門戶提供以上5個系統(tǒng)的訪問入口并集中展示相關內(nèi)容。
依托互聯(lián)網(wǎng)部署的應用系統(tǒng)共有2個:
①公共查詢系統(tǒng),面向互聯(lián)網(wǎng)公眾用戶,提供館藏開放檔案的目錄檢索和全文檢索,以及編研成果展示、網(wǎng)上展廳等。
②移動檔案服務系統(tǒng),面向移動互聯(lián)網(wǎng)用戶,提供開放檔案的統(tǒng)一發(fā)布和查詢。
3.搭建基于省電子政務外網(wǎng)的資源共享系統(tǒng)
資源共建共享是數(shù)字檔案館建設的目標導向?;谑‰娮诱胀饩W(wǎng)建立的資源共享系統(tǒng),界面簡潔、功能清晰、資源豐富,用戶經(jīng)過身份認證后登錄系統(tǒng),根據(jù)授權實現(xiàn)共建共享需求。一是通過數(shù)字檔案室及移交接收系統(tǒng)為各立檔單位提供了統(tǒng)一的數(shù)字檔案管理平臺,為各單位之間檔案資源共享創(chuàng)造了條件。二是通過全省檔案資源共享平臺共享政務公開信息、開放檔案、編研成果等。三是通過河南政務服務網(wǎng)站前端接收社會公眾的利用請求,在后臺處理完畢后將數(shù)據(jù)再推送給前端提出申請的用戶。四是利用全省檔案資源共享平臺實現(xiàn)省內(nèi)館際之間的異地查檔、跨館出證。
4.開發(fā)基于NLP技術的智能檢索系統(tǒng)
智能檢索系統(tǒng)選型HanLP技術,通過拼音檢索、首字母檢索、同義詞檢索、模型檢索、人名庫提取、地名庫提取、熱詞排行、知識圖譜、統(tǒng)計分析等功能,對智能挖掘、智能歸類、智能檢索、智能學習的智慧利用模式進行了初步探索。系統(tǒng)目前共收集目錄數(shù)據(jù)3242805條,全文數(shù)據(jù)1652107條,并全部完成了TXT抽取、中文分詞、關鍵詞提取、拼音標注及縮寫,建立了包含4174045個詞組或短語的基礎詞庫,包含62003個詞語的同義詞庫,以及河南基礎地名庫、人名庫、關鍵詞庫等。同時,按照檔案分類法對館藏系統(tǒng)中所有檔案進行分類標記,共設置20個大類。通過以上手段,實現(xiàn)了對資源總庫中檔案數(shù)據(jù)的智能檢索和知識管理,取得了較好的利用體驗和利用效果。
5.完善基于海量數(shù)字檔案安全保存策略
信息安全是數(shù)字檔案館建設的保障。在設計與建設中,確立了網(wǎng)絡、系統(tǒng)、資源、管理等安全策略。一是確定網(wǎng)絡、系統(tǒng)的安全等級保護級別。省電子政務外網(wǎng)、局域網(wǎng)及部署其上的應用系統(tǒng)都按照等保三級要求規(guī)劃設計與建設。二是部署海量數(shù)字檔案長期保存系統(tǒng),保障數(shù)字檔案長久保存過程中的真實性、完整性、可用性和安全性。三是建立全方位的安全防護。根據(jù)局域網(wǎng)業(yè)務系統(tǒng)安全要求,在對檔案安全風險分析的基礎上建立安全防護模型,從應用層、系統(tǒng)層、網(wǎng)絡層、物理層和管理層5個層面對數(shù)字檔案館進行分層防護,從而全面保障數(shù)字檔案館的安全。其中:應用層安全,通過采用身份認證、權限控制、數(shù)字簽名、應用審計及數(shù)據(jù)加等技術手段,重點保護各業(yè)務平臺賬號、鑰、操作等安全;系統(tǒng)層安全,通過進行操作系統(tǒng)加固、漏洞掃描、防病毒查殺、備份恢復等,重點保護操作系統(tǒng)、數(shù)據(jù)庫的安全;網(wǎng)絡層安全,通過使用防火墻篩查、鏈路加、違規(guī)外聯(lián)監(jiān)控、VLAN劃分、安全隔離、入侵檢測、安全審計等手段,重點保護網(wǎng)絡安全;物理層安全,通過采取電力保障、設備安全、防電磁泄漏、防物理破壞、環(huán)境安全、介質(zhì)安全等有效方式,重點保護機房環(huán)境、核心設備、重要介質(zhì)等安全;管理層安全,通過成立管理機構,加強人員培訓,制定管理制度和應急預案等,建立起安全機制,為信息系統(tǒng)和檔案數(shù)據(jù)的安全提供制度保障。
6.以共享為主要目標的資源建設
根據(jù)不同網(wǎng)絡用戶,對資源進行分類部署。局域網(wǎng)部署的是覆蓋全部館藏各門類檔案、圖書、資料的目錄數(shù)據(jù)、全文數(shù)據(jù)(檔案除外)及政務公開信息;省電子政務外網(wǎng)部署全省各級檔案館的開放檔案目錄、民生檔案目錄、特色檔案資源以及省直各立檔單位的已進館檔案數(shù)據(jù);互聯(lián)網(wǎng)部署省館開放檔案目錄及開放檔案全文數(shù)據(jù)、政務公開信息及公開的檔案編研成果。依托資源共享系統(tǒng),制定資源共建計劃和資源共享辦法,指導市級檔案館上傳檔案館指南、專題介紹、開放檔案目錄數(shù)據(jù)、專題目錄數(shù)據(jù)、原文數(shù)據(jù),有計劃地組織具有河南特色的專題資源庫。家譜檔案資源庫架構已經(jīng)搭建,依據(jù)家譜檔案元數(shù)據(jù)著錄規(guī)范,上傳家譜數(shù)據(jù),并對數(shù)據(jù)進行解析加工,從家族譜影、家族名人、家風家訓、姓氏字輩、家譜遺跡等方面挖掘數(shù)據(jù),探索數(shù)字人文與資源管理的結(jié)合。
努力方向
面對加快檔案信息化戰(zhàn)略轉(zhuǎn)型的機遇和挑戰(zhàn),數(shù)字檔案館建設應朝著以下幾個方向努力:一是要著力應用,以用促建。要加快數(shù)字檔案館系統(tǒng)在省館內(nèi)部、省直單位和市、縣級檔案館的推廣應用,培育電子文件單套歸檔的試點,推進原生電子檔案的接收,加大資源共享力度,使數(shù)字檔案館成為檔案管理、業(yè)務協(xié)同、對外服務、提升功能的有效平臺,同時通過應用反饋,促進數(shù)字檔案館建設不斷完善。二是要推進融合,以融促用。隨著“放管服”改革的深化,截至2020年2月1日,河南省共發(fā)布省、市、縣三級政務服務網(wǎng)上辦理事項197417項,這些事項的辦理將產(chǎn)生大量電子文件。檔案部門要進一步加強與大數(shù)據(jù)管理部門的融合,做好政務服務網(wǎng)電子文件規(guī)范化管理、歸檔與共享。三是要深化研究,以研促轉(zhuǎn)。新的政策環(huán)境、技術背景、多元化需求導向下,數(shù)字檔案館建設正在向著業(yè)務協(xié)同、資源共享、安全可信、長期保存、智慧智能的方向發(fā)展,因此需要從物聯(lián)網(wǎng)、云計算、數(shù)據(jù)挖掘、移動互聯(lián)網(wǎng)應用等方面繼續(xù)深化對數(shù)字檔案館的研究,推動數(shù)字檔案館的智慧轉(zhuǎn)型。
作者單位:河南省檔案館
文章來源:《中國檔案》2020年第8期
圖表來源:作者提供