智慧檔案管理與大數(shù)據(jù)解決方案的領(lǐng)航者,讓信息價(jià)值超越期待
電 話:18937133779
網(wǎng) 址:http://oaoy.cn
郵 箱:zboao@qq.com
元數(shù)據(jù)(Metadata),又稱中介數(shù)據(jù)、中繼數(shù)據(jù),為描述數(shù)據(jù)的數(shù)據(jù)(data about data)。
元數(shù)據(jù)作用是:
1、描述數(shù)據(jù)屬性(property)的信息,用來支持如指示存儲位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能。
2、元數(shù)據(jù)算是一種電子式目錄,為了達(dá)到編制目錄的目的,必須在描述并收藏?cái)?shù)據(jù)的內(nèi)容或特色,進(jìn)而達(dá)成協(xié)助數(shù)據(jù)檢索的目的。
元數(shù)據(jù)的應(yīng)用舉例:
1、數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)集的名稱、關(guān)系、字段、約束等;
2、數(shù)據(jù)部署:數(shù)據(jù)集的物理位置;
3、數(shù)據(jù)流:數(shù)據(jù)集之間的流程依賴關(guān)系(非參照依賴),包括數(shù)據(jù)集到另一個數(shù)據(jù)集的規(guī)則;
4、質(zhì)量度量:數(shù)據(jù)集上可以計(jì)算的度量;
5、度量邏輯關(guān)系:數(shù)據(jù)集度量之間的邏輯運(yùn)算關(guān)系;
6、ETL過程:過程運(yùn)行的順序,并行、串行;
7、數(shù)據(jù)集快照:一個時間點(diǎn)上,數(shù)據(jù)在所有數(shù)據(jù)集上的分布情況。
擴(kuò)展資料:
元數(shù)據(jù)的優(yōu)點(diǎn):
1、自描述:元數(shù)據(jù)自動提供 COM 中 IDL 的功能,允許將一個文件同時用于定義和實(shí)現(xiàn)。運(yùn)行庫模塊和程序集甚至不需要向操作系統(tǒng)注冊。結(jié)果,運(yùn)行庫使用的說明始終反映編譯文件中的實(shí)際代碼,從而提高應(yīng)用程序的可靠性。
2、設(shè)計(jì):元數(shù)據(jù)提供所有必需的有關(guān)已編譯代碼的信息,以供用戶從用不同語言編寫的 PE 文件中繼承類。用戶可以創(chuàng)建用任何托管語言(任何面向公共語言運(yùn)行庫的語言)編寫的任何類的實(shí)例,而不用擔(dān)心顯式封送處理或使用自定義的互用代碼。
謝海洋 王素娟 元數(shù)據(jù),英文拼寫為Metadata,目前已被廣泛應(yīng)用于各種信息資源的管理領(lǐng)域中。在檔案界,最早使用“元數(shù)據(jù)”的是美國的電子文件管理專家戴維?比爾曼,他在20世紀(jì)90年代初發(fā)表的有關(guān)電子文件管理方面的論文中首先使用了元數(shù)據(jù)這一術(shù)語。 元數(shù)據(jù)的概念目前在檔案界還沒有一個統(tǒng)一的定論,目前比較有代表性的描述有: 1.元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)(Data about Data)”,其中,后一個Data是指被描述的信息資源,前一個Data則是指為理解該信息資源而存儲的有關(guān)信息,即元數(shù)據(jù)。這是元數(shù)據(jù)目前公認(rèn)最為經(jīng)典、通俗和簡潔的定義。 2.國際檔案理事會《電子文件管理指南》(1997)認(rèn)為“元數(shù)據(jù)是關(guān)于文件的背景信息和結(jié)構(gòu)的數(shù)據(jù),是有關(guān)電子文件的技術(shù)性信息。” 3.《澳大利亞聯(lián)邦機(jī)構(gòu)電子文件保管元數(shù)據(jù)標(biāo)準(zhǔn)》(1999)認(rèn)為“文件保管元數(shù)據(jù)是關(guān)于電子文件背景的描述信息?!?4.英國國家檔案館《電子文件管理指南》(1999)認(rèn)為“元數(shù)據(jù)是關(guān)于文件和文件集合的背景及其相互關(guān)系的結(jié)構(gòu)化描述和編目數(shù)據(jù)?!?5.馮惠玲主編的《電子文件管理教程》認(rèn)為元數(shù)據(jù)是“由電子文件系統(tǒng)自動記錄的關(guān)于文件形成時間、地點(diǎn)、人員、活動、文件系統(tǒng)、結(jié)構(gòu)及內(nèi)容方面的具體數(shù)據(jù)。” 6.“元數(shù)據(jù)可以理解為用來描述資源的屬性與特征的信息?!保瓌⒓艺妗峨娮游募芾砝碚撆c實(shí)踐》,科學(xué)出版社2003年版。 7.“元數(shù)據(jù)是對數(shù)據(jù)對象規(guī)范描述所形成的數(shù)據(jù)集合,通過計(jì)算機(jī)可讀的開放語言來標(biāo)記元數(shù)據(jù),就能在系統(tǒng)間發(fā)現(xiàn)、交換、轉(zhuǎn)換和理解相應(yīng)的數(shù)字對象,支持系統(tǒng)間互操作?!保瓘垥粤帧堕_放元數(shù)據(jù)機(jī)制:理念與原則》,《中國圖書館學(xué)報(bào)》2003年3期。 以上描述雖然表述各不相同,但我們可以發(fā)現(xiàn)一個共同點(diǎn),即元數(shù)據(jù)主要是動態(tài)地描述電子文檔各種特征的信息數(shù)據(jù)集合,并且它能為分散的、由多種數(shù)字化資源有機(jī)構(gòu)成的檔案信息體系提供整合的工具與紐帶。隨著研究的深入,我們對元數(shù)據(jù)的認(rèn)識在逐步深化。 檔案工作人員為便于理解,可以簡單把電子文檔的元數(shù)據(jù)視為兩方面:一是“著錄信息或著錄數(shù)據(jù)”。其中,“元數(shù)據(jù)元素就是著錄項(xiàng)目,元數(shù)據(jù)格式就是著錄項(xiàng)目之間關(guān)系的結(jié)構(gòu)化表示,元數(shù)據(jù)編碼就是著錄信息的編制?!保▌⒃侥稀秾﹄娮游募芾碓獢?shù)據(jù)的再認(rèn)識》,《檔案學(xué)通訊》2005年2期);二是電子文檔的內(nèi)容、背景和結(jié)構(gòu)等方面的信息。 國外學(xué)者將元數(shù)據(jù)喻為電子文件管理系統(tǒng)中的“血液”,足見元數(shù)據(jù)在數(shù)字檔案館電子文件管理中發(fā)揮著舉足輕重的作用。元數(shù)據(jù)的作用主要可以概括為以下幾方面: 1.元數(shù)據(jù)能協(xié)助數(shù)字檔案館構(gòu)建信息檢索機(jī)制。元數(shù)據(jù)具有動態(tài)跟蹤功能,能夠即時動態(tài)地獲取電子文件管理的各項(xiàng)信息。在數(shù)字檔案館的海量信息庫中,借助元數(shù)據(jù),可以快速發(fā)現(xiàn)并獲取特定的信息單元。 2.元數(shù)據(jù)能維護(hù)信息的識別與讀取。電子文件所攜帶的元數(shù)據(jù)信息可以完整地記錄電子文件的原始狀態(tài),能夠系統(tǒng)地映射出電子文件的信息內(nèi)容、背景和結(jié)構(gòu)等;還能夠映射出電子文件的生成環(huán)境和行政管理環(huán)境。只有在獲取數(shù)據(jù)對象的同時也獲取這些元數(shù)據(jù)信息,被檢索到的數(shù)據(jù)單元才是可理解的、可讀的。 3.元數(shù)據(jù)能保障電子文件的真實(shí)性與憑證性。元數(shù)據(jù)系統(tǒng)能夠跟蹤記錄電子文件從產(chǎn)生那一刻起的載體、設(shè)備及所用技術(shù)的變遷史以及使用干預(yù)該文件的整個歷史過程,即不論載體、設(shè)備、技術(shù)如何更新?lián)Q代,不論使用者、使用人數(shù)的多少都全部作為歷史數(shù)據(jù)保存下來,記錄備案。這些為數(shù)字信息單元真實(shí)性和憑證性提供了重要的佐證。
元數(shù)據(jù)(Meta Data)是關(guān)于數(shù)據(jù)的數(shù)據(jù),當(dāng)人們描述現(xiàn)實(shí)世界的現(xiàn)象時,就會產(chǎn)生抽象信息,這些抽象信息便可以看作是元數(shù)據(jù),元數(shù)據(jù)主要用來描述數(shù)據(jù)的上下文信息。
通俗的來講,假若圖書館的每本書中的內(nèi)容是數(shù)據(jù)的話,那么找到每本書的索引則是元數(shù)據(jù),元數(shù)據(jù)之所以有其它方法無法比擬的優(yōu)勢,就在于它可以幫助人們更好的理解數(shù)據(jù)。
發(fā)現(xiàn)和描述數(shù)據(jù)的來龍去脈,特別是那些即將要從OLTP系統(tǒng)上升到DW/BI體系建設(shè)的企業(yè),元數(shù)據(jù)可以幫他們形成清晰直觀的數(shù)據(jù)流圖,元數(shù)據(jù)是數(shù)據(jù)管控的基本手段。
元數(shù)據(jù)是為了提升共享、重新獲取和理解企業(yè)信息資產(chǎn)的水平,元數(shù)據(jù)是企業(yè)信息管理的潤滑劑,不對元數(shù)據(jù)進(jìn)行管理或管理不得當(dāng)。
信息將被丟失或處于隱匿狀態(tài)而難以被用戶使用,數(shù)據(jù)集成將十分昂貴,不能對業(yè)務(wù)進(jìn)行有效支撐。終端用戶要識別相關(guān)的信息將十分困難,最終用戶將失去對數(shù)據(jù)的信任。
擴(kuò)展資料
元數(shù)據(jù)分類
元數(shù)據(jù)管理的范圍將涵括數(shù)據(jù)產(chǎn)生、數(shù)據(jù)存儲、數(shù)據(jù)加工和展現(xiàn)等各個環(huán)節(jié)的數(shù)據(jù)描述信息,幫助用戶理解數(shù)據(jù)來龍去脈、關(guān)系及相關(guān)屬性。按其描述對象的不同可以劃分為三類元數(shù)據(jù):技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù)和管理元數(shù)據(jù)。這三種元數(shù)據(jù)的具體描述如下:
1、技術(shù)元數(shù)據(jù) 技術(shù)元數(shù)據(jù)是描述數(shù)據(jù)系統(tǒng)中技術(shù)領(lǐng)域相關(guān)概念、關(guān)系和規(guī)則的數(shù)據(jù),主要包括對數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)處理方面的特征描述,覆蓋數(shù)據(jù)源接口、數(shù)據(jù)倉庫與數(shù)據(jù)集市存儲、ETL、OLAP、數(shù)據(jù)封裝和前端展現(xiàn)等全部數(shù)據(jù)處理環(huán)節(jié);
2、業(yè)務(wù)元數(shù)據(jù) 業(yè)務(wù)元數(shù)據(jù)是描述數(shù)據(jù)系統(tǒng)中業(yè)務(wù)領(lǐng)域相關(guān)概念、關(guān)系和規(guī)則的數(shù)據(jù),主要包括業(yè)務(wù)術(shù)語、信息分類、指標(biāo)定義和業(yè)務(wù)規(guī)則等信息;
3、管理元數(shù)據(jù) 管理元數(shù)據(jù)是描述數(shù)據(jù)系統(tǒng)中管理領(lǐng)域相關(guān)概念、關(guān)系和規(guī)則的數(shù)據(jù),主要包括人員角色、崗位職責(zé)和管理流程等信息。
參考資料來源:百度百科-元數(shù)據(jù)
元數(shù)據(jù)(Meta Date),主要記錄數(shù)據(jù)倉庫中模型的定義、各層級間的映射關(guān)系、監(jiān)控?cái)?shù)據(jù)倉庫的數(shù)據(jù)狀態(tài)及ETL的任務(wù)運(yùn)行狀態(tài)。一般會通過元數(shù)據(jù)資料庫(Metadata Repository)來統(tǒng)一地存儲和管理元數(shù)據(jù),其主要目的是使數(shù)據(jù)倉庫的設(shè)計(jì)、部署、操作和管理能達(dá)成協(xié)同和一致。
元數(shù)據(jù)是數(shù)據(jù)倉庫管理系統(tǒng)的重要組成部分,元數(shù)據(jù)管理是企業(yè)級數(shù)據(jù)倉庫中的關(guān)鍵組件,貫穿數(shù)據(jù)倉庫構(gòu)建的整個過程,直接影響著數(shù)據(jù)倉庫的構(gòu)建、使用和維護(hù)。