由中國工程院承擔建設的中國工程科技知識中心,是經國傢批準建設的國傢工程科技領域公益性、開放式的知識資源集成和服務平颱建設項目,是國傢信息化建設的重要組成部分,旨在為國傢工程科技領域重大決策、重大工程科技活動、企業創新與人纔培養等提供科技大數據支撐和專業化知識服務,助推國傢科技創新驅動發展戰略。
自2012年該項目啓動建設5年來,中國工程科技知識中心已建立化工、農業、醫藥、能源和衛生等近30個專業知識服務分中心係統,通過自建、聯盟、采購、網絡開放獲取等方式,匯聚瞭二十多個主題領域的資源,包括文獻、數值數據、工具(事實)、行業報告和政策法規等,資源總量超過44億條,數據容量達到84TB,資源建設初具規模,實現瞭工程科技領域各類數據匯集的重大突破。
為建成中國工程科技領域的“元數據海”,元數據標準規範至關重要。為此,項目組提齣要在參考藉鑒國內外標準規範基礎上,研究構建一套與知識中心建設目標相一緻的元數據標準規範,以此指導和規範中國工程科技知識中心各類數字資源元數據匯交、元搜索服務和係統互操作,從根本上實現工程科技全領域資源的匯聚打通和互聯互通,實現海量資源一站式、全方位搜索和發現服務。
《中國工程科技知識中心元數據規範(1)》編寫組在廣泛調研和參考國內外大量元數據標準規範基礎上,經過多層次、多方麵的專題研討與專傢谘詢,並廣泛嚮參建分中心、技術研究中心和平颱組徵求意見,經過多輪修訂完善,建立瞭一套具有較好適用性、實用性和可擴展性的中國工程科技知識中心元數據標準規範。
1 引言
2 編製範圍
3 編製思路及原則
3.1 編製思路
3.2 編製原則
4 引用文件
5 術語和定義
5.1 元數據
5.2 元素
5.3 屬性
5.4 容器類元素
5.5 通用容器
5.6 編碼體係
5.7 數據集
5.8 期刊
5.9 圖書
5.10 期刊論文
5.11 會議論文
5.12 學位論文
5.13 專傢學者
5.14 科技機構
5.15 科研項目
5.16 科技成果
5.17 專利
5.18 標準
5.19 産業政策
5.20 新聞資訊
5.21 圖片
6 領域資源關聯模型
7 元數據描述框架
8 通用容器描述規範
8.1 管理通用容器描述規範
8.2 主題通用容器描述規範
8.3 責任者通用容器描述規範
8.4 責任機構通用容器描述規範
8.5 國彆(地區)通用容器描述規範
8.6 會議通用容器描述規範
8.7 收錄類彆通用容器描述規範
8.8 基金項目通用容器描述規範
8.9 成果産齣通用容器描述規範
8.10 參考文獻通用容器描述規範
8.11 附件通用容器描述規範
8.12 擴展通用容器描述規範
9 數據集元素集描述規範
9.1 內容結構
9.2 描述細則
10 資源元素集描述規範
10.1 期刊元素集描述規範
10.2 圖書元素集描述規範
10.3 期刊論文元素集描述規範
10.4 會議論文元素集描述規範
10.5 學位論文元素集描述規範
10.6 專傢學者元素集描述規範
10.7 科技機構元素集描述規範
10.8 科研項目元素集描述規範
10.9 科技成果元素集描述規範
10.10 專利元素集描述規範
10.11 標準元素集描述規範
10.12 産業政策元素集描述規範
10.13 新聞資訊元素集描述規範
10.14 圖片元素集描述規範
附錄
附錄1 元數據規範編碼體係
附錄2 XMLSchema典型示例
1引言
為指導和規範中國工程科技知識中心(以下簡稱:知識中心)各類數字資源元數據匯交、元搜索服務、資源集成整閤和係統間互操作,從根本上實現知識中心資源的匯聚打通,迫切需要建立一係列與知識中心建設目標相適應的元數據標準規範。
元數據(Metadata)是描述數據的數據,即根據特定的目的定義描述規則來描述特定類型的資源,是對數據進行組織和管理的基礎。利用元數據對數字化信息資源進行描述、管理、交換和共享,已成為當前數字信息資源建設的重要手段。元數據的開發與應用,倡導遵循標準化、規範化和開放性原則,從而為各類信息管理係統和知識服務係統的互操作和開放性奠定基礎。
知識中心標準規範編委會在充分藉鑒國際上相關元數據研究應用成果基礎上,根據知識中心的應用需求,研究製訂瞭用於知識中心和各分中心相關資源描述、交換、復用、轉換、整閤和打通要求的元數據規範,有助於進一步規範各類資源的揭示、匯聚和共享服務。
2編製範圍
2編製範圍
知識中心元數據標準規範是描述知識中心各類資源的元數據標準,是根據各類資源特點確定的元數據集閤。基於這些元素實現對各類資源的描述、定位、管理、檢索、交互、集成和打通。
《中國工程科技知識中心元數據規範(Ⅰ)》建立瞭知識中心領域資源關聯模型和元數據描述框架,抽象、歸納瞭管理、主題、責任者、責任機構、國彆(地區)、會議、收錄類彆、基金項目、成果産齣、參考文獻、附件和擴展共12類通用容器,並對1個數據集元素集和期刊、圖書、期刊論文、會議論文、學位論文、專傢學者、科技機構、科研項目、科技成果、專利、標準、産業政策、新聞資訊、圖片等14類資源,以及23個規範編碼體係做瞭詳盡的元數據規範描述和約定。
本標準規範針對各類資源的內容和外觀特徵進行規定,也針對知識中心各類資源中涉及的共性通用屬性進行描述,對於其他未包括在內,以及在應用發展中可能會齣現的元素,可在本標準規範框架基礎上進行擴展。
3編製思路及原則
3編製思路及原則
3��1編製思路
緊密圍繞知識中心總體建設目標和階段重點建設任務,在梳理知識中心和各專業分中心亟須建設的多類型資源基礎上,藉鑒和參考國內外相關標準,結閤知識中心建設特點進行自定義擴展,同時麵嚮人和計算機多場景應用需求,研究製定知識中心的元數據規範體係。
3��2編製原則
3��2��1模塊化
模塊化是元數據最重要特徵,其關鍵是根據實際使用需要,將資源對象區分為若乾個實體,對資源的描述即是對多個不同實體的組閤和描述。本規範是在對知識中心各類資源進行調研分析和綜閤對比基礎上,將其分為通用容器、數據集元素集、資源元素集模塊和規範編碼體係四個部分。
3��2��2可復用可擴展
支持對通用容器的組裝復用,也可在本規範製定的元數據基礎基礎上,進行相關通用容器和元素集的復用、繼承和擴展,支持根據專業特色資源和個性化應用需求,進行其他類型資源元數據規範的擴展。
3��2��3計算機可識彆可理解
麵嚮計算機和網絡化應用,將元數據規範文本轉化為XML Schema形式化描述文件,並基於XML Schema將各類資源元數據轉化、封裝為XML文件,支持計算機對XML文件的自動識彆、理解和驗證。
注:本規範對應的XML Schema形式化描述文件及XML樣例數據,將單獨提供。
4引用文件
4引用文件
本規範廣泛藉鑒和參考瞭《都柏林核心元數據元素集》、美國國傢生物技術信息中心(NCBI)的JATS、國傢科技圖書文獻中心《NSTL文獻資源加工規範》、科技文獻書目本體(BIBO)、研究社區語義網本體(SWRC)和可交換圖像文件(EXIF)等現有國內外著名的標準規範。
引用的元數據描述標準和規範主要有:
GB/T 25100#2010 信息與文獻——都柏林核心元數據元素集
DCMI抽象模型�盵DCMI]
DCMI 元數據術語集�盵DCMI-TERMS]
ISO 639—2 Codes for the representation of names of languages�盇lpha-3code�盵ISO 639—2]
[ISO 639—2]語種名稱代碼錶:3位代碼[ISO 639—2]
日期與時間格式,W3C注釋[W3CDTF]
www�眞3�眔rg/TR/NOTE-datetime
《NSTL文獻資源加工規範》
http://spec�眓stl�眊ov�眂n/specification/namespace
ANSI/NISO Z39��96 Journal Article Tag Suite(JATS)
http://jats�眓lm�眓ih�眊ov/archiving/tag-library/1��0/
書目本體(Bibliographic Ontology,BIBO)
語義網研究社區本體(Semantic Web for Research Communities,SWRC)
可交換圖像文件元數據規範(Exchangeable Image File,EXIF)
JEITA CP-3451B,Exif Version 2��3 [S]�盝EITA & CIPA, 2010��
5術語和定義
5術語和定義
本部分內容用於描述本規範的元素屬性涉及的術語和定義。
5��1元數據
“元數據”(Metadata)是定義和描述其他數據的數據。[GB/T 1839��1—2009,術語和定義3��2��18]。
5��2元素
“元素”是XML術語,是元數據的基本單元。
5��3屬性
“屬性”是XML術語,有屬性名和屬性值,可對元素進行描述、限定、說明。
5��4容器類元素
“容器類元素”是包含其他元素的元素,與其他元素的關係為父子或祖先/後代的關係。
5��5通用容器
“通用容器”是指數據集和其他類型資源元素集中涉及的共性元素,將這些共性元素提取並形成通用集閤。
5��5��1管理通用容器
“管理通用容器”是指各類資源的管理性通用信息,側重於對數據唯一標識、追蹤溯源和增量更新,如:資源類型、來源機構、唯一標識符、創建時間和修改時間等。
5��5��2主題通用容器
“主題通用容器”用於描述各類資源中涉及的自由關鍵詞,或經過知識標引和組織後的範疇、學科分類、主題、概念及對應編號,以及描述專傢學者、科技機構的研究方嚮、專業領域和專利的分類號等。
5��5��3責任者通用容器
“責任者通用容器”主要用於描述圖書、期刊論文、會議論文、學位論文、標準、專利等各類資源中涉及的作者、著者、編者、導師,以及項目參與者和成果完成人等。
5��5��4責任機構通用容器
“責任機構通用容器”主要用於描述圖書、期刊論文、會議論文、學位論文、標準、專利等資源中涉及的齣版商、論文作者機構、專傢學者工作單位、科技機構上級部門、科研項目資助機構、科技成果完成機構等。
5��5��5國彆(地區)通用容器
“國彆(地區)通用容器”主要描述各類資源中與國傢或地區相關的信息。
5��5��6會議通用容器
“會議通用容器”描述資源中相關聯的會議名稱、會議日期、會議地點等信息,主要來源於會議論文、期刊論文等資源。
5��5��7收錄類彆通用容器
“收錄類彆通用容器”是指期刊、期刊論文、會議論文等資源被SCI、EI、CSCD、核心期刊等收錄情況。
5��5��8基金項目通用容器
“基金項目通用容器”是指會議論文、期刊論文、科技成果等資源中接受資助的基金項目等相關信息。
5��5��9成果産齣通用容器
“成果産齣通用容器”是指專傢學者、科技機構、科研項目等資源中描述相關科研成果産齣的相關信息。
5��5��10參考文獻通用容器
“參考文獻通用容器”是描述期刊論文、學位論文、圖書、專利等資源中的參考文獻信息。
5��5��11附件通用容器
“附件通用容器”是描述與數據集、期刊論文、學位論文、專傢學者、專利等各類資源元數據相對應的PDF、圖片、壓縮文件等附件文件的信息。
5��5��12擴展通用容器
“擴展通用容器”是描述在數據集及各類資源元素集元數據標準中未涉及的元素描述及定義的擴展信息。
5��6編碼體係
“編碼體係”是元數據修飾的一種方式,用來規範元素或屬性取值範圍的受控詞錶或規範名稱列錶。
5��7數據集
“數據集”是指具有相同或相似數據結構的同類資源數據集閤,可以是數據庫,也可以是數據庫的一個(邏輯)部分。本規範中的數據集是指知識中心中同類資源的數據集閤,既包括本規範明確製定元數據規範的圖書、期刊論文、專傢學者、科技機構、基金項目、産業政策等類型資源,也包括其他未製定元數據標準規範的資源類型(如各類科學數據、統計數據、地圖數據等)。來自於不同分中心的同類型資源屬於不同數據集。
5��8期刊
“期刊”是指經過同行評審的期刊,發錶在期刊上的文章通常涉及特定的學科。期刊展示瞭研究領域的成果,並起到瞭公示的作用,其內容主要以原創研究、綜述文章、書評等形式的文章為主。
5��9圖書
“圖書”主要是指由齣版社(商)齣版的不包括封麵和封底在內49頁以上的印刷品,具有特定的書名和著者名,編有國際標準書號,有定價並取得版權保護的齣版物稱為圖書。
5��10期刊論文
“期刊論文”是發錶在期刊文獻上的學術文章(通常不含簡介、緻謝、編者按、廣告等)。除論文內容以外,期刊論文還包含作者姓名、作者所屬機構等信息。
5��11會議論文
“會議論文”是指在學術會議上提交的論文,在會議上宣讀或交流,而後以印刷版或電子版方式齣版,典型的是以會議論文集(會議錄)方式齣版。
5��12學位論文
“學位論文”是為申請學位而撰寫的學術論文,是學位申請者獲得學位的必要條件之一。
5��13專傢學者
“專傢學者”是指取得重要學術成就和有影響力的院士、科學傢和科技創新人員等。
5��14科技機構
“科技機構”是以科學研究為目的,以技術服務為目標,有組織、有一定規模、有固定場所的,並有固定工作人員的,符閤一定條件的,主要包括科研機構、高等院校、公司企業、行業學/協會等。
5��15科研項目
“科研項目”即開展科學技術研究的一係列獨特的、復雜的並相互關聯的活動,這些活動有著一個明確的目標或目的,必須在特定的時間、預算、資源限定內,依據規範完成。
5��16科技成果
“科技成果”是指由法定機關(一般指科技行政部門)認可,在一定範圍內經實踐證明先進、成熟、適用,能取得良好經濟、社會或生態環境效益的科學技術成果,其內涵與知識産權和專有技術基本相一緻,是無形資産中不可缺少的重要組成部分。
5��17專利
“專利”是指一項獲得專利機構批準的發明創造。它是由專利機構依據發明申請所頒發的一種文件。這種文件敘述發明的內容,並且産生一種法律狀態,即該獲得專利的發明在一般情況下隻有得到專利所有人的許可纔能利用(包括製造、使用、銷售和進口等),專利的保護有時間和地域的限製。
5��18標準
“標準”是為瞭在一定範圍內獲得最佳秩序,經協商一緻製定並由公認機構批準,共同使用和重復使用的一種規範性文件。它以科學、技術和實踐經驗的綜閤成果為基礎,經有關方麵協商一緻,由主管機構批準,以特定形式發布,作為共同遵守的準則和依據。
5��19産業政策
“産業政策”是政府為瞭實現一定的經濟和社會目標而對産業的形成和發展進行乾預的各種規劃、綱要、政策等。
5��20新聞資訊
“新聞資訊”是指權威機構、組織和企業等在互聯網上即時、動態發布的有價值的新聞資訊等網絡信息資源。
5��21圖片
“圖片”是指一般性的圖形、圖像等,如數碼相機拍的照片,如BMP、JPG、PNG、GIF等常規資源,
序
由中國工程院承擔建設的中國工程科技知識中心,是經國傢批準建設的國傢工程科技領域公益性、開放式的知識資源集成和服務平颱建設項目,是國傢信息化建設的重要組成部分,旨在為國傢工程科技領域重大決策、重大工程科技活動、企業創新與人纔培養等提供科技大數據支撐和專業化知識服務,助推國傢科技創新驅動發展戰略。
自2012年該項目啓動建設5年來,中國工程科技知識中心已建立化工、農業、醫藥、能源和衛生等近30個專業知識服務分中心係統,通過自建、聯盟、采購、網絡開放獲取等方式,匯聚瞭二十多個主題領域的資源,包括文獻、數值數據、工具(事實)、行業報告和政策法規等,資源總量超過44億條,數據容量達到84TB,資源建設初具規模,實現瞭工程科技領域各類數據匯集的重大突破。
為建成中國工程科技領域的“元數據海”,元數據標準規範至關重要。為此,項目組提齣要在參考藉鑒國內外標準規範基礎上,研究構建一套與知識中心建設目標相一緻的元數據標準規範,以此指導和規範中國工程科技知識中心各類數字資源元數據匯交、元搜索服務和係統互操作,從根本上實現工程科技全領域資源的匯聚打通和互聯互通,實現海量資源一站式、全方位搜索和發現服務。
本書編寫組在廣泛調研和參考國內外大量元數據標準規範基礎上,經過多層次、多方麵的專題研討與專傢谘詢,並廣泛嚮參建分中心、技術研究中心和平颱組徵求意見,經過多輪修訂完善,建立瞭一套具有較好適用性、實用性和可擴展性的中國工程科技知識中心元數據標準規範。
本書製定的元數據標準規範,研究建立瞭中國工程科技知識中心領域資源元數據描述框架和關聯模型,抽象、歸納瞭管理、主題、責任者、責任機構、基金項目、成果産齣等12類通用容器,詳盡描述瞭數據集元素集和期刊、圖書、期刊論文、會議論文、學位論文、專傢學者、科技機構、科研項目、科技成果、專利、標準、産業政策等14類資源元素集的元數據描述規範細則。本規範將對提升中國工程科技知識中心資源描述、交換、復用、轉換、整閤和打通,實現數據的深度融閤與深度利用提供重要保障。
本書是一本較全麵論述中國工程院知識中心資源元數據標準規範編製的著作。該書的齣版,可喜可賀,希望能指導和支撐知識中心各參建單位科學、高質、高效匯聚各類數字資源。盡管本書元數據規範是麵嚮中國工程科技知識中心建設項目而研製,但對其他相關機構開展多源異構大數據的匯聚融閤也具有重要參考價值和藉鑒意義。
說實話,剛拿到《中國工程科技知識中心元數據規範(1)》這本書的時候,我對它抱持著一種“敬而遠之”的態度。總覺得這類偏嚮技術標準的書籍,對於非專業人士而言,門檻會很高。但當我真正沉下心來閱讀時,卻發現它並非如我想象般冰冷和晦澀。相反,它通過一種非常清晰的邏輯,一點點地揭示瞭工程科技信息背後那套嚴謹的組織方式。這本書讓我開始思考,我們日常接觸的各種工程項目、技術報告、專利文獻,背後都應該有一套統一的“語言”來描述它們。而這本書,正是這套“語言”的編纂者。它詳細地闡述瞭如何為這些信息“畫像”,如何給它們貼上精確的標簽,以便於日後被準確地檢索和調用。我尤其對其中關於“分類體係”和“術語標準”的部分印象深刻。這些內容,雖然看起來是基礎性的,但卻構成瞭整個信息管理體係的根基。沒有清晰的分類,信息就會雜亂無章;沒有統一的術語,交流就會産生誤解。這本書就像是為整個工程科技知識體係打下瞭一個堅實的地基,讓未來的信息集成和知識挖掘有瞭可靠的保障。
评分這本書給我的直觀感受,是它像一本“地圖冊”,但這張地圖冊描繪的不是地理空間,而是工程科技信息的“存在狀態”和“關係網絡”。我之前在參與一些跨部門的項目閤作時,經常會因為信息孤島和格式不統一而頭疼。不同團隊、不同係統産生的技術數據,往往難以直接整閤,需要花費大量的時間進行轉換和梳理。而《中國工程科技知識中心元數據規範(1)》這本書,就提供瞭一種打破信息壁壘的可能性。它所倡導的元數據規範,就像是為所有工程科技信息建立瞭一個通用的“身份證”和“履曆錶”。通過這套規範,我們可以準確地知道每一個信息單元是什麼,它屬於哪個範疇,它的主要特徵是什麼,它與其他信息之間可能存在怎樣的關聯。這種標準化的描述方式,極大地提高瞭信息的可發現性、可理解性和可互操作性。我甚至想象,未來基於這樣的規範,我們可以構建一個更加智能化的工程知識搜索引擎,能夠快速地為研究人員、工程師提供所需的精準信息,甚至能夠輔助進行知識的創新和發現。
评分《中國工程科技知識中心元數據規範(1)》這本書,給我最大的觸動在於,它將抽象的信息管理概念,落地到瞭工程科技應用的具體場景中。我之前一直覺得“元數據”這個詞離我的工作比較遙遠,但這本書的解讀,讓我意識到它其實滲透在我們工程實踐的方方麵麵。它就像是一本“工程信息管理的手冊”,詳細地告訴我們,如何對海量的工程科技數據進行有效的組織、描述和管理。我注意到書中對不同類型工程信息的元數據模型進行瞭詳細的定義,這讓我理解到,並非所有信息都可以用同一套標準來衡量,需要根據信息的具體屬性來製定相應的元數據項。這種精細化的處理方式,對於確保信息的準確性和完整性至關重要。我開始思考,如果所有參與工程項目的人員,都能夠理解和遵循這套規範,那麼在項目進行過程中,信息的流轉和共享將會變得多麼順暢,多少潛在的錯誤和返工都能夠被規避。這本書不僅是一份技術規範,更是一種對未來工程信息管理效率提升的承諾。
评分《中國工程科技知識中心元數據規範(1)》這本書,說實話,我拿到它的時候,內心是有些忐忑的。畢竟“元數據規範”這樣的字眼,聽起來就帶著一股子專業和嚴肅,我擔心自己作為一名普通的工程技術愛好者,可能無法完全消化其中的內容。然而,翻開第一頁,我發現我的擔憂似乎有些多餘。這本書的編排方式,至少在我初讀的感受裏,並沒有我想象中那麼枯燥晦澀。它似乎在努力地為讀者搭建一座橋梁,連接起現實工程世界的復雜性與信息管理背後的邏輯性。我開始嘗試理解它所闡述的“規範”的意義,不僅僅是條條框框的規定,而更像是一種共通的語言,一種能夠讓不同領域、不同係統的工程科技信息得以有效交流和整閤的基石。它所涉及的各個維度,從數據的定義、分類,到描述的要素、格式,都仿佛是為龐大的工程知識體係構建瞭一個清晰的骨架。雖然我無法深入到每一個技術細節,但整體的框架和理念卻漸漸在我腦海中成形。我開始思考,未來當我要查找某個項目的技術文檔,或者要對比不同方案的優劣時,如果信息都遵循瞭這樣的規範,那麼效率將會提升多少?這種對未來信息管理效率的暢想,讓我對這本書的價值有瞭更深刻的認識。
评分這本書給我的感覺,就像是在一片信息海洋的入口處,矗立著一座宏偉的燈塔。它並沒有直接展示海中的寶藏,而是通過一種非常係統和嚴謹的方式,教會我如何辨認方嚮,如何辨彆航道。我之前接觸過一些工程項目的信息管理,常常會遇到信息不匹配、數據格式混亂的問題,導緻查找效率低下,甚至産生誤判。而《中國工程科技知識中心元數據規範(1)》這本書,就好像是為解決這些痛點而生。它不僅僅羅列瞭一些技術指標,更多的是在強調一種“標準”的重要性。這種標準,如同工程師在設計圖紙上的約定俗成,能夠確保信息在傳遞和處理過程中的一緻性和準確性。我特彆注意到其中關於“標識符”和“屬性”的闡述,這讓我理解到,每一個工程科技實體,都應該有一個獨特的身份,並且能夠通過一係列標準化的屬性來清晰地描述其特徵。這種精細化的管理思路,對於構建一個龐大、有序、可查詢的工程知識庫來說,是至關重要的。這本書就像是一張藏寶圖的設計藍圖,雖然它本身不是寶藏,但它能指導我們如何高效地找到和利用那些真正的寶藏。
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有