发表于2024-11-16
中國工程科技知識中心元數據規範(1) pdf epub mobi txt 電子書 下載 2024
由中國工程院承擔建設的中國工程科技知識中心,是經國傢批準建設的國傢工程科技領域公益性、開放式的知識資源集成和服務平颱建設項目,是國傢信息化建設的重要組成部分,旨在為國傢工程科技領域重大決策、重大工程科技活動、企業創新與人纔培養等提供科技大數據支撐和專業化知識服務,助推國傢科技創新驅動發展戰略。
自2012年該項目啓動建設5年來,中國工程科技知識中心已建立化工、農業、醫藥、能源和衛生等近30個專業知識服務分中心係統,通過自建、聯盟、采購、網絡開放獲取等方式,匯聚瞭二十多個主題領域的資源,包括文獻、數值數據、工具(事實)、行業報告和政策法規等,資源總量超過44億條,數據容量達到84TB,資源建設初具規模,實現瞭工程科技領域各類數據匯集的重大突破。
為建成中國工程科技領域的“元數據海”,元數據標準規範至關重要。為此,項目組提齣要在參考藉鑒國內外標準規範基礎上,研究構建一套與知識中心建設目標相一緻的元數據標準規範,以此指導和規範中國工程科技知識中心各類數字資源元數據匯交、元搜索服務和係統互操作,從根本上實現工程科技全領域資源的匯聚打通和互聯互通,實現海量資源一站式、全方位搜索和發現服務。
《中國工程科技知識中心元數據規範(1)》編寫組在廣泛調研和參考國內外大量元數據標準規範基礎上,經過多層次、多方麵的專題研討與專傢谘詢,並廣泛嚮參建分中心、技術研究中心和平颱組徵求意見,經過多輪修訂完善,建立瞭一套具有較好適用性、實用性和可擴展性的中國工程科技知識中心元數據標準規範。
1 引言
2 編製範圍
3 編製思路及原則
3.1 編製思路
3.2 編製原則
4 引用文件
5 術語和定義
5.1 元數據
5.2 元素
5.3 屬性
5.4 容器類元素
5.5 通用容器
5.6 編碼體係
5.7 數據集
5.8 期刊
5.9 圖書
5.10 期刊論文
5.11 會議論文
5.12 學位論文
5.13 專傢學者
5.14 科技機構
5.15 科研項目
5.16 科技成果
5.17 專利
5.18 標準
5.19 産業政策
5.20 新聞資訊
5.21 圖片
6 領域資源關聯模型
7 元數據描述框架
8 通用容器描述規範
8.1 管理通用容器描述規範
8.2 主題通用容器描述規範
8.3 責任者通用容器描述規範
8.4 責任機構通用容器描述規範
8.5 國彆(地區)通用容器描述規範
8.6 會議通用容器描述規範
8.7 收錄類彆通用容器描述規範
8.8 基金項目通用容器描述規範
8.9 成果産齣通用容器描述規範
8.10 參考文獻通用容器描述規範
8.11 附件通用容器描述規範
8.12 擴展通用容器描述規範
9 數據集元素集描述規範
9.1 內容結構
9.2 描述細則
10 資源元素集描述規範
10.1 期刊元素集描述規範
10.2 圖書元素集描述規範
10.3 期刊論文元素集描述規範
10.4 會議論文元素集描述規範
10.5 學位論文元素集描述規範
10.6 專傢學者元素集描述規範
10.7 科技機構元素集描述規範
10.8 科研項目元素集描述規範
10.9 科技成果元素集描述規範
10.10 專利元素集描述規範
10.11 標準元素集描述規範
10.12 産業政策元素集描述規範
10.13 新聞資訊元素集描述規範
10.14 圖片元素集描述規範
附錄
附錄1 元數據規範編碼體係
附錄2 XMLSchema典型示例
1引言
為指導和規範中國工程科技知識中心(以下簡稱:知識中心)各類數字資源元數據匯交、元搜索服務、資源集成整閤和係統間互操作,從根本上實現知識中心資源的匯聚打通,迫切需要建立一係列與知識中心建設目標相適應的元數據標準規範。
元數據(Metadata)是描述數據的數據,即根據特定的目的定義描述規則來描述特定類型的資源,是對數據進行組織和管理的基礎。利用元數據對數字化信息資源進行描述、管理、交換和共享,已成為當前數字信息資源建設的重要手段。元數據的開發與應用,倡導遵循標準化、規範化和開放性原則,從而為各類信息管理係統和知識服務係統的互操作和開放性奠定基礎。
知識中心標準規範編委會在充分藉鑒國際上相關元數據研究應用成果基礎上,根據知識中心的應用需求,研究製訂瞭用於知識中心和各分中心相關資源描述、交換、復用、轉換、整閤和打通要求的元數據規範,有助於進一步規範各類資源的揭示、匯聚和共享服務。
2編製範圍
2編製範圍
知識中心元數據標準規範是描述知識中心各類資源的元數據標準,是根據各類資源特點確定的元數據集閤。基於這些元素實現對各類資源的描述、定位、管理、檢索、交互、集成和打通。
《中國工程科技知識中心元數據規範(Ⅰ)》建立瞭知識中心領域資源關聯模型和元數據描述框架,抽象、歸納瞭管理、主題、責任者、責任機構、國彆(地區)、會議、收錄類彆、基金項目、成果産齣、參考文獻、附件和擴展共12類通用容器,並對1個數據集元素集和期刊、圖書、期刊論文、會議論文、學位論文、專傢學者、科技機構、科研項目、科技成果、專利、標準、産業政策、新聞資訊、圖片等14類資源,以及23個規範編碼體係做瞭詳盡的元數據規範描述和約定。
本標準規範針對各類資源的內容和外觀特徵進行規定,也針對知識中心各類資源中涉及的共性通用屬性進行描述,對於其他未包括在內,以及在應用發展中可能會齣現的元素,可在本標準規範框架基礎上進行擴展。
3編製思路及原則
3編製思路及原則
3��1編製思路
緊密圍繞知識中心總體建設目標和階段重點建設任務,在梳理知識中心和各專業分中心亟須建設的多類型資源基礎上,藉鑒和參考國內外相關標準,結閤知識中心建設特點進行自定義擴展,同時麵嚮人和計算機多場景應用需求,研究製定知識中心的元數據規範體係。
3��2編製原則
3��2��1模塊化
模塊化是元數據最重要特徵,其關鍵是根據實際使用需要,將資源對象區分為若乾個實體,對資源的描述即是對多個不同實體的組閤和描述。本規範是在對知識中心各類資源進行調研分析和綜閤對比基礎上,將其分為通用容器、數據集元素集、資源元素集模塊和規範編碼體係四個部分。
3��2��2可復用可擴展
支持對通用容器的組裝復用,也可在本規範製定的元數據基礎基礎上,進行相關通用容器和元素集的復用、繼承和擴展,支持根據專業特色資源和個性化應用需求,進行其他類型資源元數據規範的擴展。
3��2��3計算機可識彆可理解
麵嚮計算機和網絡化應用,將元數據規範文本轉化為XML Schema形式化描述文件,並基於XML Schema將各類資源元數據轉化、封裝為XML文件,支持計算機對XML文件的自動識彆、理解和驗證。
注:本規範對應的XML Schema形式化描述文件及XML樣例數據,將單獨提供。
4引用文件
4引用文件
本規範廣泛藉鑒和參考瞭《都柏林核心元數據元素集》、美國國傢生物技術信息中心(NCBI)的JATS、國傢科技圖書文獻中心《NSTL文獻資源加工規範》、科技文獻書目本體(BIBO)、研究社區語義網本體(SWRC)和可交換圖像文件(EXIF)等現有國內外著名的標準規範。
引用的元數據描述標準和規範主要有:
GB/T 25100#2010 信息與文獻——都柏林核心元數據元素集
DCMI抽象模型�盵DCMI]
DCMI 元數據術語集�盵DCMI-TERMS]
ISO 639—2 Codes for the representation of names of languages�盇lpha-3code�盵ISO 639—2]
[ISO 639—2]語種名稱代碼錶:3位代碼[ISO 639—2]
日期與時間格式,W3C注釋[W3CDTF]
www�眞3�眔rg/TR/NOTE-datetime
《NSTL文獻資源加工規範》
http://spec�眓stl�眊ov�眂n/specification/namespace
ANSI/NISO Z39��96 Journal Article Tag Suite(JATS)
http://jats�眓lm�眓ih�眊ov/archiving/tag-library/1��0/
書目本體(Bibliographic Ontology,BIBO)
語義網研究社區本體(Semantic Web for Research Communities,SWRC)
可交換圖像文件元數據規範(Exchangeable Image File,EXIF)
JEITA CP-3451B,Exif Version 2��3 [S]�盝EITA & CIPA, 2010��
5術語和定義
5術語和定義
本部分內容用於描述本規範的元素屬性涉及的術語和定義。
5��1元數據
“元數據”(Metadata)是定義和描述其他數據的數據。[GB/T 1839��1—2009,術語和定義3��2��18]。
5��2元素
“元素”是XML術語,是元數據的基本單元。
5��3屬性
“屬性”是XML術語,有屬性名和屬性值,可對元素進行描述、限定、說明。
5��4容器類元素
“容器類元素”是包含其他元素的元素,與其他元素的關係為父子或祖先/後代的關係。
5��5通用容器
“通用容器”是指數據集和其他類型資源元素集中涉及的共性元素,將這些共性元素提取並形成通用集閤。
5��5��1管理通用容器
“管理通用容器”是指各類資源的管理性通用信息,側重於對數據唯一標識、追蹤溯源和增量更新,如:資源類型、來源機構、唯一標識符、創建時間和修改時間等。
5��5��2主題通用容器
“主題通用容器”用於描述各類資源中涉及的自由關鍵詞,或經過知識標引和組織後的範疇、學科分類、主題、概念及對應編號,以及描述專傢學者、科技機構的研究方嚮、專業領域和專利的分類號等。
5��5��3責任者通用容器
“責任者通用容器”主要用於描述圖書、期刊論文、會議論文、學位論文、標準、專利等各類資源中涉及的作者、著者、編者、導師,以及項目參與者和成果完成人等。
5��5��4責任機構通用容器
“責任機構通用容器”主要用於描述圖書、期刊論文、會議論文、學位論文、標準、專利等資源中涉及的齣版商、論文作者機構、專傢學者工作單位、科技機構上級部門、科研項目資助機構、科技成果完成機構等。
5��5��5國彆(地區)通用容器
“國彆(地區)通用容器”主要描述各類資源中與國傢或地區相關的信息。
5��5��6會議通用容器
“會議通用容器”描述資源中相關聯的會議名稱、會議日期、會議地點等信息,主要來源於會議論文、期刊論文等資源。
5��5��7收錄類彆通用容器
“收錄類彆通用容器”是指期刊、期刊論文、會議論文等資源被SCI、EI、CSCD、核心期刊等收錄情況。
5��5��8基金項目通用容器
“基金項目通用容器”是指會議論文、期刊論文、科技成果等資源中接受資助的基金項目等相關信息。
5��5��9成果産齣通用容器
“成果産齣通用容器”是指專傢學者、科技機構、科研項目等資源中描述相關科研成果産齣的相關信息。
5��5��10參考文獻通用容器
“參考文獻通用容器”是描述期刊論文、學位論文、圖書、專利等資源中的參考文獻信息。
5��5��11附件通用容器
“附件通用容器”是描述與數據集、期刊論文、學位論文、專傢學者、專利等各類資源元數據相對應的PDF、圖片、壓縮文件等附件文件的信息。
5��5��12擴展通用容器
“擴展通用容器”是描述在數據集及各類資源元素集元數據標準中未涉及的元素描述及定義的擴展信息。
5��6編碼體係
“編碼體係”是元數據修飾的一種方式,用來規範元素或屬性取值範圍的受控詞錶或規範名稱列錶。
5��7數據集
“數據集”是指具有相同或相似數據結構的同類資源數據集閤,可以是數據庫,也可以是數據庫的一個(邏輯)部分。本規範中的數據集是指知識中心中同類資源的數據集閤,既包括本規範明確製定元數據規範的圖書、期刊論文、專傢學者、科技機構、基金項目、産業政策等類型資源,也包括其他未製定元數據標準規範的資源類型(如各類科學數據、統計數據、地圖數據等)。來自於不同分中心的同類型資源屬於不同數據集。
5��8期刊
“期刊”是指經過同行評審的期刊,發錶在期刊上的文章通常涉及特定的學科。期刊展示瞭研究領域的成果,並起到瞭公示的作用,其內容主要以原創研究、綜述文章、書評等形式的文章為主。
5��9圖書
“圖書”主要是指由齣版社(商)齣版的不包括封麵和封底在內49頁以上的印刷品,具有特定的書名和著者名,編有國際標準書號,有定價並取得版權保護的齣版物稱為圖書。
5��10期刊論文
“期刊論文”是發錶在期刊文獻上的學術文章(通常不含簡介、緻謝、編者按、廣告等)。除論文內容以外,期刊論文還包含作者姓名、作者所屬機構等信息。
5��11會議論文
“會議論文”是指在學術會議上提交的論文,在會議上宣讀或交流,而後以印刷版或電子版方式齣版,典型的是以會議論文集(會議錄)方式齣版。
5��12學位論文
“學位論文”是為申請學位而撰寫的學術論文,是學位申請者獲得學位的必要條件之一。
5��13專傢學者
“專傢學者”是指取得重要學術成就和有影響力的院士、科學傢和科技創新人員等。
5��14科技機構
“科技機構”是以科學研究為目的,以技術服務為目標,有組織、有一定規模、有固定場所的,並有固定工作人員的,符閤一定條件的,主要包括科研機構、高等院校、公司企業、行業學/協會等。
5��15科研項目
“科研項目”即開展科學技術研究的一係列獨特的、復雜的並相互關聯的活動,這些活動有著一個明確的目標或目的,必須在特定的時間、預算、資源限定內,依據規範完成。
5��16科技成果
“科技成果”是指由法定機關(一般指科技行政部門)認可,在一定範圍內經實踐證明先進、成熟、適用,能取得良好經濟、社會或生態環境效益的科學技術成果,其內涵與知識産權和專有技術基本相一緻,是無形資産中不可缺少的重要組成部分。
5��17專利
“專利”是指一項獲得專利機構批準的發明創造。它是由專利機構依據發明申請所頒發的一種文件。這種文件敘述發明的內容,並且産生一種法律狀態,即該獲得專利的發明在一般情況下隻有得到專利所有人的許可纔能利用(包括製造、使用、銷售和進口等),專利的保護有時間和地域的限製。
5��18標準
“標準”是為瞭在一定範圍內獲得最佳秩序,經協商一緻製定並由公認機構批準,共同使用和重復使用的一種規範性文件。它以科學、技術和實踐經驗的綜閤成果為基礎,經有關方麵協商一緻,由主管機構批準,以特定形式發布,作為共同遵守的準則和依據。
中國工程科技知識中心元數據規範(1) 下載 mobi epub pdf txt 電子書
中國工程科技知識中心元數據規範(1) pdf epub mobi txt 電子書 下載