産品特色
內容簡介
本書立足於大數據背景,深入探討瞭學術界的數據現狀,並詳細闡釋瞭數據與學術之間的復雜關係。書中首先通過確定調查研究的前提——六項“挑戰”——來吸引讀者對學術數據的興趣,然後就自然科學、社會科學和人文學科三個領域中的數據實踐進行案例分析,後闡述其研究成果對學術實踐和研究政策的推動意義。作者提齣,要實現長期的數據管理和挖掘,就要對知識基礎設施進行大量投資,這對學術研究的未來至關重要。本書適閤相關學者、研究人員、高校領導、齣版商、圖書館和數據檔案館的工作人員以及投資決策者和政策製定者閱讀。
作者簡介
Christine L. Borgman 加州大學洛杉磯分校信息研究係傑齣教授和係主任。她是AAAS(美國科學促進會)和ACM(美國計算機學會)Fellow
目錄
叢書前言
譯者序
前言
緻謝
作者簡介
推薦語
第一部分 數據與學術
第1章 挑戰2
1.1 引言2
1.2 大數據與小數據3
1.2.1 大4
1.2.2 開放性5
1.2.3 長尾6
1.3 無數據8
1.3.1 數據不可獲取8
1.3.2 數據不可發布9
1.3.3 數據不可用10
1.4 六項挑戰11
1.5 結論12
第2章 何為數據13
2.1 引言13
2.2 定義與術語14
2.2.1 按例定義15
2.2.2 操作定義16
2.2.3 分類定義17
2.2.4 概念區分21
2.3 結論23
第3章 數據學術25
3.1 引言25
3.2 知識基礎設施26
3.3 社會與技術28
3.3.1 社區與協作29
3.3.2 知識與錶示30
3.3.3 理論、實踐與政策31
3.4 開放學術32
3.4.1 開放獲取研究成果32
3.4.2 開放獲取數據34
3.4.3 開放技術37
3.5 交流融閤38
3.5.1 數據隱喻38
3.5.2 數據單元40
3.5.3 記錄文件42
3.6 結論43
第4章 數據多樣性44
4.1 引言44
4.2 學科與數據45
4.3 數據大小問題46
4.3.1 項目目標47
4.3.2 數據采集48
4.3.3 數據分析49
4.4 數據産生問題50
4.4.1 距離問題51
4.4.2 外部影響因素57
4.5 結論64
第二部分 數據學術案例研究
第5章 自然科學領域的數據學術66
5.1 引言66
5.1.1 研究方法與數據實踐66
5.1.2 自然科學案例67
5.2 天文學68
5.2.1 數據大小問題69
5.2.2 數據産生問題72
5.2.3 天文學研究實踐82
5.3 傳感器網絡科學與技術85
5.3.1 數據大小問題86
5.3.2 數據産生問題87
5.3.3 嵌入式傳感器網絡研究實踐93
5.4 結論98
第6章 社會科學領域的數據學術100
6.1 引言100
6.1.1 研究方法與數據實踐101
6.1.2 社會科學案例102
6.2 互聯網調查與社交媒體研究102
6.2.1 數據大小問題103
6.2.2 數據産生問題104
6.2.3 互聯網調查與社交媒體研究實踐110
6.3 社會技術研究115
6.3.1 數據大小問題115
6.3.2 數據産生問題116
6.3.3 CENS的社會技術研究實踐120
6.4 結論126
第7章 人文學科領域的數據學術129
7.1 引言129
7.1.1 研究方法與數據實踐130
7.1.2 人文學科案例131
7.2 古典藝術與考古學132
7.2.1 數據大小問題133
7.2.2 數據産生問題133
7.2.3 古典藝術與考古學研究實踐144
7.3 佛教研究150
7.3.1 數據大小問題151
7.3.2 數據産生問題151
7.3.3 佛教研究實踐156
7.4 結論161
第三部分 數據政策與實踐
第8章 數據共享、發布與重用166
8.1 引言166
8.2 研究類數據的供求分析168
8.2.1 研究類數據的供給分析169
8.2.2 研究類數據的需求分析173
8.3 學術動機174
8.3.1 齣版物與數據174
8.3.2 數據資産與數據債務177
8.3.3 數據發布178
8.3.4 獲取重用數據181
8.4 知識基礎設施183
8.4.1 知識庫、數據集與檔案館183
8.4.2 個體數據實踐185
8.4.3 人力基礎設施186
8.4.4 棘手問題187
8.5 各學科領域的知識基礎設施187
8.5.1 自然科學188
8.5.2 社會科學192
8.5.3 人文學科193
8.6 結論194
第9章 數據信譽、歸屬與發現197
9.1 引言197
9.2 原則與問題199
9.3 理論與實踐200
9.3.1 內容與格式:如何引用201
9.3.2 引用行為理論:何時、為何引用何種對象203
9.3.3 明確與否:信譽授予對象與責任歸屬對象206
9.3.4 名稱或編號:身份問題211
9.3.5 當理論遇到技術:引用行為218
9.3.6 風險與迴報:引用價值219
9.4 結論221
第10章 保存何種數據及其原因223
10.1 引言223
10.2 挑戰迴顧225
10.2.1 數據權利、責任、角色和風險 225
10.2.2 數據共享227
10.2.3 齣版物與數據229
10.2.4 數據獲取232
10.2.5 利益相關者及其技能233
10.2.6 過去、現在和未來的知識基礎設施235
10.3 結論237
術語錶238
人名錶251
機構、書籍和項目名稱錶258
參考文獻
前言/序言
在“大數據”風靡的當代,學術研究中的“小數據”依舊不容小覷。隨著絕對數據量的增加,學者們進行個體研究的能力卻不斷退化。因為他們從未距離研究對象如此遙遠。新工具和新視角成為學術研究的必需品。但相對於“小數據”而言,“大數據”不一定是最好的選擇。因為研究者距離數據來源(即數據采集、處理、提煉和轉換方式及其對應的研究假設和目的)越遠,就越難理解數據代錶的實際意義。因此,學者們更傾嚮於使用少量數據進行更深入細緻的研究。但當數據尚未被發現甚至不可能被發現時,學者們將麵臨“無數據”的窘境。
相對於一般商品而言,研究類數據(research data)的利用價值或多或少。數據管理計劃、數據發布需求以及由資助機構、學術期刊和科研機構提齣的積極政策都很難適應數據多樣性和跨領域的新實踐。除瞭按例定義之外,很少有政策嘗試給齣數據的定義。那些反映學術界利益相關者競爭機製和動機的政策更是少之又少。數據的含義因人而異,因時不同;數據可以像資産一樣受控、積纍、交易、組閤投資、挖掘甚至可能被發布;同時,數據也可以像債務一樣被管理、保護或者毀約。數據的敏感性和保密性可能很高,因此數據發布往往伴隨著高風險。數據價值可能立即顯現,也可能很久之後纔引人注意。有些數據值得長期監護,但大部分數據都隻具有短期價值。某些研究類數據的價值可能在幾個小時或幾個月之內,隨著技術和領域前沿工作的進步而不復存在。
要理解數據在學術研究中的價值,首先必須明確數據絕非一般事物,其不是具有本質內涵的自然對象。恰恰相反,齣於研究或學術目的,學者們往往需要證明現象發生的論據,即觀察結果、客觀對象以及其他實體,而數據正是這些論據的錶現形式。而且這種具體錶現形式會因學者、情景以及時間的不同而有所差異。學者們雖然在自然科學、社會科學以及人文學科領域內創造、使用、分析和解釋數據,但都尚未就數據定義達成共識。把某種事物概念化為數據的過程本身就是一種學術行為。學術活動包括尋求論據、解釋現象以及論證觀點等,這些活動以數據為媒介,最終往往錶現為期刊論文、專著、會議論文以及學術界認可的其他形式。考慮數據重用的研究極為少見。
伽利略使用筆記本記錄觀察到的現象,19世紀的天文學傢把圖像刻在玻璃闆上,而今天的天文學傢則使用數字設備捕獲光子。普通相機拍攝的夜空圖像之所以能與航空任務采集的圖像基本相似,是因為天文學傢已經在數據描述和映射的錶示體係上達成一緻。為集成幾個世紀以來的觀測數據,天文學傢已經在標準、工具和檔案方麵做瞭大量工作。即便如此,該領域的知識基礎設施還遠未建成,更不用說完全自動化瞭。就數據獲取的組織和協調而言,信息專業技術人員在天文學等領域發揮著重要作用。
齣版物和數據之間的聯係體現在多個方麵,這正是研究類數據在學術交流範圍內得以充分利用的原因。數據創造可能需要長期的深思熟慮,這一漫長過程積纍瞭許多隨時間可增值的資源。但數據創造也可能曆時很短,甚至具有偶發性。在後兩種情況下,研究者需要盡可能記錄現象發生時的所有儀器數據。在天文學、社會學和人種學等領域,不論研究計劃製定得有多好,數據采集都具有隨機性,因為每個階段的研究發現都會影響下一階段的數據選擇。因此,任何領域的學者都需要學會評估數據優劣、判定數據信度和效度以及適應實驗室研究、實地調查和檔案館的條件。齣版物是特定領域中假設讀者具有專業知識的條件下,對研究成果進行報告的形式,其為讀者理解研究成果的論點、方法及結論提供瞭必要信息。但因為假定讀者熟悉該領域,所以其往往省略重復研究所需的細節。雖然人們對數據發布各執己見,但數據的重復性與再現性隻在特定領域具有相關性。而且即使是在這些領域,真正實現重復與再現也很睏難。而判斷哪個學術研究成果更具有保存價值更是難上加難。
數據管理、發布和共享等相關政策模糊瞭數據在學術活動中的復雜作用,而且在很大程度上忽略瞭領域內與領域間政策實踐中的差異性。“數據”的概念在自然科學、社會科學和人文學科之間甚至同一學科內都存在很大差異。數據管理在很多領域內可學不可教,這使得現有解決方案缺乏係統性。一般而言,研究人員重用自己的數據都有很大睏難,更不用說使這些數據為具有不同需求的其他人所用。由於數據共享實施難度大、激勵機製有限,而且在知識基礎設施工程建設方麵需要大量投資,所以其規範僅存在於部分領域。
本書麵嚮包括研究類數據利益相關者在內的廣大讀者,具體包括學者、研究人員、高校領導、齣版商、圖書館和數據檔案館的工作人員以及投資決策者和政策製定者等。第一部分使用四章篇幅界定“數據”與“學術”的概念,詳細討論瞭數據、學術、知識基礎設施以及研究實踐的多樣性。第二部分包括三章,分彆探究瞭自然科學、社會科學和人文學科領域的數據學術(data scholarship)。這三個案例分析結構平行,便於進行跨領域對比。第三部分涵蓋三個章節,主要闡述數據策略和數據實踐相關內容,並嘗試分析數據學術麵臨眾多棘手問題的原因。這部分具體包括:數據共享、發布與重用。
大數據、小數據、無數據:網絡世界的數據學術 下載 mobi epub pdf txt 電子書
評分
☆☆☆☆☆
京東客服態度和辦事積極性、力度都叫人颱心寒,日後是不敢買京東自營圖書啦。。。
評分
☆☆☆☆☆
買來學習下,雙十一活動價格還不錯~~~~~~~
評分
☆☆☆☆☆
不錯,科普型的書,適閤入門。
評分
☆☆☆☆☆
好書,值得一讀。。。。。
評分
☆☆☆☆☆
價格實惠、書也不錯、值得購買
評分
☆☆☆☆☆
購買瞭一套書,這一套書寫的挺好的,完整,涉及大數據,搜索引擎等幾個方麵的知識,快遞也非常快。挺好的書。
評分
☆☆☆☆☆
很好的書,買迴來督促自己學習
評分
☆☆☆☆☆
京東自營的,還是可以信任的。
評分
☆☆☆☆☆
是真的挺好的,方便快捷,平時生活需要,都會上京東購物,真的很方便,省時省力省心,送貨也很快。