发表于2024-11-21
機器學習:從公理到算法(中國計算機學會學術著作叢書) pdf epub mobi txt 電子書 下載 2024
機器學習是本次人工智能熱潮的核心技術。引起轟動的應用如AlphaGo等都可以看到機器學習的身影。目前,機器學習理論紛繁復雜,算法形式花樣百齣。人們一直在疑惑,機器學習,特彆是其中的深度學習的本質到底是什麼?
作者積二十年研究之力,將各種學習理論融於一體,提齣瞭五條學習公理,據此推導齣瞭常見的學習算法,包括深度學習。如果想要知道機器學習的本質,快速理清各種學習算法之間的關係,《機器學習:從公理到算法(中國計算機學會學術著作叢書)》是一條不容錯過的終南捷徑。
《機器學習:從公理到算法(中國計算機學會學術著作叢書)》是一本基於公理研究學習算法的書。共17章,由兩部分組成。第一部分是機器學習公理以及部分理論演繹,包括第1、2、6、8章,論述學習公理以及相應的聚類、分類理論。第二部分關注如何從公理推齣經典學習算法,包括單類、多類和多源問題。第3~5章為單類問題,分彆論述密度估計、迴歸和單類數據降維。第7、9~16章為多類問題,包括聚類、神經網絡、K近鄰、支持嚮量機、Logistic迴歸、貝葉斯分類、決策樹、多類降維與升維等經典算法。最後第17章研究瞭多源數據學習問題。
《機器學習:從公理到算法(中國計算機學會學術著作叢書)》可以作為高等院校計算機、自動化、數學、統計學、人工智能及相關專業的研究生教材,也可以供機器學習的愛好者參考。
於劍,北京交通大學計算機學院教授,博士生導師,交通數據分析與挖掘北京市重點實驗室主任,先後獲得北京大學數學專業本科、碩士、博士,中國人工智能學會機器學習專委會副主任,中國計算機學會人工智能與模式識彆專委會秘書長,承擔多項國傢自然科學基金項目,發錶多篇學術論文,包括TPAMI、CVPR 等。
第1章引言1
11機器學習的目的:從數據到知識1
12機器學習的基本框架2
121數據集閤與對象特性錶示3
122學習判據4
123學習算法5
13機器學習思想簡論5
延伸閱讀7
習題8
參考文獻9
第2章歸類理論11
21類錶示公理13
22歸類公理17
23歸類結果分類20
24歸類方法設計準則22
241類一緻性準則23
242類緊緻性準則23
243類分離性準則25
244奧卡姆剃刀準則25
討論27
延伸閱讀29
習題30
參考文獻31
第3章密度估計33
31密度估計的參數方法33
311最大似然估計33
312貝葉斯估計35
32密度估計的非參數方法39
321直方圖39
322核密度估計39
323K近鄰密度估計法40
延伸閱讀40
習題41
參考文獻41
第4章迴歸43
41綫性迴歸43
42嶺迴歸47
43Lasso迴歸48
討論51
習題52
參考文獻52
第5章單類數據降維53
51主成分分析54
52非負矩陣分解56
53字典學習與稀疏錶示57
54局部綫性嵌入59
55典型關聯分析62
56多維度尺度分析與等距映射63
討論65
習題66
參考文獻66
第6章聚類理論69
61聚類問題錶示及相關定義69
62聚類算法設計準則70
621類緊緻性準則和聚類不等式70
622類分離性準則和重閤類非穩定假設72
623類一緻性準則和迭代型聚類算法73
63聚類有效性73
631外部方法73
632內蘊方法75
延伸閱讀76
習題77
參考文獻77
第7章聚類算法81
71樣例理論:層次聚類算法81
72原型理論:點原型聚類算法83
721C均值算法84
722模糊C均值86
73基於密度估計的聚類算法88
731基於參數密度估計的聚類算法88
732基於無參數密度估計的聚類算法97
延伸閱讀106
習題107
參考文獻108
第8章分類理論111
81分類及相關定義111
82從歸類理論到經典分類理論112
821PAC理論113
822統計機器學習理論115
83分類測試公理118
討論119
習題119
參考文獻120
第9章基於單類的分類算法:神經網絡121
91分類問題的迴歸錶示121
92人工神經網絡122
921人工神經網絡相關介紹122
922前饋神經網絡124
93從參數密度估計到受限玻耳茲曼機129
94深度學習131
941自編碼器132
942捲積神經網絡132
討論133
習題134
參考文獻134
第10章K近鄰分類模型137
101K近鄰算法138
1011K近鄰算法問題錶示138
1012K近鄰分類算法139
1013K近鄰分類算法的理論錯誤率140
102距離加權最近鄰算法141
103K近鄰算法加速策略142
104kd樹143
105K近鄰算法中的參數問題144
延伸閱讀145
習題145
參考文獻145
第11章綫性分類模型147
111判彆函數和判彆模型147
112綫性判彆函數148
113綫性感知機算法151
1131感知機數據錶示151
1132感知機算法的歸類判據152
1133感知機分類算法153
114支持嚮量機156
1141綫性可分支持嚮量機156
1142近似綫性可分支持嚮量機159
1143多類分類問題162
討論164
習題165
參考文獻166
第12章對數綫性分類模型167
121Softmax迴歸167
122Logistic迴歸170
討論172
習題173
參考文獻173
第13章貝葉斯決策175
131貝葉斯分類器175
132樸素貝葉斯分類176
1321最大似然估計178
1322貝葉斯估計181
133最小化風險分類183
134效用最大化分類185
討論185
習題186
參考文獻186
第14章決策樹187
141決策樹的類錶示187
142信息增益與ID3算法192
143增益比率與C45算法194
144Gini指數與CART算法195
145決策樹的剪枝196
討論197
習題197
參考文獻198
第15章多類數據降維199
151有監督特徵選擇模型199
1511過濾式特徵選擇200
1512包裹式特徵選擇201
1513嵌入式特徵選擇201
152有監督特徵提取模型202
1521綫性判彆分析202
1522二分類綫性判彆分析問題202
1523二分類綫性判彆分析203
1524二分類綫性判彆分析優化算法205
1525多分類綫性判彆分析205
延伸閱讀207
習題207
參考文獻207
第16章多類數據升維:核方法209
161核方法209
162非綫性支持嚮量機210
1621特徵空間210
1622核函數210
1623常用核函數212
1624非綫性支持嚮量機212
163多核方法213
討論215
習題215
參考文獻216
第17章多源數據學習217
171多源數據學習的分類217
172單類多源數據學習217
1721完整視角下的單類多源數據學習218
1722不完整視角下的單類多源數據學習220
173多類多源數據學習221
174多源數據學習中的基本假設222
討論222
習題223
參考文獻223
後記225
索引229
第 1章引言
好好學習,天天嚮上。 ——毛澤東, 1951年題詞
大數據時代,人類收集、存儲、傳輸、管理數據的能力日益提高,各行各業已經積纍瞭大量的數據資源,如著名的 Nature雜誌於 2008年 9月齣版瞭一期大數據專刊 [1],列舉瞭生物信息、交通運輸、金融、互聯網等領域的大數據應用。如何有效分析數據並得到有用信息甚至知識成為人們關注的焦點。人們寄希望於智能數據分析來完成該項任務。機器學習是智能數據分析技術的核心理論。 Science雜誌於 2015年 7月組織瞭一個人工智能專題 [2],其中有關機器學習的內容依然占據瞭重要的部分。本章將討論機器學習的基本目的、基本框架、思想發展以及未來走嚮。
1.1機器學習的目的:從數據到知識
人類最重要的一項能力是能夠從過去的經驗中學習,並形成知識。韆百年來,人類不斷從學習中積纍知識,為人類文明打下瞭堅實的基礎。“學習”是人與生俱來的基本能力,是人類智能( human intelligence)形成的必要條件。自 2000年以來,隨著互聯網技術的普及,積纍的數據已經超過瞭人類個體處理的極限,以往人類自己親自處理數據形成知識的模式已經到瞭必須改變的地步,人類必須藉助於計算機纔能處理大數據,更直白地說,我們希望計算機可以像人一樣從數據中學到知識。
由此,如何利用計算機從大數據中學到知識成為人工智能研究的熱點。“機器學習”(machine learning)是從數據中提取知識的關鍵技術。其初衷是讓計算機具備與人類相似的學習能力。迄今為止,人們尚不知道如何使計算機具有與人類相媲美的學習能力。然而,每年都有大量新的針對特定任務的機器學習算法湧現,幫助人們發現完成這些特定任務的新知識(有時也許僅僅是隱性新知識)。對機器學習的研究不僅已經為人們提供瞭許多前所未有的應用服務(如信息搜索、機器翻譯、語音識彆、無人駕駛等),改善瞭人們的生活,而且也幫助人們開闢瞭許多新的學科領域,如計算金融學、計算廣告學、計算生物學、計算社會學、計算曆史學等,為人類理解這個世界提供瞭新的工具和視角。可以想見 ,作為從數據中提取知識的工具,機器學習在未來還會幫助人們進一步開拓新的應用和新的學科。
機器學習存在很多不同的定義,常用的有三個。第一個常用的機器學習定義是“計算機係統能夠利用經驗提高自身的性能”,更加形式化的論述可見文獻 [3]。機器學習名著《統計學習理論的本質》給齣瞭機器學習的第二個常見定義,“學習就是一個基於經驗數據的函數估計問題” [4]。在《統計學習基礎》這本書的序言裏給齣瞭第三個常見的機器學習定義,“提取重要模式、趨勢,並理解數據,即從數據中學習” [11]。這三個常見定義各有側重:第一個聚焦學習效果,第二個的亮點是給齣瞭可操作的學習定義,第三個突齣瞭學習任務的分類。但其共同點是強調瞭經驗或者數據的重要性,即學習需要經驗或者數據。注意到提高自身性能需要知識,函數、模式、趨勢顯然自身是知識,因此,這三個常見的定義也都強調瞭從經驗中提取知識,這意味著這三種定義都認可機器學習提供瞭從數據中提取知識的方法。眾所周知,大數據時代的特點是“信息泛濫成災但知識依然匱乏”。可以預料,能自動從數據中學到知識的機器學習必將在大數據時代扮演重要的角色。
那麼如何構建一個機器學習任務的基本框架呢?
1.2機器學習的基本框架
考慮到我們希望用機器學習來代替人學習知識,因此,在研究機器學習以前,先迴顧一下人類如何學習知識是有益的。對於人來說,要完成一個具體的學習任務,需要學習材料、學習方法以及學習效果評估方法。如學習英語,需要英語課本、英語磁帶或者錄音等學習材料,明確學習方法是背誦和練習,告知學習效果評估方法是英語評測考試。檢測一個人英語學得好不好,就看其利用學習方法從學習材料得到的英語知識是否能通過評測考試。機器學習要完成一個學習任務,也需要解決這三方麵的問題,並通過預定的測試。
對應於人類使用的學習材料,機器學習完成一個學習任務需要的學習材料,一般用描述對象的數據集閤來錶示,有時也用經驗來錶示。對應於人類完成學習任務的學習方法,機器學習完成一個學習任務需要的學習方法,一般用學習算法來錶示。對應於人類完成一個學習任務的學習效果現場評估方法(如老師需要時時觀察課堂氣氛和學生的注意力情況),機器學習完成一個學習任務也需要對學習效果進行即時評估,一般用學習判據來錶示。對於機器學習來說,用來描述數據對象的數據集閤對最終學習任務的完成狀況有重要影響,用來指導學習算法設計的學習判據有時也用來評估學習算法的效果,但一般機器學習算法性能的標準評估會不同於學習判據,正如人學習的學習效果即時評估方式與最終的評估方式一般也不同。對於機器學習來說,通常也會有特定的測試指標,如正確率,學習速度等。
可以用一個具體的機器學習任務來說明。給定一個手寫體數字字符數據集閤,希望機器能夠通過這些給定的手寫體數字字符,學到正確識彆手寫數字字符的知識。顯然,學習材料是手寫體數字字符數據集,學習算法是字符識彆算法,學習判據可以是識彆正確率,也可以是其他有助於提高識彆正確率的指標。
數據集閤、學習判據、學習算法對於任何學習任務都是需要討論的對象。數據集閤的不同錶示,影響學習判據與學習算法的設計。學習判據與學習算法的設計密切相關,下麵分彆討論。
1.2.1數據集閤與對象特性錶示
對於一個學習任務來說,我們希望學到特定對象集閤的特定知識。無論何種學習任務,學到的知識通常是與這個世界上的對象相關。通過學到的知識,可以對這個世界上的對象有更好的描述,甚至可以預測其具有某種性質、關係或者行為。為此,學習算法需要這些對象的特性信息,這些信息可以客觀觀測,即關於特定對象的特性信息集閤,該集閤一般稱為對象特性錶示,是學習任務作為學習材料的數據集閤的組成部分。理論上,用來描述對象的數據集閤的錶示包括對象特性輸入錶示、對象特性輸齣錶示。
顯然,對象特性輸入錶示是我們能夠得到的對象的觀測描述,對象特性輸齣錶示是我們學習得到的對象的特性描述。需要指齣的是,對象的特性輸入錶示或者說對象的輸入特徵一定要與學習任務相關。根據醜小鴨定理( Ugly Duckling Theorem)[5],不存在獨立於問題而普遍適用的特徵錶示,特徵的有效與否是問題依賴的。醜小鴨定理是由 Satosi Watanabe於 1969年提齣的,其內容可錶述為“如果選定的特徵不閤理,那麼世界上所有事物之間的相似程度都一樣,醜小鴨與白天鵝之間的區彆和兩隻白天鵝之間的區彆一樣大”。該定理錶明在沒有給定任何假設的情況下,不存在普適的特徵錶示;相似性的度量是特徵依賴的,是主觀的、有偏置的,不存在客觀的相似性度量標準。因此,對於任何機器學習任務來說,得到與學習任務匹配的特徵錶示是學習任務成功的首要條件。對於機器學習來說,一般假設對象特徵已經給定,特彆是對象特性輸入錶示。
對於對象特性輸入錶示,通常有三種錶示方式。一種是嚮量錶示,對於每個對象,可以相對獨立地觀察其特有的一些特徵。這些特徵組成該對象的一個描述,並代錶該對象。第二種錶示是網絡錶示,對於每個對象,由其與其他對象的關係來描述,簡單說來,觀察得到的是對象之間的彼此關係。第三種是混閤錶示 ,對於每個對象,其嚮量錶示和網絡錶示同時存在。
不論對於人還是機器,能夠提供學習或者訓練的對象總是有限的。不妨假設有 N個對象,對象集閤為 O = {o1,o2, ··· ,oN },其中 ok錶示第 k個對象。其對應的對象特性輸入錶示用 X = {x1,x2, ··· ,xN }來錶示,其中 xk錶示對象 ok的特性輸入錶示。當每個對象有嚮量錶示時, xk可以錶示為 xk =[x1k,x2k, ··· ,xpk]T。因此,對象特性輸入錶示 X可以用矩陣 [xτk]p×N來錶示,其中 p錶示對象輸入特徵的維數, xτk錶示 ok的第 τ個輸入特徵值,這些特徵值可以是名詞性屬性值,也可以是連續性屬性值。
如果對象特性輸入錶示 X存在網絡錶示,即 X可以用矩陣 [Nkl]N×N來錶示,其中 Nkl錶示對象 ok與對象 ol的網絡關係。如果是相似性關係,則對象特性輸入錶示 X為相似性矩陣 S(X)=[skl]N×N,其中 skl錶示對象 ok與對象 ol的相似性。通常, skl越大錶明對象 ok與對象 ol的相似性越大。因此,對象 ok可以由行嚮量 [sk1,sk2, ··· ,skN ]錶示。如果是相異性關係,則對象特性輸入錶示 X為相異性矩陣 D(X)=[Dkl]N×N,其中 Dkl錶示對象 ok與對象 o1的相異性。類似的,Dkl越大錶明對象 ok與對象 ol的相異性越大。因此,對象 ok可以由行嚮量 [Dk1,Dk2, ··· ,DkN ]錶示。如果是相鄰關係,對象特性輸入錶示 X為鄰接性矩陣 A(X)=[akl]N×N,其中 akl錶示對象 ok與對象 ol是否相鄰,通常其取值為 0或者 1。
對應的對象特性輸齣錶示用 Y = {y1,y2, ··· ,yN }來錶示,其中 yk錶示對象 ok的特性輸齣錶示。具體的錶示形式由學習算法決定,通常是對象特性輸齣錶示 Y可以用矩陣 [yτk]d×N來錶示,其中 d錶示對象輸齣特徵的維數, yτk錶示 ok的第 τ個輸齣特徵值,這些特徵值通常是連續性屬性值。
顯然,除去對象特性輸入、輸齣錶示,數據集閤還有其他部分,這些部分的錶示與知識錶示有關,通常依賴於知識錶示。知識錶示不同,學習算法的數據集閤輸入輸齣錶示也會不同。一個容易想到的公開問題是,適閤於機器學習的統一知識錶示是否存在?如果存在,是何形式?現今的機器學習方法一般是針對具體的學習任務,設定具體的知識錶示。因此,本章先不討論學習算法的輸入輸齣統一錶示,這個問題留待第 2章討論。
1.2.2學習判據
完成一個學習任務,需要一個判據作為選擇學習到的知識好壞的評價標準。理論上,符閤一個學習任務的具體化知識可以有很多。通常,如何從中選齣最好的具體化知識錶示是一個 NP難問題。因此,需要限定符閤一個特定學習任務的具體化知識範圍,適當減小知識假設空間的大小,減少學習算法的搜索空間。為瞭從限定的假設空間選擇最優的知識錶示,需要根據不同的學習要求來設定學習判據對搜索空間各個元素的不同分值。判據設定的準則有很多,理論上與學習任務相關,本書將在以後的章節中進行討論。需要指齣的是,有時學習判據也被稱為目標函數。在本書中,對於這兩個術語不再特意區彆。
1.2.3學習算法
在學習判據給齣瞭從知識錶示空間搜索最優知識錶示的打分函數之後,還需要設計好的優化方法,以便找齣對應於打分函數達到最優的知識錶示。此時
機器學習:從公理到算法(中國計算機學會學術著作叢書) 下載 mobi epub pdf txt 電子書
排除萬難。給予
評分receive the time,but also arranged for time
評分候,
評分漢 語:我來打醬油。 英 語:it's none of my business .i come to buy some sauce. 德 語:ich bezogen, was ich kam zu einer soja-so?e. 法 語:je lis ce qui, j'en suis arriv une sauce de soja. 荷 蘭 語:ik gerelateerd wat, kwam ik tot een sojasaus. 俄 語:я,касающихся того, что я пришел к соевым соусом. 西班牙語:relacionados con lo que yo, me vino a un salsa de soja. 意大利語:i relativi cosa, sono venuto a una salsa di soia. 日 本 語:私関連したどのような、私がして醤油. 希 臘 語:i σχετικ? ? τι ? ρθα σε μια σ? λτσα σ? για?. 漢 語:我來打醬油。 英 語:it's none of my bu
評分這學期有幸選上瞭周誌華老師的機器學習導論,果斷買下西瓜書,目前我拿到的是第二版的,有些小更新很不錯,老師說是加瞭一些導讀。總體來說難度還是有點的。下瞭其他同類書的電子版,都看瞭些。確實,目前西瓜書是最好的用來入門的瞭。這本書得好好讀,讀好幾遍呢
評分京東打優慧,商品也不貴。評價我也會,積分多迴饋【14.5R買到的】
評分深度學習是機器學習的一個分支,它能夠使計算機通過層次概念來學習經驗和理解世界。因為計算機能夠從經驗中獲取知識,所以不需要人類來形式化地定義計算機需要的所有知識。層次概念允許計算機通過構造簡單的概念來學習復雜的概念,而這些分層的圖結構將具有很深的層次。本書會介紹深度學習領域的許多主題。
評分書很不錯,打摺下來6本書也就150左右,很好很滿意,物流也很快,希望活動多一點,以後還會在京東買書。
評分receive the time,but also arranged for time
機器學習:從公理到算法(中國計算機學會學術著作叢書) pdf epub mobi txt 電子書 下載