都說這年頭不會點機器學習不好意思齣門,但高深的數學理論,復雜的算法又讓很多人忘而卻步,不知從何下手,《機器學習篇》繞過理論障礙,打通瞭一條由淺入深的機器學習之路。
豐富的實戰案例講解,介紹如何將機器學習技術運用到股票量化交易、圖片渲染、圖片識彆等領域。
機器學習需要一條脫離過高理論門檻的入門之路。本書《機器學習篇》從小紅帽采蘑菇的故事開篇,介紹瞭基礎的機器學習分類模型的訓練(第1章)。如何評估、調試模型?如何閤理地發掘事物的特徵?如何利用幾個模型共同發揮作用?後續章節一步一步講述瞭如何優化模型,更好地完成分類預測任務(第2章),並且初步嘗試將這些技術運用到金融股票交易中(第3章)。自然界*好的非綫性模型莫過於人類的大腦。《深度學習篇》從介紹並對比一些常見的深度學習框架開始(第4章),講解瞭DNN模型的直觀原理,嘗試給齣一些簡單的生物學解釋,完成簡單的圖片識彆任務(第5章)。後續章節在此基礎上,完成更為復雜的圖片識彆CNN模型(第6章)。接著,本書展示瞭使用Caffe完成一個完整的圖片識彆項目,從準備數據集,到完成識彆任務(第7章)。後麵簡單描述瞭RNN模型(第8章),接著展示瞭一個將深度學習技術落地到圖片處理領域的項目(第9章)。
阿布:多年互聯網金融技術從業經驗,曾就職於奇虎360、百度互聯網證券、百度金融等互聯網型金融公司,現自由職業,個人量化交易者,擅長個人中小資金量化交易領域係統開發,以及為中小型量化私募資金提供技術解決方案、技術支持、量化培訓等工作。
胥嘉幸:北京大學碩士,先後就職於百度金融證券、百度糯米搜索部門。多年緻力於大數據機器學習方麵的研究,有深厚的數學功底和理論支撐。在將機器學習技術融於傳統金融量化領域方麵頗有研究。
第一篇 機器學習篇
第1 章 初識機器學習 .................................................................................... 2
1.1 機器學習——賦予機器“學習”的靈魂 ..................................................................... 2
1.1.1 小紅帽識彆毒蘑菇 ................................................................................................................... 2
1.1.2 三種機器學習問題 ................................................................................................................... 6
1.1.3 常用符號 .................................................................................................................................. 6
1.1.4 迴顧 .......................................................................................................................................... 7
1.2 KNN——相似的鄰居請投票 ........................................................................................ 7
1.2.1 模型原理 .................................................................................................................................. 7
1.2.2 鳶尾花卉數據集(IRIS) ....................................................................................................... 9
1.2.3 訓練模型 .................................................................................................................................. 9
1.2.4 評估模型 ................................................................................................................................ 12
1.2.5 關於KNN ............................................................................................................................... 14
1.2.6 運用KNN 模型 ...................................................................................................................... 15
1.2.7 迴顧 ........................................................................................................................................ 16
1.3 邏輯分類I:綫性分類模型 ........................................................................................ 16
1.3.1 參數化的模型 ........................................................................................................................ 16
1.3.2 邏輯分類:預測..................................................................................................................... 18
1.3.3 邏輯分類:評估..................................................................................................................... 22
1.3.4 邏輯分類:訓練..................................................................................................................... 23
1.3.5 迴顧 ........................................................................................................................................ 24
1.4 邏輯分類II:綫性分類模型 ....................................................................................... 24
1.4.1 尋找模型的權重..................................................................................................................... 24
VI ∣ 機器學習之路——Caffe、Keras、scikit-learn 實戰
1.4.2 去均值和歸一化..................................................................................................................... 31
1.4.3 實現 ........................................................................................................................................ 33
1.4.4 迴顧 ........................................................................................................................................ 34
第2 章 機器學習進階 .................................................................................. 35
2.1 特徵工程 ...................................................................................................................... 35
2.1.1 泰坦尼剋號生存預測 ............................................................................................................. 35
2.1.2 兩類特徵 ................................................................................................................................ 38
2.1.3 構造非綫性特徵..................................................................................................................... 41
2.1.4 迴顧 .................................................................................
前言
越來越多的人期待能擠進機器學習這一行業,這些人往往有一些編程和自學能力,但數學等基礎理論能力不足。對於這些人群,從頭開始學習概率統計等基礎學科是痛苦的,如果直接上手使用機器學習工具往往又感到理解不足,缺少點什麼。本書就是麵嚮這一人群,避過數學推導等復雜的理論推衍,介紹模型背後的一些簡單直觀的理解,以及如何上手使用。本書希望能夠得到這些人的喜愛。
本書包含兩部分:機器學習篇和深度學習篇。
機器學習篇(1~3 章)主要從零開始,介紹什麼是數據特徵,什麼是機器學習模型,如何訓練模型、調試模型,以及如何評估模型的成績。通過一些簡單的任務例子,講解在使用模型時如何分析並處理任務數據的特徵,如何組閤多個模型共同完成任務,並在第3章初步嘗試將機器學習技術運用到股票交易中,重復熟悉這些技術的同時,感受機器學習技術在落地到專業領域時常犯的錯誤。
深度學習篇(4~9 章)則主要介紹瞭一些很基礎的深度學習模型,如DNN、CNN等,簡單涵蓋瞭一些RNN 的概念描述。我們更關注模型的直觀原理和背後的生物學設計理念,希望讀者能夠帶著這些理解,直接上手應用深度學習框架。說一點關於閱讀本書的建議。本書在編寫時不關注模型技術的數學推導及嚴謹錶述,轉而關注其背後的直觀原理理解。建議讀者以互動執行代碼的方式學習,所有示例使用IPython Notebook 編寫。讀者可在Git 上找到對應章節的內容,一步一步運行書中講解的知識點,直觀感受每一步的執行效果。具體代碼下載地址:https://github.com/bbfamily/abu。
本書適閤有Python 編程能力的讀者。如果讀者有簡單的數學基礎,瞭解概率、矩陣則更佳。使用過Numpy、pandas 等數據處理工具的讀者讀起來也會更輕鬆,但這些都不是必需的。如果讀者缺乏Python 編程能力,或者希望進一步獲得Numpy、pandas 等工具使用相關的知識,可以關注公眾號:abu_quant,獲得一些技術資料及文章。
感謝齣版社提供機會讓我們編寫本書,感謝編輯不辭辛苦地和我溝通排版等細節問題。
本書的完成同樣需要感謝我們的幾位朋友:吳汶(老虎美股)、劉兆丹(百度金融),感謝你們在本書編寫作過程中提供的有力支持。感謝本書的試讀人員:蔡誌威、李寅龍。
我對這本書的價值判斷,很大程度上建立在它所覆蓋的工具鏈的互補性上。Caffe代錶著對效率和底層優化的追求,很多時候,當你需要榨乾GPU的每一分性能時,它是不二之選;而Keras,則代錶瞭易用性和快速迭代的哲學,它讓我們可以像搭樂高積木一樣構建復雜的網絡。scikit-learn則像是一個萬金油,處理特徵工程、模型選擇和傳統算法時,它的簡潔高效無人能及。這本書如果能清晰地闡述何時應該使用哪一個框架,以及它們之間的數據格式轉換和模型遷移的技巧,那麼它的實用價值將呈幾何級增長。我希望看到的是一種融會貫通的境界,而不是簡單地把三個工具的書籍內容拼湊在一起。例如,如何利用scikit-learn強大的交叉驗證工具來指導Keras模型的超參數搜索,或者如何用Caffe訓練齣的高性能模型權重,反過來對scikit-learn中集成的某些組件進行微調,這種工具間的“對話”纔是真正的實戰智慧的體現。
评分從讀者的角度來看,一本好的實戰書必須能夠建立起讀者的信心,讓他敢於動手,不怕齣錯。我關注的重點在於,這本書在代碼的“可復現性”上做得有多到位。這不僅僅是代碼能跑起來那麼簡單,而是指環境依賴的清晰羅列、數據集獲取的便捷指引,以及最關鍵的——關鍵步驟的“預期輸齣”的展示。如果書中每一段核心代碼後,都能附上讀者應該看到的結果截圖或數據狀態描述,那麼它就成功地為讀者搭建瞭一個參照係,讓我們在調試過程中能快速定位問題所在。我特彆希望作者能在深入探討這些主流框架的同時,也能引入一些新興的、但已被廣泛認可的最佳實踐。比如,如何有效地進行模型版本控製,如何利用TensorBoard等可視化工具來深入剖析訓練過程中的梯度消失或爆炸問題,這些都是書本知識嚮職業技能跨越的關鍵點。這本書的齣現,似乎正是瞄準瞭彌補理論與工程實踐之間那道鴻溝的絕佳嘗試。
评分這本書的封麵設計,初看之下,就散發齣一種既專業又接地氣的氣息。那深邃的藍色背景,仿佛寓意著數據世界的廣袤與未知,而那清晰的字體排版,又讓人感到條理分明,心中湧起一股“原來如此”的明晰感。我尤其欣賞它在視覺上傳達齣的那種務實精神,沒有太多花哨的裝飾,一切都指嚮核心——實戰。這不像那些堆砌理論的教科書,讀起來像在啃堅硬的石頭,這本書更像是為你準備好瞭一套精良的工具箱,每一個工具都標明瞭用途和用法。光是看到“Caffe、Keras、scikit-learn”這幾個並列的詞組,我就知道作者不是在泛泛而談,而是直指當下工業界和研究領域最主流、最實用的三大陣營。這種平衡感把握得極好,它讓你既能窺見深度學習的尖端應用(Caffe的工業級性能),又能享受到快速原型開發的便捷(Keras的優雅抽象),同時還能顧及到傳統機器學習的紮實基礎(scikit-learn的普適性)。這種廣度與深度兼備的布局,讓我對後續的學習內容充滿瞭期待,它承諾的不是象牙塔裏的理論推演,而是能夠立即投入戰鬥的實戰經驗。
评分拿到書後的第一感受是那種沉甸甸的踏實感,紙張的質感相當不錯,閱讀體驗很舒適,這對一本需要反復翻閱和對照代碼的書來說至關重要。我翻開目錄,立刻被其結構吸引住瞭。它似乎沒有采取傳統的“先理論後實踐”的綫性敘事方式,而是更傾嚮於“帶著問題去學習”的驅動模式。每一個章節的標題都透露著一種“我們馬上要解決一個具體難題”的信號,而不是晦澀的數學概念堆砌。例如,如果某一章聚焦於圖像分類,我預感它會直接帶我們進入如何配置環境、如何加載數據、如何選擇網絡結構,而不是先花大篇幅解釋捲積的數學原理。這種以結果為導嚮的編排,對於我這種有著一定編程基礎,但對算法細節感到頭疼的實踐者來說,簡直是福音。我迫不及待地想知道,作者是如何巧妙地將Caffe那相對復雜的配置流程,通過Keras的高級封裝進行平滑過渡的,並最終用scikit-learn的簡潔接口來對比驗證結果的。這種多框架並舉的視角,無疑能幫助讀者構建更全麵、更靈活的技術棧認知地圖。
评分這本書的敘事風格,從前言透露齣的語氣來看,非常像一位經驗豐富的前輩在手把手帶新人。它沒有采用高高在上的姿態去灌輸知識,而是充滿瞭一種鼓勵和引導的口吻。我能想象到作者在撰寫時,一定在斟酌如何用最少的術語解釋最復雜的概念,如何在代碼示例中植入關鍵的“陷阱”提示,以及如何在關鍵轉摺點設置“思考題”。這種“亦師亦友”的寫作方式,極大地降低瞭學習麯綫的陡峭程度。畢竟,機器學習領域的新手最怕的就是“這個參數是乾什麼的?為什麼選這個激活函數?”這種一問三不知的窘境。我期待書中能有大量的代碼片段,並且這些片段不僅僅是孤立的功能展示,而是能夠串聯成一個完整的項目流程,從數據預處理到模型部署的每一個環節都有清晰的注釋和邏輯解釋。如果書中能加入一些實際生産環境可能遇到的“髒數據”處理案例,那就更是錦上添花,能讓我提前領教到真實世界的復雜性。
评分物流速度快,快递小哥服务态度好
评分很好的书 多读书读好书 乃人生一快事
评分书的质量挺好的,开始学习。
评分内容一般,代码无结果展现,感觉写的仓促!
评分不是特别好,不建议阅读
评分粗略翻了一下 这本书适合有一定基础的读者,
评分内容一般,代码无结果展现,感觉写的仓促!
评分虽然便宜然而daoban
评分这本书给我了一些新的启发,值得好好总结,希望能用在工作中
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有