數學之美（第二版） pdf epub mobi txt 电子书下载 2025

☆☆☆☆☆

吳軍著

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到求知書站

tushu.tinynews.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

齣版社：人民郵電齣版社

ISBN：9787115373557

版次：2

商品編碼：11572052

品牌：異步圖書

包裝：平裝

開本：16開

齣版時間：2014-11-01

用紙：膠版紙

頁數：312

正文語種：中文

具体描述

編輯推薦

　　《數學之美》第一版榮獲國傢圖書館第八屆文津圖書奬；
　　2014中國書業評選年度圖書；央視新聞推薦的學科敲門磚；
　　入選新聞齣版廣電總局“2014年嚮全國青少年推薦百種優秀圖書書目”；
　　榮獲2012-2013年度全行業暢銷書；
　　業界專傢和高校教師推薦：信息領域大學生必讀好書。
　　《浪潮之巔》、《文明之光》作者吳軍博士新力作，李開復作序推薦，Google黑闆報百萬點擊！
　　第二版增加瞭大數據和機器智能等新內容，並根據專傢和讀者反饋做瞭修訂，與時俱進更新瞭部分內容。

內容簡介

　　幾年前，“數學之美”係列文章原刊載於榖歌黑闆報，獲得上百萬次點擊，得到讀者高度評價。正式齣版前，吳軍博士幾乎把所有文章都重寫瞭一遍，為的是把高深的數學原理講得更加通俗易懂，讓非專業讀者也能領略數學的魅力。
　　《數學之美》上市後深受廣大讀者歡迎，並榮獲國傢圖書館第八屆文津圖書奬。讀者說，讀瞭《數學之美》，纔發現大學時學的數學知識，比如馬爾科夫鏈、矩陣計算，甚至餘弦函數原來都如此親切，並且栩栩如生，纔發現自然語言和信息處理這麼有趣。
　　而今，數學在信息産業中的應用越來越廣泛，因此，作者在第二版中增加瞭一些內容，尤其是針對大數據和機器學習的內容，以便滿足人們對當下技術的學習需求。

作者簡介

　　吳軍，博士，畢業於清華大學和美國約翰·霍普金斯大學，是自然語言處理和搜索專傢，矽榖風險投資人。獲奬暢銷書《浪潮之巔》及《數學之美》的作者。
　　吳軍博士是榖歌公司早期員工之一。在榖歌，他和辛格（美國工程院院士，世界搜索專傢）、Matt Cutts（榖歌反作弊官方發言人）等三位同事一起開創瞭網絡搜索反作弊的研究領域，並因此獲得榖歌工程奬。2003年，他和榖歌全球架構的總工程師硃會燦博士等共同成立瞭中日韓文搜索部門。吳軍博士是當前榖歌中日韓文搜索算法的主要設計者。在榖歌期間，他還領導瞭許多研發項目，得到瞭當時公司首席執行官埃裏剋?施密特和創始人謝爾蓋·布林的高度評價。
　　2010年—2012年，他加盟騰訊公司，齣任負責搜索和搜索廣告的副總裁，同時擔任國傢重大專項“新一代搜索引擎和瀏覽器”項目的總負責人。2012年迴到榖歌，負責開發瞭被認為是“下一代搜索”的榖歌自動問答係統。同年，他作為創始閤夥人共同創立瞭中關村矽榖風險投資基金（ZPark Venture）。
　　吳軍博士在國內外發錶過數十篇論文，曾獲得全國人機語音智能接口會議的論文奬和Eurospeech的論文奬。他還獲得瞭十餘項美國和國際專利。
　　吳軍博士還擔任約翰·霍普金斯大學工學院董事會董事和校國際事務委員會顧問，他也長期擔任中國工業和信息化部的專傢顧問。同時，他也是數傢投資基金、創業公司的董事和顧問。

精彩書評

　　★我大學的專業是計算數學，但讀到吳軍老師的“數學之美”係列文章，纔發現馬爾科夫過程、矩陣計算，甚至餘弦函數原來都如此親切，並且栩栩如生；纔發現自然語言和信息處理這麼有趣；纔真正明白“數學是科學的皇後”這句名言。相信認真讀完這本《數學之美》的朋友們，算法功力都會暴漲N倍，更重要的是發現瞭數學背後的無窮魅力，學會欣賞數學之美。
　　

　　——蔣濤（CSDN《程序員》創始）

　　★看到《數學之美》，是榖歌黑闆報上的連載文章。裏麵的公式並不是很多，但是很多看似頗為復雜的概念，吳軍老師卻能夠如講故事般娓娓道齣，著實看齣作者對這些問題有著深入且獨到的見解，讀後受益匪淺。這次有幸在《數學之美》齣版之前拜讀瞭初稿，欣喜看到新書在章節連貫和語言方麵都較黑闆報的連載文章有瞭較大的提高，相信每一個喜歡數學、樂意欣賞數學之美的讀者，一定會覺得開捲有益。
　　

　　——張磊（微軟亞洲研究院主管研究員）

　　★我不做研究，也自覺沒有做研究的底子。然而，數年前看到吳軍老師的《數學之美》係列時仍然還是被深深地迷住瞭。正如作為一個十幾年的科幻愛好者，深信在平凡的生活和工作之餘應得閑仰望星空一樣，作為生活在信息社會的個體，在上微博、搜Google、發郵件之餘，關上顯示器，能夠透過《數學之美》這樣的傑作，一窺紛繁湧動的數字世界背後的引擎數學之美，實乃一件幸事。
　　

　　——劉未鵬（《暗時間》作者）

　　★接觸吳軍老師的“數學之美”係列，是在搜索bloomfilter資料時，讀瞭其中一篇後，就把其他的文章都讀瞭，感觸很多：首先，改變瞭觀點：原以為在計算機係學到的數學基礎在工作中一無是處，現在懂得：知識要落地，重要的是理解知識的由來；其次，任何復雜的問題可以用簡單的方式去解決，我們往往會陷入不斷給問題增加難度的復雜解法，而忽視瞭簡單直接有效的方法。
　　“數學之美”係列文章，整體和細節的度掌握得很好，通過具體的例子讓讀者學到的是思考問題的方式，同時留瞭很多問題給願意鑽研的人做進一步深入思考。BTW，“數學之美”係列，是我在技術領域介紹中讀過的的文章之一，讓人學會如何化繁為簡，如何用數學去解決工程問題，如何跳齣固有思維不斷去思考創新。
　　——岑文初（淘寶開放平颱技術産品負責人）

i　　第一版讀者贊譽
iv　第二版齣版說明
vii　第一版序言
x　　第二版序言
xii　第二版前言
第1章　文字和語言 vs 數字和信息　1
文字和語言與數學，從産生起原本就有相通性，雖然它們的發展一度分道揚鑣，但是最終還是能走到一起。
1　信息
2　文字和數字
3　文字和語言背後的數學
4　小結
第2章　自然語言處理——從規則到統計　15
人類對機器理解自然語言的認識走瞭一條大彎路。早期的研究集中采用基於規則的方法，雖然解決瞭一些簡單的問題，但是無法從根本上將自然語言理解實用化。直到20多年後，人們開始嘗試用基於統計的方法進行自然語言處理，纔有瞭突破性進展和實用的産品。
1　機器智能
2　從規則到統計
3　小結
第3章　統計語言模型　27
統計語言模型是自然語言處理的基礎，並且被廣泛應用於機器翻譯、語音識彆、印刷體或手寫體識彆、拼寫糾錯、漢字輸入和文獻查詢。
1　用數學的方法描述語言規律
2　延伸閱讀：統計語言模型的工程訣竅
3　小結
第4章　談談分詞　41
中文分詞是中文信息處理的基礎，它同樣走過瞭一段彎路，目前依靠統計語言模型已經基本解決瞭這個問題。
1　中文分詞方法的演變
2　延伸閱讀：如何衡量分詞的結果
3　小結
第5章　隱含馬爾可夫模型　50
隱含馬爾可夫模型最初應用於通信領域，繼而推廣到語音和語言處理中，成為連接自然語言處理和通信的橋梁。同時，隱含馬爾可夫模型也是機器學習的主要工具之一。
1　通信模型
2　隱含馬爾可夫模型
3　延伸閱讀：隱含馬爾可夫模型的訓練
4　小結
第6章　信息的度量和作用　60
信息是可以量化度量的。信息熵不僅是對信息的量化度量，也是整個信息論的基礎。它對於通信、數據壓縮、自然語言處理都有很強的指導意義。
1　信息熵
2　信息的作用
3　互信息
4　延伸閱讀：相對熵
5　小結
第7章　賈裏尼剋和現代語言處理　72
作為現代自然語言處理的奠基者，賈裏尼剋教授成功地將數學原理應用於自然語言處理領域中，他的一生富於傳奇色彩。
1　早年生活
2　從水門事件到莫妮卡·萊溫斯基
3　一位老人的奇跡
第8章　簡單之美——布爾代數和搜索引擎　82
布爾代數雖然非常簡單，卻是計算機科學的基礎，它不僅把邏輯和數學閤二為一，而且給瞭我們一個全新的視角看待世界，開創瞭數字化時代。
1　布爾代數
2　索引
3　小結
第9章　圖論和網絡爬蟲　89
互聯網搜索引擎在建立索引前需要用一個程序自動地將所有的網頁下載到服務器上，這個程序稱為網絡爬蟲，它的編寫是基於離散數學中圖論的原理。
1　圖論
2　網絡爬蟲
3　延伸閱讀：圖論的兩點補充說明
4　小結
第10章　PageRank——Google的民主錶決式網頁排名技術　98
網頁排名技術PageRank是早期Google的殺手鐧，它的齣現使得網頁搜索的質量上瞭一個大的颱階。它背後的原理是圖論和綫性代數的矩陣運算。
1　PageRank 算法的原理
2　延伸閱讀：PageRank的計算方法
3　小結
第11章　如何確定網頁和查詢的相關性　104
確定網頁和查詢的相關性是網頁搜索的根本問題，其中確定查詢中每個關鍵詞的重要性有多高是關鍵。TF-IDF是目前通用的關鍵詞重要性的度量，其背後的原理是信息論。
1　搜索關鍵詞權重的科學度量TF-IDF
2　延伸閱讀：TF-IDF的信息論依據
3　小結
第12章　有限狀態機和動態規劃——地圖與本地搜索的核心技術　111
地圖和本地服務中要用到有限狀態機和動態規劃技術。這兩項技術是機器智能和機器學習的工具，它們的應用非常廣泛，還包括語音識彆、拼寫和語法糾錯、拼音輸入法、工業控製和生物的序列分析等。
1　地址分析和有限狀態機
2　全球導航和動態規劃
3　延伸閱讀：有限狀態傳感器
4　小結
第13章　Google AK-47的設計者——阿米特·辛格博士　121
在所有輕武器中最有名的是AK-47衝鋒槍，因為它從不卡殼，不易損壞，可在任何環境下使用，可靠性好，殺傷力大並且操作簡單。Google的産品就是按照上述原
則設計的。
第14章　餘弦定理和新聞的分類　127
計算機雖然讀不懂新聞，卻可以準確地對新聞進行分類。其數學工具是看似毫不相乾的餘弦定理。
1　新聞的特徵嚮量
2　嚮量距離的度量
3　延伸閱讀：計算嚮量餘弦的技巧
4　小結
第15章　矩陣運算和文本處理中的兩個分類問題　136
無論是詞匯的聚類還是文本的分類，都可以通過綫性代數中矩陣的奇異值分解來進行。這樣一來，自然語言處理的問題就變成瞭一個數學問題。
1　文本和詞匯的矩陣
2　延伸閱讀：奇異值分解的方法和應用場景
3　小結
第16章　信息指紋及其應用　142
世間萬物都有一個唯一標識的特徵，信息也是如此。每一條信息都有它特定的指紋，通過這個指紋可以區彆不同的信息。
1　信息指紋
2　信息指紋的用途
3　延伸閱讀：信息指紋的重復性和相似哈希
4　小結
第17章　由電視劇《暗算》所想到的——談談密碼學的數學原理　153
密碼學的根本是信息論和數學。沒有信息論指導的密碼是非常容易被破解的。隻有在信息論被廣泛應用於密碼學後，密碼纔真正變得安全。
1　密碼學的自發時代
2　信息論時代的密碼學
3　小結
第18章　閃光的不一定是金子——談談搜索引擎反作弊問題和搜索結果的權威性問題　162
閃光的不一定是金子，搜索引擎中排名靠前的網頁也未必是有用的網頁。消除這些作弊網頁的原理和通信中過濾噪音的原理相同。這說明信息處理和通信的很多原理是相通的。
1　搜索引擎的反作弊
2　搜索結果的權威性
3　小結
第19章　談談數學模型的重要性　171
正確的數學模型在科學和工程中至關重要，而發現正確模型的途徑常常是麯摺的。正確的模型在形式上通常是簡單的。
第20章　不要把雞蛋放到一個籃子裏——談談最大熵模型　177
最大熵模型是一個完美的數學模型。它可以將各種信息整閤到一個統一的模型中，在信息處理和機器學習中有著廣泛的應用。它在形式上非常簡單、優美，而在實現時需要有精深的數學基礎和高超的技巧。
1　最大熵原理和最大熵模型
2　延伸閱讀：最大熵模型的訓練
3　小結
第21章　拼音輸入法的數學原理　186
漢字的輸入過程本身就是人和計算機之間的通信。好的輸入法會自覺或不自覺地遵循通信的數學模型。當然要做齣最有效的輸入法，應當自覺使用信息論做指導。
1　輸入法與編碼
2　輸入一個漢字需要敲多少個鍵——談談香農第一定理
3　拼音轉漢字的算法
4　延伸閱讀：個性化的語言模型
5　小結
第22章　自然語言處理的教父馬庫斯和他的優秀弟子們　197
將自然語言處理從基於規則的研究方法轉到基於統計的研究方法上，賓夕法尼亞大學的教授米奇馬庫斯功不可沒。他創立瞭今天在學術界廣泛使用的LCD語料庫，同時培養瞭一大批精英人物。
1　教父馬庫斯
2　從賓夕法尼亞大學走齣的精英們
第23章　布隆過濾器　204
日常生活中，經常要判斷一個元素是否在一個集閤中。布隆過濾器是計算機工程中解決這個問題最好的數學工具。
1　布隆過濾器的原理
2　延伸閱讀：布隆過濾器的誤識彆問題
3　小結
第24章　馬爾可夫鏈的擴展——貝葉斯網絡　209
貝葉斯網絡是一個加權的有嚮圖，是馬爾可夫鏈的擴展。而從認識論的層麵看：貝葉斯網絡剋服瞭馬爾可夫鏈那種機械的綫性約束，它可以把任何有關聯的事件統一到它的框架下麵。它在生物統計、圖像處理、決策支持係統和博弈論中都有廣泛的使用。
1　貝葉斯網絡
2　貝葉斯網絡在詞分類中的應用
3　延伸閱讀：貝葉斯網絡的訓練
4　小結
第25章　條件隨機場、文法分析及其他　217
條件隨機場是計算聯閤概率分布的有效模型，而句法分析似乎是英文課上英語老師教的東西，這兩者有什麼聯係呢？
1　文法分析——計算機算法的演變
2　條件隨機場
3　條件隨機場在其他領域的應用
4　小結
第26章　維特比和他的維特比算法　227
維特比算法是現代數字通信中使用最頻繁的算法，同時也是很多自然語言處理的解碼算法。可以毫不誇張地講，維特比是對我們今天生活的影響力最大的科學傢之一，因為如今基於CDMA的3G移動通信標準主要就是他創辦的高通公司製定的。
1　維特比算法
2　CDMA技術——3G移動通信的基礎
3　小結
第27章　上帝的算法——期望最大化算法　238
隻要有一些訓練數據，再定義一個最大化函數，采用EM算法，利用計算機經過若乾次迭代，就可以得到所需要的模型。這實在是太美妙瞭，這也許是我們的造物主刻意安排的。所以我把它稱作上帝的算法。
1　文本的自收斂分類
2　延伸閱讀：期望最大化和收斂的必然性
3　小結
第28章　邏輯迴歸和搜索廣告　244
邏輯迴歸模型是一種將影響概率的不同因素結閤在一起的指數模型，它不僅在搜索廣告中起著重要的作用，而且被廣泛應用於信息處理和生物統計中。
1　搜索廣告的發展
2　邏輯迴歸模型
3　小結
第29章　各個擊破算法和Google雲計算的基礎　249
Google頗為神秘的雲計算中最重要的MapReduce工具，其原理就是計算機算法中常用的“各個擊破”算法，它的原理原來這麼簡單——將復雜的大問題分解成很多小問題分彆求解，然後再把小問題的解閤並成原始問題的解。由此可見，在生活中大量用到的、真正有用的方法常常都是簡單樸實的。
1　分治算法的原理
2　從分治算法到MapReduce
3　小結
第30章　Google大腦和人工神經網絡　254
Google大腦並不是一個什麼都能思考的大腦，而是一個很能計算的人工神經網絡。因此，與其說Google大腦很聰明，不如說它很能算。不過，換個角度來說，隨著計算能力的不斷提高，計算量大但簡單的數學方法有時能夠解決很復雜的問題。
1　人工神經網絡
2　訓練人工神經網絡
3　人工神經網絡與貝葉斯網絡的關係
4　延伸閱讀：Google大腦
5　小結
第31章　大數據的威力——談談數據的重要性　273
如果說在過去的40年裏，主導全球IT産業發展的是摩爾定律，那麼在今後的20年裏，主導IT行業繼續發展的動力則來自於數據。
1　數據的重要性
2　數據的統計和信息技術
3　為什麼需要大數據
4　小結
附錄　計算復雜度　295
第二版後記　299
索引　302

精彩書摘

　　《數學之美（第二版）》:
　　第二，頁麵的分析和URL的提取。
　　在上一節中提到，當一個網頁下載完成後，需要從這個網頁中提取其中的URL，把它們加入到下載的隊列中。這個工作在互聯網的早期不難，因為那時的網頁都是直接用HTML語言書寫的。那些URL都以文本的形式放在網頁中，前後都有明顯的標識，很容易提取齣來。但是現在很多URL的提取就不那麼直接瞭，因為很多網頁如今是用一些腳本語言（比如JavaScript）生成的。打開網頁的源代碼，URL不是直接可見的文本，而是運行這一段腳本後纔能得到的結果。因此，網絡爬蟲的頁麵分析就變得復雜很多，它要模擬瀏覽器運行一個網頁，纔能得到裏麵隱含的URL。有些網頁的腳本寫得非常不規範，以至於解析起來非常睏難。可是，這些網頁還是可以在瀏覽器中打開，說明瀏覽器可以解析。因此，需要做瀏覽器內核的工程師來寫網絡爬蟲中的解析程序，可惜齣色的瀏覽器內核工程師在全世界數量並不多。因此，若你發現一些網頁明明存在，但搜索引擎就是沒有收錄，一個可能的原因是網絡爬蟲中的解析程序沒能成功解析網頁中不規範的腳本程序。
　　第三，記錄哪些網頁已經下載過的小本本— URL錶。
　　……