发表于2024-11-22
Web安全之機器學習入門 pdf epub mobi txt 電子書 下載 2024
本書是國內首部機器學習應用於Web安全的作品,作者是百度安全專傢,他用風趣幽默的語言詮釋瞭超過15種的機器學習算法,及其在Web安全領域中的實際應用,非常實用,包括所有案例源代碼,以及公開的測試數據,可極大地降低學習成本,使讀者快速上手實踐。
在現今的互聯網公司中,産品綫綿延復雜,安全防禦體係無時無刻不在應對新的挑戰。哪怕是擁有豐富工作經驗的安全從業者,在麵對層齣不窮的攻擊手段和海量日誌數據時也會望洋興嘆。機器學習是這些問題天然契閤的解決方案,在數據量以指數級不斷增長的未來,甚至有可能是齣路
本書由百度安全專傢撰寫,零基礎學習智能化Web安全技術指南,二十多位業界專傢聯袂推薦。本書首先介紹主流的機器學習工具,以及Python應用於機器學習的優勢,並介紹Scikit-Learn環境搭建、TensorFlow環境搭建。接著介紹機器學習的基本概念和Web安全基礎知識。然後深入講解幾個機器學習算法在Web安全領域的實際應用,如K近鄰、決策樹、樸素貝葉斯、邏輯迴歸、支持嚮量機、K-Means算法、FP-growth、隱式馬爾可夫、有嚮圖、神經網絡等,還介紹瞭深度學習算法CNN、RNN。本書針對每一個算法都給齣瞭具體案例,理論結閤實際,講解清晰,文筆幽默,適閤有信息安全基礎知識的網絡開發與運維技術人員參考。
劉焱 百度安全Web防護産品綫負責人,負責百度安全的Web安全産品,包括防DDoS、Web應用防火牆、Web威脅感知、服務器安全以及安全數據分析等,具有近十年雲安全及企業安全從業經曆,全程參與瞭百度企業安全建設。研究興趣包括機器學習、Web安全、僵屍網絡、威脅情報等。他是FreeBuf專欄作傢、i春鞦知名講師,多次在OWASP 、電子學會年會等發錶演講,參與編寫瞭《大數據安全標準白皮書》。他還建立瞭微信公眾號:“兜哥帶你學安全”,發布瞭大量信息安全技術知識。
此亦篤信之年,此亦大惑之年。此亦多麗之陽春,此亦絕念之窮鼕。人或萬事俱備,人或一事無成。我輩其青雲直上,我輩其黃泉永墜。——《雙城記》狄更斯著,魏易譯
如今是一個人工智能興起的年代,也是一個黑産猖獗的年代;是一個機器學習算法百花齊放的年代,也是一個隱私泄露、惡意代碼傳播、網絡攻擊肆虐的年代。AlphaGo碾壓柯潔之後,不少人擔心AI會搶瞭人類的工作,然而信息安全領域專業人纔嚴重匱乏,極其需要AI來補充專業缺口。
兜哥的這本書展示瞭豐富多彩的機器學習算法在錯綜復雜的Web安全中的應用,是一本非常及時的人工智能在信息安全領域的入門讀物。正如書中所述,沒有好的算法,隻有閤適的算法。雖然這幾年深度學習呼聲很高,但各種機器學習算法依然在形形色色的應用場景中有著各自獨特的價值,熟悉並用好這些算法在安全領域的實戰中會起到重要的作用。
——Lenx,百度首席安全科學傢,安全實驗室負責人
存儲和計算能力的爆發式增長,讓我們獲得瞭比以往更全麵、實時地獲取以及分析數據的潛在能力,但麵對産生的海量信息如何快速準確地轉化為業務需求則需要依賴一些非傳統的手段。就安全領域來說,原先依賴於規則的問題解法過於受限於編寫規則的安全專傢自身知識領域的廣度和深度,以及對於問題本質的理解能力。但我們都知道,安全漏洞層齣不窮,攻擊利用的方式多種多樣,僅僅依賴於規則進行問題的發現在現階段的威脅形勢下慢慢變得捉襟見肘。麵對威脅,企業安全人員需要打造這樣一種能力,它能夠讓我們脫離單純的點對點的競爭,case by case的對抗,轉而從更高的維度上來審視業務,發現潛在的異常事件。這些異常事件可能會作為安全人員深入調查的起點,讓我們具備找到原有安全能力盲區以及發現新威脅的能力,使我們的技能水平以及對威脅的響應速度能持續提升。同時這種能力和防禦體係結閤,也有可能讓我們達到在麵對某些未知威脅時,以不變應萬變,獲得天然免疫的理想狀態。兜哥的這本書或許是開啓我們這種能力的一把鑰匙。本書通過介紹通俗易懂的機器學習原理,結閤實際企業中的安全業務需求場景,讓廣大安全人員能夠感受到這種“如日中天”的技術在傳統安全領域內如何大放異彩。最後,May the force be with you。
——王宇,螞蟻金服安全總監
百度是擁有海量互聯網數據的幾傢公司之一,兜哥是百度前IT安全負責人,現Web安全産品負責人,研發的産品不僅應用於百度公司內部檢測網絡攻擊,也應用在多個百度的商業安全産品中,服務於數萬站長。兜哥的團隊是國內極早一批將機器學習算法應用於網絡安全場景的團隊之一,本書聚集瞭兜哥及其團隊多年的安全實踐經驗,覆蓋瞭互聯網公司可能會遇到的多個安全場景, 比如用圖算法檢測WebShell等,非常好地解決瞭百度商業安全客戶被入侵留後門的問題。兜哥將自己的技術選型、算法、代碼傾囊相授,我相信本書的齣版將會大大降低安全研發工程師轉型安全數據分析專傢的難度,值得推薦。
——黃正,百度安全實驗室X-Team負責人。
在大數據時代,犯罪分子作案的手段越來越高明,手動分析的成本越來越高,效率也越來越低;與此同時,人工智能技術越來越成熟,安全與人工智能技術相結閤,纔能適應新的環境,推薦安全從業者學習這本書。
——桑文峰,神策數據創始人&CEO;
網絡世界的攻擊與防護對抗發展到今天,各種技術已經日趨專業和精細,通過古老的string-match的防禦方式越來越不能適應新的攻擊環境,對於想嘗試著把機器學習和安全相結閤的從業人員來說,閱讀本書是個很好的開端。
——趙林林,微步在綫技術閤夥人,前美團、高德安全負責人
就我有限的瞭解,在很長一段時間裏,安全技術和機器學習技術都是分彆演進的。安全問題幾乎會伴隨著任何新生事物而來,並與之同生長,這也使得安全研究人員往往會把注意力局限於關注事物的個體特徵而忽略其群體特徵;而有的時候,即使有意於群體特徵的研究,也可能會囿於工具和方法以緻難於寸進,這對安全問題的解決形成瞭事實上的約束。機器學習作為一種可以從另一個維度來解決問題的技術,則對此約束進行瞭相當程度的突破。用新工具去解決老問題,這要求對這兩者都有比較深入的瞭解(例如 AlphaGo),基於瞭解而進行實踐,基於實踐而予以總結分享,這樣的知識分享和傳遞,正是劉焱這本書的價值所在。
——張宇平,數盟CTO
在安全分析中要想用好機器學習,需要精通算法、懂得攻防、理解數據,三方麵的知識缺一不可。這樣的人固然難找,兜哥卻恰好是其中的一員。兜哥憑藉在一綫互聯網企業多年的安全實戰經驗給讀者奉上瞭這本滿滿都是乾貨的大作。書中沒有煩瑣的公式推演,一切用代碼說話,特彆適閤瞭解算法原理、不知道如何在實際中應用的人學習。我個人讀後深受啓發,也推薦給身邊每一個做安全數據分析的同行。
——周濤,啓明星辰“鴻雁”計劃首席研究員
在大數據時代潮流中,如何將大數據思想應用於網絡安全技術是一個非常重要的主題。本書將Web安全與機器學習相結閤,提齣以數據驅動為基礎,利用海量的數據資源分析Web惡意攻擊,以通俗易懂的語言講述瞭機器學習在Web安全領域多個方麵的應用。對Web安全以及大數據安全感興趣的人,這本書是一個很好的選擇。
——李琦,清華大學副研究員
伴隨著互聯網的爆炸式發展,網絡安全已上升到國傢層麵,按效果說話的安全能力建設得到高度重視。與此同時,安全團隊卻又不得不麵對百花齊放的業務場景、大規模的數據中心,以及愈加劇烈、復雜和不確定性的網絡攻擊。如何在傳統攻防對抗之外,尋找更有效、可落地的對抗方式,已成為各大企業安全團隊思考的重點。所幸,近些年來,計算和存儲資源已不是安全團隊的瓶頸,安全團隊自身在工程能力上也已非昔日吳下阿濛。機器學習成為近些年來安全領域裏第一批從學術走嚮工業的應用方嚮,並已有很多階段性的實踐成果。很欣喜地看到兜哥一直在推進機器學習係列的文章並編寫瞭此書。此書重點講解瞭常見機器學習算法在不同場景下的潛在應用和實踐,非常適閤初學者入門。希望此書能夠啓發更多的同行繼續實踐和深耕機器學習應用這個方嚮,並給安全行業帶來更多的反饋和討論。
——程岩,京東安全首席架構師
人工智能的技術發展正在不斷加速,是時候探討如何將機器學習應用於安全領域瞭。人工智能真的能在未來對抗網絡攻擊、自主保護我們的係統嗎?這本書打開瞭一道門。這不僅是一部機器學習的科普書,一部機器學習在安全場景下的實戰書,更是一部鼓勵技術創新應用的行動指南。
——謝忱,FreeBuf聯閤創始人,鬥象科技COO
安全正在發生變革,已經從專傢模式逐漸演變成係統化、平颱化,而隨著機器學習和大數據技術的發展,未來安全將逐漸智能化。而這種變化已經得到瞭驗證,在業務安全領域風控係統的基礎數據中,如IP和用戶畫像、設備指紋生成和識彆、規則的挖掘都使用大量的機器學習算法;在網絡安全領域,如何入侵檢測係統發現未知的攻擊、如何解決無效的攻擊行為也采用瞭大量的分類和關聯規則算法。兜哥作為互聯網企業的安全界資深研究者,一直對新技術的運用進行探索,這本書將為你打開安全智能化的大門。
——吳聖,58同城高級架構師
機器學習一直是高大上的領域,作者結閤自己的實際工作和研究,把機器學習在安全領域的應用講得深入淺齣、很接地氣,稍具基礎知識的讀者就可動手體驗應用機器學習的美妙感受。
——姚誌武,藉貸寶安全總監
縱觀安全行業近十餘年的攻擊方式,從早的單機小工具到如今分布式、大數據、自動化等攻擊方式,防禦的方式不得不隨之不斷升級,於是齣現各種雲安全産品,這些産品都能産生大量有價值的數據,但卻少有産品能夠真正利用這些數據實現聯動防禦,所以這些雲都是單朵的小雲。我們需要利用人工智能將這些數據進行聯動,進行多維度、高精度的深入分析,還原攻擊路徑,纔能真正實現態勢感知,防禦未知攻擊。而人工智能的基礎就是機器學習,讓機器自適應、自分析、自決策,未來的安全防禦必須具備這樣的特性。本書采用實例的方式講解機器學習在安全領域的應用,不僅能讓讀者瞭解到機器學習,還能讓讀者瞭解到攻擊方式的檢測手段,是一本難得的好書。
——尹毅,Sobug技術閤夥人,《代碼審計:企業級Web代碼安全架構》作者
在機器學習領域中,大多數的實用方嚮都錶現在圖像識彆、廣告推薦和個性畫像等方麵,但很少看見安全領域相關的機器學習方法和介紹,因為“安全”的概念是很模糊的,有的場景中,很少有閤適的模型、適用的參數,甚至沒有明確的算法。這本書介紹瞭基礎的機器學習應用和方法,並結閤部分特殊的場景對安全領域中較為常見和較為煩瑣的分析提供瞭很好的例子和思維模型,不論是安全從業人員或者是機器學習領域的研究者,都值得閱讀,可以從本書中獲得很多好的啓發和靈感。
——Kevin1986,搜狐資深安全研究員
不知道十餘年前,在兜哥剛剛踏上安全這條“不歸路”時,有沒有想過如今的工作會麵對多麼錯綜復雜的環境,擔負著數億用戶的信賴。在大型互聯網公司中,産品綫綿延復雜,每一個新産品的上綫,每一次版本的迭代更新,都有不可預知的安全問題齣現,安全防禦體係也無時無刻不在應對新的挑戰。哪怕是擁有豐富工作經驗的安全從業者,在麵對層齣不窮的攻擊手段和海量的日誌數據時也會望洋興嘆。機器學習是這些問題天然契閤的解決方案,在數據量以指數級不斷增長的未來,甚至有可能是一條的齣路。機器學習如今可以說是如日中天的熱詞,但對於初學者來說可能並不是很容易就能掌握的技能。將學習到的內容應用在安全工作中更是難上加難。這或許也是機器學習經常齣現在安全從業者視野中,卻鮮有人願意深入研究的原因之一吧。兜哥作為互聯網安全領域內機器學習的先導踐行者,可以說是從零開始,在不斷嘗試中摸索齣瞭一條新的道路。毫無疑問,這是一個艱難而有價值的過程。這本書作為走過這段曆程之後的總結與分享,兜哥將多年的工作經驗毫無保留地傾注於其中,以一個甲方安全人員的視角,將機器學習如何應用在Web安全工作的各個方麵,用詼諧易懂的語言娓娓道來。在一氣嗬成地讀罷兜哥親手遞過的樣章之後,我隻有一個想法:如今的Web安全領域,太需要這樣一本佳作瞭。或許未來的某一天,機器學習或者說人工智能已經成為瞭保護互聯網安全的中堅力量。迴頭一看,正是本書在路途的起點為我們指明瞭方嚮。
——幻泉,i春鞦教研中心總監
識彆各類攻擊一直是安全領域內難以解決的問題,由於語言的多樣性,利用傳統規則匹配來識彆攻擊已經過時,傳統安全技術的發展也已經到瞭瓶頸,而本書提齣機器學習結閤 Web 安全的思路為安全技術發展指齣瞭新的方嚮。相信讀者閱讀本書後能受益匪淺。
——西瓜,四葉草CTO
安全監控的建立産生海量安全日誌,人工查看審計日誌已經無法解決企業實際安全需求。隨著硬件成本降低,大數據技術成熟,機器學習在企業安全中的實踐應運而生。本書詳細介紹瞭如何通過機器學習分析海量安全日誌,發現隱匿的攻擊,本書是企業安全建設中不可多得的孫子兵法。
——廖威,易寶支付安全總監
早在2009在百度工作時,就因為工作交集認識瞭本書作者劉焱。期間經常討論安全技術問題,為他的淵博知識與鑽研精神所摺服。近年來,Web安全被越來越多的人所重視,攻防對抗上升到一個新的高度。各種新的攻擊方法層齣不窮,傳統的檢測與防禦方式已不再適應,迫切需要更加智能的方法。隨著機器學習的爆發式發展,兩者的結閤將是未來的趨勢。在本書中,劉焱將枯燥復雜的算法、概念以簡單易懂的圖文結閤方式呈現齣來,並夾雜著他一貫的幽默風格,內容由淺入深、循序漸進。應用機器學習是未來的發展趨勢,學習掌握它使創造齣新一代的安全産品成為可能。希望大傢喜歡這本書,並從中受益。
——劉袁君,醫渡雲安全總監
通過機器學習分析海量Web日誌,進而發現業務異常和安全問題已經是安全監控平颱的標配。然而,市場上信息安全和機器學習結閤的工具書卻很少,本書從基礎知識和實際案例齣發,逐步抽絲剝繭帶你進入自動化安全的殿堂。書中的算法和思路是經過大規模部署和商業驗證的,具備很強的可操作性。
——宋文寬,聯想集團信息安全高級經理
對本書的贊譽
序一
序二
序三
前言
第1章 通嚮智能安全的旅程 1
1.1 人工智能、機器學習與深度學習 1
1.2 人工智能的發展 2
1.3 國內外網絡安全形勢 3
1.4 人工智能在安全領域的應用 5
1.5 算法和數據的辯證關係 9
1.6 本章小結 9
參考資源 10
第2章 打造機器學習工具箱 11
2.1 Python在機器學習領域的優勢 11
2.1.1 NumPy 11
2.1.2 SciPy 15
2.1.3 NLTK 16
2.1.4 Scikit-Learn 17
2.2 TensorFlow簡介與環境搭建 18
2.3 本章小結 19
參考資源 20
第3章 機器學習概述 21
3.1 機器學習基本概念 21
3.2 數據集 22
3.2.1 KDD 99數據 22
3.2.2 HTTP DATASET CSIC 2010 26
3.2.3 SEA數據集 26
3.2.4 ADFA-LD數據集 27
3.2.5 Alexa域名數據 29
3.2.6 Scikit-Learn數據集 29
3.2.7 MNIST數據集 30
3.2.8 Movie Review Data 31
3.2.9 SpamBase數據集 32
3.2.10 Enron數據集 33
3.3 特徵提取 35
3.3.1 數字型特徵提取 35
3.3.2 文本型特徵提取 36
3.3.3 數據讀取 37
3.4 效果驗證 38
3.5 本章小結 40
參考資源 40
第4章 Web安全基礎 41
4.1 XSS攻擊概述 41
4.1.1 XSS的分類 43
4.1.2 XSS特殊攻擊方式 48
4.1.3 XSS平颱簡介 50
4.1.4 近年典型XSS攻擊事件分析 51
4.2 SQL注入概述 53
4.2.1 常見SQL注入攻擊 54
4.2.2 常見SQL注入攻擊載荷 55
4.2.3 SQL常見工具 56
4.2.4 近年典型SQL注入事件分析 60
4.3 WebShell概述 63
4.3.1 WebShell功能 64
4.3.2 常見WebShell 64
4.4 僵屍網絡概述 67
4.4.1 僵屍網絡的危害 68
4.4.2 近年典型僵屍網絡攻擊事件分析 69
4.5 本章小結 72
參考資源 72
第5章 K近鄰算法 74
5.1 K近鄰算法概述 74
5.2 示例:hello world!K近鄰 75
5.3 示例:使用K近鄰算法檢測異常操作(一) 76
5.4 示例:使用K近鄰算法檢測異常操作(二) 80
5.5 示例:使用K近鄰算法檢測Rootkit 81
5.6 示例:使用K近鄰算法檢測WebShell 83
5.7 本章小結 85
參考資源 86
第6章 決策樹與隨機森林算法 87
6.1 決策樹算法概述 87
6.2 示例:hello world!決策樹 88
6.3 示例:使用決策樹算法檢測POP3暴力破解 89
6.4 示例:使用決策樹算法檢測FTP暴力破解 91
6.5 隨機森林算法概述 93
6.6 示例:hello world!隨機森林 93
6.7 示例:使用隨機森林算法檢測FTP暴力破解 95
6.8 本章小結 96
參考資源 96
第7章 樸素貝葉斯算法 97
7.1 樸素貝葉斯算法概述 97
7.2 示例:hello world!樸素貝葉斯 98
7.3 示例:檢測異常操作 99
7.4 示例:檢測WebShell(一) 100
7.5 示例:檢測WebShell(二) 102
7.6 示例:檢測DGA域名 103
7.7 示例:檢測針對Apache的DDoS攻擊 104
7.8 示例:識彆驗證碼 107
7.9 本章小結 108
參考資源 108
第8章 邏輯迴歸算法 109
8.1 邏輯迴歸算法概述 109
8.2 示例:hello world!邏輯迴歸 110
8.3 示例:使用邏輯迴歸算法檢測Java溢齣攻擊 111
8.4 示例:識彆驗證碼 113
8.5 本章小結 114
參考資源 114
第9章 支持嚮量機算法 115
9.1 支持嚮量機算法概述 115
9.2 示例:hello world!支持嚮量機 118
9.3 示例:使用支持嚮量機算法識彆XSS 120
9.4 示例:使用支持嚮量機算法區分僵屍網絡DGA傢族 124
9.4.1 數據搜集和數據清洗 124
9.4.2 特徵化 125
9.4.3 模型驗證 129
好好好好好好好
評分很棒很棒!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
評分京東快遞依然那麼快。基本第二天就到瞭。
評分兜哥的書不用懷疑,值得擁有。
評分書寫的不錯,下次還會購買!
評分一直想瞭解機器學習在web安全上應用的的知識,這本書正好
評分一天不讀書,無人看得齣;一周不讀書,開始會爆粗;一月不讀書,智商輸給豬
評分書很給力,價格優惠
評分Web安全之機器學習三部麯 兜哥的書還是要好好讀的
Web安全之機器學習入門 pdf epub mobi txt 電子書 下載