包郵Python 3爬蟲 數據清洗與可視化實戰+Python3網絡爬蟲開發實戰

包郵Python 3爬蟲 數據清洗與可視化實戰+Python3網絡爬蟲開發實戰 pdf epub mobi txt 电子书 下载 2025

崔慶纔 零一,韓要賓,黃園園 著
圖書標籤:
  • Python3
  • 爬蟲
  • 數據清洗
  • 數據可視化
  • 網絡爬蟲
  • 開發實戰
  • 編程
  • 技術
  • 數據分析
  • 實戰教程
想要找书就要到 求知書站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 蓝墨水图书专营店
出版社: 电子工业出版社
ISBN:9787121333590
商品编码:26807294188

具体描述





















作 譯 者:零一,韓要賓,黃園園

齣版時間:2018-03    韆 字 數:200

版    次:01-01    頁    數:212

開    本:16開

裝    幀:

I S B N :9787121333590     

換    版:

所屬分類:科技 >> 計算機 >> 計算機科學

紙質書定價:¥49.0

本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平颱的頁麵數據,並對數據做清洗和存儲。本書簡化瞭Python基礎部分,保證有足夠的篇幅來介紹爬蟲和數據清洗的內容,對於Python基礎,建議新手可以選購對應的基礎書籍配閤本書一起學習。

第1 章 Python 基礎 ..................................................................................... 1

1.1 安裝Python 環境.............................................................................................................. 1

1.1.1 Python 3.6.2 安裝與配置 .......................................................................................... 1

1.1.2 使用IDE 工具——PyCharm .................................................................................... 4

1.1.3 使用IDE 工具——Anaconda ................................................................................... 4

1.2 Python 操作入門 .............................................................................................................. 6

1.2.1 編寫第一個Python 代碼 .......................................................................................... 6

1.2.2 Python 基本操作 ....................................................................................................... 9

1.2.3 變量 .......................................................................................................................... 10

1.3 Python 數據類型 ............................................................................................................ 10

1.3.1 數字 .......................................................................................................................... 10

1.3.2 字符串 .......................................................................................................................11

1.3.3 列錶 .......................................................................................................................... 13

1.3.4 元組 .......................................................................................................................... 14

1.3.5 集閤 .......................................................................................................................... 15

1.3.6 字典 .......................................................................................................................... 15

1.4 Python 語句與函數 ......................................................................................................... 16

1.4.1 條件語句 .................................................................................................................. 16

1.4.2 循環語句 .................................................................................................................. 16

1.4.3 函數 .......................................................................................................................... 17

第2 章 寫一個簡單的爬蟲 .......................................................................... 18

2.1 關於爬蟲的閤法性 ......................................................................................................... 18

2.2 瞭解網頁 ......................................................................................................................... 20

2.2.1 認識網頁結構 .......................................................................................................... 21

2.2.2 寫一個簡單的HTML ............................................................................................. 21

2.3 使用requests 庫請求網站 .............................................................................................. 23

Python 3 爬蟲、數據清洗與可視化實戰

 

2.3.1 安裝requests 庫 ....................................................................................................... 23

2.3.2 爬蟲的基本原理 ...................................................................................................... 25

2.3.3 使用GET 方式抓取數據 ........................................................................................ 26

2.3.4 使用POST 方式抓取數據 ...................................................................................... 27

2.4 使用Beautiful Soup 解析網頁 ....................................................................................... 30

2.5 清洗和組織數據 ............................................................................................................. 34

2.6 爬蟲攻防戰 ..................................................................................................................... 35

第3 章 用API 爬取天氣預報數據 ............................................................... 38

3.1 注冊免費API 和閱讀技術文檔 ..................................................................................... 38

3.2 獲取API 數據 ................................................................................................................ 40

3.3 存儲數據到MongoDB ................................................................................................... 45

3.3.1 下載並安裝MongoDB ............................................................................................ 45

3.3.2 在PyCharm 中安裝Mongo Plugin ......................................................................... 46

3.3.3 將數據存入MongoDB ............................................................................................ 49

3.4 MongoDB 數據庫查詢 ................................................................................................... 52

第4 章 大型爬蟲案例:抓取某電商網站的商品數據 ................................... 55

4.1 觀察頁麵特徵和解析數據 ............................................................................................. 55

4.2 工作流程分析 ................................................................................................................. 64

4.3 構建類目樹 ..................................................................................................................... 65

4.4 獲取産品列錶 ................................................................................................................. 68

4.5 代碼優化 ......................................................................................................................... 70

4.6 爬蟲效率優化 ................................................................................................................. 74

4.7 容錯處理 ......................................................................................................................... 77

第5 章 Scrapy 爬蟲 ................................................................................... 78

5.1 Scrapy 簡介 ..................................................................................................................... 78

5.2 Scrapy 安裝 ..................................................................................................................... 79

5.3 案例:用Scrapy 抓取股票行情 .................................................................................... 80

第6 章 Selenium爬蟲 ................................................................................ 88

6.1 Selenium 簡介 ................................................................................................................. 88

6.2 案例:用Selenium 抓取電商網站數據 ........................................................................ 90

 

第7 章 數據庫連接和查詢 ........................................................................ 100

7.1 使用PyMySQL ............................................................................................................ 100

7.1.1 連接數據庫 ............................................................................................................ 100

7.1.2 案例:某電商網站女裝行業TOP100 銷量數據 ................................................. 102

7.2 使用SQLAlchemy ........................................................................................................ 104

7.2.1 SQLAlchemy 基本介紹 ......................................................................................... 104

7.2.2 SQLAlchemy 基本語法 ......................................................................................... 105

7.3 MongoDB ...................................................................................................................... 107

7.3.1 MongoDB 基本語法 .............................................................................................. 107

7.3.2 案例:在某電商網站搜索“連衣裙”的商品數據 ............................................ 107

第8 章 NumPy ......................................................................................... 109

8.1 NumPy 簡介 .................................................................................................................. 109

8.2 一維數組 ........................................................................................................................110

8.2.1 數組與列錶的異同 .................................................................................................110

............




齣版信息

書 名Python 3網絡爬蟲開發實戰

係列書名圖靈原創

執行編輯關於本書的內容有任何問題,請聯係 王軍花

書 號978-7-115-48034-7

頁 數608

印刷方式單色

開 本16開

齣版狀態正在排版

定價99.00

 

 

本書特色

1.本書詳細介紹瞭爬蟲的關鍵技術,涵蓋麵廣,實用性強。

2.本書作者崔慶纔,北京航空航天大學碩士,北京釘趣網絡公司技術總監,其個人博客為cuiqingcai.com,其上爬蟲文章的瀏覽量總計已過百萬。

 

目錄

本書介紹瞭如何利用Python 3開發網絡爬蟲,書中首先介紹瞭環境配置和基礎知識,然後討論瞭urllib、requests、正則錶達式、Beautiful Soup、XPath、pyquery、數據存儲、Ajax數據爬取等內容,接著通過多個案例介紹瞭不同場景下如何實現數據爬取,最後介紹瞭pyspider框架、Scrapy框架和分布式爬蟲。

本書適閤Python程序員閱讀。


用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

相关图书

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有