Python網絡數據采集

Python網絡數據采集 pdf epub mobi txt 电子书 下载 2025

[美] 米切爾(RyanMitchell)著陶俊傑 著
想要找书就要到 求知書站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店鋪: 文軒網旗艦店
齣版社: 人民郵電齣版社
ISBN:9787115416292
商品編碼:10297799911
齣版時間:2016-03-01

具体描述

作  者:(美)米切爾(Ryan Mitchell) 著;陶俊傑,陳小莉 譯 定  價:59 齣 版 社:人民郵電齣版社 齣版日期:2016年03月01日 頁  數:200 裝  幀:平裝 ISBN:9787115416292

網絡上的數據量越來越大,單靠瀏覽網頁獲取信息越來越睏難,如何有效地提取並利用信息已成為一個巨大的挑戰。本書采用簡潔強大的Python語言,全麵介紹網絡數據采集技術,教你從不同形式的網絡資源中自由地獲取數據。你將學會如何使用Python腳本和網絡API一次性采集並處理成韆上萬個網頁上的數據。本書適閤熟悉Python的程序員、安全專業人士、網絡管理員閱讀。書中不僅介紹瞭網絡數據采集的基本原理,還深入探討瞭更不錯的主題,比如分析原始數據、用網絡爬蟲測試網站等。此外,書中還提供瞭詳細的代碼示例,以等

譯者序   ix
前言   xi
部分  創建爬蟲
第1章  初見網絡爬蟲   2
1.1  網絡連接   2
1.2  BeautifulSoup簡介   4
1.2.1  安裝BeautifulSoup   5
1.2.2  運行BeautifulSoup   7
1.2.3  可靠的網絡連接   8
第2章  復雜HTML解析   11
2.1  不是一直都要用錘子   11
2.2  再端一碗BeautifulSoup   12
2.2.1  BeautifulSoup的find()和findAll()   13
2.2.2  其他BeautifulSoup對象   15
2.2.3  導航樹   16
2.3  正則錶達式   19
2.4  正則錶達式和BeautifulSoup   23
2.5  獲取屬性   24
2.6  Lambda錶達式   24
2.7  超YUEBeautifulSoup   25
部分目錄

內容簡介

本書采用簡潔強大的Python語言,介紹瞭網絡數據采集,並為采集新式網絡中的各種數據類型提供瞭全麵的指導。靠前部分重點介紹網絡數據采集的基本原理:如何用Python從網絡服務器請求信息,如何對服務器的響應進行基本處理,以及如何以自動化手段與網站進行交互。第二部分介紹如何用網絡爬蟲測試網站,自動化處理,以及如何通過更多的方式接入網絡。 (美)米切爾(Ryan Mitchell) 著;陶俊傑,陳小莉 譯 Ryan Mitchell,數據科學傢、軟件工程師,目前在波士頓LinkeDrive公司負責開發公司的API和數據分析工具。此前,曾在Abine公司構建網絡爬蟲和網絡機器人。她經常做網絡數據采集項目的谘詢工作,主要麵嚮金融和零售業。另著有Instant Web Scraping with Java。

用户评价

评分

哈哈哈

评分

書不錯,就是太貴瞭,這麼薄薄的一本,要這個價格

评分

差評。下單時可以選紙質發票,寄過來卻沒有。聯係商傢迴復隻有電子發票。書還沒有看,十分影響心情。

评分

很好的書 沒有摺角 還有過塑

评分

也許正版也會有印刷問題吧,可惜瞭這本書,印刷不清楚,顔色不均勻,看著非常難受。

评分

非常好的書,好好好好好

评分

還可以,沒看呢

评分

書還算可以,還沒有讀完

评分

書還是很不錯的,但是不適閤小白看

相关图书

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有