Python網絡爬蟲開發從入門到精通

Python網絡爬蟲開發從入門到精通

作者: 劉延林
出版社: 北京大學出版社
出版在: 2019-12-01
ISBN-13: 9787301309094
ISBN-10: 7301309090
裝訂格式: 平裝
總頁數: 372 頁





內容描述


本書共分 3 篇,針對 Python 爬蟲初學者,
從零開始,系統地講解了如何利用 Python 
進行常見的網絡爬蟲的程序開發。
第 1 篇快速入門篇(第 1 章 ~ 第 9 章):
本篇主要介紹了 Python 環境的搭建和一些 Python 的基礎語法知識等、
Python爬蟲入門知識及基本的使用方法、Ajax 數據的分析和抓取、
動態渲染頁面數據的爬取、網站代理的設置與使用、驗證碼的識別與破解,
以及 App 數據抓取、數據的存儲方法等內容。
第 2 篇技能進階篇(第 10 章 ~ 第 12 章):
本篇主要介紹了 PySpider 和 Scrapy 兩個常用爬蟲框架的基本使用方法、
分布式爬蟲的實現思路,以及數據分析、數據清洗常用庫的使用方法。
第 3 篇項目實戰篇(第 13 章):本篇通過 6 個綜合實戰項目,
詳細地講解了 Python 數據爬蟲開始與實戰應用。
本篇對全書內容進行了總結回顧,強化讀者的實操水平。
本書案例豐富,注重實戰,既適合 Python 程序員和爬蟲愛好者閱讀學習,
也適合作為廣大職業院校相關專業的教學用書。


作者介紹


劉延林
知名論壇Python爬蟲專題管理員,
擅長Python爬蟲技術,並對Python數據分析與挖掘有深入研究。
在CSDN等多個知名博客網站發表多篇技術文章,深受讀者的喜愛。




相關書籍

Python 資料科學與機器學習:從入門到實作必備攻略 (Hands-On Data Science and Machine Learning with Python)

作者 Frank Kane 陳光欣 譯

2019-12-01

Fluent Python (Paperback)

作者 Luciano Ramalho

2019-12-01

機器學習基礎:從入門到求職

作者 胡歡武

2019-12-01