Home > Book
Check-outs :

Python網路爬蟲 : 大數據擷取、清洗、儲存與分析 : 王者歸來 /

  • Hit:13
  • Rating:0
  • Review:0
  • Trackback:0
  • Forward:0


轉寄 列印
第1級人氣樹(0)
人氣指樹
  • keepsite
  • Introduction
  • About Author
  • Collection(0)
  • Review(0)
  • Rating(0)
  • Trackback(0)

本書特色、內容簡介 這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。 # 認識搜尋引擎與網路爬蟲 # 認識約定成俗的協議robots.txt # 從零開始解析HTML網頁 # 認識與使用Chrome開發人員環境解析網頁 # 認識Python內建urllib、urllib2模組,同時介紹好用的requests模組 # 說明lxml模組 # Selenium模組 # XPath方法解說 # css定位網頁元素 # Cookie觀念 # 自動填寫表單 # 使用IP代理服務與實作 # 偵測IP # 更進一步解說更新的模組Requests-HTML # 認識適用大型爬蟲框架的Scrapy模組 在書籍內容,本書設計爬蟲程式探索下列相關網站,讀者可以由不同的網站主題,深入測試自己設計網路爬蟲的能力,以適應未來職場的需求。 # 金融資訊 # 股市數據 # 人力銀行 # 交友網站 # 維基網站 # 主流媒體網站 # 政府開放數據網站 # 社群服務網站 # PTT網站 # 電影網站 # 星座網站 # 小說網站 # 台灣高鐵 # 露天拍賣網站 # httpbin網站 # python.org網站 # github.com網站 # ipstack.com網站API實作 # Google API實作 # Facebook API實作 探索網站成功後,本書也說明下列如何下載或儲存不同資料格式的數據。 # CSV檔案格式 # JSON檔案格式 # XML、Pickle # Excel # SQLite資料庫 本書沿襲作者著作的特色,程式實例豐富,相信讀者只要遵循本書內容必定可以在最短時間精通Python網路爬蟲設計。

洪錦魁 一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家。 ■ DOS 時代他的代表作品是 IBM PC 組合語言、C、C++、Pascal、資料結構。 ■ Windows 時代他的代表作品是 Windows Programming 使用 C、Visual Basic。 ■ Internet 時代他的代表作品是網頁設計使用 HTML。 ■ 大數據時代他的代表作品是 R 語言邁向 Big Data 之路。 除了作品被翻譯為簡體中文、馬來西亞文外,2000 年作品更被翻譯為Mastering HTML 英文版行銷美國。 近年來作品則是在北京清華大學和台灣深智同步發行: 1:Java 入門邁向高手之路王者歸來 2:Python 入門邁向高手之路王者歸來 3:HTML5 + CSS3 王者歸來 4:R 語言邁向Big Data 之路 他的著作最大的特色是,所有程式語法會依特性分類,同時以實用的程式範例做解說,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。

Must Login
Must Login
Must Login
Must Login


Teackback URL: