登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

『繁體書』Python:網路爬蟲與資料分析入門實戰

書城自編碼: 3261748
分類: 繁體書 →台灣書
作者: 林俊瑋,林修博
國際書號(ISBN): 9789864343386
出版社: 博碩
出版日期: 2018-10-04
版次: 初版
頁數/字數: 256頁
書度/開本: 17x23cm

售價:NT$ 450

share:

** 我創建的書架 **
未登入.



新書推薦:
于胥斯原 乡族、风水与地方记忆
《 于胥斯原 乡族、风水与地方记忆 》

售價:NT$ 806.0
以经治国与汉代社会
《 以经治国与汉代社会 》

售價:NT$ 449.0
我真正想要什么?:智慧瑜伽答问/正念系列
《 我真正想要什么?:智慧瑜伽答问/正念系列 》

售價:NT$ 265.0
元朝理财记 从成吉思汗的崛起到元朝的衰亡
《 元朝理财记 从成吉思汗的崛起到元朝的衰亡 》

售價:NT$ 449.0
欧洲史:一本书历览欧洲数千年兴衰起伏,理解欧洲文明何以铸就今日世界
《 欧洲史:一本书历览欧洲数千年兴衰起伏,理解欧洲文明何以铸就今日世界 》

售價:NT$ 1520.0
趣学CCNA——路由与交换(第2版)
《 趣学CCNA——路由与交换(第2版) 》

售價:NT$ 458.0
世界航空地理(世界国别与区域地理研究丛书)
《 世界航空地理(世界国别与区域地理研究丛书) 》

售價:NT$ 1112.0
学术的中心:英法德美
《 学术的中心:英法德美 》

售價:NT$ 398.0

建議一齊購買:

+

NT$ 650
《 Python 技術者們:實踐!帶你一步一腳印由初學到精通 》
+

NT$ 880
《 Python資料分析 第二版 》
+

NT$ 450
《 練好機器學習的基本功:用Python進行基礎數學理論的實作 》
+

NT$ 480
《 Python初學特訓班(增訂版)(附250分鐘影音教學/範例程式) 》
+

NT$ 500
《 Python 自動化的樂趣:搞定重複瑣碎&單調無聊的工作 》
+

NT$ 620
《 Excel VBA 757個最強活用範例集-暢銷回饋版 》
內容簡介:
想自動化生活瑣事?想透過程式擷取網路上的公開資訊?學了Python卻不知道有什麼實際應用?正在尋找入門難度低且成就感高的Python專案?想知道網路爬蟲如何與資料分析結合?本書一次教給你!
本書適合閱讀的對象:
●對網路爬蟲程式或資料分析有興趣者
●想自動化生活瑣事(例如自動追蹤網站特價通知、節省資料收集的時間等),化被動資訊接收為主動
●Python新手或入門級讀者(知道何謂變數、if判斷式與迴圈,寫過一些小程式),想練習低門檻及高成就感的Python專案

本書特色:

●基於熱門線上課程與實體教學的學員迴響重新編寫及增補而成的實戰書籍
●以台灣讀者熟悉的網站為範例(PTT、Dcard、台灣證交所、蘋果日報網站、Yahoo奇摩電影、GoogleMapsAPI、IMDB電影資料庫等)的Python網路爬蟲程式教學
●由淺入深,以實務需求為導向,涵蓋爬蟲常用函式庫、資料儲存、文件編碼、表單及登入頁處理、爬蟲程式被封鎖的常見原因等經驗談
●全新的資料分析章節,包含三個爬蟲程式的經典應用:量化投資、影評情緒分析與商品特價通知
關於作者:

林俊瑋

熱門開源專案「PTT網路版爬蟲」作者。加州大學爾灣分校(UCIrvine)博士候選人,研究領域為軟體測試自動化,曾執行包含網頁及手機App爬蟲實作的多個研究專案,也曾在國外知名研究機構及國內軟體公司實習,並有多年政府資訊部門工作與介接政府開放資料經驗。
林修博
台灣大學電子工程研究所畢業,目前任職於軟體公司擔任全端工程師。有多年爬蟲撰寫經驗,並且將其商用化。
目錄
Chapter01環境設定與網頁爬蟲初探
1-1環境設定及套件安裝:Anaconda
1-2使用IDE:PyCharm
1-3使用JupyterNotebook
1-4網頁文件解構與網頁爬蟲初探
Chapter02BeautifulSoup講解與網頁解構
2-1不要重複造輪子:寫爬蟲之前
2-2BeautifulSoup重要功能find,find_all,.text,.stripped_strings
2-3網頁結構巡覽(parent,children,siblings)
2-4正規表示式RegularExpression
Chapter03網頁爬蟲範例實戰
3-1PTT八卦板今日熱門文章
3-2Yahoo奇摩電影本週新片
3-3兩大報當日焦點新聞
3-4Google搜尋股價資訊
3-5Dcard今日熱門文章
Chapter04使用API
4-1API簡介
4-2PTT八卦板眾來源分佈ipstack.com
4-3IMDBAPI
4-4GoogleMapsAPIsGoogleGeocodingPlacesAPI
4-5DcardAPI
Chapter05資料儲存
5-1儲存圖片與多媒體檔案
5-2儲存資料到CSV檔
5-3儲存資料到資料庫SQLite
Chapter06不同編碼與類型的文件
6-1非UTF-8編碼的文件
6-2XML文件
Chapter07進階爬蟲議題
7-1處理表單及登入頁:台灣高鐵時刻查詢
7-2處理表單及登入頁:Yelp登入
7-3使用WebDriver:台銀法拍屋資訊查詢
7-4爬蟲程式經驗談:被封鎖的常見原因、常用Header欄位、網站隱藏欄位、使用代理伺服器
Chapter08資料分析實戰
8-1台股每日盤後資訊爬蟲及策略回測(量化投資)
8-2電影評論情緒分析(中文自然語言處理與機器學習)
8-3商品特價Gmail通知:Costco商品網頁
附表本書範例目標網站列表
附錄A在Mac安裝Anaconda開發環境
附錄BPython爬蟲框架Scrapy入門教學
B-1Scrapy環境安裝
B-2簡易部落格爬蟲
B-3Scrapy系統架構
B-4博客來網路書店爬蟲

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.