面對網路上每天排山倒海的訊息來源,根本不知道如何「自動、且系統化」的把這些資料蒐集下來,轉化成有價值的資訊,此時,你需要的就是爬蟲的技術!
課程介紹🌟
網路爬蟲,就是幫你自動把目標網站中的特定欄位蒐集下來,再整理成易於分析的格式,讓你有機會透過大量資料的蒐集,看到別人只關注單一零散訊息看不到的黃金!
網路爬蟲最常被使用的情境就是訊息不斷更新,而且稍縱即逝的電商產業、社群網站、還有金融網站,若能透過爬蟲時時監控價格、關注社群變化,便能掌握別人不知道的訊息,享有資訊不對稱的商機!
課程目標📖
課程的設計重點不是在教程式語言,而是幫你歸類出實際撰寫爬蟲時,可能遇到的資料格式以及阻擋手法。讓你知道,碰到甚麼網站,用甚麼方式把資料爬下來,而且用你喜歡的語言!
尤其,後續的分析方法也會影響到語言的選擇,或許你已經知道如何用 Python 做文字分析,那你上完課就可以用 Python 爬新聞網站;或許你喜歡先用 R 做資料觀察,那就用 R 把資料抓下來處理。爬蟲基礎的所有技巧我們都會教,同時給您兩種語言選擇,一定跟市面上不一樣。
課程大綱
🎯 程式基礎
🎯 爬蟲入門介紹
🎯 模仿遊戲-學會模仿你的瀏覽器
🎯 資料躲貓貓-資料藏在哪裡
🎯 網路爬蟲架構
🎯 資料整理方法
🎯 解鎖更多爬蟲技巧
適合授課對象
✔ 工作上需要蒐集資料者
✔ 有志成為資料分析師者
✔ 行銷經營、趨勢潮流追隨者
✔ 資訊提供商
✔ 對市場資訊敏感者
✔ 小散戶、認真的賭徒們
技能GET
⭐ 學會 R & Python 環境設定、資料分析基礎,以及爬蟲套件的使用
⭐ 能夠藉由觀察網站連線技巧判斷不同網站的阻擋方式並予以破解
⭐ 可以把抓下來的資料運用不同方式整理成易於分析的格式
⭐ 了解如何使用第三方 API 工具抓取想要的資料
課程時間📝
15小時48分鐘的線上課程
課程費用💰
NT$ 4,600