TShopping

 找回密碼
 註冊
搜索
查看: 235|回復: 0

[轉帖] 超簡單台股每日爬蟲教學

[複製鏈接]
發表於 2021-7-8 15:09:45 | 顯示全部樓層 |閱讀模式
 
Push to Facebook Push to Plurk  
今天教大家如何下載今日的股價,並從中篩選本益比較低的股票,重點是超簡單,只要15行以內就可以辦到!以後這個blog會偶爾釋放一些程式片段,讓大家組裝成一個功能健全的回測+當日選股的架構。
大家最終最終會學到:
  • 如何爬取每日資訊
  • 如何爬取財報
  • 利用上述資料來篩選股票
  • 觀察篩選後的股票在歷史回測中是否能獲利
  • 每日計算當天獲利與明天操作
只要長期追蹤這個blog,當我某天心血來潮就會放上一些code,讓大家能夠自行學習並拼裝成自己的系統,以下是我的系統的截圖:

台股 爬蟲教學

台股 爬蟲教學

可以看到我的系統內每天都有數個程式交易策略在運行,選股策略每天會公布隔天的操作方式,也可以利用這個介面編寫回測,並驗證策略的效果。磁力回測是我們之前黑客松比賽用的名字,其實我們是台大黑客松第一名得獎團隊,後來又於中信金控黑客松得到第一名,才開始了量化回測之路,現在由於大家比較忙,目前只剩我還在使用這套系統而已XDD。
這套系統非常完善,我們編寫了幾套策略在上面,獲利還算OK,當然我不可能直接把這套系統公布出來,畢竟這是大家一起做的心血,然而有一些簡單卻重要的功能,我會在這個blog上面分享給大家。只要持續關注本blog,最後大家可以拼裝出自己的系統!
那就廢話不多說,來看看如何使用 python 爬取當天大盤,首先,我們得先安裝 python 的 package:
假如懶得安裝的話,也可以用雲端colab直接執行程式,來看看程式怎麼運作的喔!
https://colab.research.google.com/drive/1MgGot14B_nynU4nf4SeJF2UbphubXO8o
然後就可以開始了,首先抓取台股的資料表:

crawler
  1. import requests
  2. from io import StringIO
  3. import pandas as pd
  4. import numpy as np

  5. datestr = '20180131'

  6. # 下載股價
  7. r = requests.post('https://www.twse.com.tw/exchangeReport/MI_INDEX?response=csv&date=' + datestr + '&type=ALL')

  8. # 整理資料,變成表格
  9. df = pd.read_csv(StringIO(r.text.replace("=", "")),
  10.             header=["證券代號" in l for l in r.text.split("\n")].index(True)-1)

  11. # 整理一些字串:
  12. df = df.apply(lambda s: pd.to_numeric(s.astype(str).str.replace(",", "").replace("+", "1").replace("-", "-1"), errors='coerce'))

  13. # 顯示出來
  14. df.head()
複製代碼

基本上這個 code 可以直接複製貼上就可以用了!我們可以把df印出來:

台股 爬蟲教學

台股 爬蟲教學

可以看到我們有了所有上市的股票,當天所有的資料!

接下來就是選股時間,我們想要選擇 本益比 < 15 的所有股票:

select stocks
  1. df[pd.to_numeric(df['本益比'], errors='coerce') < 15]
複製代碼

台股 爬蟲教學

台股 爬蟲教學

搭拉!是不是發現選股好簡單!
我們之後還會有更多的教學,讓大家不只是選取本益比,還有更多更多的財報數據喔!
但是有個問題,以上的範例只是爬取一天的股價,要是我想要爬很多的的要怎麼辦呢?
可以參考
時間序列實做這篇文章
將所有的股價整理成時間序列喔!


 

臉書網友討論
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則



Archiver|手機版|小黑屋|免責聲明|TShopping

GMT+8, 2021-9-23 01:12 , Processed in 0.192576 second(s), 24 queries .

本論壇言論純屬發表者個人意見,與 TShopping綜合論壇 立場無關 如有意見侵犯了您的權益 請寫信聯絡我們。

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表