這是一個會爬台股即時資訊的爬蟲,此外也
- Python2 or Python3
pip install requests
python crawl.py
stocknumber.csv
雖然99%
python genTodayVolumeFigure.py
9914
250.00: 39
250.50: 123
251.00: 8
251.50: 58
252.00: 122
252.50: 87
253.00: 198
253.50: 91
254.00: 38
254.50: 103
255.00: 29
255.50: 9
256.00: 1
(99.77974%)
python cleanTodayDuplicateData.py
刪除
git pull
python genCrontabScript.py
data
20150303
),XXXX.csv
XXXX
就是
檔案內每一行為一個抓取一次下即刻的資訊,
ex. 13:30:00,43.25,616,6690,43.25_43.30_43.35_43.40_43.45_,216_285_90_274_201_,43.20_43.15_43.10_43.05_43.00_,3_1_23_91_424_
下 載 台灣 證券 交易 所 -當日 沖 銷交易 標的 及統計 最新 清 單 可能 要 更改 getCurrentList.py
的 檔案名稱 python getCurrentList.py
得 到 stocknumber.csv
/ctrl-reference
),
- getChartOhlcStatis
- getDailyRangeOnlyKD
- getDailyRangeWithMA
- getOhlc
- getShowChart
- getStock
- getStockInfo
- getStockNames
- resetSession
其中 getStockInfo
http://mis.twse.com.tw/stock/api/getStockInfo.jsp?ex_ch=STOCK_NUMBER&_=CURRENT_TIME
- STOCK_NUMBER
是 該隻股 票 的 種類 和 號 碼,ex.tse_1101.tw_20150624
,也可以用|
一 次 query 很多筆 股 票 資料 。ex.tse_1101.tw_20150624|tse_1102.tw_20150624|tse_1103.tw_20150624
- CURRENT_TIME
是 當 下 的 epoch time,單位 是 毫秒
- msgArray
- queryTime
- rtcode
- referer
- rtmessage
- userDelay
其主msgArray
- c:
股 票 代 號 ,ex.1101
- ch:Channel,ex.
1101.tw
- ex:
上市 或 上 櫃 ,ex.tse
- n:
股 票 名稱 ,ex.台 泥 - nf:
似 乎為全 名 ,ex.台灣 水泥 股 份有限 公司
- z:
最近 成 交價,ex.42.85
- tv:Temporal Volume,
當 盤 成 交量,ex.1600
- v:Volume,
當日 累計 成 交量,ex.11608
- a:
最 佳 五 檔賣出 價格 ,ex.42.85_42.90_42.95_43.00_43.05_
- f:
最 價 五 檔賣出 數量 ,ex.83_158_277_571_233_
- b:
最 佳 五 檔買入 價格 ,ex.42.80_42.75_42.70_42.65_42.60_
- g:
最 佳 五 檔買入 數量 ,ex.10_28_10_2_184_
- tlong:
資料 時間 ,ex.1424755800000
- t:
資料 時間 ,ex.13:30:00
- ip:
好 像 是 一 個 flag,3是 暫緩收 盤 股 票 , 2是 趨漲, 1是 趨跌, ex.0
- d:
今日日 期 ,ex.20150224
- h:
今日 最高 ,ex.42.90
- l:
今日 最低 ,ex.42.35
- o:
開 盤 價 ,ex.42.40
- u:
漲 停 點 ,ex.45.10
- w:跌停
點 ,ex.39.20
- y:
昨 收 ,ex.42.15
- i: ex.
01
- it: ex.
12
- p: ex.
0
- tk0: ex.
1101.tw_tse_20150224_B_9999310874
- tk1: ex.
1101.tw_tse_20150224_B_9999293545
- Gitter.im
azx754@gmail.com
2017/02/15