pythone 鉅亨網抓歷史資料
證交所一直擋,pythone 改成 sleep 5s 也沒用,多抓幾支就幾個小時,無奈只能改從其他網站抓了,從原本的檔案更改,鉅亨網好像沒有下載的選項,目前卡在要無法送出資料,麻煩各大大有空時指導下,感謝。
改成這樣, 開始跟結束日期格式是對了,不過無法送出查詢 {:4_161:}
給個證交所要下載的網頁畫面,我來試試 到底是要抓什麼?
各位大大
證交所是因為會擋,所以要改從鉅亨網抓歷史資料
證交所抓檔案原程式檔如附件,需要在 C:\stock 資料夾內才能執行
本帖最後由 阿俊 於 18-12-28 16:57 編輯
BeLikeCheetah 發表於 18-12-27 18:16
到底是要抓什麼?
BeLikeCheetah 大
要改成抓鉅亨網的個股歷史股價,一樓的附件不是完全的,4樓的附件才是原本抓 完整證交所資料用的,
不過目前抓證交所資料就算 sleep time 改成 5 秒,也是會攔 ip ,所以打算改抓鉅亨網的個股歷史收盤資料,
不過還不太會分析網站,所以目前改到一樓的檔案時遇到瓶頸...
阿俊 發表於 18-12-28 16:52
BeLikeCheetah 大
要改成抓鉅亨網的個股歷史股價,一樓的附件不是完全的,4樓的附件才是原本抓 完 ...
不能只抓盤後資料>每日收盤行情就好嗎? 裡面有所有股票的當日開高低收量 BeLikeCheetah 發表於 18-12-28 21:40
不能只抓盤後資料>每日收盤行情就好嗎? 裡面有所有股票的當日開高低收量 ...
BeLikeCheetah 大
如果是抓每日成交,需要每日抓一次,我沒有每天看股票,通常一星期整理一次看看有沒有啥超跌的股可以選
我只跑比較大波段,不常常殺進殺出的,資本沒那麼雄厚,心臟也沒那麼強。
再麻煩各位大大撥空幫忙看下,感恩
Hi 各位先進 :
近日終於有比較長的時間可以靜下來想想,並查詢網上的範例,終於有一點小小的進度。
目前已經完成可以將 鉅亨網的資料下載,並存成 CSV 檔 , 如照片1 。
但問題又來了,因為進入的日期都是往前預設一個月,如照片2。
但我想要先改成我要的日期再抓資料,
不知道版上的高手可以幫忙解惑一下嗎??
附上程式碼供各位參考 (檔案要放在 E:\Information\Investment 才能執行)
本帖最後由 Simon 於 19-1-20 13:08 編輯
阿俊 發表於 19-1-20 12:46
Hi 各位先進 :
近日終於有比較長的時間可以靜下來想想,並查詢網上的範例,終於有一點小小的進度。 ...
請參閱 https://tw.saowen.com/a/99ff3a498678981e901d989c1f1581c7f2d3ecaabf325a0f738dff685fe3ad9a
1.先取得該物件的名稱
2.設定該物件參數
3.執行查詢
Simon 發表於 19-1-20 13:06
請參閱 https://tw.saowen.com/a/99ff3a498678981e901d989c1f1581c7f2d3ecaabf325a0f738dff685fe3ad9a
1. ...
Dear simon 大:
看了下日期是沒有唯讀屬性,應該不需移除屬性,所以清空格式再輸入我要的資料日期
結果清空後,會變空白,無法代入我要的起始日,直接變成歷史最早資料日
driver.find_element_by_id('ctl00_ContentPlaceHolder1_startText').clear()
driver.find_element_by_id('ctl00_ContentPlaceHolder1_startText').send_keys(classSelectTextStart)
又或者使用 js 直接將數值改為我要的起始日,也是一樣變成從歷史最早資料開始
jsstart = "$('input').attr('value','classSelectTextStart')"
請問要從哪方面下手??
Simon 發表於 19-1-21 18:54
阿俊大您好,
因為PYTHON太久沒用了, 都忘光光了
所以立馬雙手奉上剛剛自己寫的C# 執行檔
Dear simon 大:
使用 C# 不會遇到證交所擋 IP 嗎??我使用 python 每隔 5秒 抓一次,
大概抓個 200 檔就被檔 ip 了。要再過 1~3 分鐘才能再抓,所以我才改抓鉅亨網 {:4_205:}
不然我也懶得改程式.....,不是專業人員改的很痛苦 {:4_154:}
本帖最後由 Simon 於 19-1-22 20:23 編輯
阿俊 發表於 19-1-21 21:43
Dear simon 大:
使用 C# 不會遇到證交所擋 IP 嗎??我使用 python 每隔 5秒 抓一次,
大概抓個 2 ...
剛剛測試一下。。。
更新300-500檔股票。。。IP沒有被檔阿。。。
阿俊大可以試試看。。。
程式會自動休息2.5 sec 。
請注意:
程式會在放到2019/01/30日前。。。之後就會失效。。。
Simon 發表於 19-1-22 20:07
剛剛測試一下。。。
更新300-500檔股票。。。IP沒有被檔阿。。。
阿俊大可以試試看。。。
Hi simon 大:
檔案我昨天已經下載了,也試了不會擋 IP 。
你可能誤解我的意思了,我是指一樣用程式 request 証交所,
証交所那邊應該不知道每個人是用什麼程式抓資料,所以應該是用 IP 跟時間過濾,
只要是密集蒐集就會擋個 3 分鐘,
而您的程式竟然沒有擋...... ,好像蠻神奇的。小弟還蠻想知道原因的 ^_^
還是您是用會員的身份登錄抓資料,所以才不會被擋啊??
本帖最後由 Simon 於 19-1-22 22:01 編輯
阿俊 發表於 19-1-22 21:33
Hi simon 大:
檔案我昨天已經下載了,也試了不會擋 IP 。
你可能誤解我的意思了,我是指一樣用程 ...
我沒有會員啦。。。只是用多執行緒去跑而已。。。
(其實我在程式裡面加上了AI。。。去阻擋證交所監控IP。。。你相信嗎?){:4_186:} 感覺一堆高手....可能還要再複習一下Python了
頁:
[1]
2