1. 程式人生 > >python爬取股票資料

python爬取股票資料

今天主要給大家介紹的是使用python爬取網易財經模組股票的歷史資料.先來介紹一下環境:

原始文件:http://mp.weixin.qq.com/s/18H_MYCKT3MMXM13WQCOqQ

1、版本:python2.7

2、使用beautisoup模組

以仙珺製藥(股票程式碼:002332)為例,首先開啟獲取歷史股票行情的網頁,網頁地址為:http://quotes.money.163.com/trade/lsjysj_002332.html?year=2017&season=1本文主要獲取從上市時間到目前為止所有的行情資料.網頁截圖為如下:

網頁原始碼如下:下面就是使用python爬取資料資訊

爬取資料為分為一下幾個步驟:

1、構造url地址 2、下載html網頁,主要是用urllib2庫
def down_load(url,try_times=2):
	req = urllib2.Request(url)
	try:
		response = urllib2.urlopen(req)
		html = response.read()
		return html
	except urllib2.URLError as e:
		print 'down error',e.reason
		html = None
		if try_times > 0 :
			if hasattr(e, 'code') and 500 <= e.code < 600:
				return download(url,try_times-1)

3、解析網頁,儲存檔案,解析網頁主要是用beautifulsoup.具體如下:
soup_pakge = BeautifulSoup(html)
	#解析html先解析表頭
	#print(HEADERS)
	soup_head=soup_pakge.findAll('table','table_bg001 border_box limit_sale')

爬取的資料結果如下:

獲取原始碼請關注公眾號(CPPguy),傳送:股票.就會接收到下載程式碼的連結和密碼.

原始文件:http://mp.weixin.qq.com/s/18H_MYCKT3MMXM13WQCOqQ