1. 程式人生 > >Python 爬蟲 爬取單個基因 表格資料的生物學功能 (urllib+正則表示式):

Python 爬蟲 爬取單個基因 表格資料的生物學功能 (urllib+正則表示式):

Python 爬蟲 爬取單個基因的生物學功能(urllib+正則表示式):

import re
import urllib
from urllib import request
url = 'https://www.ncbi.nlm.nih.gov/gene/?term=FUT1'   #  查詢FUT1基因的網址
response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')   #  對response  進行解碼
print(content)
print(type(content))
p =re.findall('<td>(.*?)</td>',content)     #  (.*?)為正則表示式的目標區域
print('FUT1:',p[0])