數據獲取的幾種方法

阿新 • • 發佈：2018-11-10

str string lar tags use int 簽名 params proxy

方法一：正則表達式

import re
import urllib2
＃不需要代理的
res = urllib2.urlopen(url).read()
#需要代理使用這個
ueser-agent = ‘user‘
headers ={‘User-agent‘:ueser-agent}
request = urllib2.Request(url,headers = headers)
opener = urllib2.build_opener()
 proxy_params = {urlparse.urlparse(url).scheme:proxy}
opener.add_heandler(urllib2.ProxyHandler(proxy_params))
res  
= opener.open(request).read()
print(res)
#Regular是需要匹配數據的正則表達式
print(re.findall(Regular,res))

方法二：Beautiful Soup

安裝：

　　pip install beautifulsoup4

import re
import urllib2
from bs4 import BeautifulSoup
＃不需要代理的
res = urllib2.urlopen(url).read()
#需要代理使用這個
ueser-agent = ‘user‘
headers ={‘User-agent‘:ueser-agent}
request  
= urllib2.Request(url,headers = headers)
opener = urllib2.build_opener()
 proxy_params = {urlparse.urlparse(url).scheme:proxy}
opener.add_heandler(urllib2.ProxyHandler(proxy_params))
res = opener.open(request).read()
print(res)

soup = BeautifulSoup(res,‘html-parser‘)
fixed_html = soup.prettity()
print 
(fixed_html)
#查找標簽對應的數據
#tag標簽名,如‘ul‘，attr標簽屬性及屬性值組成的鍵值對，數據類型為字典，如：{‘class‘:‘country‘}
#查找單個標簽
tagData = soup.find(tag,attrs=attr)
#查找同名的標簽集
tagsData = soup.find_all(tag)

方發三：Lxml

安裝

　　pip install lxml

import re
import urllib2
import lxml
#不需要代理的
res = urllib2.urlopen(url).read()
#需要代理使用這個
ueser-agent = ‘user‘
headers ={‘User-agent‘:ueser-agent}
request = urllib2.Request(url,headers = headers)
opener = urllib2.build_opener()
 proxy_params = {urlparse.urlparse(url).scheme:proxy}
opener.add_heandler(urllib2.ProxyHandler(proxy_params))
res = opener.open(request).read()
print(res)

tree = lxml.html.fromstring(res)
td = tree.cssselect(‘tr#place>td.area‘)[0]
area = td.text_content()
print(area)

數據獲取的幾種方法

前端往後端發送數據的幾種方法

jquery 創建 url地址 -type res sage div oid null 先來談談XmlHttpRequest對象 XmlHttpRequest對象的主要方法： a. void open(String method,String url,Boolen a

html向後端提交數據的幾種方法

客戶內容 form表單 orm 實現不用完整 RM 表單提交（未寫完）一 . 刷新頁面　　1. form表單提交　　　　GET/POST 二. 局部刷新（不刷新頁面）　　1. Ajax 狀態碼： 0 - (未初始化)還沒有調用send()方法 1 - (載入

Java中創建數組的幾種方法

java false 三種數組下標 [1] [] 判斷 color str Java中創建數組的幾種方法 public static void main(String[] args) { //創建數組的第一種方法 int[] arr=new int[6]; int

使用 Hive裝載數據的幾種方式

rom art lec install 查詢語句如果 mode lena 重寫裝載數據 1、以LOAD的方式裝載數據 LOAD DATA [LOCAL] INPATH ‘filepath‘ [OVERWRITE] INTO TABLE tablename [PARTIT

【巨坑】springmvc 輸出json格式數據的幾種方式！

mapping cep process 添加 exc 文件中 != style find 最近公司項目需要發布一些數據服務，從設計到實現兩天就弄完了，心中竊喜之。結果臨近部署時突然發現。。。。。服務輸出的JSON 數據中 date 類型數據輸出格式要麽是時間戳，要麽

php創建數組的幾種方法

如果 ron 自動 php 字符數字 coder 所有 hellip 第1種格式 $數組名稱 = array(‘值’, ‘值’, ‘值’,……); 此種格式沒有指定數組

SpringMVC中controller返回json數據的兩種方法

rac new enter req imp 工具 response 返回 basepath SpringMVC中controller返回json數據的兩種方法 1.jsp的ajax請求： function getJson(){ $.ajax({ t

Python抓取數據的幾種方式

cnblogs 方式 edit api lencod nco financial 取數 .org import urllib.requestresponse = urllib.request.urlopen(‘http://python.org/‘)html = res

[數據結構] 幾種排序算法

記錄新的 post span 原來 .... 排序 eight 開始　　插入排序　　直接插入排序(Insertion Sort)的基本思想是：每次將一個待排序的元素，按其關鍵字大小插入到前面已經排好序的子序列中的適當位置，直到全部記錄插入完成為止。　　設數組為a

Form表單提交數據的幾種方式

顯示 text alt 成對 std ade pos word 變量一、submit提交在form標簽中添加Action(提交的地址)和method(post或get),且有一個submit按鈕（<input type=’submit’&

深入了解Entity Framework框架及訪問數據的幾種方式

指定 conn 視圖空白 list rac codefirst 代碼遷移配置文件但是一、前言 1、Entity Framework概要 Entity Framework是微軟以ADO.NET為基礎所發展出來的對象關系映射(O/R Mapping)解決方案。

Mysql導出數據的幾種方式

單個情況下正常的 com 展示 efm 工具 mys utf8 MySQL導出數據的目的有很多種，如數據庫備份、表結構導出、表數據導出、分析數據采取等。 Part1 select into outfile 先說最短小精悍的select into outfile, 這是小

前端mock數據的幾種方式

enter express add res ble 服務模擬 mongodb easymock 方式備註本地php服務架設直接輸出json 使用在線mock服務如easyMock、apizza、Rap1\2 , 可以遠程協作本地node服務：

Spring MVC中返回JSON數據的幾種方式

return res set 轉換 public servlet 兩種 dispatch ont 我們都知道Spring MVC 的Controller方法中默認可以返回ModeAndView 和String 類型，返回的這兩種類型數據是被DispatcherServlet

js--引用型別Array--2.數組合並幾種方法

根據第一部分的基礎知識，我們最容易想到的是concat、push、unshift 1.concat合併陣列 concat是生成一個新陣列，記憶體則是a和b的和 var a = [1,2,3], b = ["ab","cd","ef"],

MariaDB快速批量插入數據的幾種辦法

bsp 數量級存儲磁盤數量引擎創建索引 ron 通過前言當要向MariaDB中插入新的數據時，以下過程會影響插入所消耗的時間：(按時間消耗長短降序排序) 將數據sync到磁盤上(它是事務結束的一部分) 添加新的鍵值。索引越大，更新鍵值所消耗的時間就越

數據獲取的幾種方法

str string lar tags use int 簽名 params proxy 方法一：正則表達式 import re import urllib2 ＃不需要代理的 res = urllib2.urlopen(url).read() #需要代理使用這個 ueser

判斷JS數據類型的幾種方法

object sta 無效追溯是否執行都是 undefine 代碼原文轉自http://www.cnblogs.com/onepixel/p/5126046.html！說到數據類型，我們先說一下JavaScript 中常見的幾種數據類型：基本類型：string

關閉MySQL數據庫的幾種方法

cnblogs shutdown admin min 推薦 pwd port -s stop #1.使用mysqldadmin mysqladmin -uroot -p shutdown mysqladmin -u ${mysql_user} -p${mysql_pw

Spring3 MVC請求參數獲取的幾種方法

setup return 異常 pathvaria method let 方法 ces 解決一、 [email protected]/* */ @RequestMapping(value="user/{id}/{name}",method=Requ

數據獲取的幾種方法

相關推薦