python進階（lxml的用法）

阿新 • • 發佈：2018-11-19

本節處理的檔案如下，檔名為：webhtml.html

<!DOCTYPE html>
<html>
<head>
	<title>漏斗圖</title>
	<script type="text/javascript" src="./echarts.js"></script>
</head>
<body>
	<div id="main" style="width: 800px;height: 600px">1111</div>
	<article id="main2" style="width: 800px;height: 600px">
		<span>
			logo
			<a href="http://www.baidu.com" style="font-size:15px;">taobao</a>
			<b>hahaha<em>3333</em></b>
			<a href="www.baidu.com">taobao2</a>
		</span>
	</article>
	<div id="last">last... ...</div>
	<div class="one">11111111111111111111111</div>
	<div class="one two" name="sec" data-foo="value">22222222222222222222222</div>
	<div id="left">
		<a href="http://www.taobao1.com">11111</a>
		<a href="http://www.taobao2.com">333333</a>
		<a href="http://www.taobao3.com">4444</a>
		<a href="http://www.taobao4.com">55555</a>
	</div>
	<script type="text/javascript">
		var myChart=echarts.init(document.getElementById('main'))
		var option={
			title:{
				text:"你的附近哪家自助貨架比較多",
				subtext:"資料地區:上海",
			},
			tooltip:{
				// trigger:'item'   //not axis
			},
			legend:{
				orient:"vertical",
				left:"left",
				top:"center",
				data:['猩便利','小u貨架','友寶','峰小櫃','小e微店']
				//data中的名字和series 中data中的name相等
			},
			toolbox:{
				// show:true,
				feature:{              //feature  不是 true
					// mark:{
					// 	show:true
					// },
					dataView:{
						show:true,
						readOnly:true
					},
					restore:{
						show:true
					},
					saveAsImage:{
						show:true
					}
				}
			},
			series:[{
				name:"貨架詳情",
				type:"funnel",
				left:"30%",
				max:100,
				min:0,
				data:[
					{
						value:100,
						name:"猩便利",
					},{
						value:80,
						name:"友寶"
					},{
						value:60,
						name:"峰小櫃"
					},{
						name:"小u貨架",
						value:20
					},{
						name:"小e微店",
						value:40
					}
				]
			}]
		}
		myChart.setOption(option)
 
	</script>
</body>
</html>

一、lxml的基本知識：

①xpath路徑可以放在瀏覽器中檢視。

②string得到結果是str，/text()得到的結果是list。

③ /@屬性名得到的結果也是list。

1、lxml物件的建立：

（1）通過resquests響應內容：

from lxml import etree
import requests
                              響應內容
responce1 = requests.get('https://www.baidu.com').content.decode('utf-8')
html_lxml = etree.HTML(responce1)    建立lxml物件

（2）開啟本地檔案：

2、將lxml物件序列化：

result = etree.tostring(html_lxml,pretty_print=True,encoding='utf-8').decode('utf-8')
print(result)

二、xpath語法：

1、選取節點：

2、謂語：

3、xpath萬用字元：

4、例項：

5、xpath運算子：

其中或（|）比較常用。

< >= 等運算子用於標籤內容比較，如例：

6、xpath獲得標籤屬性和標籤內容：

獲得是內容，而不是標籤本身。

① /text() 獲取第一層節點的所有內容，不包括子節點，且結果是list。
② /@屬性名：獲得標籤的屬性，結果也是 list。
③ string 獲得所有節點的內容，包括子節點，結果是 str 。

7、例項：

python進階（lxml的用法）

本節處理的檔案如下，檔名為：webhtml.html <!DOCTYPE html> <html> <head> <

python進階（time模組）

一、時間戳與元組時間： import time # 時間戳與元組時間時間戳轉化為元組時間 print(time.time()) # 1542594772.0971806

python進階（異常處理）

一、異常處理基本知識： 1、程式碼異常的特性： python程式一旦發生錯誤，就從錯誤的位置停下來了，不會執行後面的內容。二、異常處理語句（try

Python自動化開發課堂筆記【Day08】 - Python進階（面向對象的高級用法，網絡編程）

sta 自然 log 報錯面向 read urn total 析構函數面向對象的高級用法 1. __str__ 只要執行打印對象的操作，就會觸發該對象類中的__str__方法（也就是對象的綁定方法）它是一種默認的方法，默認的打印輸出為<__main__.Foo o

python進階（爬蟲 BeautifulSoup用法）

操作演示檔案：檔名： webhtml.html <!DOCTYPE html> <html> <head> <title>漏斗圖</title> <script type="

Python自動化開發課堂筆記【Day06】 - Python進階（類）

擴展性程序 lex 類名人物優點 ini 參數 self. 類與對象面向過程的程序設計：　　優點：極大的降低了程序的復雜度　　缺點：一套流水線或者流程就是用來解決一個問題，生產汽水的流水線無法生產汽車，即使能，也是得大改，改一個組件，牽一發而動全身面向對象的程序設計

Python進階（3）_進程與線程中的lock（互斥鎖、遞歸鎖、信號量）

fun 我們 bsp 控制支持發生 class 線程數據操作 1、同步鎖 (Lock) 當各個線程需要訪問一個公共資源時，會出現數據紊亂例如： 1 import threading,time 2 def sub(): 3 global num

Python基礎知識進階（五---2）----程序基本結構、簡單分支、異常處理、三大實例分析、基本循環結構、通用循環構造方法、死循環嵌套循環、布爾表達式

方法算法嵌套構造方法決策樹輸入繼續實例控制上一篇隨筆寫的內容有點多了，決定分成兩節，不然自己看的時候也頭疼。三者最大實例: 分支結構可以改變程序的控制流，算法不再是單調的一步步順序執行。　　　　假設：以找出三個數字中最大者的程序設計為例。　　　　　

python之函數的進階（2-1）

加載 gif pre span 進行文件 chang ret 16px 動態參數：一,*args：args是元祖，它包含了所有的位置參數。 1,第一種形參中只含*args。 def func(*args): print(*args,type(args)) f

Python之面向對象的進階（3-13）

姓名一次 ttr ini 構造 IT args pri attr 構造方法：在面向對象中，創建一個對象的過程（new一個對象） #new一個對象 # object.__new__() # class A: # def __init__(self): #

python進階（10）——單例/異常

單例設計模式：前人留下的對某一特定問題的成熟的解決方案（套路）單例設計模式：類建立的物件，在系統中只有唯一一個例項，每一次執行類名（）返回的物件，記憶體地址是相同的 __new__方法：使用類名（）建立物件時，python直譯器執行兩步： 1首先呼叫__new__內建方法為

python進階（2）——re模組：正則表示式1

實驗結果輸出文件，包括多項引數（大約幾百個），想把所有的loss value對應的值提取出來，畫出曲線圖，這就需要用到正則表示式，基於此，開始學習正則表示式。正則表示式：可匹配文字片段的模式萬用字元：句點.(.ython與jpython與python與 ython都匹配，但不與ython

python進階（1）——模組：開箱即用

一.開箱即用之前總結的將模組作為函式匯入程式中：https://mp.csdn.net/postedit/80904368 二.查明模組包含什麼：dir（） dir(copy) 使用help獲取幫助 help(copy) help(

python進階（3）——檔案

開啟檔案：(非當前目錄需指定完整路徑） f = open('lcctry.py') 讀取和寫入： f = open('lcctry.txt','w') f.write('hello, world') Out[130]: 12 f.close() 讀取時的r可以不寫，呼叫open時

python進階（2）——re模組：正則表示式2

re.split 根據模式來分割字串 import re text='a, b,,,,c d' print(re.split('[, ]+', text)) #re.split:以空格和字串分割字元 re.findall 返回列表，包含所有與給定模式匹配的子串 import re

python進階（資料分析numpy庫二）

2、ndarray陣列的切片：（1）陣列切片的基本知識各個維度上單獨切片，用 “，” 隔開，用 “：”表示該維度所有的值。

python進階（資料分析numpy庫一）

numpy——基礎，以矩陣為基礎的數學計算模組，純數學儲存和處理大型矩陣。這個是很基礎的擴充套件，其餘的擴充套件都是以此為基礎。 scipy——數值計算庫,在numPy庫的基礎上增加了眾多的數學、科學以及工程計算中常用的庫函式。方便、易於使用、專為科學和工程設計的Py

python進階（爬蟲正則表示式）

一、正則表示式的基本知識： 1、正則表示式是一種高度專業化的程式語言，並不是只在python語言中存在，而python需要插入 re 模組才能使用正則表示式。 2、正則表示式只能處理字串，用於模糊匹配。 3、正則表示式的區間是閉區間。二、正則表示式組成： &nb

學習Python就業有哪些方向，附加視訊教程（python3從入門到進階（面向物件），實戰（爬蟲，飛機遊戲，GUI實戰）視訊教程）

python3從入門到進階（面向物件），實戰（爬蟲，飛機遊戲，GUI實戰）視訊教程連結：http://pan.baidu.com/s/1kUG0pLH密碼：加以下微信為好友，朋友圈獲取。入門與基礎面向物件程式設計爬蟲實戰GUI實戰飛機遊戲Python是一門面向物件的程式語言，

python 進階（1）

python進階（1）參考慕課python教程1.函數語言程式設計1.1 函數語言程式設計簡介a.python不是純函數語言程式設計b.python中變數可以指向函式，函式名就是指向函式的變數。c.高階函式: 可以接受函式作為引數的函式，def add(x,y,f):ret

python進階（lxml的用法）

一、lxml的基本知識：

1、lxml物件的建立：

2、將lxml物件序列化：

二、xpath語法：

1、選取節點：

2、謂語：

3、xpath萬用字元：

4、例項：

5、xpath運算子：

6、xpath獲得標籤屬性和標籤內容：

7、例項：

相關推薦