Python安全筆記（一）

阿新 • • 發佈：2018-12-30

BeatifulSoup用法

1、BeatifulSoup安裝

BeatifulSoup是常用的Python的擴充套件包，用於對web檔案格式化顯示、按條件查詢等功能。它是bs4包中的一部分，使用前需安裝bs4：

pip install bs4

並在python程式中匯入：

from bs4 import BeatifulSoup

2、常用用法：

2.1 對下載的網頁按格式顯示：

r = requests.get("www.baidu.com")
cont = r.content
soup = BeautifulSoup(doc, "html.parser")
print(BeatifulSoup.prettify()) //將html檔案按縮排格式顯示

2.2 對網頁按標籤、按屬性、按內容檢索
例子：

html_doc = '''
<html><head><title>The Dormouse's Story</title></head>
<body>
<p class="title"><b>The Dormouse's Story</b></p>
<asdasd>hello world</asdasd>
<p class="story">Once upon a time,there were three little sisters,and their names were
<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a>and
<a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>

<p class="story"> ...</p>
'''

2.2.1 檢索出所有p標籤的內容
1）打印出所有名稱為“P”的標籤，結果可以按列表的方式使用，比如使用index

    soup=BeautifulSoup(html_doc, "html.parser")
    print(soup.find_all("p"))

2）打印出所有名稱為“P”的標籤中的第一個

       print(soup.find_all("p")[0]  
    結果為：
        <p class="title"><b>The Dormouse's Story</b></p>

3）分行打印出所有名稱為“a”的標籤，

     for i in soup.find_all(“a”):
          print(i)     
結果為
       <a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>
       <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>
       <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>

4）也可以結合正則表示式用，以下返回名稱以p開頭的標籤：

      soup.find_all(re.compile("^p")

5）可以根據內容檢索，以下打印出包含id=link2的標籤：

print(soup.find_all(id="link2"))
結果為：
     [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]

打印出包含"id=link2"的標籤中的href元素：

print(soup.find_all(id="link2")[0]["href"])
結果為：
       http://example.com/lacie

6）可以根據標籤中含的多個元素聯合查詢，以下打印出“id=link2”且“class="sister"的標籤（注意class要寫成class_）：

print(soup.find_all(id="link2",class_="sister"))
結果是：
     [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]

Python安全筆記（一）

BeatifulSoup用法 1、BeatifulSoup安裝 BeatifulSoup是常用的Python的擴充套件包，用於對web檔案格式化顯示、按條件查詢等功能。它是bs4包中的一部分，使用前需安裝bs4： pip install bs4 並在python程式中

Python 學習筆記（一）

pytho oat 變量情況 class 弱類型定義寫代碼基本上為什麽學習Python?因為Python 的用處太多了。本想學會一們語言就好好的維持下去，但是最近Python太火啦，什麽人工智能、網絡爬蟲的，耳濡目染的，心想多學習一些東西總是好的，於是就抽空學習

python學習筆記（一）

學習筆記關鍵參數引號出現大寫字母整除 mil 不能函數名以前學習過c/c++,在初次接觸python後有恨多類似的概念，最近開始接觸python，正在閱讀python簡明教程，遇到的python自己的語法特性。 python中的縮進代表python中的一個塊，

python基礎筆記（一）

val 變量下劃線 .py 字母 pass 變量名 del 交互 python解釋器執行python程序的過程：python3 C:\test.py 1.啟動python解釋器（內存中） 2.將C：\test.py 內容從硬盤讀入內存（這一步與文本編輯器是一樣的） 3.執

python學習筆記（一）續

余數必須 return 行緩沖 pyc 構造逆序返回 reverse 1、在交互式解釋器中，給變量賦值（字符串，數值等等）並通過輸入變量名顯示它們的值。再用 print 語句做同樣的事。區別在於：變量賦值是數值時沒有區別；當變量賦值是字符串時，通過變量名顯示它們的值的

python學習筆記（一）簡介

程序應用 shift 聖誕節其他 .exe 一點交互例如　　Python是著名的“龜叔”Guido van Rossum在1989年聖誕節期間，為了打發無聊的聖誕節而編寫的一個編程語言。　　優點： Python為我們提供了非常完善的基礎代碼庫 Python的代碼

Boost Python學習筆記（一）

enc dpkg 編譯工具 module 項目 href cloud etc DC 開發環境搭建下載源碼 boost_1_66_0.tar.gz 生成編譯工具 # tar axf boost_1_66_0.tar.gz # cd boost_1_66_0 # yum in

"Web Scraping with Python"筆記（一）

數據類型大小不存在所有者不能存在跟蹤技術背景 1. 合法性：抓取的數據用於個人使用，不存在問題；數據用於轉載，需註意抓取的數據類型。一般情況，抓取的真實數據（營業地址，電話清單等）允許轉載。而原創數據（比如意見和評論）受版權限制不能轉載。 2.

Python學習筆記（一）認識Python

一、Python的設計哲學優雅明確簡單二、Python的特點 Python是完全面向物件的語言函式、模組、數字、字串都是物件，在Python中一切皆物件完全hick繼承、過載、多重繼承支援過載運算子，也支援泛型設計

Python 學習筆記（一）[語法基礎]

資料型別數字整數（int，long）：記憶體決定長度，不支援自增（++）和自減（–）浮點數（float）：帶小數點的數，無窮小數會做精度處理布林（bool）：非空（None）非 0 → true，0 或空（None） → false 複數（com

廖雪峰Python教程筆記（一）

感謝廖老師精彩的Python教程，收益良多，感謝感謝！整理筆記，以備後續複習，第一部分一直到模組結束，整理如下，其中大量的單引號是有問題的，由於word直接打的，嫌麻煩，沒有都進行修正，請見諒 1、a = ‘XYZ’ 的過程是先在記憶體中建立一個’XYZ’字串，然後

Python學習筆記（一）——瀏覽器自動化測試工具Selenium

看了網友用Python通過影評來分析電影是好片還是爛片，自己也有了個想法想去分析下百度貼吧的帖子是精品帖子還是水帖子。目前正在熟悉工具的使用。會用到的庫：Selenium, pandas(資料模型)，jieba（分詞器），snownlp（情感分析），worldcloud（

python複習筆記（一）

當你用一種語言開始作真正的軟體開發時，你除了編寫程式碼外，還需要很多基本的已經寫好的現成的東西，來幫助你加快開發進度。高階程式語言通常都會提供一個比較完善的基礎程式碼庫，讓你能直接呼叫。Python就為我們提供了非常完善的基礎程式碼庫，覆蓋了網路、檔案、GUI、資料庫、文字等大量內容，被形象地稱作“內建電池

Python學習筆記（一）Python基礎

1.1 Python 簡介 Python是一門跨平臺、開源、免費的解釋型高階動態程式設計語音 Python支援偽編譯將原始碼轉換為位元組碼來優化程式提高執行速度和對原始碼進行編譯 Python支援使用py2exe、pyinstaller、cx_Freeze或其他類似工

Python爬蟲筆記（一）——基礎知識簡單整理

登陸時候的使用者名稱和密碼可以放在http的頭部也可以放在http的body部分。 HTTPS是否可以抓取由於https運用的加密策略是公開的，所以即使網站使用https加密仍然可以獲得資料，但是類似於微信這樣的app，它自己實現了一套加密演算法，想要抓取資料就變得

Python安全筆記（二）

“TypeError: write() argument must be str, not bytes”錯誤出現以上錯誤的程式碼： r = requests.get("https://www.baidu.com",verify=False) cont = r.content o =

python 學習筆記（一）—目錄檔案的操作

python對目錄檔案的操作是依靠os模組的。使用該模組需要匯入： import os 1. 得到當前的工作目錄： os.getcwd() 'e:\\python programs' 2. 改變當前的工作目錄 os.chdir(path) #示例：

Python複習筆記（一）高階變數型別

目標列表元組字典字串公共方法變數高階 01. 列表 02. 元組 03. 字典 04. 字串 1）判斷型別 - 9 2) 查詢和替換 - 7 3) 大小寫轉換

Python爬蟲筆記（一）

目錄 Python爬蟲筆記一、爬蟲簡介 1、爬蟲是什麼？ 2、爬蟲的技術價值二、簡單的爬蟲架構 1、簡單爬蟲架構 2、簡單爬蟲的執行流程三、爬蟲架構分析 1、URL管理器 2、網頁下載器 3、網頁解析器 Python爬蟲筆記一、爬蟲簡介

openCV Python 學習筆記（一）影象的基本操作

Python的版本是Python3.6，openCV使用的是cv2 例圖一、影象的讀取、顯示和儲存讀取影象：cv2.imread(filename,flags) 該函式有兩個引數，第一個引數是圖

Python安全筆記（一）

BeatifulSoup用法

1、BeatifulSoup安裝

2、常用用法：

相關推薦