1. 程式人生 > >Python爬蟲入門 | 3 爬蟲必備Python知識

Python爬蟲入門 | 3 爬蟲必備Python知識

Python Python入門 Pyth

這是一個適用於小白的Python爬蟲免費教學課程,只有7節,讓零基礎的你初步了解爬蟲,跟著課程內容能自己爬取資源。看著文章,打開電腦動手實踐,平均45分鐘就能學完一節,如果你願意,今天內你就可以邁入爬蟲的大門啦~

好啦,正式開始我們的第三節課《爬蟲必備Python知識》吧!啦啦哩啦啦,都看黑板~

  1. 字符串(string)

1.1 輸入字符串

編寫字符串時,既可以用單引號( ‘ )也可以用雙引號( " ):
技術分享圖片
對於帶有換行符的多行字符串,可以使用三重引號(即 ‘‘‘ 或 """ ):
技術分享圖片
1.2 訪問字符串中的值

Python訪問子字符串,可以使用方括號來截取字符串,如下實例:

技術分享圖片
以上實例執行結果:
技術分享圖片
1.3 字符串的修改

Python中已存在的字符串本身不可以改變:
技術分享圖片
報錯:
技術分享圖片
但可以對已存在的字符串進行修改,然後賦值給另一個變量:
技術分享圖片
以上實例執行結果:
技術分享圖片
1.4 Python對象轉為字符串

許多Python對象都可以用str函數轉換為字符串:
技術分享圖片
以上實例執行結果:
技術分享圖片
1.5 字符串當做序列類型處理

由於字符串其實是一串字符序列,因此可以被當做某種序列類型(如列表、元組等)進行處理:
技術分享圖片
以上實例執行結果:
技術分享圖片
1.6 Python轉義字符

當需要在字符中使用特殊字符時,Python用反斜杠()轉義字符,如下表:
技術分享圖片
1.7 字符串運算符

下表實例變量 a 值為字符串 "Hello",b 變量值為 "Python":

技術分享圖片
1.8 字符串常用方法
技術分享圖片

  1. 元組(tuple)

2.1 元組的創建

元組(tuple)是一種一維的、定長的、不可變的Python對象序列。元組創建很簡單,只需要在括號中添加元素,並使用逗號隔開即可:
技術分享圖片
創建空元組:
技術分享圖片
元組中只包含一個元素時,需要在元素後面添加逗號:
技術分享圖片
通過調用tuple,任何序列或叠代器都可以被轉化為元組:
技術分享圖片
結果為:
技術分享圖片
2.2 訪問元組

元組可以使用下標索引來訪問元組中的值,如下實例:
技術分享圖片
以上實例輸出結果:
技術分享圖片
2.3 修改元組

元組中的元素值是不允許修改的,但我們可以對元組進行連接組合,如下實例:
技術分享圖片
結果為:
技術分享圖片
2.4 元組運算符

與字符串一樣,元組之間可以使用 + 號和 * 號進行運算。這就意味著他們可以組合和復制,運算後會生成一個新的元組。

技術分享圖片
2.5 元組索引與截取

因為元組也是一個序列,所以我們可以訪問元組中的指定位置的元素,也可以截取索引中的一段元素,如下所示:

元組:
技術分享圖片
技術分享圖片
2.6 元組內置函數
技術分享圖片

  1. 列表(list)

3.1 列表的創建

跟元組相比,列表(list)是變長的,而且其內容也是可以修改的。它可以通過方括號([ ])或者list函數進行定義:
技術分享圖片
結果為:
技術分享圖片
對已經定義的列表中的內容進行修改:
技術分享圖片
結果為:
技術分享圖片
3.2 訪問列表中的值

使用下標索引來訪問列表中的值,同樣也可以使用方括號的形式截取字符,如下所示:
技術分享圖片
結果為:
技術分享圖片
3.3 更新列表

可以對列表的數據項進行修改或更新,也可以使用append()方法來添加列表項,如下所示:
技術分享圖片
結果為:
技術分享圖片
3.4 刪除列表元素

可以使用 del 語句來刪除列表的的元素,如下實例:
技術分享圖片
結果為:
技術分享圖片
3.5 判斷列表中是否存在某個值

通過 in 關鍵字,可以判斷列表中是否含有某個值:
技術分享圖片
結果為:
技術分享圖片
3.6 列表腳本操作符

列表對 + 和 的操作符與字符串相似。+ 號用於組合列表, 號用於重復列表。
技術分享圖片
3.7 列表截取

Python的列表截取與字符串操作類型,如下所示:
技術分享圖片
3.8 列表內置函數&方法
技術分享圖片

  1. 字典(dict)

4.1 字典的創建

字典是另一種可變容器模型,且可存儲任意類型對象。
字典的每個鍵值(key=>value)對用冒號( : )分割,每個對之間用逗號( , )分割,整個字典包括在花括號( {} )中 ,格式如下所示:
技術分享圖片
鍵必須是唯一的,但值則不必。值可以取任何數據類型,但鍵必須是不可變的,如字符串、數字或元組。
一個簡單的字典實例:
技術分享圖片
也可如此創建字典:
技術分享圖片
4.2 訪問字典裏的值

把相應的鍵放入方括弧,如下實例:
技術分享圖片
以上實例輸出結果:
技術分享圖片
如果用字典裏沒有的鍵訪問數據,會輸出錯誤如下:
技術分享圖片
以上實例輸出結果:
技術分享圖片
4.3 修改字典

向字典添加新內容的方法是增加新的鍵/值對,修改或刪除已有鍵/值對如下實例:
技術分享圖片
以上實例輸出結果:

技術分享圖片
4.4 刪除字典元素

del 能刪單一的元素也能刪除字典,clear 可以清空字典。del刪除字典和clear清空字典的區別在於,前者是將字典整個刪除了,字典不復存在,而後者是清空字典中的內容,留下了一個“空殼子”。

技術分享圖片
4.5 字典內置函數&方法

技術分享圖片

  1. 條件控制

5.1 條件控制流程

Python條件語句是通過一條或多條語句的執行結果(True或者False)來決定執行的代碼塊。可以通過下圖來簡單了解條件語句的執行過程:
技術分享圖片
5.2 if 語句

Python中if語句的一般形式如下所示:
技術分享圖片
如果"condition_1"為True,將執行 "statement_block_1"塊語句
如果"condition_1"為False,將判斷 "condition_2"
如果"condition_2"為True,將執行 "statement_block_2"塊語句
如果"condition_2"為False,將執行"statement_block_3"塊語句
註意:
1.每個條件後面要使用冒號(:),表示接下來是滿足條件後要執行的語句塊。
2.使用縮進來劃分語句塊,相同縮進數的語句在一起組成一個語句塊。
3.在Python中沒有switch – case語句。
舉一個 if 實例:
技術分享圖片
執行程序,輸入狗狗的年齡:
技術分享圖片
程序運行結果:
技術分享圖片
輸入enter後退出程序。

5.3 常用操作運算符
技術分享圖片
5.4 if 嵌套

在嵌套 if 語句中,可以把 if...elif...else結構放在另外一個 if...elif...else 結構中。
技術分享圖片
舉一個 if 嵌套實例:
技術分享圖片
輸入語句及結果如下:
技術分享圖片

  1. 循環語句

6.1 循環語句流程

Python中的循環語句有 for 和 while。Python循環語句的控制結構圖如下所示:
技術分享圖片
6.2 while 循環

Python中while語句的一般形式:
技術分享圖片
同樣需要註意冒號和縮進。以下實例使用了 while 來計算 1 到 100 的總和:
技術分享圖片
執行結果如下:
技術分享圖片
執行以上腳本,輸出結果如下:
技術分享圖片
6.3 for 語句

for 循環的一般格式如下:
技術分享圖片
for 實例中使用 break 語句,break 語句用於跳出當前循環體:
技術分享圖片
結果如下:
技術分享圖片
除了在 for 和 while 的循環體中使用 break 語句來跳出循環,我們還可以使用 continue 語句,continue語句被用來告訴Python跳過當前循環塊中的剩余語句,然後繼續進行下一輪循環。
代碼塊如下:
技術分享圖片
結果如下:
技術分享圖片
好了,這節課就到這裏!

技術分享圖片

Python爬蟲入門 | 3 爬蟲必備Python知識