Python 字串

字串是 Python 中最常用的資料型別。我們可以使用引號('或")來建立字串。

建立字串很簡單,只要為變數分配一個值即可。例如:

var1 = 'Hello World!'
var2 = "Python itread01"

Python訪問字串中的值

Python不支援單字元型別,單字元在 Python 中也是作為一個字串使用。

Python訪問子字串,可以使用方括號來擷取字串,如下例項:

例項(Python 2.0+)

#!/usr/bin/python var1 = 'Hello World!' var2 = "Python itread01" print "var1[0]: ", var1[0] print "var2[1:5]: ", var2[1:5]

以上例項執行結果:

var1[0]:  H
var2[1:5]:  ytho

Python字串更新

你可以對已存在的字串進行修改,並賦值給另一個變數,如下例項:

例項(Python 2.0+)

#!/usr/bin/python # -*- coding: UTF-8 -*- var1 = 'Hello World!' print "更新字串 :- ", var1[:6] + 'itread01!'

以上例項執行結果

更新字串 :-  Hello itread01!

Python轉義字元

在需要在字元中使用特殊字元時,python用反斜槓(\)轉義字元。如下表:

轉義字元描述
\(在行尾時) 續行符
\\ 反斜槓符號
\' 單引號
\" 雙引號
\a 響鈴
\b 退格(Backspace)
\e 轉義
\000
\n 換行
\v 縱向製表符
\t 橫向製表符
\r 回車
\f 換頁
\oyy 八進位制數,yy代表的字元,例如:\o12代表換行
\xyy 十六進位制數,yy代表的字元,例如:\x0a代表換行
\other 其它的字元以普通格式輸出

Python字串運算子

下表例項變數 a 值為字串 "Hello",b 變數值為 "Python":

操作符描述例項
+字串連線
>>>a + b 'HelloPython'
*重復輸出字串
>>>a * 2 'HelloHello'
[]通過索引獲取字串中字元
>>>a[1] 'e'
[ : ]擷取字串中的一部分
>>>a[1:4] 'ell'
in成員運算子 - 如果字串中包含給定的字元返回 True
>>>"H" in a True
not in 成員運算子 - 如果字串中不包含給定的字元返回 True
>>>"M" not in a True
r/R原始字串 - 原始字串:所有的字串都是直接按照字面的意思來使用,沒有轉義特殊或不能列印的字元。 原始字串除在字串的第一個引號前加上字母"r"(可以大小寫)以外,與普通字串有著幾乎完全相同的語法。
>>>print r'\n' \n >>> print R'\n' \n
%格式字串請看下一章節

例項(Python 2.0+)

#!/usr/bin/python # -*- coding: UTF-8 -*- a = "Hello" b = "Python" print "a + b 輸出結果:", a + b print "a * 2 輸出結果:", a * 2 print "a[1] 輸出結果:", a[1] print "a[1:4] 輸出結果:", a[1:4] if( "H" in a) : print "H 在變數 a 中" else : print "H 不在變數 a 中" if( "M" not in a) : print "M 不在變數 a 中" else : print "M 在變數 a 中" print r'\n' print R'\n'

以上程式執行結果為:

a + b 輸出結果: HelloPython
a * 2 輸出結果: HelloHello
a[1] 輸出結果: e
a[1:4] 輸出結果: ell
H 在變數 a 中
M 不在變數 a 中
\n
\n

Python 字串格式化

Python 支援格式化字串的輸出 。盡管這樣可能會用到非常復雜的表示式,但最基本的用法是將一個值插入到一個有字串格式符 %s 的字串中。

在 Python 中,字串格式化使用與 C 中 sprintf 函式一樣的語法。

如下例項:

#!/usr/bin/python

print "My name is %s and weight is %d kg!" % ('Zara', 21) 

以上例項輸出結果:

My name is Zara and weight is 21 kg!

python字串格式化符號:

    符   號 描述
      %c 格式化字元及其ASCII碼
      %s 格式化字串
      %d 格式化整數
      %u 格式化無符號整型
      %o 格式化無符號八進位制數
      %x 格式化無符號十六進位制數
      %X 格式化無符號十六進位制數(大寫)
      %f 格式化浮點數字,可指定小數點後的精度
      %e 用科學計數法格式化浮點數
      %E 作用同%e,用科學計數法格式化浮點數
      %g %f和%e的簡寫
      %G %f 和 %E 的簡寫
      %p 用十六進位制數格式化變數的地址

格式化操作符輔助指令:

符號功能
*定義寬度或者小數點精度
-用做左對齊
+在正數前面顯示加號( + )
<sp>在正數前面顯示空格
# 在八進位制數前面顯示零('0'),在十六進位制前面顯示'0x'或者'0X'(取決於用的是'x'還是'X')
0 顯示的數字前面填充'0'而不是預設的空格
% '%%'輸出一個單一的'%'
(var)對映變數(字典引數)
m.n. m 是顯示的最小總寬度,n 是小數點後的位數(如果可用的話)

Python2.6 開始,新增了一種格式化字串的函式 str.format(),它增強了字串格式化的功能。


Python三引號(triple quotes)

python中三引號可以將復雜的字串進行復制:

python三引號允許一個字串跨多行,字串中可以包含換行符、製表符以及其他特殊字元。

三引號的語法是一對連續的單引號或者雙引號(通常都是成對的用)。

 >>> hi = '''hi 
there'''
>>> hi   # repr()
'hi\nthere'
>>> print hi  # str()
hi 
there  

三引號讓程式設計師從引號和特殊字串的泥潭裡面解脫出來,自始至終保持一小塊字串的格式是所謂的WYSIWYG(所見即所得)格式的。

一個典型的用例是,當你需要一塊HTML或者SQL時,這時當用三引號標記,使用傳統的轉義字元體系將十分費神。

 errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=http://192.154.109.50/getitread01.php?url=https://www.itread01.com/python/Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
cursor.execute('''
CREATE TABLE users (  
login VARCHAR(8), 
uid INTEGER,
prid INTEGER)
''')

Unicode 字串

Python 中定義一個 Unicode 字串和定義一個普通字串一樣簡單:

>>> u'Hello World !'
u'Hello World !'

引號前小寫的"u"表示這裡建立的是一個 Unicode 字串。如果你想加入一個特殊字元,可以使用 Python 的 Unicode-Escape 編碼。如下例所示:

>>> u'Hello\u0020World !'
u'Hello World !'

被替換的 \u0020 標識表示在給定位置插入編碼值為 0x0020 的 Unicode 字元(空格符)。


python的字串內建函式

字串方法是從python1.6到2.0慢慢加進來的——它們也被加到了Jython中。

這些方法實現了string模組的大部分方法,如下表所示列出了目前字串內建支援的方法,所有的方法都包含了對Unicode的支援,有一些甚至是專門用於Unicode的。

方法 描述

string.capitalize()

把字串的第一個字元大寫

string.center(width)

返回一個原字串居中,並使用空格填充至長度 width 的新字串

string.count(str, beg=0, end=len(string))

返回 str 在 string 裡面出現的次數,如果 beg 或者 end 指定則返回指定範圍內 str 出現的次數

string.decode(encoding='UTF-8', errors='strict')

以 encoding 指定的編碼格式解碼 string,如果出錯預設報一個 ValueError 的 異 常 , 除非 errors 指 定 的 是 'ignore' 或 者'replace'

string.encode(encoding='UTF-8', errors='strict')

以 encoding 指定的編碼格式編碼 string,如果出錯預設報一個ValueError 的異常,除非 errors 指定的是'ignore'或者'replace'

string.endswith(obj, beg=0, end=len(string))

檢查字串是否以 obj 結束,如果beg 或者 end 指定則檢查指定的範圍內是否以 obj 結束,如果是,返回 True,否則返回 False.

string.expandtabs(tabsize=8)

把字串 string 中的 tab 符號轉為空格,tab 符號預設的空格數是 8。

string.find(str, beg=0, end=len(string))

檢測 str 是否包含在 string 中,如果 beg 和 end 指定範圍,則檢查是否包含在指定範圍內,如果是返回開始的索引值,否則返回-1

string.format()

格式化字串

string.index(str, beg=0, end=len(string))

跟find()方法一樣,只不過如果str不在 string中會報一個異常.

string.isalnum()

如果 string 至少有一個字元並且所有字元都是字母或數字則返

回 True,否則返回 False

string.isalpha()

如果 string 至少有一個字元並且所有字元都是字母則返回 True,

否則返回 False

string.isdecimal()

如果 string 只包含十進位制數字則返回 True 否則返回 False.

string.isdigit()

如果 string 只包含數字則返回 True 否則返回 False.

string.islower()

如果 string 中包含至少一個區分大小寫的字元,並且所有這些(區分大小寫的)字元都是小寫,則返回 True,否則返回 False

string.isnumeric()

如果 string 中只包含數字字元,則返回 True,否則返回 False

string.isspace()

如果 string 中只包含空格,則返回 True,否則返回 False.

string.istitle()

如果 string 是標題化的(見 title())則返回 True,否則返回 False

string.isupper()

如果 string 中包含至少一個區分大小寫的字元,並且所有這些(區分大小寫的)字元都是大寫,則返回 True,否則返回 False

string.join(seq)

以 string 作為分隔符,將 seq 中所有的元素(的字串表示)合併為一個新的字串

string.ljust(width)

返回一個原字串左對齊,並使用空格填充至長度 width 的新字串

string.lower()

轉換 string 中所有大寫字元為小寫.

string.lstrip()

截掉 string 左邊的空格

string.maketrans(intab, outtab])

maketrans() 方法用於建立字元對映的轉換表,對於接受兩個引數的最簡單的呼叫方式,第一個引數是字串,表示需要轉換的字元,第二個引數也是字串表示轉換的目標。

max(str)

返回字串 str 中最大的字母。

min(str)

返回字串 str 中最小的字母。

string.partition(str)

有點像 find()和 split()的結合體,從 str 出現的第一個位置起,把 字 符 串 string 分 成 一 個 3 元 素 的 元 組 (string_pre_str,str,string_post_str),如果 string 中不包含str 則 string_pre_str == string.

string.replace(str1, str2,  num=string.count(str1))

把 string 中的 str1 替換成 str2,如果 num 指定,則替換不超過 num 次.

string.rfind(str, beg=0,end=len(string) )

類似於 find()函式,不過是從右邊開始查詢.

string.rindex( str, beg=0,end=len(string))

類似於 index(),不過是從右邊開始.

string.rjust(width)

返回一個原字串右對齊,並使用空格填充至長度 width 的新字串

string.rpartition(str)

類似於 partition()函式,不過是從右邊開始查詢

string.rstrip()

刪除 string 字串末尾的空格.

string.split(str="", num=string.count(str))

以 str 為分隔符切片 string,如果 num 有指定值,則僅分隔 num+ 個子字串

string.splitlines([keepends])

按照行('\r', '\r\n', \n')分隔,返回一個包含各行作為元素的列表,如果引數 keepends 為 False,不包含換行符,如果為 True,則保留換行符。

string.startswith(obj, beg=0,end=len(string))

檢查字串是否是以 obj 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定範圍內檢查.

string.strip([obj])

在 string 上執行 lstrip()和 rstrip()

string.swapcase()

翻轉 string 中的大小寫

string.title()

返回"標題化"的 string,就是說所有單詞都是以大寫開始,其餘字母均為小寫(見 istitle())

string.translate(str, del="")

根據 str 給出的表(包含 256 個字元)轉換 string 的字元,

要過濾掉的字元放到 del 引數中

string.upper()

轉換 string 中的小寫字母為大寫

string.zfill(width)

返回長度為 width 的字串,原字串 string 右對齊,前面填充0