1. 程式人生 > >python知識系統表-1.變數和資料型別

python知識系統表-1.變數和資料型別

1.變數和資料型別

1.1 資料型別

1.1.1 整數

Python可處理任意大小的整數,包括負整數,在Python程式中,整數的表示方法和數學上的寫法一模一樣,例如:1,100,-8080,0等等。
計算機由於使用二進位制,所以,有時候用十六進位制表示整數比較方便,十六進位制用0x字首和0-9,a-f表示,例如:0xff00,0xa5b4c3d2等等。

1.1.2浮點數

小數,因為按科學記數法表示時,小數點位置是可變的,又稱浮點數。如1.23x10^9和12.3x10^8是相等的。浮點數可用數學寫法,如1.23,3.14,-9.01等等。但對於很大或很小的浮點數,就必須用科學計數法表示,把10用e替代,1.23x10^9就是1.23e9,或12.3e8,0.000012可寫成1.2e-5等等。
整數和浮點數在計算機內部儲存的方式是不同的,整數運算永遠是精確的(除法難道也是精確的?是的!),而浮點數運算則可能會有四捨五入的誤差。

1.1.3字串

字串是以''或""括起來的任意文字,如'abc',"xyz"等等。注意,''或""本身只是一種表示方式,不是字串的一部分,因此,字串'abc'只有a,b,c這3個字元。

1.1.4布林值

布林值和布林代數的表示完全一致,一個布林值只有True、False兩種值,要麼是True,要麼是False,在Python中,可直接用True、False表示布林值(注意大小寫),也可通過布林運算計算出來。
布林值可用and、or和not運算。
and 與運算,只有所有都為True,and運算結果才是True。
or  或運算,只要其中有一個為True,or運算結果就是True。
not 非運算,它是一個單目運算子,把True變成False,False變成True。

1.1.5空值

空值是Python裡一個特殊的值,用None表示。None不能理解為0,因為0是有意義的,而None是一個特殊的空值。
此外,Python還提供列表、字典等多種資料型別,還允許建立自定義資料型別。

1.2 print語句

print語句可向螢幕上輸出指定的文字。
print語句可跟上多個字串,用逗號“,”隔開,會連成一串輸出,print會依次列印每個字串,遇到逗號“,”會輸出一個空格。
print可列印整數,或計算結果。

1.3 註釋

Python的註釋以 # 開頭,後面的文字直到行尾都算註釋。
# 這一行全部都是註釋...
print 'hello'     # 這也是註釋

註釋還有一個巧妙的用途,就是一些程式碼我們不想執行,但又不想刪除,就可以用註釋暫時遮蔽掉:
# 暫時不想執行下面一行程式碼:
# print 'hello, python.'

1.4 什麼是變數

在計算機程式中,變數不僅可是數字,還可是任意資料型別。
在Python程式中,變數是用一個變數名錶示,變數名必須是大小寫英文、數字和下劃線(_)的組合,且不能用數字開頭,比如:
a = 1          #變數a是一個整數。
t_007 = 'T007' #變數t_007是一個字串。
在Python中,等號=是賦值語句,可把任意資料型別賦值給變數,同一個變數可反覆賦值,而且可是不同型別的變數,例如:
a = 123     # a是整數
print a
a = 'hello'   # a變為字串
print a
這種變數本身型別不固定的語言稱之為動態語言,與之對應的是靜態語言。
靜態語言在定義變數時必須指定變數型別,如果賦值的時候型別不匹配,就會報錯。例如Java是靜態語言,賦值語句如下:
int a = 123;        # a是整數型別變數
a = "mooc";         # 錯誤:不能把字串賦給整型變數
和靜態語言相比,動態語言更靈活,就是這個原因。

請不要把賦值語句的等號等同於數學的等號。比如下面的程式碼:
x = 10
x = x + 2
如果從數學上理解x = x + 2那無論如何是不成立的,在程式中,賦值語句先計算右側的表示式x + 2,得到結果12,再賦給變數x。由於x之前的值是10,重新賦值後,x的值變成12。

最後,理解變數在計算機記憶體中的表示也非常重要。當我們寫:a = 'ABC'時,Python直譯器幹了兩件事情:
1. 在記憶體中建立了一個'ABC'的字串;
2. 在記憶體中建立了一個名為a的變數,並把它指向'ABC'。
也可把一個變數a賦值給另一個變數b,這個操作實際上是把變數b指向變數a所指向的資料,例如下面的程式碼:
a = 'ABC'
b = a
a = 'XYZ'
print b
最後一行打印出變數b的內容到底是'ABC'呢還是'XYZ'?如果從數學意義上理解,就會錯誤地得出b和a相同,也應該是'XYZ',但實際上b的值是'ABC',讓我們一行一行地執行程式碼,就可以看到到底發生了什麼事:
執行a = 'ABC',直譯器建立了字串  'ABC'和變數 a,並把a指向 'ABC':
執行b = a,直譯器建立了變數 b,並把b指向 a 指向的字串'ABC':
執行a = 'XYZ',直譯器建立了字串'XYZ',並把a的指向改為'XYZ',但b並沒有更改:
所以,最後列印變數b的結果自然是'ABC'了。

1.5 定義字串

字串可用''或""括起來表示。
如果字串本身包含'可用" "括起來表示,如I'm OK可表示為:
"I'm OK"
類似的,如果字串包含",我們就可以用' '括起來表示:
'Learn "Python" in imooc'
如果字串既包含'又包含"怎麼辦?
這時,就需要對字串的某些特殊字元進行“轉義”,Python字串用\進行轉義。
要表示字串 Bob said "I'm OK"。
在它前面插入一個\表示這是一個普通字元,不代表字串的起始,因此,這個字串又可表示為:
'Bob said \"I\'m OK\".'
注意:轉義字元\不計入字串的內容中。
常用的轉義字元還有:
\n 表示換行
\t 表示一個製表符
\\ 表示\字元本身

1.6 raw單行字串與’’’多行字串

如果一個字串包含很多需要轉義的字元,對每一個字元都進行轉義會很麻煩。為避免這種情況,可在字串前面加個字首r,表示這是一個raw字串,裡面的字元就不需要轉義。例如:

但是r'...'表示法不能表示多行字串,也不能表示包含'和 "的字串。
要表示多行字串,可以用'''多行串'''表示:
'''Line 1
Line 2
Line 3'''
上面這個字串的表示方法和下面的是完全一樣的:
'Line 1\nLine 2\nLine 3'
還可在多行字串前面新增r,把這個多行字串也變成一個raw字串:
r'''Python is created by "Guido".
It is free and easy to learn.
Let's start learn Python in imooc!'''

1.7 Unicode字串

字串還有一個編碼問題。
因為計算機只能處理數字,如果要處理文字,就必須先把文字轉換為數字才能處理。最早的計算機在設計時採用8個位元(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進位制11111111=十進位制255),0 255被用來表示大小寫英文字母、數字和一些符號,這個編碼表被稱為ASCII編碼,比如大寫字母 A 的編碼是65,小寫字母 z 的編碼是122。
如果要表示中文,顯然一個位元組是不夠的,至少需要兩個位元組,而且還不能和ASCII編碼衝突,所以,中國製定了GB2312編碼,用來把中文編進去。
類似的,日文和韓文等其他語言也有這個問題。為了統一所有文字的編碼,Unicode應運而生。Unicode把所有語言都統一到一套編碼裡,這樣就不會再有亂碼問題了。
Unicode通常用兩個位元組表示一個字元,原有的英文編碼從單位元組變成雙位元組,只需要把高位元組全部填為0就可以。
因為Python的誕生比Unicode標準釋出的時間還要早,所以最早的Python只支援ASCII編碼,普通的字串'ABC'在Python內部都是ASCII編碼的。
Python在後來添加了對Unicode的支援,以Unicode編碼的字串用u'...'表示,比如:

注意: 不加 u ,中文有時候可能不正常顯示。
Unicode字串除了多了一個u之外,與普通字串沒啥區別,轉義字元和多行表示法仍然有效,如
轉義有效:
u'中文\n日文\n韓文'
多行有效:
u'''第一行
第二行'''
raw+多行:
ur'''Python的Unicode字串支援"中文",
"日文",
"韓文"等多種語言'''
如果中文字串在Python環境下遇到 UnicodeDecodeError,這是因為.py檔案儲存的格式有問題。可以在第一行添加註釋
# -*coding: utf-8 -*-
或
# coding=utf-8
目的是告訴Python直譯器,用UTF-8編碼讀取原始碼。然後用UTF-8格式儲存。

1.8 整數和浮點數

Python支援對整數和浮點數直接進行四則混合運算,運算規則和數學上的四則運算規則完全一致。
基本運算:
1 + 2 + 3   # ==> 6
4 * 5 - 6   # ==> 14
7.5 / 8 + 2.1   # ==> 3.0375
使用括號可以提升優先順序,這和數學運算完全一致,注意只能使用小括號,但是括號可巢狀很多層:
(1 + 2) * 3    # ==> 9
(2.2 + 3.3) / (1.5 * (9 - 0.3))    # ==> 0.42145593869731807
和數學運算不同的地方是,Python的整數運算結果仍然是整數,浮點數運算結果仍然是浮點數:
1 + 2       # ==> 整數 3
1.0 + 2.0    # ==> 浮點數 3.0
但是整數和浮點數混合運算的結果是浮點數:
1 + 2.0    # ==> 浮點數 3.0
為什麼要區分整數運算和浮點數運算呢?這是因為整數運算的結果永遠是精確的,而浮點數運算的結果不一定精確,因為計算機記憶體再大,也無法精確表示出無限迴圈小數,比如 0.1 換成二進位制表示就是無限迴圈小數。
那整數的除法運算遇到除不盡的時候,結果難道不是浮點數嗎?我們來試一下:
11 / 4    # ==> 2
令人驚訝的是,Python的整數除法,即使除不盡,結果仍然是整數,餘數直接被扔掉。不過,Python提供了一個求餘的運算 % 可以計算餘數:
11 % 4    # ==> 3
如果我們要計算11/ 4的精確結果,按照“整數和浮點數混合運算的結果是浮點數”的法則,把兩個數中的一個變成浮點數再運算就沒問題了:
11.0 / 4    # ==> 2.75

1.9 布林型別

Python支援布林型別的資料,布林型別只有True和False兩種值,但是布林型別有以下幾種運算:(與一假則假、或一真則真,非真即假、非假即真)
與運算:只有兩個布林值都為True時,計算結果才為True。
True and True    # ==> True
True and False    # ==> False
False and True    # ==> False
False and False    # ==> False
或運算:只要有一個布林值為True,計算結果就是True。
True or True   # ==> True
True or False   # ==> True
False or True   # ==> True
False or False   # ==> False
非運算:把True變為False,或者把False變為True:
not True   # ==> False
not False   # ==> True
布林運算在計算機中用來做條件判斷,根據計算結果為True或者False,計算機可以自動執行不同的後續程式碼。
在Python中,布林型別還可以與其他資料型別做and、or和not運算,請看下面的程式碼:
a = True
print a and 'a=T' or 'a=F'
計算結果不是布林型別,而是字串'a=T',這是為什麼呢?
因為Python把0、空字串''和None看成 False,其他數值和非空字串都看成 True,所以:
True and 'a=T' 計算結果是 'a=T'
繼續計算 'a=T' or 'a=F' 計算結果還是 'a=T'
要解釋上述結果,又涉及到 and 和 or 運算的一條重要法則:短路計算。
1. 在計算a and b時,如果a是False,則根據與運演算法則,整個結果必定為False,因此返回a;如果a是True,則整個計算結果必定取決於 b,因此返回b。
2. 在計算a or b時,如果a是True,則根據或運演算法則,整個計算結果必定為True,因此返回a;如果a是False,則整個計算結果必定取決於 b,因此返回 b。
所以Python直譯器在做布林運算時,只要能提前確定計算結果,它就不會往後算了,直接返回結果。