Python面向物件基礎:編碼細節和注意事項!
在前面,我用了3篇文章解釋python的面向物件:
- 面向物件:從程式碼複用開始
- 面向物件:設定物件屬性
- 類和物件的名稱空間
本篇是第4篇,用一個完整的示例來解釋面向物件的一些細節。
例子的模型是父類Employe和子類Manager,從類的定義開始,一步步完善直到類變得完整。
定義Person類
現在,假設Employe類有3個屬性:名字name、職稱job和月薪水pay。
定義這個類:
class Employe(): def __init__(self, name, job=None, pay=0): self.name = name self.job = job self.pay = pay
這裡為 __init__() 的job引數提供了預設值:None,表示這個員工目前沒有職稱。對於沒有職稱的人,pay當然也應該是0。這樣建立Employe物件的時候,可以只給引數name。
例如:
if __name__ == "__main__": longshuai = Employe("Ma Longshuai") xiaofang = Employe("Gao Xiaofang", job="accountant", pay=15000)
上面的if判斷表示這個py檔案如果當作可執行程式而不是模組,則執行if內的語句,如果是以模組的方式匯入這個檔案,則if內的語句不執行。這種用法在測試模組程式碼的時候非常方便。
執行該py檔案,得到結果:
<__main__.Employe object at 0x01321690> <__main__.Employe object at 0x01321610>
新增方法
每個Employe物件的name屬性由姓、名組成,中間空格分隔,現在想取出每個物件的名。對於普通的 姓 名 字串,可以使用字串工具的split()函式來處理。
例如:
>>> name = "Ma Longshuai" >>> name.split()[-1] 'Longshuai'
於是可以在longshuai和xiaofang這兩個Employe物件上:
print(longshuai.name.split()[-1]) print(xiaofang.name.split()[-1])
結果:
Longshuai Xiaofang
與之類似的,如果想要為員工按10%加薪水,可以在每個Employe物件上:
xiaofang.pay *= 1.1 print(xiaofang.pay)
無論是擷取name的名部分,還是加薪水的操作,都是Employe共用的,每個員工都可以這樣來操作。所以,更合理的方式是將它們定義為類的方法,以便後續的程式碼複用:
class Employe(): def __init__(self, name, job=None, pay=0): self.name = name self.job = job self.pay = pay def lastName(self): return self.name.split()[-1] def giveRaise(self, percent): self.pay = int(self.pay * (1 + percent)) if __name__ == "__main__": longshuai = Employe("Ma Longshuai") xiaofang = Employe("Gao Xiaofang", job="accountant", pay=15000) print(longshuai.lastName()) print(xiaofang.lastName()) xiaofang.giveRaise(0.10) print(xiaofang.pay)
上面的giveRaise()方法中使用了int()進行型別轉換,因為整數乘以一個小數,返回結果會是一個小數(例如 15000 * 0.1 = 1500.0 )。這裡我們不想要這個小數,所以使用int()轉換成整數。
定義子類並重寫父類方法
現在定義Employe的子類Manager。
class Manager(Employe):
Manager的薪水計算方式是在原有薪水上再加一個獎金白分別,所以要重寫父類的giveRaise()方法。有兩種方式可以重寫:
- 完全否定父類方法
- 在父類方法的基礎上進行擴充套件
雖然有了父類的方法,拷貝修改很方便,但第一種重寫方式仍然是不合理的。合理的方式是採用第二種。
下面是第一種方式重寫:
class Manager(Employe): def giveRaise(self, percent, bonus=0.10): self.pay = int(self.pay * (1 + percent + bonus))
這種重寫方式邏輯很簡單,但是完全否定了父類的giveRaise()方法,完完全全地重新定義了自己的方法。這種方式不合理,因為如果修改了Employe中的giveRaise()計算方法,Manager中的giveRaise()方法也要修改。
下面是第二種在父類方法基礎上擴充套件,這是合理的重寫方式。
class Manager(Employe): def giveRaise(self, percent, bonus=0.10): Employe.giveRaise(self, percent + bonus)
第二種方式是在自己的giveRaise()方法中呼叫父類的giveRaise()方法。這樣的的好處是在需要修改薪水計算方式時,要麼只需修改Employe中的,要麼只需修改Manager中的,不會同時修改多個。
另外注意,上面是通過硬編碼的類名Employe來呼叫父類方法的,python中沒有其它方法,只能通過這種硬編碼的方式。但好在並沒有任何影響。因為呼叫時明確指定了第一個引數為self,而self代表的是物件自身,所以邏輯上仍然是對本物件的屬性self.pay進行修改。
測試下:
if __name__ == "__main__": wugui = Manager("Wu Xiaogui", "mgr", 15000) wugui.giveRaise(0.1, 0.1) print(wugui.pay)
一般在重寫方法的時候,只要允許,就應該選擇在父類基礎上進行擴充套件重寫。如果真的需要定義完全不同的方法,可以不要重寫,而是在子類中定義新的方法。當然,如果真的有需求要重寫,且又要否定父類方法,那也沒辦法,不過這種情況基本上都是因為在類的設計上不合理。
定製子類構造方法
對於子類Manager,每次建立物件的時候其實沒有必要去傳遞一個引數"job=mgr"的引數,因為這是這個子類自然具備的。於是,在構造Manager物件的時候,可以讓它自動設定"job=mgr"。
所以,在Manager類中重寫 __init__() 。既然涉及到了重寫,就有兩種方式:(1)完全否定父類方法,(2)在父類方法上擴充套件。無論何時,總應當選第二種。
以下是Manager類的定義:
class Manager(Employe): def __init__(self, name, pay): Employe.__init__(self, name, "mgr", pay) def giveRaise(self, percent, bonus=0.10): Employe.giveRaise(self, percent + bonus)
現在構造Manager物件的時候,只需給name和pay就可以:
if __name__ == "__main__": wugui = Manager("Wu Xiaogui", 15000) wugui.giveRaise(0.1, 0.1) print(wugui.pay)
子類必須重寫方法
有些父類中的方法可能會要求子類必須重寫。
本文的這個示例不好解釋這一點。下面簡單用父類Animal、子類Horse、子類Sheep、子類Cow來說明,這個例子來源於我寫的面向物件相關的第一篇文章:從程式碼複用開始。
現在要為動物定義叫聲speak()方法,方法的作用是輸出"誰發出了什麼聲音"。看程式碼即可理解:
class Animal: def __init__(self, name): self.name = name def speak(self): print(self.name + " speak " + self.sound()) def sound(self): raise NotImplementedError("you must override this method")
在這段程式碼中,speak()方法呼叫了sound()方法,但Animal類中的sound()方法卻明確丟擲異常"你必須自己實現這個方法"。
為什麼呢?因為每種動物發出的叫聲不同,而這裡又是通過方法來返回叫聲的,不是通過屬性來表示叫聲的,所以每個子類必須定義自己的叫聲。如果子類不定義sound(),子類物件呼叫 self.sound() 就會搜尋到父類Animal的名稱空間上,而父類的sound()會丟擲錯誤。
現在在子類中重寫sound(),但是Cow不重寫。
class Horse(Animal): def sound(self): return "neigh" class Sheep(Animal): def sound(self): return "baaaah" class Cow(Animal): pass
測試:
h = Horse("horseA") h.speak() s = Sheep("sheepA") s.speak() c = Cow("cowA") c.speak()
結果正如預期,h.speak()和s.speak()都正常輸出,但c.speak()會丟擲"you must override this method"的異常。
再考慮一下,如果父類中不定義sound()會如何?同樣會在c.speak()時丟擲錯誤。雖然都會終止程式,但是這已經脫離了面向物件的程式碼複用原則:對於物件公有的屬性,都應該抽取到類中,對於類所公有的屬性,都應該抽取到父類中。sound()顯然是每種動物都應該具備的屬性,要麼定義為子類變數,要麼通過類方法來返回。
之前也提到過,如果可以,儘量不要定義類變數,因為這破壞了面向物件的封裝原則,打開了"黑匣子"。所以最合理的方法,還是每個子類重寫父類的sound(),且父類中的sound()強制要求子類重寫。
運算子過載
如果用print()去輸出我們自定義的類的物件,比如Employe物件,得到的都是一個元資料資訊,比如包括型別和地址。
例如:
print(longshuai) print(xiaofang) ## 結果: <__main__.Employe object at 0x01321690> <__main__.Employe object at 0x01321610>
我們可以自定義print()如何輸出物件,只需定義類的 __str__() 方法即可。只要在類中自定義了這個方法,print()輸出物件的時候,就會自動呼叫這個 __str__() 取得返回值,並將返回值輸出。
例如,在輸出每個Employe物件的時候,都輸出它的name、job、pay,並以一種自定義的格式輸出。
class Employe(): def __init__(self, name, job=None, pay=0): self.name = name self.job = job self.pay = pay def lastName(self): return self.name.split()[-1] def giveRaise(self, percent): self.pay = int(self.pay * (1 + percent)) ## 過載__str__()方法 def __str__(self): return "[Employe: %s, %s, %s]" % (self.name, self.job, self.pay)
現在再print()輸出物件,將得到這個物件的資訊,而不是這個物件的元資料:
print(longshuai) print(xiaofang) ## 結果: [Employe: Ma Longshuai, None, 0] [Employe: Gao Xiaofang, accountant, 15000]
實際上,print()總是會呼叫物件的 __str__() ,如果類中沒有定義 __str__() ,就會查詢父類中的 __str__() 。這裡Employe的父類是祖先類object,它正好有一個 __str__() :
>>> object.__dict__["__str__"] <slot wrapper '__str__' of 'object' objects>
換句話說,當Employe中定義了 __str__() ,就意味著過載了父類object的 __str__() 方法。而這個方法正好是被print()呼叫的,於是將這種行為稱之為" 運算子過載 "。
可能從print()上感受不到為什麼是運算子,換一個例子就很好理解了。 __add__() 是決定加號 + 運算模式的,比如 3 + 2 之所以是5,是因為int類中定義了 __add__() 。
>>> a=3 >>> type(a) <class 'int'> >>> int.__dict__["__add__"] <slot wrapper '__add__' of 'int' objects>
這使得每次做數值加法運算的時候,都會呼叫這個 __add__() 來決定如何做加法:
實際上在類中定義建構函式 __init__() 也是運算子過載,它在每次建立物件的時候被呼叫。
還有很多運算子可以過載,加減乘除、字串串聯、大小比較等等和運算子有關、無關的都可以被過載。在後面,會專門用一篇文章來介紹運算子過載。進群:960410445 即可獲取數十套PDF!
序列化
物件也是一種資料結構,資料結構可以進行序列化。通過將物件序列化,可以實現物件的本地永續性儲存,還可以通過網路套接字傳送給網路對端,然後通過反序列化可以還原得到完全相同的原始資料。
序列化非本文內容,此處僅是介紹一下該功能,後面我會寫幾篇專門介紹python序列化的文章