理解Python的雙下劃線命名(轉)
阿新 • • 發佈:2017-10-01
函數 python的函數 del 標準 開頭 變量名 cnblogs 通過 全局
正確的答案是:
A.__private()
B.public()
如果您已經猜對了,那麽可以不看我這篇博文了。如果你沒有猜對或者心裏有所疑問,那我的這篇博文正是為您所準備的。
一切由為什麽會輸出“A.__private()”開始。但要講清楚為什麽,我們就有必要了解一下Python的命名機制。
據 Python manual,變量名(標識符)是Python的一種原子元素。當變量名被綁定到一個對象的時候,變量名就指代這個對象,就像人類社會一樣,不是嗎?當變 量名出現在代碼塊中,那它就是本地變量;當變量名出現在模塊中,它就是全局變量。模塊相信大家都有很好的理解,但代碼塊可能讓人費解些。在這裏解釋一下:
代碼塊就是可作為可執行單元的一段Python程序文本;模塊、函數體和類定義都是代碼塊。不僅如此,每一個交互腳本命令也是一個代碼塊;一個腳本文件也是一個代碼塊;一個命令行腳本也是一個代碼塊。
接下來談談變量的可見性,我們引入一個範圍的概念。範圍就是變量名在代碼塊的可見性。 如果一個代碼塊裏定義本地變量,那範圍就包括這個代碼塊。如果變量定義在一個功能代碼塊裏,那範圍就擴展到這個功能塊裏的任一代碼塊,除非其中定義了同名 的另一變量。但定義在類中的變量的範圍被限定在類代碼塊,而不會擴展到方法代碼塊中。
迷蹤
據上節的理論,我們可以把代碼分為三個代碼塊:類A的定義、類B的定義和變量b的定義。根據類定義,我們知道代碼給類A定義了三個成員變量(Python的函數也是對象,所以成員方法稱為成員變量也行得通。);類B定義了兩個成員變量。這可以通過以下代碼驗證:
>>> print ‘\n‘.join(dir(A))
_A__private
__init__
public
>>> print ‘\n‘.join(dir(B))
_A__private
_B__private
__init__
public
咦,為什麽類A有個名為_A__private的 Attribute 呢?而且__private消失了!這就要談談Python的私有變量軋壓了。
探究
懂Python的朋友都知道Python把以兩個或以上下劃線字符開頭且沒有以兩個或以上下劃線結尾的變量當作私有變量。私有變量會在代碼生成之前被轉換為長格式(變為公有)。轉換機制是這樣的:在變量前端插入類名,再在前端加入一個下劃線字符。這就是所謂的私有變量軋壓(Private name mangling)。如類 A裏的__private標識符將被轉換為_A__private,這就是上一節出現_A__private和__private消失的原因了。
再講兩點題外話:
一是因為軋壓會使標識符變長,當超過255的時候,Python會切斷,要註意因此引起的命名沖突。
二是當類名全部以下劃線命名的時候,Python就不再執行軋壓。如:
>>> class ____(object):
def __init__(self):
self.__method()
def __method(self):
print ‘____.__method()‘
>>> print ‘\n‘.join(dir(____))
__class__
__delattr__
__dict__
__doc__
__getattribute__
__hash__
__init__
__method # 沒被軋壓
__module__
__new__
__reduce__
__reduce_ex__
__repr__
__setattr__
__str__
__weakref__
>>> obj = ____()
____.__method()
>>> obj.__method() # 可以外部調用
____.__method()
現在我們回過頭來看看為什麽會輸出“A.__private()”吧!
真相
相信現在聰明的讀者已經猜到答案了吧?如果你還沒有想到,我給你個提示:真相跟C語言裏的宏預處理差不多。
因為類A定義了一個私有成員函數(變量),所以在代碼生成之前先執行私有變量軋壓(註意到上一節標紅的那行字沒有?)。軋壓之後,類A的代碼就變成這樣了:
class A(object):
def __init__(self):
self._A__private() # 這行變了
self.public()
def _A__private(self): # 這行也變了
print ‘A.__private()‘
def public(self):
print ‘A.public()‘
是不是有點像C語言裏的宏展開啊?
因為在類B定義的時候沒有覆蓋__init__方法,所以調用的仍然是A.__init__,即執行了self._A__private(),自然輸出“A.__private()”了。
下面的兩段代碼可以增加說服力,增進理解:
>>> class C(A):
def __init__(self): # 重寫 __init__ ,不再調用 self._A__private
self.__private() # 這裏綁定的是 _C_private
self.public()
def __private(self):
print ‘C.__private()‘
def public(self):
print ‘C.public()‘
>>> c = C()
C.__private()
C.public()
############################
>>> class A(object):
def __init__(self):
self._A__private() # 調用一個沒有定義的函數, Python 會把它給我的
self.public()
def __private(self):
print ‘A.__private()‘
def public(self):
print ‘A.public()‘
>>>a = A()
A.__private()
A.public()
add by zhj:今天在學習SimpleHTTPServer的源代碼時,看到了Python標準庫SocketServer模塊中有個BaseServer類,該類的__init__方法定義如下
def __init__(self, server_address, RequestHandlerClass): """Constructor. May be extended, do not override.""" self.server_address = server_address self.RequestHandlerClass= RequestHandlerClass self.__is_shut_down = threading.Event() self.__shutdown_request = False
看到它的註釋寫著,該類不能override。在初始化時,它定義了__is_shut_down和__shutdown_request兩個變量,我之前對__xx這樣的變量的含義不理解,
現在聯想到會不會是這種變量不能被子類override呢?然後查到了下面這篇文章,果然如此。Python已經從解釋器層面考慮到了這種私有變量,保證了這種
變量不會被子類的同名變量覆蓋,很牛逼,這樣的話,其實子類就完全沒有必要再定義同名的__xx變量了,因為即使定義了,也不能覆蓋父類中的同名變量,
而且這樣寫易讀性很差,很容易讓人搞混。Python這個trick做得還是挺不錯的。其實,之前對__xx變量的含義也有了解,但當時只思考它的工作原理,並不
理解它這樣做到底是為了什麽,回頭想想:當時自己本末倒置了,如果先知道這樣做的目的,再理解原理就更容易些。
原文:未找到
引子 我熱情地邀請大家猜測下面這段程序的輸出: class A(object): def __init__(self): self.__private() self.public() def __private(self): print ‘A.__private()‘ def public(self): print ‘A.public()‘ class B(A): def __private(self): print ‘B.__private()‘ def public(self): print ‘B.public()‘ b = B() 初探理解Python的雙下劃線命名(轉)