Python的內(nèi)存管理機(jī)制對(duì)于工程師而言,內(nèi)存管理機(jī)制非常重要,是繞不過去的一環(huán)。如果你是Java工程師,面試的時(shí)候一定會(huì)問JVM。C++工程師也一定會(huì)問內(nèi)存泄漏,同樣我們想要深入學(xué)習(xí)Python,內(nèi)存管理機(jī)制也是繞不過去的一環(huán)。
不過好在Python的內(nèi)存管理機(jī)制相對(duì)來說比較簡(jiǎn)單,我們也不用特別深入其中的細(xì)節(jié),簡(jiǎn)單做個(gè)了解即可。
Python內(nèi)存管理機(jī)制的核心就是引用計(jì)數(shù),在Python當(dāng)中一切都是對(duì)象,對(duì)象通過引用來使用。
我們看到的是變量名,但是變量名指向了內(nèi)存當(dāng)中的一塊對(duì)象。這種關(guān)系在Python當(dāng)中稱為引用,我們通過引用來操作對(duì)象。所以根據(jù)這點(diǎn),引用計(jì)數(shù)很好理解,也就是說我們會(huì)對(duì)每一個(gè)對(duì)象進(jìn)行統(tǒng)計(jì)所有指向它的指針的數(shù)量。如果一個(gè)對(duì)象引用計(jì)數(shù)為0,那么說明它沒有任何引用指向它,也就是說它已經(jīng)沒有在使用了,這個(gè)時(shí)候,Python就會(huì)將這塊內(nèi)存收回。
簡(jiǎn)單來說引用計(jì)數(shù)原理就是這些,但我們稍微深入一點(diǎn),來簡(jiǎn)單看看哪些場(chǎng)景會(huì)引起對(duì)象引用的變化。
引用計(jì)數(shù)的變化顯然只有兩種,一種是增加,一種是減少,這兩種場(chǎng)景都只有4種情況。我們先來看下增加的情況:
首先是初始化,最簡(jiǎn)單的就是我們用賦值操作給一個(gè)變量賦值。舉個(gè)例子:
n=123
這就是最簡(jiǎn)單的初始化操作,雖然123在我們來看是一個(gè)常數(shù),但是在Python底層同樣被認(rèn)為是一個(gè)常數(shù)對(duì)象。n是它的一個(gè)引用。
第二種情況是引用的傳遞,最簡(jiǎn)單的就是我們將一個(gè)變量的值賦值給了另外一個(gè)變量。
m=n
比如我們將n賦值給m,它的本質(zhì)是我們創(chuàng)建了一個(gè)新的引用,指向了同樣一塊內(nèi)存。如果我們用id操作去查看m和n的id,會(huì)發(fā)現(xiàn)它們的id是一樣的。也就是說它們并不是存儲(chǔ)了兩份相同的值,而是指向了同一份值。并不是有兩個(gè)叫做王小二的人,而是王小二有兩個(gè)不同的賬號(hào)。
第三種情況是作為元素被存儲(chǔ)進(jìn)了容器當(dāng)中,比如被存儲(chǔ)進(jìn)了list當(dāng)中。
a=[1,2,123]
雖然我們用到了一個(gè)容器,但是容器并不會(huì)拷貝一份這些對(duì)象,還是只是存儲(chǔ)這些對(duì)象的引用。
最后一種情況就是作為參數(shù)傳給函數(shù),在Python當(dāng)中,所有的傳參都是引用傳遞。這也是為什么,我們經(jīng)??吹接腥藭?huì)這樣寫代碼的原因:
deftest(a):
a.append(3)
a=[]
test(a)
print(a)
我們根據(jù)上面列舉的這四種引用計(jì)數(shù)增加的情況,不難推導(dǎo)出引用減少的情況,其實(shí)基本上是對(duì)稱的操作。
和初始化對(duì)應(yīng)的操作是銷毀,比如我們創(chuàng)建的對(duì)象被del操作給銷毀了,那么同樣引用計(jì)數(shù)會(huì)-1
deln
和賦值給其他變量名的操作相反的操作是覆蓋,比如之前我們的n=123,也就是n這個(gè)變量指向123,現(xiàn)在我們將n賦值成其他值,那么123這個(gè)對(duì)象的引用計(jì)數(shù)同樣會(huì)減少。
n=124
既然元素存儲(chǔ)在容器當(dāng)中會(huì)帶來引用計(jì)數(shù),那么同樣元素從容器當(dāng)中移除也會(huì)減少引用計(jì)數(shù)。這個(gè)也很好理解,最簡(jiǎn)單的就是list調(diào)用remove方法移除一個(gè)元素:
a.remove(123)
最后一個(gè)對(duì)應(yīng)的就是作用域,也就是當(dāng)變量離開了作用域,那么它對(duì)應(yīng)的內(nèi)存塊的引用計(jì)數(shù)同樣會(huì)減少。比如我們函數(shù)調(diào)用結(jié)束,那么作為參數(shù)的這些變量對(duì)應(yīng)的引用計(jì)數(shù)都會(huì)減1。
如果一個(gè)對(duì)象的引用計(jì)數(shù)減到0,也就是沒有引用再指向它的時(shí)候,那么當(dāng)Python進(jìn)行g(shù)c的時(shí)候,這塊內(nèi)存就會(huì)被釋放,也就是這個(gè)對(duì)象會(huì)被清除,騰出空間來。
注意一下,引用計(jì)數(shù)減到0與內(nèi)存回收之間并不是立即發(fā)生的,而是有一段間隔的。根據(jù)Python的機(jī)制,內(nèi)存回收只會(huì)在特定條件下執(zhí)行。在占用內(nèi)存比較小還有很多富裕的情況下,往往是不會(huì)執(zhí)行內(nèi)存回收的。因?yàn)镻ython在執(zhí)行g(shù)c(garbagecollection)的時(shí)候也會(huì)stoptheworld,也就是暫停其他所有的任務(wù),所以這是影響性能的一件事情,只會(huì)在有必要的時(shí)候執(zhí)行。
我們費(fèi)這么大勁來介紹Python中的內(nèi)存機(jī)制,除了向大家科普一下這一塊內(nèi)容之外,更重要的一點(diǎn)是為了引出我們開發(fā)的時(shí)候經(jīng)常遇見的一種情況——循環(huán)引用。
循環(huán)引用如果熟悉了Python的引用,來理解循環(huán)引用是非常容易的。說白了也很簡(jiǎn)單,就是你的一個(gè)變量引用我,我的一個(gè)變量引用你。
我們來寫一段簡(jiǎn)單的代碼,來看看循環(huán)引用:
classTest:
def__init__(self):
pass
if__name__=='__main__':
a=Test()
b=Test()
a.t=b
b.t=a
如果你打個(gè)斷點(diǎn)來看的話,會(huì)看到a和b之間的循環(huán)引用:
這里是無限展開的,因?yàn)檫@是一個(gè)無限循環(huán)。無限循環(huán)并不會(huì)導(dǎo)致程序崩潰,也不會(huì)帶來太大的問題,它的問題只有一個(gè),就是根據(jù)前面介紹的引用計(jì)數(shù)法,a和b的引用永遠(yuǎn)不可能為0。
也就是說根據(jù)引用計(jì)數(shù)的原則,這兩個(gè)變量永遠(yuǎn)不會(huì)被回收,這顯然是不合理的。雖然Python當(dāng)中專門建立了機(jī)制來解決引用循環(huán)的問題,但是我們并不知道它什么時(shí)候會(huì)被觸發(fā)。
這個(gè)問題在Python當(dāng)中非常普遍,尤其在我們實(shí)現(xiàn)一些數(shù)據(jù)結(jié)構(gòu)的時(shí)候。舉個(gè)最簡(jiǎn)單的例子就是樹中的節(jié)點(diǎn),就是引用循環(huán)的。因?yàn)楦腹?jié)點(diǎn)會(huì)存儲(chǔ)所有的孩子,往往孩子節(jié)點(diǎn)也會(huì)存儲(chǔ)父節(jié)點(diǎn)的信息。那么這就構(gòu)成了引用循環(huán)。
classNode:
def__init__(self,val,father):
self.val=val
self.father=father
self.childs=[]
弱引用為了解決這個(gè)問題,Python中提供了一個(gè)叫做弱引用的概念。弱引用本質(zhì)也是一種引用,但是它不會(huì)增加對(duì)象的引用計(jì)數(shù)。也就是說它不能保證它引用的對(duì)象一定不會(huì)被銷毀,只要沒有銷毀,弱引用就可以返回預(yù)期的結(jié)果。
弱引用不用我們自己開發(fā),這是Python當(dāng)中集成的一個(gè)現(xiàn)成的模塊weakref。
這個(gè)模塊當(dāng)中的方法很多,用法也很多,但是我們基本上用不到,一般來說最常用的就是ref方法。通過weakref庫(kù)中的ref方法,可以返回對(duì)象的一個(gè)弱引用。我們還是來看個(gè)例子:
importweakref
classTest:
def__init__(self,name):
self.name=name
def__str__(self):
returnself.name
if__name__=='__main__':
a=Test('a')
b=Test('b')
a.t=weakref.ref(b)
b.t=weakref.ref(a)
print(a.t())
其實(shí)還是之前的代碼,只是做了一點(diǎn)簡(jiǎn)單的改動(dòng)。一個(gè)是我們給Test加上了name這個(gè)屬性,以及str方法。另一個(gè)是我們把直接賦值改成了使用weakref。
這一次我們?cè)俅驍帱c(diǎn)進(jìn)來看的話,就看不到無限循環(huán)的情況了:
ref返回的是一個(gè)獲取引用對(duì)象的方法,而不是對(duì)象本身。所以我們想要獲取這個(gè)對(duì)象的話,需要再把它當(dāng)成函數(shù)調(diào)用一下。
當(dāng)然這樣很麻煩,我們還有更好的辦法,就是使用property注解。通過property注解,我們可以把weakref封裝掉,這樣在使用的時(shí)候就沒有感知了。
importweakref
classTest:
def__init__(self,name):
self.name=name
def__str__(self):
returnself.name
@property
defnode(self):
returnNoneifself._nodeisNoneelseself._node()
@node.setter
defnode(self,node):
self._node=weakref.ref(node)
總結(jié)引用和循環(huán)引用都是基于Python本身的機(jī)制,如果對(duì)這塊機(jī)制不了解,很容易采坑。因?yàn)榭赡軙?huì)出現(xiàn)邏輯是對(duì)的,但是有一些意想不到的bug的情況。這種時(shí)候,往往很難通過review代碼或者是測(cè)試發(fā)現(xiàn),這也是我們學(xué)習(xí)的瓶頸所在。很容易發(fā)現(xiàn)代碼已經(jīng)寫得很熟練了,但是一些進(jìn)階的代碼還是看不懂或者是寫不出來,本質(zhì)上就是因?yàn)槿鄙倭藢?duì)于底層的了解和認(rèn)知。
循環(huán)引用的問題在我們開發(fā)代碼的時(shí)候還蠻常見的,尤其是涉及到樹和圖的數(shù)據(jù)結(jié)構(gòu)的時(shí)候。由于循環(huán)引用的關(guān)系,很有可能出現(xiàn)被刪除的樹仍然占用著空間,內(nèi)存不足的情況發(fā)生。這個(gè)時(shí)候使用weakref就很有必要了。
以上內(nèi)容為大家介紹了Python的內(nèi)存管理機(jī)制,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。