您好,登錄后才能下訂單哦!
這篇文章主要講解了“怎么掌握Python的垃圾回收機制”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么掌握Python的垃圾回收機制”吧!
得益于 Python
的自動垃圾回收機制,在 Python
中創建對象時無須手動釋放。這對開發者非常友好,讓開發者無須關注低層內存管理。但如果對其垃圾回收機制不了解,很多時候寫出的 Python
代碼會非常低效。
垃圾回收算法有很多,主要有: 引用計數
、 標記-清除
、 分代收集
等。
在 python
中,垃圾回收算法以 引用計數
為主, 標記-清除
和 分代收集
兩種機制為輔。
引用計數原理比較簡單:
每個對象有一個整型的引用計數屬性。用于記錄對象被引用的次數。例如對象 A
,如果有一個對象引用了 A
,則 A
的引用計數 +1
。當引用刪除時, A
的引用計數 -1
。當 A
的引用計數為0時,即表示對象 A
不可能再被使用,直接回收。
在 Python
中,可以通過 sys
模塊的 getrefcount
函數獲取指定對象的引用計數器的值,我們以實際例子來看。
import sys class A(): def __init__(self): pass a = A() print(sys.getrefcount(a))
運行上面代碼,可以得到輸出結果為 2
。
上面我們看到,創建一個 A
對象,并將對象賦值給 a
變量后,對象的引用計數器值為 2
。那么什么時候計數器會 +1
,什么時候計數器會 -1
呢?
A() a=A() func(a) arr=[a,a]
對象被顯式銷毀,如 del a
。變量重新賦予新的對象,例如 a=0
。對象離開它的作用域,如 func
函數執行完畢時, func
函數中的局部變量(全局變量不會)。
對象所在的容器被銷毀,或從容器中刪除對象。
為了更好的理解計數器的增減,我們運行實際代碼,一目了然。
import sys class A(): def __init__(self): pass print("創建對象 0 + 1 =", sys.getrefcount(A())) a = A() print("創建對象并賦值 0 + 2 =", sys.getrefcount(a)) b = a c = a print("賦給2個變量 2 + 2 =", sys.getrefcount(a)) b = None print("變量重新賦值 4 - 1 =", sys.getrefcount(a)) del c print("del對象 3 - 1 =", sys.getrefcount(a)) d = [a, a, a] print("3次加入列表 2 + 3 =", sys.getrefcount(a)) def func(c): print('傳入函數 1 + 2 = ', sys.getrefcount(c)) func(A())
輸出結果如下:
創建對象 0 + 1 = 1 創建對象并賦值 0 + 2 = 2 賦給2個變量 2 + 2 = 4 變量重新賦值 4 - 1 = 3 del對象 3 - 1 = 2 3次加入列表 2 + 3 = 5 傳入函數 1 + 2 = 3
高效、邏輯簡單,只需根據規則對計數器做加減法。
實時性。一旦對象的計數器為零,就說明對象永遠不可能再被用到,無須等待特定時機,直接釋放內存。
需要為對象分配引用計數空間,增大了內存消耗。
當需要釋放的對象比較大時,如字典對象,需要對引用的所有對象循環嵌套調用,可能耗時比較長。
循環引用。 這是引用計數的致命傷,引用計數對此是無解的,因此必須要使用其它的垃圾回收算法對其進行補充。
上一小節提到,引用計數算法無法解決循環引用問題,循環引用的對象會導致大家的計數器永遠都不會等于 0
,帶來無法回收的問題。
標記-清除
算法主要用于潛在的循環引用問題,該算法分為2步:
標記階段。將所有的對象看成圖的節點,根據對象的引用關系構造圖結構。從圖的根節點遍歷所有的對象,所有訪問到的對象被打上標記,表明對象是“可達”的。
清除階段。遍歷所有對象,如果發現某個對象沒有標記為“可達”,則就回收。
以具體代碼示例說明:
class A(): def __init__(self): self.obj = None def func(): a = A() b = A() c = A() d = A() a.obj = b b.obj = a return [c, d] e = func()
上面代碼中,a和b相互引用,e引用了c和d。整個引用關系如下圖所示
如果采用引用計數器算法,那么a和b兩個對象將無法被回收。而采用標記清除法,從根節點(即e對象)開始遍歷,c、d、e三個對象都會被標記為 可達
,而a和b無法被標記。因此a和b會被回收。
這是讀者可能會有疑問,為什么確定根節點是e,而不會是a、b、c、d呢?這里就有講究了,什么樣的對象會被看成是根節點呢?一般而言,根節點的選取包括(但不限于)如下幾種:
當前棧幀中的本地變量表中引用的對象,如各個線程被調用的方法堆棧中使用到的參數、 局部變量、 臨時變量等。
全局靜態變量
...
在執行垃圾回收過程中,程序會被暫停,即 stop-the-world
。這里很好理解:你媽媽在打掃房間的時候,肯定不允許你在房間內到處丟垃圾,要不然永遠也無法打掃干凈。
為了減少程序的暫停時間,采用 分代回收
( Generational Collection
)降低垃圾收集耗時。
分代回收基于這樣的法則:
接大部分的對象生命周期短,大部分對象都是朝生夕滅。
經歷越多次數的垃圾收集且活下來的對象,說明該對象越不可能是垃圾,應該越少去收集。
Python
中,對象一共有3種世代: G0
, G1
, G2
。
對象剛創建時為 G0
。
如果在一輪 GC
掃描中存活下來,則移至 G1
,處于 G1
的對象被掃描次數會減少。
如果再次在掃描中活下來,則進入 G2
,處于 G1
的對象被掃描次數將會更少。
當某世代中分配的對象數量與被釋放的對象之差達到某個閾值的時,將觸發對該代的掃描。當某世代觸發掃描時,比該世代年輕的世代也會觸發掃描。
那么這個閾值是多少呢?我們可以通過代碼查看或者修改,示例代碼如下
import gc threshold = gc.get_threshold() print("各世代的閾值:", threshold) # 設置各世代閾值 # gc.set_threshold(threshold0[, threshold1[, threshold2]]) gc.set_threshold(800, 20, 20)
輸出結果如下:
各世代的閾值: (700, 10, 10)
感謝各位的閱讀,以上就是“怎么掌握Python的垃圾回收機制”的內容了,經過本文的學習后,相信大家對怎么掌握Python的垃圾回收機制這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。