您好,登錄后才能下訂單哦!
這篇文章主要介紹了Linux如何實現寫時拷貝技術,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
COW技術初窺
在linux程序中,fork()會產生一個和父進程完全相同的子進程,但子進程在此后多會exec系統調用,出于效率考慮,linux中引入了“寫時復制”技術,也就是只有進程空間的各段的內容要發生變化時,才將父進程的內容復制一份給子進程。
那么子進程的物理空間沒有代碼,怎么去取指令執行exec系統調用呢??
在fork之后exec之前兩個進程用的是相同的物理空間(內存區),子進程的代碼段、數據段、堆棧都是指向父進程的物理空間,也就是說,兩者的虛擬空間不同,其對應的物理空間是一個。當父子進程中有更改相應段的行為發生時,再為子進程相應的段分配物理空間。如果不是因為exec,內核會給子進程的數據段、堆棧段分配相應的物理空間(至此兩者都有各自的進程空間,互不影響),而代碼段繼續共享父進程的物理空間(兩者的代碼完全相同)。而如果是因為exec,由于兩者執行的代碼不同,子進程的代碼段也會分配單獨的物理空間。
在網上看到的還有個細節問題是:fork之后內核會將子進程排在隊列的前面,以讓子進程先執行,以免父進程執行導致寫時復制,而后子進程執行exec系統調用,因無意義的復制而造成效率的下降。
COW詳述
現在有一個父進程P1,這是一個主體,那么它是有靈魂也是有身體的。現在在其虛擬地址空間(有相應的數據結構表示)上有:正文段,數據段,堆,棧這四個部分,相應地,內核要為這四個部分分配給自的物理塊。即正文段塊、數據段塊、堆塊、棧塊。至于如何分配,這是內核去做的事,在此不詳述。
1. 現在P1用fork()函數為進程創建一個子進程P2
內核:
(1) 復制P1的正文段,數據段,堆,棧這四個部分,注意是其內容相同。
(2) 為這四個部分分配物理塊,P2的:正文段(為P1的正文段的物理塊,其實就是不為P2分配正文段塊,讓P2的正文段指向P1的正文段塊),數據段(P2自己的數據段塊,為其分配對應的塊),堆(P2自己的堆塊),棧(P2自己的棧塊)。如下圖所示,同左到右大的方向箭頭表示復制內容:
2. 寫時復制技術
寫時復制技術:內核只為新生成的子進程創建虛擬空間結構,它們復制于父進程的虛擬空間結構,但是不為這些段分配物理內存,它們共享父進程的物理空間,當父子進程中有更改相應的段的行為發生時,再為子進程相應的段分配物理空間。
3. vfork
vfork的做法更加簡單粗暴,內核連子進程的虛擬地址空間也不創建了,直接共享了父進程的虛擬空間,當然了,這種做法就順水推舟的共享了父進程的物理空間
總結
傳統的fork()系統調用直接把所有的資源復制給新創建的進程。這種實現過于簡單并且效率低下,因為它拷貝的數據也許并不共享,更糟的情況是,如果新進程打算立即執行一個新的映像,那么所有的拷貝將是無用功。
Linux的fork()使用寫時拷貝(copy-on-write)頁實現。寫時拷貝是一種可以推遲甚至免除拷貝數據的技術。內核此時并不復制整個地址空間,而是讓父進程和子進程共享一個拷貝。只有在需要寫入的時候,數據才會復制,從而使各個進程擁有各自的拷貝。也就是說,資源的復制只有在需要寫入的時候才進行,在此之前,只是以只讀方式共享。這種技術使地址空間的頁的拷貝被推遲到實際發生寫入的時候。
在頁根本不會被寫入的情況下,舉例來說,fork()之后立即調用exec(),它們就無需復制了,fork()的實際開銷就是復制父進程的頁表以及給子進程創建唯一的進程描述符。在一般情況下,進程創建后都會馬上運行一個可執行的文件,這種優化可以避免拷貝大量根本不會使用的數據(地址空間常常包含數十兆的數據)。由于Unix強調進程快速執行的能力,所以這個優化是很重要的,注:Linux COW和exec沒有必然聯系
感謝你能夠認真閱讀完這篇文章,希望小編分享的“Linux如何實現寫時拷貝技術”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。