當你在 Linux 上啟動一個進程時會發生什麼？

2020-06-16 16:56:26

本文是關於 fork 和 exec 是如何在 Unix 上工作的。你或許已經知道，也有人還不知道。幾年前當我了解到這些時，我驚嘆不已。

我們要做的是啟動一個進程。我們已經在部落格上討論了很多關於系統呼叫的問題，每當你啟動一個進程或者開啟一個檔案，這都是一個系統呼叫。所以你可能會認為有這樣的系統呼叫：

start_process(["ls","-l","my_cool_directory"])

這是一個合理的想法，顯然這是它在 DOS 或 Windows 中的工作原理。我想說的是，這並不是 Linux 上的工作原理。但是，我查閱了文件，確實有一個 posix_spawn 的系統呼叫基本上是這樣做的，不過這不在本文的討論範圍內。

fork 和 exec

Linux 上的 posix_spawn 是通過兩個系統呼叫實現的，分別是 fork 和 exec（實際上是 execve），這些都是人們常常使用的。儘管在 OS X 上，人們使用 posix_spawn，而 fork 和 exec 是不提倡的，但我們將討論的是 Linux。

Linux 中的每個進程都存在於“進程樹”中。你可以通過執行 pstree 命令檢視進程樹。樹的根是 init，進程號是 1。每個進程（init 除外）都有一個父進程，一個進程都可以有很多子進程。

所以，假設我要啟動一個名為 ls 的進程來列出一個目錄。我是不是只要發起一個進程 ls 就好了呢？不是的。

我要做的是，建立一個子進程，這個子進程是我（me）本身的一個克隆，然後這個子進程的“腦子”被吃掉了，變成 ls。

開始是這樣的：

my parent
|- me

然後執行 fork()，生成一個子進程，是我（me）自己的一份克隆：

my parent
|- me
|--clone of me

然後我讓該子進程執行 exec("ls")，變成這樣：

my parent
|- me
|--ls

當 ls 命令結束後，我幾乎又變回了我自己：

my parent
|- me
|--ls(zombie)

在這時 ls 其實是一個殭屍進程。這意味著它已經死了，但它還在等我，以防我需要檢查它的返回值（使用 wait 系統呼叫）。一旦我獲得了它的返回值，我將再次恢復獨自一人的狀態。

my parent
|- me

fork 和 exec 的程式碼實現

如果你要編寫一個 shell，這是你必須做的一個練習（這是一個非常有趣和有啟發性的專案。Kamal 在 Github 上有一個很棒的研討會：https://github.com/kamalmarhubi/shell-workshop）。

事實證明，有了 C 或 Python 的技能，你可以在幾個小時內編寫一個非常簡單的 shell，像 bash 一樣。（至少如果你旁邊能有個人多少懂一點，如果沒有的話用時會久一點。）我已經完成啦，真的很棒。

這就是 fork 和 exec 在程式中的實現。我寫了一段 C 的虛擬碼。請記住，fork 也可能會失敗哦。

int pid = fork();
// 我要分身啦
// “我”是誰呢？可能是子進程也可能是父進程
if(pid ==0){
// 我現在是子進程
// “ls” 吃掉了我腦子，然後變成一個完全不一樣的進程
exec(["ls"])
}elseif(pid ==-1){
// 天啊，fork 失敗了，簡直是災難！
}else{
// 我是父進程耶
// 繼續做一個酷酷的美男子吧
// 需要的話，我可以等待子進程結束
}

上文提到的“腦子被吃掉”是什麼意思呢？

進程有很多屬性：

開啟的檔案（包括開啟的網路連線）
環境變數
信號處理程式（在程式上執行 Ctrl + C 時會發生什麼？）
記憶體（你的“地址空間”）
暫存器
可執行檔案（/proc/$pid/exe）
cgroups 和名稱空間（與 Linux 容器相關）
當前的工作目錄
執行程式的使用者
其他我還沒想到的

當你執行 execve 並讓另一個程式吃掉你的腦子的時候，實際上幾乎所有東西都是相同的！你們有相同的環境變數、信號處理程式和開啟的檔案等等。

唯一改變的是，記憶體、暫存器以及正在執行的程式，這可是件大事。

為何 fork 並非那麼耗費資源（寫入時複製）

你可能會問：“如果我有一個使用了 2GB 記憶體的進程，這是否意味著每次我啟動一個子進程，所有 2 GB 的記憶體都要被複製一次？這聽起來要耗費很多資源！”

事實上，Linux 為 fork() 呼叫實現了寫時複製copy on write，對於新進程的 2GB 記憶體來說，就像是“看看舊的進程就好了，是一樣的！”。然後，當如果任一進程試圖寫入記憶體，此時系統才真正地複製一個記憶體的副本給該進程。如果兩個進程的記憶體是相同的，就不需要複製了。

為什麼你需要知道這麼多

你可能會說，好吧，這些細節聽起來很厲害，但為什麼這麼重要？關於信號處理程式或環境變數的細節會被繼承嗎？這對我的日常程式設計有什麼實際影響呢？

有可能哦！比如說，在 Kamal 的部落格上有一個很有意思的 bug。它討論了 Python 如何使信號處理程式忽略了 SIGPIPE。也就是說，如果你從 Python 裡執行一個程式，預設情況下它會忽略 SIGPIPE！這意味著，程式從 Python 指令碼和從 shell 啟動的表現會有所不同。在這種情況下，它會造成一個奇怪的問題。

所以，你的程式的環境（環境變數、信號處理程式等）可能很重要，都是從父進程繼承來的。知道這些，在偵錯時是很有用的。

via: https://jvns.ca/blog/2016/10/04/exec-will-eat-your-brain/

作者：Julia Evans 譯者：jessie-pang 校對：wxy

本文由 LCTT 原創編譯，Linux中國榮譽推出