2021-05-12 14:32:11
Linux 系統呼叫過程詳細分析
2020-06-16 16:39:04
核心版本:Linux-4.19
作業系統通過系統呼叫為執行於其上的進程提供服務。
那麼,在應用程式內,呼叫一個系統呼叫的流程是怎樣的呢?
我們以一個假設的系統呼叫 xyz() 為例,介紹一次系統呼叫的所有環節。
如上圖所示,系統呼叫執行的流程如下:
1. 應用程式程式碼呼叫 xyz(),該函數是一個包裝系統呼叫的庫函數;
2. 庫函數 xyz() 負責準備向核心傳遞的引數,並觸發軟中斷以切換到核心;
3. CPU 被軟中斷打斷後,執行中斷處理常式,即系統呼叫處理常式(system_call);
4. 系統呼叫處理常式呼叫系統呼叫服務例程(sys_xyz ),真正開始處理該系統呼叫。
系統呼叫的實現來自於Glibc,幾乎所有 C 程式都要呼叫 Glibc 的動態連結庫 libc.so 中的庫函數。這些庫函數的原始碼是不可見的,可通過 objdump 或 gdb 等工具對程式碼進行組合反編譯,摸清大體的過程。
我們可不必太過糾結,知道原理就好。
下面繼續分析在核心中的實現過程。
Pure EABI user space always put syscall number into scno (r7).
當從使用者態轉為核心態時,系統會將 syscall number 儲存在暫存器 R7 中,利用 R7 來傳參。
在 entry-header.S 檔案中,有如下程式碼:
scno .req r7 @ syscall number
tbl .req r8 @ syscall table pointer
why .req r8 @ Linux syscall (!= 0)
tsk .req r9 @ current thread_info
類似於給暫存器起了個“別名”。
最後通過
invoke_syscall tbl, scno, r10, __ret_fast_syscall
程式碼成功呼叫 syscall table 中的服務程式。
invoke_syscall 定義如下:
.macro invoke_syscall, table, nr, tmp, ret, reload=0
#ifdef CONFIG_CPU_SPECTRE
mov tmp, nr
cmp tmp, #NR_syscalls @ check upper syscall limit
movcs tmp, #0
csdb
badr lr, ret @ return address
.if reload
add r1, sp, #S_R0 + S_OFF @ pointer to regs
ldmccia r1, {r0 - r6} @ reload r0-r6
stmccia sp, {r4, r5} @ update stack arguments
.endif
ldrcc pc, [table, tmp, lsl #2] @ call sys_* routine
#else
cmp nr, #NR_syscalls @ check upper syscall limit
badr lr, ret @ return address
.if reload
add r1, sp, #S_R0 + S_OFF @ pointer to regs
ldmccia r1, {r0 - r6} @ reload r0-r6
stmccia sp, {r4, r5} @ update stack arguments
.endif
ldrcc pc, [table, nr, lsl #2] @ call sys_* routine
#endif
.endm
回看
invoke_syscall tbl, scno, r10, __ret_fast_syscall
這段程式碼。tbl 是指向的何處呢?
接下來,就簡單的介紹一下 syscall table 這個表是怎樣形成的。
檢視程式碼我們發現,tbl 表示 sys_call_table 的地址:
adr tbl, sys_call_table @ load syscall table pointer
entry-common.S 中有這樣一段程式碼:
syscall_table_start sys_call_table
#define COMPAT(nr, native, compat) syscall nr, native
#ifdef CONFIG_AEABI
#include <calls-eabi.S>
#else
#include <calls-oabi.S>
#endif
#undef COMPAT
syscall_table_end sys_call_table
calls-eabi.S 檔案內容如下:
NATIVE(0, sys_restart_syscall)
NATIVE(1, sys_exit)
NATIVE(2, sys_fork)
NATIVE(3, sys_read)
NATIVE(4, sys_write)
NATIVE(5, sys_open)
NATIVE(6, sys_close)
NATIVE(8, sys_creat)
NATIVE(9, sys_link)
NATIVE(10, sys_unlink)
NATIVE(11, sys_execve)
NATIVE(12, sys_chdir)
NATIVE(14, sys_mknod)
NATIVE(15, sys_chmod)
NATIVE(16, sys_lchown16)
NATIVE(19, sys_lseek)
NATIVE(20, sys_getpid)
...
以上程式碼中宏的定義如下:
/* 定義 sys_call_table,並將 __sys_nr 清 0 */
.macro syscall_table_start, sym
.equ __sys_nr, 0
.type sym, #object
ENTRY(sym)
.endm
/* 檢查序號錯誤,並利用 sys_ni_syscall 填充缺少的序號 */
.macro syscall, nr, func
.ifgt __sys_nr - nr
.error "Duplicated/unorded system call entry"
.endif
.rept nr - __sys_nr
.long sys_ni_syscall
.endr
.long func
.equ __sys_nr, nr + 1
.endm
/* 檢查序號是否超過了 __NR_syscalls,如果不足的話,用 sys_ni_syscall 來填充 */
.macro syscall_table_end, sym
.ifgt __sys_nr - __NR_syscalls
.error "System call table too big"
.endif
.rept __NR_syscalls - __sys_nr
.long sys_ni_syscall
.endr
.size sym, . - sym
.endm
/* NATIVE 宏定義 */
#define NATIVE(nr, func) syscall nr, func
到這裡應該分析完了系統呼叫的大概過程,感謝大家花費寶貴的時間瀏覽,如果有什麼問題歡迎探討,後期會進行修改和補充!
相關文章