首頁 > 軟體

Linux 系統呼叫過程詳細分析

2020-06-16 16:39:04

核心版本:Linux-4.19

作業系統通過系統呼叫為執行於其上的進程提供服務。

那麼,在應用程式內,呼叫一個系統呼叫的流程是怎樣的呢?

我們以一個假設的系統呼叫 xyz() 為例,介紹一次系統呼叫的所有環節。

如上圖所示,系統呼叫執行的流程如下:

1. 應用程式程式碼呼叫 xyz(),該函數是一個包裝系統呼叫的庫函數;
2. 庫函數 xyz() 負責準備向核心傳遞的引數,並觸發軟中斷以切換到核心;
3. CPU 被軟中斷打斷後,執行中斷處理常式,即系統呼叫處理常式(system_call);
4. 系統呼叫處理常式呼叫系統呼叫服務例程(sys_xyz ),真正開始處理該系統呼叫。

系統呼叫的實現來自於Glibc,幾乎所有 C 程式都要呼叫 Glibc 的動態連結庫 libc.so 中的庫函數。這些庫函數的原始碼是不可見的,可通過 objdump 或 gdb 等工具對程式碼進行組合反編譯,摸清大體的過程。

我們可不必太過糾結,知道原理就好。

下面繼續分析在核心中的實現過程。

Pure EABI user space always put syscall number into scno (r7).

當從使用者態轉為核心態時,系統會將 syscall number 儲存在暫存器 R7 中,利用 R7 來傳參。

在 entry-header.S 檔案中,有如下程式碼:

scno    .req    r7      @ syscall number
tbl .req    r8      @ syscall table pointer
why .req    r8      @ Linux syscall (!= 0)
tsk .req    r9      @ current thread_info

類似於給暫存器起了個“別名”。

最後通過

invoke_syscall tbl, scno, r10, __ret_fast_syscall

程式碼成功呼叫 syscall table 中的服務程式。

invoke_syscall 定義如下:

    .macro  invoke_syscall, table, nr, tmp, ret, reload=0
#ifdef CONFIG_CPU_SPECTRE
    mov tmp, nr
    cmp tmp, #NR_syscalls      @ check upper syscall limit
    movcs   tmp, #0
    csdb
    badr    lr, ret            @ return address
    .if reload
    add r1, sp, #S_R0 + S_OFF       @ pointer to regs
    ldmccia r1, {r0 - r6}           @ reload r0-r6
    stmccia sp, {r4, r5}            @ update stack arguments
    .endif
    ldrcc   pc, [table, tmp, lsl #2]  @ call sys_* routine
#else
    cmp nr, #NR_syscalls       @ check upper syscall limit
    badr    lr, ret            @ return address
    .if reload
    add r1, sp, #S_R0 + S_OFF       @ pointer to regs
    ldmccia r1, {r0 - r6}           @ reload r0-r6
    stmccia sp, {r4, r5}            @ update stack arguments
    .endif
    ldrcc   pc, [table, nr, lsl #2]   @ call sys_* routine
#endif
    .endm

回看

invoke_syscall tbl, scno, r10, __ret_fast_syscall

這段程式碼。tbl 是指向的何處呢?

接下來,就簡單的介紹一下 syscall table 這個表是怎樣形成的。

檢視程式碼我們發現,tbl 表示 sys_call_table 的地址:

adr tbl, sys_call_table @ load syscall table pointer

entry-common.S 中有這樣一段程式碼:

    syscall_table_start sys_call_table
    
#define COMPAT(nr, native, compat) syscall nr, native
#ifdef CONFIG_AEABI
#include <calls-eabi.S>
#else
#include <calls-oabi.S>
#endif
#undef COMPAT

    syscall_table_end sys_call_table

calls-eabi.S 檔案內容如下:

NATIVE(0, sys_restart_syscall)
NATIVE(1, sys_exit)
NATIVE(2, sys_fork)
NATIVE(3, sys_read)
NATIVE(4, sys_write)
NATIVE(5, sys_open)
NATIVE(6, sys_close)
NATIVE(8, sys_creat)
NATIVE(9, sys_link)
NATIVE(10, sys_unlink)
NATIVE(11, sys_execve)
NATIVE(12, sys_chdir)
NATIVE(14, sys_mknod)
NATIVE(15, sys_chmod)
NATIVE(16, sys_lchown16)
NATIVE(19, sys_lseek)
NATIVE(20, sys_getpid)
    ...

以上程式碼中宏的定義如下:

    /* 定義 sys_call_table,並將 __sys_nr 清 0 */
    .macro  syscall_table_start, sym
    .equ    __sys_nr, 0
    .type   sym, #object
ENTRY(sym)
    .endm

    /* 檢查序號錯誤,並利用 sys_ni_syscall 填充缺少的序號 */
    .macro  syscall, nr, func
    .ifgt   __sys_nr - nr
    .error  "Duplicated/unorded system call entry"
    .endif
    .rept   nr - __sys_nr
    .long   sys_ni_syscall
    .endr
    .long   func
    .equ    __sys_nr, nr + 1
    .endm

    /* 檢查序號是否超過了 __NR_syscalls,如果不足的話,用 sys_ni_syscall 來填充 */
    .macro  syscall_table_end, sym
    .ifgt   __sys_nr - __NR_syscalls
    .error  "System call table too big"
    .endif
    .rept   __NR_syscalls - __sys_nr
    .long   sys_ni_syscall
    .endr
    .size   sym, . - sym
    .endm

    /* NATIVE 宏定義 */
#define NATIVE(nr, func) syscall nr, func

到這裡應該分析完了系統呼叫的大概過程,感謝大家花費寶貴的時間瀏覽,如果有什麼問題歡迎探討,後期會進行修改和補充!


IT145.com E-mail:sddin#qq.com