2021-05-12 14:32:11
交叉編譯器 arm-linux-gnueabi 和 arm-linux-gnueabihf 的區別
交叉編譯器 arm-linux-gnueabi 和 arm-linux-gnueabihf 的區別
自己之前一直沒搞清楚這兩個交叉編譯器到底有什麼問題,特意google一番,總結如下,希望能幫到道上和我有同樣困惑的兄弟…..
一. 什麼是ABI和EABI
1) ABI: 二進位制應用程式介面(Application Binary Interface (ABI) for the ARM Architecture)
在計算機中,應用二進位制介面描述了應用程式(或者其他型別)和作業系統之間或其他應用程式的低階介面.
ABI涵蓋了各種細節,如:
資料型別的大小、布局和對齊;
呼叫約定(控制著函數的引數如何傳送以及如何接受返回值),例如,是所有的引數都通過棧傳遞,還是部分引數通過暫存器傳遞;哪個暫存器用於哪個函數引數;通過棧傳遞的第一個函數引數是最先push到棧上還是最後;
系統呼叫的編碼和一個應用如何向作業系統進行系統呼叫;
以及在一個完整的作業系統ABI中,目標檔案的二進位制格式、程式庫等等。
一個完整的ABI,像Intel二進位制相容標準 (iBCS) ,允許支援它的作業系統上的程式不經修改在其他支援此ABI的操作體統上執行。
ABI不同於應用程式介面(API),API定義了原始碼和庫之間的介面,因此同樣的程式碼可以在支援這個API的任何系統中編譯,ABI允許編譯好的目的碼在使用相容ABI的系統中無需改動就能執行。
2) EABI: 嵌入式ABI
嵌入式應用二進位制介面指定了檔案格式、資料型別、暫存器使用、堆積組織優化和在一個嵌入式軟體中的引數的標準約定。
開發者使用自己的組合語言也可以使用EABI作為與相容的編譯器生成的組合語言的介面。
支援EABI的編譯器建立的目標檔案可以和使用類似編譯器產生的程式碼相容,這樣允許開發者連結一個由不同編譯器產生的庫。
EABI與關於通用計算機的ABI的主要區別是應用程式程式碼中允許使用特權指令,不需要動態連結(有時是禁止的),和更緊湊的堆疊幀組織用來節省記憶體。廣泛使用EABI的有Power PC和ARM.
二. gnueabi相關的兩個交叉編譯器: gnueabi和gnueabihf
在debian源里這兩個交叉編譯器的定義如下:
gcc-arm-linux-gnueabi – The GNU C compiler for armel architecture
gcc-arm-linux-gnueabihf – The GNU C compiler for armhf architecture
可見這兩個交叉編譯器適用於armel和armhf兩個不同的架構, armel和armhf這兩種架構在對待浮點運算採取了不同的策略(有fpu的arm才能支援這兩種浮點運算策略)
其實這兩個交叉編譯器只不過是gcc的選項-mfloat-abi的預設值不同. gcc的選項-mfloat-abi有三種值soft,softfp,hard(其中後兩者都要求arm裡有fpu浮點運算單元,soft與後兩者是相容的,但softfp和hard兩種模式互不相容):
soft : 不用fpu進行浮點計算,即使有fpu浮點運算單元也不用,而是使用軟體模式。
softfp : armel架構(對應的編譯器為gcc-arm-linux-gnueabi)採用的預設值,用fpu計算,但是傳引數用普通暫存器傳,這樣中斷的時候,只需要儲存普通暫存器,中斷負荷小,但是引數需要轉換成浮點的再計算。
hard : armhf架構(對應的編譯器gcc-arm-linux-gnueabihf)採用的預設值,用fpu計算,傳引數也用fpu中的浮點暫存器傳,省去了轉換, 效能最好,但是中斷負荷高。
把以下測試使用的c檔案內容儲存成mfloat.c:
#include <stdio.h>
int main(void)
{
double a,b,c;
a = 23.543;
b = 323.234;
c = b/a;
printf(“the 13/2 = %fn”, c);
printf(“hello world !n”);
return 0;
}
1)使用arm-linux-gnueabihf-gcc編譯,使用“-v”選項以獲取更詳細的資訊:
# arm-linux-gnueabihf-gcc -v mfloat.c
COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=hard’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’
-mfloat-abi=hard,可看出使用hard硬體浮點模式。
2)使用arm-linux-gnueabi-gcc編譯:
# arm-linux-gnueabi-gcc -v mfloat.c
COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=softfp’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’
-mfloat-abi=softfp,可看出使用softfp模式。
三. 拓展閱讀
下文闡述了ARM程式碼編譯時的軟浮點(soft-float)和硬浮點(hard-float)的編譯以及連結實現時的不同。從VFP浮點單元的引入到軟浮點(soft-float)和硬浮點(hard-float)的概念
VFP (vector floating-point)
從ARMv5開始,就有可選的 Vector Floating Point (VFP) 模組,當然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 可以設定成不帶VFP的模式供晶片廠商選擇。
VFP經過若干年的發展,有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16個浮點暫存器,預設為32個)和VFPv3+NEON (如大多數的Cortex-A8晶片) 。對於包含NEON的ARM晶片,NEON一般和VFP公用暫存器。
硬浮點Hard-float
編譯器將程式碼直接編譯成發射給硬體浮點協處理器(浮點運算單元FPU)去執行。FPU通常有一套額外的暫存器來完成浮點引數傳遞和運算。
使用實際的硬體浮點運算單元FPU當然會帶來效能的提升。因為往往一個浮點的函數呼叫需要幾個或者幾十個時鐘週期。
軟浮點 Soft-float
編譯器把浮點運算轉換成浮點運算的函數呼叫和庫函數呼叫,沒有FPU的指令呼叫,也沒有浮點暫存器的引數傳遞。浮點引數的傳遞也是通過ARM暫存器或者堆疊完成。
現在的Linux系統預設編譯選擇使用hard-float,即使系統沒有任何浮點處理器單元,這就會產生非法指令和異常。因而一般的系統映象都採用軟浮點以相容沒有VFP的處理器。
armel ABI和armhf ABI
在armel中,關於浮點數計算的約定有三種。以gcc為例,對應的-mfloat-abi引數值有三個:soft,softfp,hard。
soft是指所有浮點運算全部在軟體層實現,效率當然不高,會存在不必要的浮點到整數、整數到浮點的轉換,只適合於早期沒有浮點計算單元的ARM處理器;
softfp是目前armel的預設設定,它將浮點計算交給FPU處理,但函數引數的傳遞使用通用的整型暫存器而不是FPU暫存器;
hard則使用FPU浮點暫存器將函數引數傳遞給FPU處理。
需要注意的是,在相容性上,soft與後兩者是相容的,但softfp和hard兩種模式不相容。
預設情況下,armel使用softfp,因此將hard模式的armel單獨作為一個abi,稱之為armhf。
而使用hard模式,在每次浮點相關函數呼叫時,平均能節省20個CPU週期。對ARM這樣每個週期都很重要的體系結構來說,這樣的提升無疑是巨大的。
在完全不改變原始碼和設定的情況下,在一些應用程式上,使用armhf能得到20%——25%的效能提升。對一些嚴重依賴於浮點運算的程式,更是可以達到300%的效能提升。
Soft-float和hard-float的編譯選項
在CodeSourcery gcc的編譯引數上,使用-mfloat-abi=name來指定浮點運算處理方式。-mfpu=name來指定浮點協處理的型別。
可選型別如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。
使用-mfloat-abi=hard (等價於-mhard-float) -mfpu=vfp來選擇編譯成硬浮點。使用-mfloat-abi=softfp就能相容帶VFP的硬體以及soft-float的軟體實現,執行時的聯結器ld.so會在執行浮點運算時對於運算單元的選擇,
是直接的硬體呼叫還是庫函數呼叫,是執行/lib還是/lib/vfp下的libm。-mfloat-abi=soft (等價於-msoft-float)直接呼叫軟浮點實現庫。
在ARM RVCT工具鏈下,定義fpu模式:
–fpu softvfp
–fpu softvfp+vfpv2
–fpu softvfp+vfpv3
–fpu softvfp+vfpv_fp16
–fpu softvfp+vfpv_d16
–fpu softvfp+vfpv_d16_fp16.
定義浮點運算型別
–fpmode ieee_full : 所有單精度float和雙精度double的精度都要和IEEE標準一致,具體的模式可以在執行時動態指定;
–fpmode ieee_fixed : 捨入到最接近的實現的IEEE標準,不帶不精確的異常;
–fpmode ieee_no_fenv :捨入到最接近的實現的IEEE標準,不帶異常;
–fpmode std :非規格數flush到0、捨入到最接近的實現的IEEE標準,不帶異常;
–fpmode fast : 更積極的優化,可能會有一點精度損失。
Linux公社的RSS地址:https://www.linuxidc.com/rssFeed.aspx
本文永久更新連結地址:https://www.linuxidc.com/Linux/2018-09/154271.htm
相關文章