转载-关于armhf (hard-float ABI for ARM)

原文地址:

http://www.claudxiao.net/2012/02/armhf/

armhf是什么

在Ubuntu 12.04和Debian里,除了arm, armel,还出现了一个名为armhf的版本。这个东西是什么?

众所周知,armel是目前主要的ARM ABI。armhf则是armel的一个变种,主要区别在浮点计算上。

在armel中,关于浮点数计算的约定有三种。以gcc为例,对应的-mfloat-abi参数值有三个:soft,softfp,hard。soft是指所有浮点运算全部在软件层实现,效率当然不高,适合于早期没有浮点计算单元的ARM处理器;softfp是目前armel的默认设置,它将浮点计算交给FPU处理,但函数参数的传递使用通用的整型寄存器而不是FPU寄存器;hard则使用FPU浮点寄存器将函数参数传递给FPU处理。

需要注意的是,在兼容性上,soft与后两者是兼容的,但softfp和hard两种模式不兼容。默认情况下,armel使用softfp,因此将hard模式的armel单独作为一个abi,称之为armhf。

价值

使用softfp模式,会存在不必要的浮点到整数、整数到浮点的转换。而使用hard模式,在每次浮点相关函数调用时,平均能节省20个CPU周期[1]。对ARM这样每个周期都很重要的体系结构来说,这样的提升无疑是巨大的。

在完全不改变源码和配置的情况下,在一些应用程序上,使用armhf能得到20——25%的性能提升[2]。对一些严重依赖于浮点运算的程序,更是可以达到300%的性能提升[3]。

使用

armhf的开启需要硬件的支持,在Debian的wiki上要求ARMv7 CPU、Thumb-2指令集以及VFP3D16浮点处理器[4]。

在gcc的编译参数上,使用-mfloat-abi=hard -mfpu=vfp即可。

在工具上,CodeSourcery最早支持hard模式。也可已自己编译工具链[5]。

linux with armfp的历史

2010年5月20日,Konstantinos Margaritis发文称将Ubuntu Larmic移植为hard模式[6]。这一消息后来在powerdeveloper上引发关于性能提升的讨论[7]。

2010年7月6日,Hector Oron将他与Konstantinos的邮件讨论记录发往debian-arm邮件列表[8],将其称之为armelfp,引起社区重视,并得到armhf这个正式名称。

2010年7月18日,非官方的debian-armhf移植工作开始[9]。

2011年11月24日,该移植开始成为debian官方活动。

目前,debian仓库中超过90%的软件已经移植完毕[10]。

Debian预计在Wheezy (7.0)发布armhf的正式版。而Ubuntu也计划在Precise Pangolin 12.04 LTS中发布一个armhf版。

此外,对此前提到过的Toshiba AC100,目前已经有了armhf的debian和ubuntu镜像可以安装试用[11, 12]。


上面是原文内容,基本上对于soft,softfp和hard给出了一个简洁的说明。下面实际build三个程序看一下,就用树莓派官方提供的arm-bcm2708hardfp-linux-gnueabi和arm-bcm2708-linux-gnueabi两个编译器,前一个支持hardfloat,后一个默认是soft版本。以helloworld作为示例,分别编译三个文件:用bcm2708hardfp编译foo_hard,用bcm2708编译foo_soft和foo_softfp。默认情况下,编译器会根据自己的版本编译出softfp或者hard版本,不用额外添加-mfloat-abi选项,并且bcm2708不识别-mfloat-abi=hard参数,相反bcm2708hardfp也不识别-mfloat-abi=soft softfp选项。所以这里其实不用太过关心,真正应该去了解的还是厂家的CPU到底支持hard与否。假设使用的第三方库和你的eabi支持的硬件浮点不一样,在链接的时候会提示类似的错误,具体错误内容可能不一致,但是也八九不离十是因为浮点运算方式不同导致的:

foo_hard uses VFP register arguments, /tmp/ccuZkXVx.o does not

最后看一下如何区分ELF程序是支持hardfloat还是不支持hardfloat,用readelf -a|grep FP查看一下输出信息,一般hardfloat版本会有“Tag_ABI_VFP_args: VFP registers”的标记,例如下面:

# readelf -a foo_hard | grep FP
Tag_VFP_arch: VFPv2
Tag_ABI_FP_denormal: Needed
Tag_ABI_FP_exceptions: Needed
Tag_ABI_FP_number_model: IEEE 754
Tag_ABI_HardFP_use: SP and DP
  Tag_ABI_VFP_args: VFP registers
# readelf -a foo_soft | grep FP
Tag_VFP_arch: VFPv2
Tag_ABI_FP_denormal: Needed
Tag_ABI_FP_exceptions: Needed
Tag_ABI_FP_number_model: IEEE 754
Tag_ABI_HardFP_use: SP and DP
# readelf -a foo_softfp | grep FP
Tag_VFP_arch: VFPv2
Tag_ABI_FP_denormal: Needed
Tag_ABI_FP_exceptions: Needed
Tag_ABI_FP_number_model: IEEE 754
Tag_ABI_HardFP_use: SP and DP

附简写说明:

FPU - floating-point unit

eabi - embedded application binary interface

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据