手机版
你好,游客 登录 注册
背景:
阅读新闻

ARM指令集 VS thumb指令集

[日期:2011-09-25] 来源:Linux社区  作者:seucr [字体: ]

1 thumb指令集概述

为兼容数据总线宽度为16位的应用系统,ARM体系结构除了支持执行效率很高的32位ARM指令集以外,同时支持16位的Thumb指令集。

Thumb指令集是ARM指令集的一个子集,是针对代码密度问题而提出的,它具有16位的代码宽度。与等价的32位代码相比较,Thumb指令集在保留32位代码优势的同时,大大的节省了系统的存储空间。Thumb不是一个完整的体系结构,不能指望处理器只执行Thumb指令集而不支持ARM指令集。

当处理器在执行ARM程序段时,称ARM处理器处于ARM工作状态,当处理器在执行Thumb程序段时,称ARM处理器处于Thumb工作状态(CPSRT=0armT=1thumb)。Thumb指令集并没有改变ARM体系底层的编程模型,只是在该模型上增加了一些限制条件,只要遵循一定的调用规则,Thumb子程序和ARM子程序就可以互相调用。

ARM指令集相比较,Thumb指令集中的数据处理指令的操作数仍然是32位,指令地址也为32位,但Thumb指令集为实现16位的指令长度,舍弃了ARM指令集的一些特性,相比之下从指令集上看thumbarm主要有以下不同:

l 跳转指令。条件跳转在范围上有更多的限制,转向子程序只具有无条件转移。

l 数据处理指令。对通用寄存器进行操作,操作结果需放入其中一个操作数寄存器,而不是第三个寄存器。

l 单寄存器加载和存储指令。Thumb状态下,单寄存器加载和存储指令只能访问寄存器R0R7

l 批量寄存器加载和存储指令。LDMSTM指令可以将任何范围为R0R7的寄存器子集加载或存储,PUSHPOP指令使用堆栈指针R13作为基址实现满递减堆栈,除R0R7外,PUSH指令还可以存储链接寄存器R14,并且POP指令可以加载程序指令PC

Thumb指令集没有包含进行异常处理时需要的一些指令,因此,在异常中断时还是需要使用ARM指令。这种限制决定了Thumb指令不能单独使用需要与ARM指令配合使用。

 2 thumb寄存器和arm寄存器的关系

1)Thumb 状态寄存器集是ARM 状态寄存器集的子集

    程序员可直接访问个通用寄存器R0R7PC堆栈指针SP、链接寄存器LRCPSR每个特权模式都有分组的SPLRSPSR

2)Thumb状态寄存器与ARM 状态寄存器的关系

         Thumb状态寄存器与ARM状态寄存器有如下关系:

l Thumb状态R0R7ARM状态R0R7相同。

l Thumb状态CPSRSPSRARM状态CPSRSPSR 相同。

l Thumb状态SP映射到ARM状态R13

l Thumb状态LR映射到ARM状态R14

l Thumb状态PC映射到ARM状态PCR15)。

3)、在Thumb状态中访问高寄存器

    在Thumb状态中高寄存器(寄存器R0R7为低寄存器,寄存器R8R15为高寄存器)不是标准寄存器集的一部分,汇编语言程序员对它们的访问受到限制,但可以将它们用于快速暂存。

    可以使用MOV指令的特殊变量将一个值从低寄存器R0R7转移到高寄存器R8R15或者从高寄存器到低寄存器。CMP指令可用于比较高寄存器和低寄存器的值。ADD 指令可用于将高寄存器的值与低寄存器的值相加。

3 thumb指令集与arm指令集效用分析

    在ARM处理器中,内核同时支持32位的ARM指令和16位的Thumb令。对于ARM指令来说,所有的指令长度都是32位,并且执行周期大多为单周期,指令都是有条件执行的。thumb指令的特点如下

1、指令执行条件经常不会使用;

2、源寄存器与目标寄存器经常是相同的;

3、使用的寄存器数量比较少;

4、常数的值比较小;

5、内核中的桶式移位器(barrel shifter)经常是不使用的;

 3.1 目标代码大小(密度)

16位的Thumb指令一般可以完成和32ARM相同的任务。

当用户使用C程序来处理应用时,如果编译为Thumb指令,那么它的目标代码大小只有编译为ARM指令时的65%左右,这样就增加了指令密度。一般认为:

Thumb代码所需的存储空间约为ARM代码的60%~70%。

Thumb代码使用的指令数比ARM代码多约30%~40%。

3.2 性能

处理器在这两种状态下的性能是依赖于指令执行的存储器的宽度的。下面的图2.2具体说明二者的性能比较。


可以看出:

1在存储器是32位的情况下ARM性能略好

这是因为同样的代码编译的结果Thumb指令将会比ARM30%-40%Thumb指令仍旧花费同样指令周期来从32-bit块内存预取。

216-bit内存上,即使有比ARM多的代码,这时Thumb性能也较好

这是因为Thumb每一条指令预取需要一个周期而每条ARM指令需要两个周期,因此尽管thumb指令比arm指令要多,但是依然比arm要快。

另外,在16-bit内存上,Thumb的性能降低了;这是因为数据去操作和特殊的堆栈操作,即使在Thumb下,堆栈操作仍是32-bit操作,导致低的性能在 16-bit内存架构上。

一个改进的方法是提供32-bit的内存来放置堆栈。在这种情况下的性能提高到了32-bit内存架构的水平。主要的差别是因为使用的整型的(32-bit)全局数据将仍被存储在16-bit内存上。

 另外,与ARM代码相比较,使用Thumb代码,存储器的功耗会降低约30%

 小结

       本节回答解释了第一章提出的问题12,即在一般的情况下,Thumb指令与ARM指令的时间效率和空间效率关系为:

l Thumb代码所需的存储空间约为ARM代码的60%~70%。

l Thumb代码使用的指令数比ARM代码多约30%~40%。

l 若使用32位的存储器,ARM代码比Thumb代码快约40%。

l 若使用16位的存储器,Thumb代码比ARM代码快约40%~50%。

l ARM代码相比较,使用Thumb代码,存储器的功耗会降低约30%。

    显然,ARM指令集和Thumb指令集各有其优点。

    若对系统的性能有较高要求,应使用32位的存储系统和ARM指令集;

    若对系统的成本及功耗有较高要求,则应使用16位的存储系统和Thumb指令集。

    当然,若两者结合使用,充分发挥其各自的优点,会取得更好的效果。

linux
相关资讯       arm 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款