大学毕业N年了,在其中也或多或少的用到了一些ASM东西,但是都没有系统的学习,每次写完就不管,然后每次要用的时候都是用google去查资料,今天突然来了心情,想学学ASM,这个东西还是不错,对于软件或者游戏系统的性能能绝对的提高。:)
从X8086开始学了一年,第一个ASM的程序就是变32换16进制的程序,不过现在叫我从新开始写ASM程序,还是有点不会了。主要很多的东西忘了。先来学习一下ASM中必须知道的32位寄存器。
32位PC- CPU所含有的寄存器有:
4个数据寄存器(EAX、EBX、ECX和EDX)
2个变址和指针寄存器(ESI和EDI) 2个指针寄存器(ESP和EBP)
6个段寄存器(ES、CS、SS、DS、FS和GS)
1个指令指针寄存器(EIP) 1个标志寄存器(EFlags)
ARM:
ARM有37个寄存器,其中31个通用寄存器,6个状态寄存器.
PC-ASM(详细可以看)
1. 数据寄存器
数据寄存器主要用来保存操作数和运算结果等信息,从而节省读取操作数所需占用总线和访问存储器的时间.32位CPU有4个32位的通用寄存器EAX、EBX、ECX和EDX。对低16位数据的存取,不会影响高16位的数据。这些低16位寄存器分别命名为:AX、BX、CX和DX,它和先前的CPU中的寄存器相一致。
2.变址寄存器
32位CPU有2个32位通用寄存器ESI和EDI。其低16位对应先前CPU中的SI和DI,对低16位数据的存取,不影响高16位的数据。
寄存器ESI、EDI、SI和DI称为变址寄存器(Index Register),它们主要用于存放存储单元在段内的偏移量,用它们可实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。
3.指针寄存器
32位CPU有2个32位通用寄存器EBP和ESP。其低16位对应先前CPU中的SBP和SP,对低16位数据的存取,不影响高16位的数据。寄存器EBP、ESP、BP和SP称为指针寄存器(Pointer Register),主要用于存放堆栈内存储单元的偏移量,用它们可实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。
3.段寄存器
段寄存器是根据内存分段的管理模式而设置的。内存单元的物理地址由段寄存器的值和一个偏移量组合而成的,这样可用两个较少位数的值组合成一个可访问较大物理空间的内存地址。
CPU内部的段寄存器:
CS——代码段寄存器(Code Segment Register),其值为代码段的段值;
DS——数据段寄存器(Data Segment Register),其值为数据段的段值;
ES——附加段寄存器(Extra Segment Register),其值为附加数据段的段值;
SS——堆栈段寄存器(Stack Segment Register),其值为堆栈段的段值;
FS——附加段寄存器(Extra Segment Register),其值为附加数据段的段值;
GS——附加段寄存器(Extra Segment Register),其值为附加数据段的段值。
4.指令指针寄存器
32位CPU把指令指针扩展到32位,并记作EIP,EIP的低16位与先前CPU中的IP作用相同。
指令指针EIP、IP(Instruction Pointer)是存放下次将要执行的指令在代码段的偏移量。在具有预取指令功
能的系统中,下次要执行的指令通常已被预取到指令队列中,除非发生转移情况。所以,在理解它们的功能
时,不考虑存在指令队列的情况。
5.标志寄存器
a. 运算结果标志位
b. 状态控制标志位
c. 32位标志寄存器增加的标志位
ARM:
1.不分组寄存器(R0-R7)
不分组也就是说说,在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时,由于不同的处理器模式使用一个名字相同的物理寄存器,就是使用的同一个寄存器,这样可能造成寄存器中数据被破坏,所以在进行模式切换时必须加以保护。
2.备份寄存器(R8-R14)
对于R8-R12来说,除在快速中断模式下,每个模式对应相同物理寄存器,所以在FIQ模式下可不必保护和恢复中断现场。
对于R13-R14来说,每个寄存器对应6个不同的物理寄存器,其中一个是用户模式和系统模式共用的。
寄存器R13常用做栈指针SP,除用户和系统模式外,其他模式在使用时的名字构成为R13_<mode>。
寄存器R14又被称为连接寄存器(LR),除用户和系统模式外,其他模式在使用时的名字构成为R14_<mode>。
有下面两种特殊用途:
A、每个处理器模式自己的物理R14中存放在当前子程序的返回地址。当通过BL或BLX指令调用子程序时,R14被设置成该子程序的返回地址。
B、当异常中断发生时,该异常模式下的R14被设置成保存该模式基于PC的返回地址,对于有些异常模式,R14的值有可能与将返回的地址有个常数的偏移量,不同模式偏移量还有所不同(在ARM 的异常处理里有详细介绍)。
3.程序计数器R15
对于用户来说,尽量避免使用STR/STM指令来保存R15的值。当成功向R15写入一个地址数值时,程序将跳转到该地址执行。
在ARM状态下指令总是字对齐的,所以PC的PC[1:0]位恒为零,在想PC写入地址时一定要注意将PC[1:0]设为零。
ARM采用的是3级流水线结构,所以PC指向的是当前执行指令的下两条指令,PC-8为当前指令地址。
4.程序状态寄存器
CPSR(当前程序状态寄存器)可以在任何处理器模式下被访问。同时除了用户和系统模式以外,每中处理器模式下都有一个专用的物理状态寄存器,称为SPSR(备份程序状态寄存器)。当特定的异常中断发生时,这个寄存器用于存放当前程序状态寄存器的内容。当在用户模式和系统模式中访问SPSR,将会产生不可预知的结果。
CPSR和SPSR的格式相同,如下:
0:M0
1:M1
2:M2
3:M3
4:M4
5:T(=1 Thumb执行)
6:F(=1是禁止)
7:I(=1是禁止)
"#" 代表和一个字符串相连接
"##" 代表和一个符号连接,符号可以是变量,或另一个宏符号。
举例如下:
宏定义如下
(1)
#define DEV_FILE_NAME "/dev/test_kft"
#define OPEN_FILE(fd, n) \
{ \
fd = open(DEV_FILE_NAME #n,O_RDONLY); \
if(fd < 0) \
{ \
printf("Open device error\n"); \
return 0; \
} \
}
如此调用:
OPEN_FILE(fd1, 1);
OPEN_FILE(fd2, 2);
OPEN_FILE(fd3, 3);
OPEN_FILE(fd4, 4);
OPEN_FILE(fd5, 5);
OPEN_FILE(fd6, 6);
用gcc -E展开后,如下
2299: { fd1 = open("/dev/test_kft" "1",00); if(fd1 < 0) { printf("Open device error\n"); return 0; } };
2300: { fd2 = open("/dev/test_kft" "2",00); if(fd2 < 0) { printf("Open device error\n"); return 0; } };
2301: { fd3 = open("/dev/test_kft" "3",00); if(fd3 < 0) { printf("Open device error\n"); return 0; } };
2302: { fd4 = open("/dev/test_kft" "4",00); if(fd4 < 0) { printf("Open device error\n"); return 0; } };
2303: { fd5 = open("/dev/test_kft" "5",00); if(fd5 < 0) { printf("Open device error\n"); return 0; } };
2304: { fd6 = open("/dev/test_kft" "6",00); if(fd6 < 0) { printf("Open device error\n"); return 0; } };
如果没有定义DEV_FILE_NAME ,就是
2299: { fd1 = open(DEV_FILE_NAME "1",00); if(fd1 < 0) { printf("Open device error\n"); return 0; } };
2300: { fd2 = open(DEV_FILE_NAME "2",00); if(fd2 < 0) { printf("Open device error\n"); return 0; } };
2301: { fd3 = open(DEV_FILE_NAME "3",00); if(fd3 < 0) { printf("Open device error\n"); return 0; } };
2302: { fd4 = open(DEV_FILE_NAME "4",00); if(fd4 < 0) { printf("Open device error\n"); return 0; } };
2303: { fd5 = open(DEV_FILE_NAME "5",00); if(fd5 < 0) { printf("Open device error\n"); return 0; } };
2304: { fd6 = open(DEV_FILE_NAME "6",00); if(fd6 < 0) { printf("Open device error\n"); return 0; } };
所以可以很清楚的看出#n 解析出来的是"n" , 用于连接一个已有的字符串。
(2) 再来看 ## 是什么意思, 宏定义如下:
#define OPEN_FILE(fd, n) \
{ \
fd = open(DEV_FILE_NAME ##n,O_RDONLY); \
if(fd < 0) \
{ \
printf("Open device error\n"); \
return 0; \
} \
}
调用方式相同。
看宏展开:
2299: { fd1 = open(DEV_FILE_NAME1,00); if(fd1 < 0) { printf("Open device error\n"); return 0; } };
2300: { fd2 = open(DEV_FILE_NAME2,00); if(fd2 < 0) { printf("Open device error\n"); return 0; } };
2301: { fd3 = open(DEV_FILE_NAME3,00); if(fd3 < 0) { printf("Open device error\n"); return 0; } };
2302: { fd4 = open(DEV_FILE_NAME4,00); if(fd4 < 0) { printf("Open device error\n"); return 0; } };
2303: { fd5 = open(DEV_FILE_NAME5,00); if(fd5 < 0) { printf("Open device error\n"); return 0; } };
2304: { fd6 = open(DEV_FILE_NAME6,00); if(fd6 < 0) { printf("Open device error\n"); return 0; } };
现在看清楚了, ##n 的作用是把n直接连接在了一个符号的末尾. 好, 现在我们定义一个符号看看效果。
#define DEV_FILE_NAME1 "/dev/test_kft1"
再展开:
2299: { fd1 = open("/dev/test_kft1",00); if(fd1 < 0) { printf("Open device error\n"); return 0; } };
2300: { fd2 = open(DEV_FILE_NAME2,00); if(fd2 < 0) { printf("Open device error\n"); return 0; } };
2301: { fd3 = open(DEV_FILE_NAME3,00); if(fd3 < 0) { printf("Open device error\n"); return 0; } };
2302: { fd4 = open(DEV_FILE_NAME4,00); if(fd4 < 0) { printf("Open device error\n"); return 0; } };
2303: { fd5 = open(DEV_FILE_NAME5,00); if(fd5 < 0) { printf("Open device error\n"); return 0; } };
2304: { fd6 = open(DEV_FILE_NAME6,00); if(fd6 < 0) { printf("Open device error\n"); return 0; } };
很显然第一个符号被替换了, 因为是符号是宏的缘故。 这样我们也能把这一扩展特性应用在变量上。