使用ida pro做反编译时,要注意类型转换
反编译器常常在反编译的时候做一些假设,想调用call常常返回,内存模式是flat,函数框架被正确设置等。当这些假设是正确的,输出代码是正确的。当假设是错误的话,那么得到的代码就和真实的代码不一定一致。来看个例子,
使用反编译器得到如下伪码。
显然,变量v3(相当于edx)根本没有被初始化,为什么?
发生这样的时候,是因为被调用函数常常破坏寄存器的值。在x86约定中,只有esi,edi,ebx和ebp可以跨越call保存。换句话说,其他的寄存器可以通过一个函数调用改变它们的值。因此,反编译器假定函数遵守调用约定,它在函数调用前和函数调用后,把edx识别成两个变量。第一个变量被优化成a1,第二个变量v3成了未初始化的。
实际上 edx有以下三种可能。
-
未修改
-
用来返回一个值
-
被毁坏
通过被调用的函数,反编译器选择了第三种情况。来我们来看看如果是对的,会出现什么
正如我们看到,edx寄存器根本没有被引用。于是我们发现是第一种情况。
As we see, the edx register is not referenced at all, so we have the case #1. If the decompiler could find it out itself, without our help, our life would be much easier (maybe it will do so in the future!) Meanwhile, we have to add the required information ourselves. We do it using the Edit, Functions, Set function type command in IDA. The callee does not spoil any registers:
反编译器产生不同的伪码
因此,我们知道edx并没有通过call被修改。它不过是在调用前后建立了两个实例。
通过调用函数利用edx返回值。我们如下操作设置类型
上面表达式的意识是,函数带有一个参数,参数被调用者压栈,并把结果返回给edx
在第三种情况下,反编译器为edx建立两个不同的变量,第一个被优化掉,第二个被用来放返回值。
正如我们看到的,类型信息在反编译器中扮演了一个很重要的角色。为了得到一个正确的代码,我们要特别注意类型。