2023-03-13 21:09:47 +08:00
# 第七章 脱壳
## 7.1 壳,加壳,脱壳
2023-03-19 23:01:23 +08:00
`Android` 的`APK` 文件实际上是一种压缩文件格式,它包含了应用程序的二进制代码、资源文件、清单文件等。在安装应用程序之前,系统会将`APK` 文件解压缩并安装到设备上。在`APK` 文件中,应用程序的二进制代码通常是以`DEX( Dalvik Executable) ` 格式存储的。`DEX` 格式是一种针对移动设备优化的字节码格式,与`Java` 虚拟机`( JVM) ` 的字节码格式有所不同。由于`DEX` 格式采用了特殊的指令集和数据结构,使得反编译工具可以轻松地将其转换为可读性较高的`Java` 代码。此外,许多反编译工具还可以通过反汇编和反混淆等技术来还原出源代码,因此为了防止应用程序的关键代码轻易被暴露,开发人员会采取一系列的手段来保护代码。
2023-03-13 21:09:47 +08:00
2023-03-19 23:01:23 +08:00
Android常规对代码保护的方案主要包括以下几种:
2023-03-13 21:09:47 +08:00
2023-03-19 23:01:23 +08:00
1. 混淆( Obfuscation) : 通过重命名类、方法、变量等标识符来隐藏程序逻辑, 使得反编译后的代码难以被理解和分析。
2. 压缩( Compression) : 将应用程序的二进制代码压缩成较小的体积, 防止恶意用户逆向工程和复制源代码。
3. 签名( Signing) : 在应用程序发布前, 使用数字证书对应用程序进行签名, 确保其完整性和来源可信。
4. 加固( Hardening) : 在应用程序内部添加额外的安全保护机制, 如代码加密、反调试、反注入等, 增强应用程序的抵御能力。
5. 动态加载( Dynamic Loading) : 将敏感的代码和资源文件放置在远程服务器上, 在运行时动态加载到本地设备, 以防止被攻击者轻易访问和修改。
### 7.1.1 什么是加壳
加壳`( Packing) ` 就是一种应用程序加固手段之一。它将原始应用程序二进制代码嵌入到一个特殊的外壳中,通过修改程序入口和解密算法等方式,增加反调试、反逆向、防篡改等安全机制,提高应用程序的安全性。
加壳的目的是使应用程序难以被攻击者分析和修改,从而提高应用程序的抵御能力。但是,加壳也会带来一些负面影响,如增加应用程序的体积、降低应用程序运行效率、可能引入新的安全漏洞等。
2023-03-13 21:09:47 +08:00
2023-03-19 23:01:23 +08:00
常见的加壳壳包括:
1. `DexProtector` :一款商业化的加壳工具,支持`Android` 和`iOS` 平台,可以对`Java` 代码和`NDK` 库进行加固。其特点是支持多种代码混淆技术,同时还提供了反调试、防止`Hook` 攻击、反模拟器等多种安全机制。
2. `Qihoo360` 加固保:一款免费的加壳工具,支持`Android` 和`iOS` 平台,采用自己研发的加固壳技术,可以对`Java` 代码和`C/C++` 库进行加固,同时还提供了反调试、反逆向、防篡改等多种安全机制。
3. `Bangcle` :一款国内著名的加壳工具,支持`Android` 和`iOS` 平台,提供了多种加固壳方案,如`DexShell、SOShell、` 加密资源等,同时还支持反调试、反注入等多种安全机制。
4. `APKProtect` :一款功能强大的加壳工具,支持`Android` 平台,可以对`Java` 代码和`Native` 库进行加固,支持多种加固方式,如代码混淆、`Resource Encryption、Anti-debugging` 等,同时还提供了反反编译、反调试等多种安全机制。
这些加壳工具都有不同的特点和适用场景,开发者可以根据实际需求选择合适的加壳壳进行加固。需要注意的是,加壳只是一种安全加固手段,不能取代其他常规的安全措施,并且可能带来一些负面影响,如体积增大、运行效率下降等。
2023-03-22 00:11:03 +08:00
### 7.1.2 如何脱壳
2023-03-13 21:09:47 +08:00
2023-03-21 00:54:36 +08:00
加壳的本质就是对DEX格式的java字节码进行保护避免被攻击者分析和修改, 而脱壳就是通过分析壳的特征和原理, 将被壳保护的java字节码还原出来, 通常用于逆向分析、恶意代码分析等领域。
脱壳常用的几个步骤如下。
1. 静态分析:通过对样本进行静态分析,获取样本中的壳的特征,加密算法、解密函数等信息,为后续的动态分析做好准备。
2. 动态分析: 在调试器或hook工具的帮助下, 运行加密的程序, 跟踪程序的执行流程, 并尝试找到解密或解压的位置, 获取加密或压缩前的原始数据。
3. 重构代码:通过分析反汇编代码,重新构建可读性高且易于理解的代码,以便更好地理解样本的行为。
在脱壳的过程中, 会面临开发者为保护代码而添加的各类的防护措施, 例如代码混淆、反调试、ROM检测、root检测、hook注入检测等加固手段, 而这个博弈的过程就是一种攻防对抗。而ROM脱壳将从另外一个层面解决一部分对抗的问题。
2023-03-13 21:09:47 +08:00
## 7.2 壳的特征
2023-03-21 00:54:36 +08:00
早期的Android应用程序很容易被反编译和修改, 因此一些开发者会使用简单的壳来保护自己的应用程序。这些壳主要是基于Java层的代码混淆和加密, 以及Native层的简单加密。
但是单纯的混淆和加密很难保障代码的安全性, 第一代壳, 动态加载壳就诞生了, 这时的思想主要还是将整个DEX进行加密保护, 在运行期间才会解密还原DEX文件, 再动态加载运行原文件。但是这样依赖Java的动态加载机制, 非常容易被攻击, 直接通过加载流程就能拿到被保护的数据, 这种壳的特征非常明显, 当反编译解析时, 只能看到壳的代码, 找不到任何Activity相关的处理, 这种情况就是动态加载壳了。
随后第二代壳, 指令抽取壳就出现了, 对Java层的代码进行函数粒度的保护, 第一代的思想是将整个DEX保护起来, 而第二代的思想就是只需要保护关键的函数即可。将原始DEX中需要保护的函数内部的codeitem进行清空, 将真正的函数内容加密保护存放在其他地方, 只有当这个函数真正执行时, 才通过解密函数将其还原填充回去, 达到让其能正常执行的目的, 有些指令抽取壳甚至会在函数执行完成后, 重新将codeitem清空。否则执行过一次的函数指令将很容易被还原出来。这种壳的特征可以通过函数内容的特征来分辨, 例如一些空的函数, 查看smali指令发现内部有大量的nop空指令, 这种情况就时指令抽取壳
随着攻防的对抗不断的升级, 第二代壳也无法带来安全保障, 第三代壳, 指令转换壳诞生了。指令转换壳的思想和指令抽取是相同的, 对具体的函数进行保护, 但是在第二代壳的缺陷上进行了优化, 由于指令抽取壳最终依然还是一个Java函数的调用, 最终还是要将指令回填后进行执行的。不管是如何保护, 只要在获取到执行过程中的`codeitem` ,就能轻易的修复为真实的`DEX` 文件。而指令转换壳则是将被保护的函数转换为native, 将函数的指令集解析成中间码, 中间码会被映射到自定义的虚拟机进行解析执行。这样就不会走Android提供的指令解析执行流程了。但是这样也会导致函数执行过慢, 以及一些兼容问题, 这类壳的特征也非常明显, 就是native化一些函数, 并且可能会包含大量密集的虚拟指令。
2023-03-22 00:11:03 +08:00
## 7.3 脱壳的原理
了解Android中类的加载机制和函数执行的调用流程是理解如何脱壳的基础。在Android系统中, 应用程序是在`Dalvik` 或者`ART` 虚拟机上运行的。当应用启动时, Android系统会根据应用程序包中的`AndroidManifest.xml` 文件来确定应用程序中哪些组件需要被启动,并且在启动过程中加载应用程序所需的类。
Android中的类加载器遵循双亲委派模型, 即每个类加载器在尝试加载一个类之前, 都会先委托其父类加载器去加载该类。如果父类加载器无法完成加载任务, 则子类加载器才会尝试自行加载。这个模型保证了不同的类只会被加载一次, 同时也保护了核心`Java API` 不被恶意代码篡改。
在Android应用程序中, 每个类都会被分配到一个特定的`DEX` 文件(即`Dalvik Executable` )中。`DEX` 文件中包含了所有该类的方法和属性的字节码。当一个应用程序启动时, 它的DEX文件会被加载到内存中, 并由虚拟机负责解释执行其中的代码。
在函数执行的调用流程中,当一个函数被调用时,虚拟机会将当前线程的状态保存下来,并跳转到被调用函数的入口地址开始执行该函数。在函数执行期间,虚拟机会对函数中的指令进行解释执行,并维护函数执行过程中所需的各种数据结构,例如栈帧等。在函数执行完毕后,虚拟机会将结果返回给调用方,并恢复之前保存的线程状态。
深入学习Android的类加载机制和函数执行的调用流程, 可以更好地理解应用程序的运行机制和寻找脱壳点。
### 7.3.1 双亲委派机制
`Android` 中的类通常是在`DEX` 文件中保存的,而`ClassLoader` 则是用来加载这些`DEX` 文件的。在Android中, 每个应用程序包`( APK) ` 都包含一个或多个`DEX` 文件,这些`DEX` 文件中包含了应用程序的所有类信息。当一个类需要被使用时,`ClassLoader` 就会从相应的`DEX` 文件中加载该类,并将其转换成可执行的`Java` 类。因此,`ClassLoader` 和`DEX` 密切相关,`ClassLoader` 是`DEX` 文件的载体和管理者。下面是在`AOSP12` 中各类的`ClassLoader` 。
1. `BootClassLoader` :位于 `ClassLoader ` 层次结构中的最顶层。负责加载系统级别的类,如` Java` 核心库和一些基础库。
2. `PathClassLoader` :从应用程序的` APK` 文件中加载类和资源。`PathClassLoader ` 继承自` BaseDexClassLoader ` 类,它能够加载已经被优化的 `Dex` 文件和未经过优化的 `Dex` 文件。`PathClassLoader` 主要用于加载已经打包在 `APK ` 文件中的代码和资源。
3. `DexClassLoader` :从` .dex` 或` .odex` 文件中加载类。`DexClassLoader ` 继承自` BaseDexClassLoader ` 类,它支持动态加载 `Dex ` 文件,并且可以在运行时进行优化操作。`DexClassLoader ` 主要用于加载未安装的 `APK` 文件中的代码。
4. `InMemoryDexClassLoader` :用于从内存中加载已经存在于内存中的` dex ` 文件。它继承自 `BaseDexClassLoader` ,并且可以处理多个` dex ` 文件。`InMemoryDexClassLoader ` 可以在运行时动态加载 `dex` 文件,并且不需要将文件保存到磁盘上,从而提高应用程序的性能。`InMemoryDexClassLoader` 主要可以用于自定义类加载器场景下。
5. `BaseDexClassLoader` : `DexClassLoader` 、`InMemoryDexClassLoader` 和 `PathClassLoader` 的基类,封装了加载 `dex` 文件的基本逻辑,包括创建` DexPathList` 对象、打开 `dex ` 文件、查找类等操作。`BaseDexClassLoader ` 实现了双亲委派模型,即在自身无法加载类时,会委派给父类加载器进行查找。`BaseDexClassLoader` 还支持多个 `dex ` 文件的加载,并且可以在运行时进行优化操作。
类加载器采用了双亲委派机制`( Parent Delegation Model) ` ,这是一种经典的`Java` 类加载机制。
双亲委派机制是指当一个类加载器收到请求去加载一个类时,它并不会自己去加载,而是把这个任务委托给父类加载器去完成。如果父类加载器还存在父类加载器,这个请求就会向上递归,直到达到最顶层的`BootClassLoader` 为止。也就是说,最先调用加载的`ClassLoader` 是最顶层的,最后尝试加载的是当前的`ClassLoader` 。
采用双亲委派机制可以有效地避免类的重复加载,并保证核心`API` 的安全性。具体表现为:
- 在类加载时,首先从当前加载器的缓存中查找是否已经加载了该类,如果已经加载,则直接返回;
- 如果没有在缓存中找到该类,则将加载任务委派给父类加载器去完成;
- 父类加载器如果也没有找到该类,则将会递归向上委派,直到`BootClassLoader` ;
- `BootClassLoader` 无法代理加载的类,则会让子类加载器自行加载。
明白了双亲委派机制后, 了解到继承关系对于ClassLoader是非常重要的, 下图是它们之间的继承关系。
TODO 帮我补一个继承关系的图
### 7.3.2 类的加载流程
在`Android` 中,`ClassLoader` 类是双亲委派机制的主要实现者。该类提供了`findClass` 和`loadClass` 方法,其中`findClass` 是`ClassLoader` 的抽象方法,需要由子类实现。接下来将跟踪源码实现,详细了解`ClassLoader` 是如何进行类加载流程的。
在前文中曾经介绍过如何使用`DexClassLoader` 加载一个类,并调用其中的函数,下面是当时的加载样例代码。
```java
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
String dexPath = "/system/framework/kjar.jar";
String dexOutputDir = getApplicationInfo().dataDir;
ClassLoader classLoader = new DexClassLoader(dexPath, dexOutputDir, null,
getClass().getClassLoader());
Class< ?> clazz2 = null;
try {
clazz2 = classLoader.loadClass("cn.mik.myjar.MyCommon");
Method addMethod = clazz2.getDeclaredMethod("add", int.class,int.class);
Object result = addMethod.invoke(null, 12,25);
Log.i("MainActivity","getMyJarVer:"+result);
} catch (ClassNotFoundException e) {
e.printStackTrace();
} catch (InvocationTargetException e) {
e.printStackTrace();
} catch (NoSuchMethodException e) {
e.printStackTrace();
} catch (IllegalAccessException e) {
e.printStackTrace();
}
}
```
`ClassLoader ` 加载类时,`loadClass` 和` findClass` 都可以完成对类的加载工作,它们在加载类时有着不同的作用和执行流程。
首先看看`loadClass` 的特征,它的方法签名如下。
````java
protected Class< ?> loadClass( final String class_name, final boolean resolve ) throws ClassNotFoundException;
````
其中`name` 参数表示要加载的类的全名;`resolve` 参数表示是否需要在加载完成后进行链接操作。如果 `resolve` 参数为` true` ,则会尝试在加载完成后对该类进行链接操作,包括验证、准备和解析等步骤。如果 `resolve` 参数为` false` ,则不会进行链接操作。
在执行` loadClass ` 方法时,`ClassLoader ` 会先检查自身是否已经加载过该类,如果已经加载过,则直接返回该类的` Class` 对象。如果没有加载过,则将任务委托给父类加载器进行处理,如果父类加载器无法加载该类,则再次调用自身的` findClass` 方法进行加载。如果` findClass` 方法仍然无法找到该类,则抛出 `ClassNotFoundException` 异常。
接下来再了解下`findClass` 方法,它 是 `BaseClassLoader ` 类中定义的一个抽象方法,用于在特定的数据源(如文件、内存等)中查找指定名称的类,并返回对应的` Class` 对象。下面是方法签名。
```java
protected abstract Class< ?> findClass(String name) throws ClassNotFoundException;
```
与` loadClass` 不同,`findClass` 方法并不会先委派给父类加载器进行处理,而是直接在当前 `ClassLoader ` 中进行查找。如果能够找到指定的类,则通过 `defineClass ` 方法将其转换成 Class 对象,并返回该对象;否则,抛出 `ClassNotFoundException ` 异常。
明白了两者的区别后, 接下来开始跟踪源码, 了解在AOSP具体是如何加载类的。首先找到`DexClassLoader` 中`loadClass` 的实现代码。
```java
public class DexClassLoader extends BaseDexClassLoader {
public DexClassLoader(String dexPath, String optimizedDirectory,
String librarySearchPath, ClassLoader parent) {
super(dexPath, null, librarySearchPath, parent);
}
}
```
发现内部并没有任何代码,说明该实现来自于父类中,接着来查看父类`BaseDexClassLoader`
```java
public class BaseDexClassLoader extends ClassLoader {
public BaseDexClassLoader(String dexPath, File optimizedDirectory, String librarySearchPath, ClassLoader parent) {
...
}
protected Class< ?> findClass(String name) throws ClassNotFoundException {
...
}
protected URL findResource(String name) {
...
}
protected Enumeration< URL > findResources(String name) {
...
}
public String findLibrary(String name) {
...
}
protected synchronized Package getPackage(String name) {
...
}
public String toString() {
...
}
}
```
同样没有找到`loadClass` 的实现,继续看它的父类`ClassLoader` 的实现。
```java
public abstract class ClassLoader {
...
// 调用了另外一个重载, resolve参数不传的情况默认为false
public Class< ?> loadClass(String name) throws ClassNotFoundException {
return loadClass(name, false);
}
protected Class< ?> loadClass(String name, boolean resolve)
throws ClassNotFoundException
{
// 尝试在已经加载过的里面查找
Class< ?> c = findLoadedClass(name);
if (c == null) {
try {
// 有父类的情况,就让父类来加载
if (parent != null) {
c = parent.loadClass(name, false);
} else {
// 到达父类顶端后,则使用这个函数查找,通常来查找引导类和扩展类
c = findBootstrapClassOrNull(name);
}
} catch (ClassNotFoundException e) {
// ClassNotFoundException thrown if class not found
// from the non-null parent class loader
}
if (c == null) {
// 父类没有找到的情况, 再通过findClass查找
c = findClass(name);
}
}
return c;
}
...
protected Class< ?> findClass(String name) throws ClassNotFoundException {
throw new ClassNotFoundException(name);
}
}
```
通过这里的代码,能够很清晰的看到前文中`ClassLoader` 的双亲委派机制,接着继续跟踪`findClass` 分析当前`ClassLoader` 是如何加载类的,由于`ClassLoader` 是一个抽象类,而`findClass` 在该类中并未实现具体代码,所以该方法是在子类中实现,上面在`BaseDexClassLoader` 的类中,就已经看到的`findClass` 的函数,下面是具体实现。
```java
public class BaseDexClassLoader extends ClassLoader {
...
private final DexPathList pathList;
...
protected Class< ?> findClass(String name) throws ClassNotFoundException {
// 首先检查当前ClassLoader是否有共享库, 如果有则遍历每个共享库的ClassLoader去尝试加载该类
if (sharedLibraryLoaders != null) {
for (ClassLoader loader : sharedLibraryLoaders) {
try {
return loader.loadClass(name);
} catch (ClassNotFoundException ignored) {
}
}
}
List< Throwable > suppressedExceptions = new ArrayList< Throwable > ();
// 当前ClassLoader操作的dex文件中查找该类
Class c = pathList.findClass(name, suppressedExceptions);
if (c == null) {
ClassNotFoundException cnfe = new ClassNotFoundException(
"Didn't find class \"" + name + "\" on path: " + pathList);
for (Throwable t : suppressedExceptions) {
cnfe.addSuppressed(t);
}
throw cnfe;
}
return c;
}
...
}
```
`pathList` 是一个`DexPathList` 对象,表示当前`ClassLoader` 所操作的一组`dex` 文件的路径列表。`findClass()` 方法通过调用`DexPathList.findClass()` 方法来查找指定名称的类。继续跟进查看。
```java
public final class DexPathList {
...
private Element[] dexElements;
...
public Class< ?> findClass(String name, List< Throwable > suppressed) {
for (Element element : dexElements) {
Class< ?> clazz = element.findClass(name, definingContext, suppressed);
if (clazz != null) {
return clazz;
}
}
if (dexElementsSuppressedExceptions != null) {
suppressed.addAll(Arrays.asList(dexElementsSuppressedExceptions));
}
return null;
}
...
}
```
`dexElements` 的数组存放着所有已经加载的`dex` 文件中的类信息。具体来说,每个`dex` 文件都被解析为一个`DexFile` 对象,而`dexElements` 数组中的每个元素实际上就是一个`Element` 对象,代表了一个`dex` 文件和其中包含的类信息。这些`Element` 对象按照优先级顺序排列,以便`ClassLoader` 可以根据它们的顺序来查找类定义。继续查看`Element` 的`findClass` 方法实现。
```java
static class Element {
...
// 管理着一个dex文件
private final DexFile dexFile;
...
private String getDexPath() {
if (path != null) {
return path.isDirectory() ? null : path.getAbsolutePath();
} else if (dexFile != null) {
// DexFile.getName() returns the path of the dex file.
return dexFile.getName();
}
return null;
}
2023-03-21 00:54:36 +08:00
2023-03-22 00:11:03 +08:00
@Override
public String toString() {
if (dexFile == null) {
return (pathIsDirectory ? "directory \"" : "zip file \"") + path + "\"";
} else if (path == null) {
return "dex file \"" + dexFile + "\"";
} else {
return "zip file \"" + path + "\"";
}
}
public Class< ?> findClass(String name, ClassLoader definingContext,
List< Throwable > suppressed) {
return dexFile != null ? dexFile.loadClassBinaryName(name, definingContext, suppressed)
: null;
}
...
}
```
可以看到这里实际就是管理一个对应的`DexFile` 对象,该对象关联着一个对应的`dex` 文件,到这里通过调用`DexFile` 对象的`loadClassBinaryName` 去加载这个类,继续跟踪它的实现。
```java
public final class DexFile {
...
public Class loadClassBinaryName(String name, ClassLoader loader, List< Throwable > suppressed) {
return defineClass(name, loader, mCookie, this, suppressed);
}
...
private static Class defineClass(String name, ClassLoader loader, Object cookie,
DexFile dexFile, List< Throwable > suppressed) {
Class result = null;
try {
result = defineClassNative(name, loader, cookie, dexFile);
} catch (NoClassDefFoundError e) {
if (suppressed != null) {
suppressed.add(e);
}
} catch (ClassNotFoundException e) {
if (suppressed != null) {
suppressed.add(e);
}
}
return result;
}
...
private static native Class defineClassNative(String name, ClassLoader loader, Object cookie,
DexFile dexFile)
throws ClassNotFoundException, NoClassDefFoundError;
}
```
这里看到经过几层调用后,进入了`native` 实现了, 根据AOSP中`native` 注册的原理,直接搜索`DexFile_defineClassNative` 找到对应的实现代码如下。
```java
static jclass DexFile_defineClassNative(JNIEnv* env,
jclass,
jstring javaName,
jobject javaLoader,
jobject cookie,
jobject dexFile) {
std::vector< const DexFile * > dex_files;
const OatFile* oat_file;
// cookie转换成一组c++中的DexFile对象以及OatFile
if (!ConvertJavaArrayToDexFiles(env, cookie, /*out*/ dex_files, /*out*/ oat_file)) {
VLOG(class_linker) < < "Failed to find dex_file";
DCHECK(env->ExceptionCheck());
return nullptr;
}
...
// 将类名转换为c++的string存放在了descriptor中
// 这里会将java中的类描述符转换为c++使用的类描述符,例如类中的.转换为\
const std::string descriptor(DotToDescriptor(class_name.c_str()));
const size_t hash(ComputeModifiedUtf8Hash(descriptor.c_str()));
for (auto& dex_file : dex_files) {
// 根据类描述符找到对应的类
const dex::ClassDef* dex_class_def =
OatDexFile::FindClassDef(*dex_file, descriptor.c_str(), hash);
if (dex_class_def != nullptr) {
ScopedObjectAccess soa(env);
ClassLinker* class_linker = Runtime::Current()->GetClassLinker();
...
// 使用类加载器和 DEX 文件定义一个新的 Java 类,并返回一个描述该类的 Class 对象指针
ObjPtr< mirror::Class > result = class_linker->DefineClass(soa.Self(),
descriptor.c_str(),
hash,
class_loader,
*dex_file,
*dex_class_def);
// 将DexFile插入到ClassLoader中。
class_linker->InsertDexFileInToClassLoader(soa.Decode< mirror::Object > (dexFile),
class_loader.Get());
if (result != nullptr) {
VLOG(class_linker) < < "DexFile_defineClassNative returning " < < result
< < " for " < < class_name.c_str ( ) ;
return soa.AddLocalReference< jclass > (result);
}
}
}
VLOG(class_linker) < < "Failed to find dex_class_def " < < class_name.c_str ( ) ;
return nullptr;
}
```
代码中看到`cookie` 中能拿到所有`DexFile` ,最终的`Class` 对象是有`DefineClass` 方法定义后返回的。继续看其实现过程。
```java
ObjPtr< mirror::Class > ClassLinker::DefineClass(Thread* self,
const char* descriptor,
size_t hash,
Handle< mirror::ClassLoader > class_loader,
const DexFile& dex_file,
const dex::ClassDef& dex_class_def) {
...
DexFile const* new_dex_file = nullptr;
dex::ClassDef const* new_class_def = nullptr;
// 类被加载前的预处理
Runtime::Current()->GetRuntimeCallbacks()->ClassPreDefine(descriptor,
klass,
class_loader,
dex_file,
dex_class_def,
& new_dex_file,
&new_class_def);
// 将dex文件加载到内存中
ObjPtr< mirror::DexCache > dex_cache = RegisterDexFile(*new_dex_file, class_loader.Get());
if (dex_cache == nullptr) {
self->AssertPendingException();
return sdc.Finish(nullptr);
}
klass->SetDexCache(dex_cache);
// 初始化类
SetupClass(*new_dex_file, *new_class_def, klass, class_loader.Get());
...
// 向类表中插入类对象
ObjPtr< mirror::Class > existing = InsertClass(descriptor, klass.Get(), hash);
...
// 加载并初始化类,在必要时创建新的类对象
LoadClass(self, *new_dex_file, *new_class_def, klass);
...
MutableHandle< mirror::Class > h_new_class = hs.NewHandle< mirror::Class > (nullptr);
// 链接类及其相关信息
if (!LinkClass(self, descriptor, klass, interfaces, & h_new_class)) {
// Linking failed.
if (!klass->IsErroneous()) {
mirror::Class::SetStatus(klass, ClassStatus::kErrorUnresolved, self);
}
return sdc.Finish(nullptr);
}
return sdc.Finish(h_new_class);
}
```
`ClassPreDefine` 是一个回调函数,它在类被加载之前被调用,用于进行一些预处理工作。具体来说,`ClassPreDefin` 会被调用以执行以下任务:
- 对新定义的类进行验证和解析,以确保类结构的正确性。
- 为新定义的类分配内存空间,并构造新对象的实例。
- 设置类的访问控制权限并更新关联的缓存信息。
`RegisterDexFile` 用于注册 `DEX` 文件。该函数负责将 `DEX ` 文件加载到内存中,并将其中包含的类和相关信息注册到运行时环境中,以供后续的程序使用。该函数的主要负责:
- 将 `DEX ` 文件加载到内存中,并为其分配一段连续的内存空间。
- 在运行时环境中创建` mirror::DexFile ` 对象,该对象包含了` DEX` 文件的元数据信息,例如文件名、`MD5 ` 哈希值等。
- 为` DEX ` 文件中包含的每个类创建相应的` mirror::Class` 对象,并将其添加到类表中进行管理。
- 为新创建的` mirror::Class` 对象设置其访问权限和其他属性,例如类标志、字段、方法等。
- 创建并返回一个 `mirror::DexCache ` 对象,该对象表示已注册的` DEX ` 文件的缓存信息。
`SetupClass` 函数用于初始化类。该函数的主要作用:
- 解析类定义,并为其分配内存空间。
- 为新创建的类对象设置相关信息,例如类名、超类、接口信息等。
- 设置类对象的访问修饰符和标志。
- 将类对象添加到运行时环境中进行管理。
- 在必要的情况下,执行与类加载生命周期有关的回调函数。
`InsertClass` 函数用于向类表中插入新的类对象,并确保在插入之前对其进行必要的验证和初始化工作。该函数的主要作用:
- 根据类描述符和哈希值查找类表中是否已经存在相同的类对象。
- 如果已经存在相同的类对象,则返回其指针,否则将新的类对象插入到类表中,并返回其指针。
- 在插入新的类对象之前,会先进行一些验证工作,例如检查类的访问权限,以及确保类的结构和超类的继承关系正确等。
- 在需要时,执行与类加载生命周期有关的回调函数。
`LoadClass` 函数用于加载并初始化类。并将其插入到类表中进行管理。主要作用:
1. 根据类描述符查找类表中是否已经存在相同的类对象,如存在则直接返回其指针。
2. 如果类表中不存在相同的类对象,则先使用 `SetupClass()` 函数创建新的类对象,并将其插入到类表中。此处调用了 `InsertClass()` 函数。
3. 加载并初始化类的超类及接口信息,以确保类的继承关系正确。
4. 执行与类加载生命周期有关的回调函数。
` LinkClass` 函数是在用于链接类,该函数会返回一个新的类对象指针,以供调用者使用。主要作用:
1. 链接类的超类,并执行与超类有关的初始化工作。
2. 链接类实现的接口,并执行与接口有关的初始化工作。
3. 链接类的字段,并执行与字段有关的初始化工作。
4. 链接类的方法,并执行与方法有关的初始化工作。
5. 在必要时创建新的类对象,并将其返回给调用者。
2023-03-22 23:48:18 +08:00
将加载类的过程中几个关键的步骤搞清楚后,继续深入查看`LoadClass` 是如何实现的,重点关注最后一个参数`kclass` 做了些什么。
2023-03-22 00:11:03 +08:00
2023-03-22 23:48:18 +08:00
```c++
void ClassLinker::LoadClass(Thread* self,
const DexFile& dex_file,
const dex::ClassDef& dex_class_def,
Handle< mirror::Class > klass) {
...
Runtime* const runtime = Runtime::Current();
{
...
// 获取类加载器的线性内存分配器
LinearAlloc* const allocator = GetAllocatorForClassLoader(klass->GetClassLoader());
// 为类中的静态字段分配内存空间
LengthPrefixedArray< ArtField > * sfields = AllocArtFieldArray(self,
allocator,
accessor.NumStaticFields());
// 为类中的实例字段分配内存空间
LengthPrefixedArray< ArtField > * ifields = AllocArtFieldArray(self,
allocator,
accessor.NumInstanceFields());
...
// 设置类的方法列表指针
klass->SetMethodsPtr(
AllocArtMethodArray(self, allocator, accessor.NumMethods()),
accessor.NumDirectMethods(),
accessor.NumVirtualMethods());
size_t class_def_method_index = 0;
uint32_t last_dex_method_index = dex::kDexNoIndex;
size_t last_class_def_method_index = 0;
// 遍历类的所有方法和字段
accessor.VisitFieldsAndMethods([& ](
const ClassAccessor::Field& field) REQUIRES_SHARED(Locks::mutator_lock_) {
...
// 遍历所有字段, 由last_static_field_idx判断是否正在处理的是静态字段
if (num_sfields == 0 || LIKELY(field_idx > last_static_field_idx)) {
// 加载字段信息
LoadField(field, klass, &sfields->At(num_sfields));
++num_sfields;
last_static_field_idx = field_idx;
}
}, [& ](const ClassAccessor::Field& field ) REQUIRES_SHARED(Locks::mutator_lock_) {
...
// 加载实例字段信息
if (num_ifields == 0 || LIKELY(field_idx > last_instance_field_idx)) {
LoadField(field, klass, &ifields->At(num_ifields));
++num_ifields;
last_instance_field_idx = field_idx;
}
}, [& ](const ClassAccessor::Method& method ) REQUIRES_SHARED(Locks::mutator_lock_) {
// 获取实例方法
ArtMethod* art_method = klass->GetDirectMethodUnchecked(class_def_method_index,
image_pointer_size_);
// 将dex_file参数中指向Java方法字节码的指针(method)解析为机器码, 并将它存储到art_method参数对应的内存区域中, 完成对Java方法实现代码的加载
LoadMethod(dex_file, method, klass, art_method);
// 将art_method参数对应的实现代码链接到oat_class_ptr参数对应的oat文件中
LinkCode(this, art_method, oat_class_ptr, class_def_method_index);
...
}, [& ](const ClassAccessor::Method& method ) REQUIRES_SHARED(Locks::mutator_lock_) {
// 和上面差不多的,不过这里处理的是虚方法
ArtMethod* art_method = klass->GetVirtualMethodUnchecked(
class_def_method_index - accessor.NumDirectMethods(),
image_pointer_size_);
LoadMethod(dex_file, method, klass, art_method);
LinkCode(this, art_method, oat_class_ptr, class_def_method_index);
++class_def_method_index;
});
...
// 将加载好的字段保存到kclass
klass->SetSFieldsPtr(sfields);
DCHECK_EQ(klass->NumStaticFields(), num_sfields);
klass->SetIFieldsPtr(ifields);
DCHECK_EQ(klass->NumInstanceFields(), num_ifields);
}
// Ensure that the card is marked so that remembered sets pick up native roots.
WriteBarrier::ForEveryFieldWrite(klass.Get());
self->AllowThreadSuspension();
}
```
然后再了解一下`LoadField` 和`LoadMethod` 是如何加载的。
```c++
void ClassLinker::LoadField(const ClassAccessor::Field& field,
Handle< mirror::Class > klass,
ArtField* dst) {
// 可以看到实际就是将值填充给了dst
const uint32_t field_idx = field.GetIndex();
dst->SetDexFieldIndex(field_idx);
dst->SetDeclaringClass(klass.Get());
dst->SetAccessFlags(field.GetAccessFlags() | hiddenapi::CreateRuntimeFlags(field));
}
void ClassLinker::LoadMethod(const DexFile& dex_file,
const ClassAccessor::Method& method,
Handle< mirror::Class > klass,
ArtMethod* dst) {
const uint32_t dex_method_idx = method.GetIndex();
const dex::MethodId& method_id = dex_file.GetMethodId(dex_method_idx);
const char* method_name = dex_file.StringDataByIdx(method_id.name_idx_);
ScopedAssertNoThreadSuspension ants("LoadMethod");
dst->SetDexMethodIndex(dex_method_idx);
dst->SetDeclaringClass(klass.Get());
...
// 如果加载的是finalize方法
if (UNLIKELY(strcmp("finalize", method_name) == 0)) {
...
} else if (method_name[0] == '< ') {
// 处理构造函数
bool is_init = (strcmp("< init > ", method_name) == 0);
bool is_clinit = !is_init & & (strcmp("< clinit > ", method_name) == 0);
if (UNLIKELY(!is_init & & !is_clinit)) {
LOG(WARNING) < < "Unexpected '< ' at start of method name " < < method_name ;
} else {
if (UNLIKELY((access_flags & kAccConstructor) == 0)) {
LOG(WARNING) < < method_name < < " didn ' t have expected constructor access flag in class "
< < klass- > PrettyDescriptor() < < " in dex file " < < dex_file.GetLocation ( ) ;
// access_flags存储了Java方法的访问标志, 如public、private、static等。kAccConstructor是一个常量, 表示Java构造函数的访问标志
access_flags |= kAccConstructor;
}
}
}
// 判断是否为native函数
if (UNLIKELY((access_flags & kAccNative) != 0u)) {
// Check if the native method is annotated with @FastNative or @CriticalNative .
access_flags |= annotations::GetNativeMethodAnnotationAccessFlags(
dex_file, dst->GetClassDef(), dex_method_idx);
}
// 设置该方法的访问标志
dst->SetAccessFlags(access_flags);
// 判断是否为接口类的抽象方法
if (klass->IsInterface() & & dst->IsAbstract()) {
// 计算并设置抽象方法的IMT索引。IMT(Interface Method Table)是一个虚拟表,用于存储接口类中的所有方法索引。
dst->CalculateAndSetImtIndex();
}
// 这个java方法是否有可执行代码, 也就是java字节码, 方法的具体执行指令集
if (dst->HasCodeItem()) {
DCHECK_NE(method.GetCodeItemOffset(), 0u);
// 根据当前是否采用AOT编译器来进行不同的方式填充可执行代码。
if (Runtime::Current()->IsAotCompiler()) {
dst->SetDataPtrSize(reinterpret_cast32< void * > (method.GetCodeItemOffset()), image_pointer_size_);
} else {
dst->SetCodeItem(dst->GetDexFile()->GetCodeItem(method.GetCodeItemOffset()));
}
} else {
dst->SetDataPtrSize(nullptr, image_pointer_size_);
DCHECK_EQ(method.GetCodeItemOffset(), 0u);
}
// 检查该方法的参数类型和返回值类型是否符合要求
const char* shorty = dst->GetShorty();
bool all_parameters_are_reference = true;
bool all_parameters_are_reference_or_int = true;
bool return_type_is_fp = (shorty[0] == 'F' || shorty[0] == 'D');
for (size_t i = 1, e = strlen(shorty); i < e ; + + i ) {
if (shorty[i] != 'L') {
all_parameters_are_reference = false;
if (shorty[i] == 'F' || shorty[i] == 'D' || shorty[i] == 'J') {
all_parameters_are_reference_or_int = false;
break;
}
}
}
// Java方法设置是否启用Nterp快速路径, 如果该函数非native的, 并且参数全部为引用类型, 则设置该方法的entry_point_from_interpreter_为Nterp快速路径
if (!dst->IsNative() & & all_parameters_are_reference) {
dst->SetNterpEntryPointFastPathFlag();
}
// 返回值类型非浮点型, 并且所有参数类型都是引用类型或整型, 则设置该方法的invocation_count_为Nterp快速路径
if (!return_type_is_fp & & all_parameters_are_reference_or_int) {
dst->SetNterpInvokeFastPathFlag();
}
}
```
`finalize` 是`Java` 中的一个方法,定义在`Object` 类中,用于执行垃圾回收前的资源清理工作。当某个对象不再被引用时,垃圾回收器会调用该对象的`finalize` 方法来完成一些特定的清理操作,如释放非托管资源等。
`Nterp` 快速路径`( Nterp Fast Path) ` 是`ART` 虚拟机的一种执行模式,可以在不进行线程切换的情况下快速执行`Java` 方法。具体来说,`Nterp` 快速路径使用一种特殊的、基于指令计数器的执行模式来处理`Java` 方法,以实现更高效的性能。
`Nterp` 快速路径的作用是提高`Java` 方法的执行速度和效率,特别是在热点代码部分,可以获得更高的吞吐量和更低的延迟。另外,由于采用了一些特殊的优化技术,如参数传递方式改变、返回值处理流程优化等,`Nterp` 快速路径还可以减少`JNI` 开销,从而提升整个应用程序的性能表现。
在前文介绍native的动态注册时, 曾经简单的讲解`LinkCode` ,这里再次对这个重点函数进行详细的了解。
```c++
bool ClassLinker::ShouldUseInterpreterEntrypoint(ArtMethod* method, const void* quick_code) {
...
if (quick_code == nullptr) {
return true;
}
..
return false;
}
static void LinkCode(ClassLinker* class_linker,
ArtMethod* method,
const OatFile::OatClass* oat_class,
uint32_t class_def_method_index) REQUIRES_SHARED(Locks::mutator_lock_) {
...
const void* quick_code = nullptr;
if (oat_class != nullptr) {
const OatFile::OatMethod oat_method = oat_class->GetOatMethod(class_def_method_index);
// 获取一个方法的快速代码( Quick Code) , 用于设置该方法的入口点地址
quick_code = oat_method.GetQuickCode();
}
// 如果有方法的快速代码,否则使用解释器执行,在下一节的函数调用中会详细讲到
bool enter_interpreter = class_linker->ShouldUseInterpreterEntrypoint(method, quick_code);
if (quick_code == nullptr) {
// 设置一个方法的入口点位置, 可以是快速代码, 解释器入口, 或者native函数的入口地址
method->SetEntryPointFromQuickCompiledCode(
method->IsNative() ? GetQuickGenericJniStub() : GetQuickToInterpreterBridge());
} else if (enter_interpreter) {
// 设置解释器入口为该方法的入口点位置
method->SetEntryPointFromQuickCompiledCode(GetQuickToInterpreterBridge());
} else if (NeedsClinitCheckBeforeCall(method)) {
DCHECK(!method->GetDeclaringClass()->IsVisiblyInitialized());
method->SetEntryPointFromQuickCompiledCode(GetQuickResolutionStub());
} else {
method->SetEntryPointFromQuickCompiledCode(quick_code);
}
// 给native设置入口地址的, 在第六章动态注册中讲到。
if (method->IsNative()) {
...
}
}
```
快速代码是指一种优化后的本地机器代码,它可以直接执行`Java` 字节码对应的指令,从而实现更快的函数调用和执行。快速代码通常是通过即时编译器`( JIT) ` 或预编译技术生成的,并保存在`Oat` 文件中。在运行时,如果一个方法已经被编译为快速代码,则`LinkCode` 函数可以直接使用`Oat` 文件中的方法描述符获取快速代码的地址,并将其设置为该方法的入口点地址。
接下来看看设置的解释器入口是什么,跟踪方法`GetQuickToInterpreterBridge` 的实现。
```c++
static inline const void* GetQuickToInterpreterBridge() {
return reinterpret_cast< const void * > (art_quick_to_interpreter_bridge);
}
```
这里和native动态注册分析时看到入口设置非常类似, `GetQuickToInterpreterBridge` 是一个静态内联函数,它将全局变量`art_quick_to_interpreter_bridge` 的地址强制转换为`const void*` 类型,然后返回该地址。`art_quick_to_interpreter_bridge` 是一个指向解释器入口点的函数指针,它在链接器启动时被初始化,是由汇编进行实现。
```assembly
ENTRY art_quick_to_interpreter_bridge
SETUP_SAVE_REFS_AND_ARGS_FRAME // Set up frame and save arguments.
// x0 will contain mirror::ArtMethod* method.
mov x1, xSELF // How to get Thread::Current() ???
mov x2, sp
// uint64_t artQuickToInterpreterBridge(mirror::ArtMethod* method, Thread* self,
// mirror::ArtMethod** sp)
bl artQuickToInterpreterBridge
RESTORE_SAVE_REFS_AND_ARGS_FRAME // TODO: no need to restore arguments in this case.
REFRESH_MARKING_REGISTER
fmov d0, x0
RETURN_OR_DELIVER_PENDING_EXCEPTION
END art_quick_to_interpreter_bridge
```
查看汇编代码能够看到关键是使用`bl` 指令调用`artQuickToInterpreterBridge` 函数,这个函数就是解释器的入口函数了。
解释器`( Interpreter) ` 是一种`Java` 字节码执行引擎,它能够直接解释和执行`Java` 字节码指令。与预编译的本地机器代码不同,解释器以`Java` 字节码为基础,通过逐条解释执行来完成函数的调用和计算过程。
当应用程序需要执行一个`Java` 方法时,链接器会将该方法的字节码读入内存,并利用解释器逐条指令执行。解释器会根据`Java` 字节码类型进行相应的操作,包括创建对象、读取/写入局部变量和操作数栈、跳转操作等。同时, 解释器还会处理异常、垃圾回收、线程同步等方面的操作, 从而保证Java程序的正确性和稳定性。
尽管解释器的执行速度比本地机器代码要慢一些,但它具有许多优点。例如,解释器可以实现更快的程序启动时间、更小的内存占用和更好的灵活性;同时,它还可以避免因硬件平台差异、编译器优化等问题导致的代码执行异常和安全隐患。
需要注意的是,`Android Runtime` 中的解释器并非独立于虚拟机的组件,而是与`JIT` 编译器和`AOT` 编译器一起构成了完整的代码执行系统。具体来说,当一个方法第一次被调用时,解释器会对其进行初步解释和执行,并生成相应的`Profile` 数据;后续调用则会根据`Profile` 数据决定是否使用`JIT` 编译器或`AOT` 编译器进行优化。这种混合的执行方式可以有效地平衡运行效率和内存开销之间的关系,提高`Java` 程序的整体性能和响应速度。
在下一节函数调用过程中,将进一步了解解释器的详细执行过程。
2023-03-22 00:11:03 +08:00
### 7.3.3 函数调用流程
2023-03-22 23:48:18 +08:00
在`Android` 中,`Java` 函数和`native` 函数的调用方式略有不同。对于`Java` 函数,它们的执行是由`Android Runtime` 虚拟机完成的。具体来说,当应用程序需要调用一个`Java` 函数时,`Android Runtime` 会根据该函数的状态和类型进行相应的处理,包括解释器执行、`JIT` 编译器动态生成机器码等;当函数执行完毕后,结果会被传递回应用程序。
对于`native` 函数,它们是由操作系统内核直接执行的。应用程序需要通过`JNI( Java Native Interface) ` 来调用`native` 函数,即先将`Java` 数据结构转换为`C/C++` 类型,然后将参数传递给`native` 函数,最后将结果转换为`Java` 数据结构并返回给应用程序。在这个过程中,`JNI` 提供了一系列的函数和接口来实现`Java` 与本地代码之间的交互和转换。
接下来根据之前的例子,开始对函数调用流程的代码进行跟踪分析。
```java
protected void onCreate(Bundle savedInstanceState) {
...
Object result = addMethod.invoke(null, 12,25);
Log.i("MainActivity","getMyJarVer:"+result);
...
}
```
找到`Method` 的`invoke` 的实现,这是一个`native` 函数,所以继续找对应的`Method_invoke` 函数。
```java
@FastNative
public native Object invoke(Object obj, Object... args)
throws IllegalAccessException, IllegalArgumentException, InvocationTargetException;
static jobject Method_invoke(JNIEnv* env, jobject javaMethod, jobject javaReceiver,
jobjectArray javaArgs) {
ScopedFastNativeObjectAccess soa(env);
return InvokeMethod< kRuntimePointerSize > (soa, javaMethod, javaReceiver, javaArgs);
}
jobject InvokeMethod(const ScopedObjectAccessAlreadyRunnable& soa, jobject javaMethod,
jobject javaReceiver, jobject javaArgs, size_t num_frames) {
...
// Java方法和ArtMethod之间存在映射关系, SOA提供了一种方便的方式来将Java对象转换为Art虚拟机中的数据对象
ObjPtr< mirror::Executable > executable = soa.Decode< mirror::Executable > (javaMethod);
const bool accessible = executable->IsAccessible();
ArtMethod* m = executable->GetArtMethod();
...
if (!m->IsStatic()) {
// Replace calls to String.< init > with equivalent StringFactory call.
if (declaring_class->IsStringClass() & & m->IsConstructor()) {
...
} else {
...
// 查找虚方法的真实实现
m = receiver->GetClass()->FindVirtualMethodForVirtualOrInterface(m, kPointerSize);
}
}
// 对java方法的参数进行转换
ObjPtr< mirror::ObjectArray < mirror::Object > > objects =
soa.Decode< mirror::ObjectArray < mirror::Object > >(javaArgs);
...
// 调用函数
JValue result;
const char* shorty;
if (!InvokeMethodImpl(soa, m, np_method, receiver, objects, & shorty, & result)) {
return nullptr;
}
return soa.AddLocalReference< jobject > (BoxPrimitive(Primitive::GetType(shorty[0]), result));
}
```
在上面这个函数中,主要使用`SOA` 将`Java` 函数以及函数的参数转换为`C++` 对象。
`Structured Object Access( SOA) ` 用于优化`Java` 对象在`Native` 代码和`Art` 虚拟机之间的传递和处理。`SOA` 技术提供了一种高效的方式,将`Java` 对象转换为基于指针的本地`C++` 对象,从而避免了频繁的对象复制和`GC` 操作,提高了程序的性能和执行效率。
在`SOA` 技术中使用`Handle` 和`ObjPtr` 等类型的指针来管理`Java` 对象和本地`C++` 对象之间的映射关系。`Handle` 是一种包装器,用于管理`Java` 对象的生命周期,并确保其在被访问时不会被`GC` 回收。`ObjPtr` 则是一种智能指针,用于管理本地`C++` 对象的生命周期,并确保其正确释放和销毁。
通过`SOA` 可以在`Native` 代码中高效地访问和操作`Java` 对象,例如调用`Java` 方法、读取`Java` 字段等。在执行过程中,`SOA` 技术会自动进行对象的内存分配和管理,以确保程序的正确性和性能表现。
接下来继续了解`InvokeMethodImpl` 函数的实现。
```c++
ALWAYS_INLINE
bool InvokeMethodImpl(const ScopedObjectAccessAlreadyRunnable& soa,
ArtMethod* m,
ArtMethod* np_method,
ObjPtr< mirror::Object > receiver,
ObjPtr< mirror::ObjectArray < mirror::Object > > objects,
const char** shorty,
JValue* result) REQUIRES_SHARED(Locks::mutator_lock_) {
// 将函数的参数转换后, 存放到arg_array中。
uint32_t shorty_len = 0;
*shorty = np_method->GetShorty(&shorty_len);
ArgArray arg_array(*shorty, shorty_len);
if (!arg_array.BuildArgArrayFromObjectArray(receiver, objects, np_method, soa.Self())) {
CHECK(soa.Self()->IsExceptionPending());
return false;
}
// 函数调用
InvokeWithArgArray(soa, m, & arg_array, result, *shorty);
...
return true;
}
```
`ArgArray` 主要用于管理`Java` 方法参数列表的类。`ArgArray` 和`Java` 中的类型对应如下:
1.基本类型:`ArgArray` 中的基本类型分别对应`Java` 中的八种基本类型
- `boolean: 'Z'`
- `byte: 'B'`
- `short: 'S'`
- `char: 'C'`
- `int: 'I'`
- `long: 'J'`
- `float: 'F'`
- `double: 'D'`
2.引用类型:`ArgArray` 中的引用类型对应`Java` 中的对象类型,包括`String、Object、` 数组等。在`ArgArray` 中,引用类型用字符`'L'` 开头,并紧跟着完整类名和结尾的分号`';'` 表示,例如`'Landroid/content/Context;'` 表示`android.content.Context` 类。
3.可变参数:可变参数在`Java` 中使用`“...”` 符号表示,而在`ArgArray` 中,则需要将所有可变参数打包为一个数组,并使用`‘ [’ ` 和`‘ ]’ ` 符号表示。例如,如果`Java` 方法声明为`“public void foo(int a, String... args)”` ,则在`ArgArray` 中,参数列表的短类型描述符为`“ILjava/lang/String;[”` 。
理解了`C++` 如何存放参数数据后,继续看下一层的函数调用。
```c++
void InvokeWithArgArray(const ScopedObjectAccessAlreadyRunnable& soa,
ArtMethod* method, ArgArray* arg_array, JValue* result,
const char* shorty)
REQUIRES_SHARED(Locks::mutator_lock_) {
// 获取java参数的数组指针
uint32_t* args = arg_array->GetArray();
if (UNLIKELY(soa.Env()->IsCheckJniEnabled())) {
CheckMethodArguments(soa.Vm(), method->GetInterfaceMethodIfProxy(kRuntimePointerSize), args);
}
method->Invoke(soa.Self(), args, arg_array->GetNumBytes(), result, shorty);
}
```
2023-03-24 00:45:29 +08:00
到这时就调用到了`ArtMethod` 的`Invoke` 函数,这里将参数的数组指针,参数数组大小,返回值指针,调用函数的描述符号传递了过去。在开始进入关键函数前,先对返回值指针`JValue* result` 进行简单介绍。
`JValue` 是用于存储和传递`Java` 方法返回值的联合体。包含了各种基本类型和引用类型的成员变量。下面是该联合体的定义。
```c++
union PACKED(alignof(mirror::Object*)) JValue {
// We default initialize JValue instances to all-zeros.
JValue() : j(0) {}
template< typename T > ALWAYS_INLINE static JValue FromPrimitive(T v);
int8_t GetB() const { return b; }
void SetB(int8_t new_b) {
j = ((static_cast< int64_t > (new_b) < < 56 ) > > 56); // Sign-extend to 64 bits.
}
uint16_t GetC() const { return c; }
void SetC(uint16_t new_c) {
j = static_cast< int64_t > (new_c); // Zero-extend to 64 bits.
}
double GetD() const { return d; }
void SetD(double new_d) { d = new_d; }
float GetF() const { return f; }
void SetF(float new_f) { f = new_f; }
int32_t GetI() const { return i; }
void SetI(int32_t new_i) {
j = ((static_cast< int64_t > (new_i) < < 32 ) > > 32); // Sign-extend to 64 bits.
}
int64_t GetJ() const { return j; }
void SetJ(int64_t new_j) { j = new_j; }
mirror::Object* GetL() const REQUIRES_SHARED(Locks::mutator_lock_) {
return l;
}
ALWAYS_INLINE
void SetL(ObjPtr< mirror::Object > new_l) REQUIRES_SHARED(Locks::mutator_lock_);
int16_t GetS() const { return s; }
void SetS(int16_t new_s) {
j = ((static_cast< int64_t > (new_s) < < 48 ) > > 48); // Sign-extend to 64 bits.
}
uint8_t GetZ() const { return z; }
void SetZ(uint8_t new_z) {
j = static_cast< int64_t > (new_z); // Zero-extend to 64 bits.
}
mirror::Object** GetGCRoot() { return &l; }
private:
uint8_t z;
int8_t b;
uint16_t c;
int16_t s;
int32_t i;
int64_t j;
float f;
double d;
mirror::Object* l;
};
```
`JValue` 结构体的大小为8个字节对齐, 结构体提供了一些成员函数, 例如`GetXXX` 和`SetXXX` 等函数,用于获取和设置不同类型的返回值。`alignof(mirror::Object*)` 的具体值取决于编译器和操作系统的不同, 一般为4或8。
对参数以及返回值的在`C++` 中的表示有了初步的了解后,开始继续查看函数调用过程中的关键函数`ArtMethod::Invoke` ,下面是具体实现代码。
```c++
void ArtMethod::Invoke(Thread* self, uint32_t* args, uint32_t args_size, JValue* result,
const char* shorty) {
...
// 将当前的环境(也就是函数调用时的程序计数器、堆栈指针等信息)保存到一个栈帧中。这个栈帧通常会被分配在堆上,并且由垃圾回收器来管理。在函数返回时,这个栈帧会被弹出,恢复之前的环境。
ManagedStack fragment;
self->PushManagedStackFragment(&fragment);
Runtime* runtime = Runtime::Current();
// IsForceInterpreter为true表示强制使用解释器执行函数
// 这里的条件是, 如果设置了强制走解释器执行, 并且非native函数, 并且非代理函数, 并且可执行的函数, 则符合条件
if (UNLIKELY(!runtime->IsStarted() ||
(self->IsForceInterpreter() & & !IsNative() & & !IsProxyMethod() & & IsInvokable()))) {
if (IsStatic()) {
// 静态函数调用
art::interpreter::EnterInterpreterFromInvoke(
self, this, nullptr, args, result, /*stay_in_interpreter=*/ true);
} else {
// 非静态函数调用
mirror::Object* receiver =
reinterpret_cast< StackReference < mirror::Object > *>(&args[0])->AsMirrorPtr();
art::interpreter::EnterInterpreterFromInvoke(
self, this, receiver, args + 1, result, /*stay_in_interpreter=*/ true);
}
} else {
...
// 是否有已编译的快速执行代码的入口点
bool have_quick_code = GetEntryPointFromQuickCompiledCode() != nullptr;
if (LIKELY(have_quick_code)) {
...
// 走快速调用方式,比解释器执行的性能高。
if (!IsStatic()) {
(*art_quick_invoke_stub)(this, args, args_size, self, result, shorty);
} else {
(*art_quick_invoke_static_stub)(this, args, args_size, self, result, shorty);
}
...
} else {
LOG(INFO) < < "Not invoking '" < < PrettyMethod ( ) < < " ' code = null";
if (result != nullptr) {
result->SetJ(0);
}
}
}
// 从栈帧中还原当前环境
self->PopManagedStackFragment(fragment);
}
```
根据以上代码得到的结论是,函数执行的路线有两条,`EnterInterpreterFromInvoke` 由解释器执行和`art_quick_invoke_stub` 快速执行通道。
`art_quick_invoke_stub` 是由一段汇编完成对函数的执行,该函数充分利用寄存器并尽可能地减少堆栈访问次数,以提高`Java` 方法的执行效率。,虽然快速执行通道的效率会更加高,但是可读性差,但是对于学习执行过程和修改执行流程来说,解释器执行会更加简单易改。所以接下来跟进解释器执行来了解执行的细节。继续跟踪`EnterInterpreterFromInvoke` 函数。
```c++
void EnterInterpreterFromInvoke(Thread* self,
ArtMethod* method,
ObjPtr< mirror::Object > receiver,
uint32_t* args,
JValue* result,
bool stay_in_interpreter) {
...
// 获取函数中的指令信息
CodeItemDataAccessor accessor(method->DexInstructionData());
uint16_t num_regs;
uint16_t num_ins;
if (accessor.HasCodeItem()) {
// 获取寄存器的数量和参数的数量
num_regs = accessor.RegistersSize();
num_ins = accessor.InsSize();
} else if (!method->IsInvokable()) {
self->EndAssertNoThreadSuspension(old_cause);
method->ThrowInvocationTimeError();
return;
} else {
DCHECK(method->IsNative()) < < method- > PrettyMethod();
// 从函数描述符中计算出寄存器数量和参数数量
// 这里将num_regs和num_ins都赋值的原因是, 方法的前几个参数通常会存储在寄存器中, 而不是堆栈中。因此, num_regs和num_ins的值应该是相同的, 都代表了当前方法使用的寄存器数量, 也就是用于存储参数和局部变量等数据的寄存器数量。
num_regs = num_ins = ArtMethod::NumArgRegisters(method->GetShorty());
// 非静态函数的情况, 会多一个this参数, 所以寄存器数量和参数数量+1
if (!method->IsStatic()) {
num_regs++;
num_ins++;
}
}
// 创建一个新的ShadowFrame作为当前栈, 将当前环境保存在其中, 并且推入栈帧, 供当前线程调用方法时使用
ShadowFrame* last_shadow_frame = self->GetManagedStack()->GetTopShadowFrame();
ShadowFrameAllocaUniquePtr shadow_frame_unique_ptr =
CREATE_SHADOW_FRAME(num_regs, last_shadow_frame, method, /* dex pc */ 0);
ShadowFrame* shadow_frame = shadow_frame_unique_ptr.get();
self->PushShadowFrame(shadow_frame);
// 计算出将要使用的第一个寄存器
size_t cur_reg = num_regs - num_ins;
// 非静态函数的情况, 第一个寄存器的值为this, 所以设置其为引用类型
if (!method->IsStatic()) {
// receiver变量表示方法调用的第一个参数
CHECK(receiver != nullptr);
shadow_frame->SetVRegReference(cur_reg, receiver);
++cur_reg;
}
uint32_t shorty_len = 0;
const char* shorty = method->GetShorty(&shorty_len);
// 遍历所有参数
for (size_t shorty_pos = 0, arg_pos = 0; cur_reg < num_regs ; + + shorty_pos , + + arg_pos , cur_reg + + ) {
DCHECK_LT(shorty_pos + 1, shorty_len);
switch (shorty[shorty_pos + 1]) {
//L 表示这个参数是个引用类型, 比如Ljava/lang/String;
case 'L': {
ObjPtr< mirror::Object > o =
reinterpret_cast< StackReference < mirror::Object > *>(&args[arg_pos])->AsMirrorPtr();
// 将转换好的数据设置到当前栈中
shadow_frame->SetVRegReference(cur_reg, o);
break;
}
case 'J': case 'D': {
// J或者D的数据类型要占用两个寄存器存放。
uint64_t wide_value = (static_cast< uint64_t > (args[arg_pos + 1]) < < 32 ) | args [ arg_pos ] ;
// 合并后的数据设置到栈中
shadow_frame->SetVRegLong(cur_reg, wide_value);
cur_reg++;
arg_pos++;
break;
}
default:
// 普通的整型数据设置到栈中
shadow_frame->SetVReg(cur_reg, args[arg_pos]);
break;
}
}
self->EndAssertNoThreadSuspension(old_cause);
// 静态函数的情况需要检查所在的类是否已经正常初始化。
if (method->IsStatic()) {
ObjPtr< mirror::Class > declaring_class = method->GetDeclaringClass();
if (UNLIKELY(!declaring_class->IsVisiblyInitialized())) {
StackHandleScope< 1 > hs(self);
Handle< mirror::Class > h_class(hs.NewHandle(declaring_class));
if (UNLIKELY(!Runtime::Current()->GetClassLinker()->EnsureInitialized(
self, h_class, /*can_init_fields=*/ true, /*can_init_parents=*/ true))) {
CHECK(self->IsExceptionPending());
self->PopShadowFrame();
return;
}
DCHECK(h_class->IsInitializing());
}
}
// 非native函数执行
if (LIKELY(!method->IsNative())) {
// 解释执行的关键函数
JValue r = Execute(self, accessor, *shadow_frame, JValue(), stay_in_interpreter);
if (result != nullptr) {
*result = r;
}
} else {
// native函数的解释执行
args = shadow_frame->GetVRegArgs(method->IsStatic() ? 0 : 1);
if (!Runtime::Current()->IsStarted()) {
UnstartedRuntime::Jni(self, method, receiver.Ptr(), args, result);
} else {
InterpreterJni(self, method, shorty, receiver, args, result);
}
}
// 弹出栈帧,还原到执行后的栈环境
self->PopShadowFrame();
}
```
在这个函数中,为即将执行的函数准备好了栈帧环境,将参数填入了`shadow_frame` 栈帧中。并且获取出了函数要执行的指令信息`accessor` 。最后通过`Execute` 执行该函数。
```java
static inline JValue Execute(
Thread* self,
const CodeItemDataAccessor& accessor,
ShadowFrame& shadow_frame,
JValue result_register,
bool stay_in_interpreter = false,
bool from_deoptimize = false) REQUIRES_SHARED(Locks::mutator_lock_) {
...
// 是否需要从解释器模式切换到编译模式。
if (LIKELY(!from_deoptimize)) {
...
instrumentation::Instrumentation* instrumentation = Runtime::Current()->GetInstrumentation();
// 从当前线程栈帧中获取要执行的函数
ArtMethod *method = shadow_frame.GetMethod();
// 是否有注册Method Entry 监听器
if (UNLIKELY(instrumentation->HasMethodEntryListeners())) {
// 触发 Method Entry 监听器,并传递相应的参数
instrumentation->MethodEnterEvent(self,
shadow_frame.GetThisObject(accessor.InsSize()),
method,
0);
...
// 是否有未处理的异常
if (UNLIKELY(self->IsExceptionPending())) {
...
return ret;
}
}
// stay_in_interpreter 表示是否需要停留在解释器模式, self->IsForceInterpreter() 表示是否强制使用解释器模式。所以内部是不走解释器执行的处理,走编译模式执行
if (!stay_in_interpreter & & !self->IsForceInterpreter()) {
jit::Jit* jit = Runtime::Current()->GetJit();
if (jit != nullptr) {
// 判断当前方法是否可以使用 JIT 编译后的机器码执行
jit->MethodEntered(self, shadow_frame.GetMethod());
if (jit->CanInvokeCompiledCode(method)) {
JValue result;
// 直接栈帧推出
self->PopShadowFrame();
uint16_t arg_offset = accessor.RegistersSize() - accessor.InsSize();
// 调用该函数的机器码实现
ArtInterpreterToCompiledCodeBridge(self, nullptr, & shadow_frame, arg_offset, &result);
// 重新推入栈帧
self->PushShadowFrame(&shadow_frame);
return result;
}
}
}
}
// 从栈帧中获取要执行的当前函数
ArtMethod* method = shadow_frame.GetMethod();
...
// kSwitchImplKind: 表示当前实现是否使用基于 switch 语句的解释器实现。
if (kInterpreterImplKind == kSwitchImplKind ||
UNLIKELY(!Runtime::Current()->IsStarted()) ||
!method->IsCompilable() ||
method->MustCountLocks() ||
Runtime::Current()->IsActiveTransaction()) {
// 使用switch解释器执行
return ExecuteSwitch(
self, accessor, shadow_frame, result_register, /*interpret_one_instruction=*/ false);
}
CHECK_EQ(kInterpreterImplKind, kMterpImplKind);
// 编译执行函数
while (true) {
// 是否支持Mterp解释器执行
if (!self->UseMterp()) {
return ExecuteSwitch(
self, accessor, shadow_frame, result_register, /*interpret_one_instruction=*/ false);
}
// 执行目标函数
bool returned = ExecuteMterpImpl(self,
accessor.Insns(),
& shadow_frame,
&result_register);
if (returned) {
return result_register;
} else {
// 失败的情况继续采用switch解释器执行
result_register = ExecuteSwitch(
self, accessor, shadow_frame, result_register, /*interpret_one_instruction=*/ true);
if (shadow_frame.GetDexPC() == dex::kDexNoIndex) {
return result_register;
}
}
}
}
```
简单看完该函数后,在继续深入前,先将其中的几个知识点进行介绍。
编译模式`( Compiled Mode) ` 是一种执行方式,它将应用程序代码编译成机器码后再执行。相较于解释器模式,编译模式具有更高的执行效率和更好的性能表现。
在` Android ` 应用程序中,编译模式采用的是 `Just-In-Time( JIT) ` 编译技术。当一个方法被多次调用时,系统会自动将其编译成本地机器码,并缓存起来以备下次使用。
当一个方法被编译成本地机器码后,其执行速度将显著提高。因为与解释器模式相比,编译模式不需要逐条解释代码,而是直接执行编译好的机器码。
由于编译过程需要一定的时间,因此在程序启动或者第一次运行新方法时,可能会出现一些额外的延迟。所以,在实际应用中,系统通常会采用一些策略,如预热机制等,来优化编译模式的性能表现。编译模式是一种性能更高、效率更好的执行方式,可以帮助应用程序在运行时获得更好的响应速度和用户体验。
`Method Entry` 监听器是` Android ` 系统中的一种监听器,它可以用来监听应用程序的方法入口。当一个方法被调用时,系统会触发` Method Entry ` 监听器,并将当前线程、当前方法和调用栈信息等相关数据传递给监听器。
`Android Studio ` 在调试模式下会自动为每个线程启动一个监听器,并在方法进入和退出时触发相应的事件。这些事件包括 `Method Entry` (方法入口)、`Method Exit` (方法出口)等。
`ExecuteSwitch` 是基于 switch 语句实现的一种解释器,用于执行当前方法的指令集。在 `Android` 应用程序中,每个方法都会对应一组指令集,用于描述该方法的具体实现。当该方法被调用时,系统需要按照指令集来执行相应的操作,从而实现该方法的功能并计算出结果。
`ExecuteMterpImpl` 是基于` Mterp( Method Interpreter) ` 技术实现。`Mterp ` 技术使用指令集解释器来执行应用程序的代码,相比于` JIT ` 编译模式可以更快地启动和执行短小精悍的方法,同时也可以避免 `JIT ` 编译带来的额外开销。
在 `Mterp ` 模式下,`Dex ` 指令集被转化成了一组` C++ ` 的函数,这些函数对应` Dex ` 指令集中的每一条指令。`ExecuteMterpImpl` 实际上就是调用这些函数来逐条解释执行当前方法的指令集。
在` Android 4.4` 中,系统首次引入了 `Mterp` 技术来加速应用程序的解释执行。在此之后的 `Android` 版本中,`Mterp ` 技术得到了不断优化和完善,并逐渐成为` Android ` 平台的主要方法执行方式之一。
从` Android 6.0` 开始,`Dalvik ` 运行时环境被弃用,取而代之的是` ART ` 运行时环境。`ART` 运行时环境可以通过` JIT ` 编译、`AOT ` 编译和` Mterp ` 等多种方式来执行应用程序的代码,其中` Mterp ` 技术被广泛使用于 `Android` 应用程序的解释执行过程中。但是对于某些特定的场景和应用程序,系统可能还是会选择其他的执行方式来获得更好的性能和效率。
`ExecuteMterpImpl` 使用了汇编语言和` C++` 语言混合编写,需要有一定的汇编和` C++ ` 编程经验才能理解其含义和功能。该代码主要实现了以下功能:
1.保存当前方法的返回值寄存器和指令集
2.设置方法执行的环境和参数,包括` vregs ` 数组、`dex_pc ` 寄存器等
3.为当前方法设置热度倒计时,并根据热度值来判断是否需要启用` Mterp ` 技术
4.执行当前方法的指令集,逐条解释执行 `Dex ` 指令
下面看`ExecuteMterpImpl` 实现代码。
```assembly
// 从xPC寄存器中获取一条指令
.macro FETCH_INST
ldrh wINST, [xPC]
.endm
// 从指令中获取操作码, 指令最顶部2个字节就是操作码, 所以这里拿操作码是 & 0xff的意思
.macro GET_INST_OPCODE reg
and \reg, xINST, #255
.endm
// 跳转到操作码处理逻辑
.macro GOTO_OPCODE reg
add \reg, xIBASE, \reg, lsl #${handler_size_bits}
br \reg
.endm
ENTRY ExecuteMterpImpl
.cfi_startproc
// 保存寄存器信息
SAVE_TWO_REGS_INCREASE_FRAME xPROFILE, x27, 80
SAVE_TWO_REGS xIBASE, xREFS, 16
SAVE_TWO_REGS xSELF, xINST, 32
SAVE_TWO_REGS xPC, xFP, 48
SAVE_TWO_REGS fp, lr, 64
// fp寄存器指向栈顶
add fp, sp, #64
/* 记录对应返回值的寄存器 */
str x3, [x2, #SHADOWFRAME_RESULT_REGISTER_OFFSET ]
/* 记录dex文件中的指令的指针 */
str x1, [x2, #SHADOWFRAME_DEX_INSTRUCTIONS_OFFSET ]
mov xSELF, x0
ldr w0, [x2, #SHADOWFRAME_NUMBER_OF_VREGS_OFFSET ]
add xFP, x2, #SHADOWFRAME_VREGS_OFFSET // 计算局部变量表的偏移地址
add xREFS, xFP, w0, uxtw #2 // 计算局部变量引用表的偏移地址
ldr w0, [x2, #SHADOWFRAME_DEX_PC_OFFSET ] // 获取当前Dex中的PC
add xPC, x1, w0, uxtw #1 // 将Dex PC转换为地址, 并保存到寄存器xPC中
CFI_DEFINE_DEX_PC_WITH_OFFSET(CFI_TMP, CFI_DEX, 0)
EXPORT_PC // 将Dex PC导出
/* Starting ibase */
ldr xIBASE, [xSELF, #THREAD_CURRENT_IBASE_OFFSET ]
/* Set up for backwards branches & osr profiling */
ldr x0, [xFP, #OFF_FP_METHOD ] // 获取当前方法的方法指针
add x1, xFP, #OFF_FP_SHADOWFRAME // 计算拿到当前线程的栈帧
mov x2, xSELF // 将当前线程对象保存到寄存器x2中
bl MterpSetUpHotnessCountdown // 热度计数器调整
mov wPROFILE, w0 // 将热度计数器的宽度赋值给寄存器wPROFILE
/* start executing the instruction at rPC */
FETCH_INST // 获取下一条指令
GET_INST_OPCODE ip // 从指令中获取操作码
GOTO_OPCODE ip // 跳转到操作码处理逻辑
/* NOTE: no fallthrough */
// cfi info continues, and covers the whole mterp implementation.
END ExecuteMterpImpl
```
这些操作码可以通过`Opcodes` 找到其对应的对应,代码如下。
```java
public interface Opcodes {
...
int OP_INVOKE_STATIC = 0x0071;
int OP_INVOKE_INTERFACE = 0x0072;
int OP_INVOKE_VIRTUAL_RANGE = 0x0074;
int OP_INVOKE_SUPER_RANGE = 0x0075;
int OP_INVOKE_DIRECT_RANGE = 0x0076;
int OP_INVOKE_STATIC_RANGE = 0x0077;
int OP_INVOKE_INTERFACE_RANGE = 0x0078;
...
}
```
而在`invoke.S` 汇编文件中,会有其对应操作码的具体实现。
```assembly
%def op_invoke_static():
% invoke(helper="MterpInvokeStatic")
%def op_invoke_static_range():
% invoke(helper="MterpInvokeStaticRange")
%def op_invoke_super():
% invoke(helper="MterpInvokeSuper")
/*
* Handle a "super" method call.
*
* for: invoke-super, invoke-super/range
*/
/* op vB, {vD, vE, vF, vG, vA}, class@CCCC */
/* op vAA, {vCCCC..v(CCCC+AA-1)}, meth@BBBB */
%def op_invoke_super_range():
% invoke(helper="MterpInvokeSuperRange")
%def op_invoke_virtual():
% invoke(helper="MterpInvokeVirtual")
/*
* Handle a virtual method call.
*
* for: invoke-virtual, invoke-virtual/range
*/
/* op vB, {vD, vE, vF, vG, vA}, class@CCCC */
/* op vAA, {vCCCC..v(CCCC+AA-1)}, meth@BBBB */
%def op_invoke_virtual_range():
% invoke(helper="MterpInvokeVirtualRange")
```
到这里,就找到对应的执行`C++` 函数将`Dex` 的指令逐一进行执行处理。`Mterp` 的执行流程到这里就非常清晰了。下一步开始分析`switch` 解释器的执行流程。
2023-03-22 23:48:18 +08:00
2023-03-22 00:11:03 +08:00
### 7.3.4 动态加载壳的实现
动态加载壳是一种常见的代码保护技术,它通过在程序运行时动态加载壳来保护应用程序。下面是一般情况下动态加载壳的流程:
2023-03-21 00:54:36 +08:00
1. 壳程序和被保护的应用程序分开编译,壳程序中包含有解密、加载、映射被保护程序等功能代码,并将被保护程序加密。
2. 当启动被保护的程序时,先运行壳程序。
3. 壳程序首先会进行自身的初始化,例如获取壳程序自身路径、解密被加密的被保护程序等操作。
4. 然后,壳程序会将被保护程序从加密状态中解密出来。
5. 接着,壳程序会在内存中为被保护程序申请一块连续的内存区域,将被保护程序的代码和数据映射到该内存区域中。
6. 壳程序会根据被保护程序的程序入口点开始执行被保护程序的代码。
7. 被保护程序运行时的系统调用和DLL库的调用等操作, 都会由壳程序处理并返回结果给被保护程序。同时, 壳程序可能会进行一些额外的安全检查, 例如防止调试、防止反汇编、防止破解等操作。
接下来我们看一个简单的动态加载壳的实现。首先准备一个需要被保护的apk, 这里直接使用前文中测试动态加载系统内置jar包的APP作为样例, 代码如下。
```java
package cn.mik.myservicedemo;
import androidx.appcompat.app.AppCompatActivity;
import android.app.Application;
import android.os.Bundle;
import android.os.IBinder;
import android.os.IMikRomManager;
import android.os.RemoteException;
import android.util.Log;
import java.lang.reflect.InvocationTargetException;
import java.lang.reflect.Method;
import dalvik.system.PathClassLoader;
public class MainActivity extends AppCompatActivity {
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
Class localClass = null;
try {
localClass = Class.forName("android.os.ServiceManager");
Method getServiceMethod = localClass.getMethod("getService", new Class[] {String.class});
if(getServiceMethod != null) {
Object objResult = getServiceMethod.invoke(localClass, new Object[]{"mikrom"});
if (objResult != null) {
IBinder binder = (IBinder) objResult;
IMikRomManager iMikRom = IMikRomManager.Stub.asInterface(binder);
String msg= iMikRom.hello();
Log.i("MainActivity", "msg: " + msg);
}
}
} catch (ClassNotFoundException e) {
e.printStackTrace();
} catch (InvocationTargetException e) {
e.printStackTrace();
} catch (NoSuchMethodException e) {
e.printStackTrace();
} catch (IllegalAccessException e) {
e.printStackTrace();
} catch (RemoteException e) {
e.printStackTrace();
}
}
}
```
TODO 动态加载壳的流程
最后使用压缩包打开apk文件, 将加壳处理好的`classes.dex` 替换apk中的原文件。然后开始重新签名这个apk, 首先生成一个签名证书, 命令如下。
```
keytool -genkeypair -alias myalias -keyalg RSA -keysize 2048 -validity 9125 -keystore mykeystore.keystore
```
输入口令以及各项信息后,得到一个证书文件`mykeystore.keystore` , 然后使用该证书对刚刚处理好的apk文件进行签名。
```
jarsigner -verbose -sigalg SHA1withRSA -digestalg SHA1 -keystore mykeystore.keystore app-debug.apk myalias
```
签名后尝试安装该apk, 结果发现报错如下。
```
adb install app-debug.apk
// 安装失败
adb: failed to install app-debug.apk: Failure [-124: Failed parse during installPackageLI: Targeting R+ (version 30 and above) requires the resources.arsc of installed APKs to be stored uncompressed and aligned on a 4-byte boundary]
```
这个错误提示表示 APK 文件未正确压缩对齐。在 Android 11( API 级别 30) 及以上版本中, 要求 APK 文件必须按照一定的规则进行压缩和对齐,以确保应用程序的安全性和稳定性。可以使用 zipalign 工具对 APK 文件进行对齐操作。
```
zipalign -v 4 app-debug.apk app-debug-over.apk
```
再次尝试安装apk后, 发现变成了另外一个错误。
```
adb install ./app-debug-over.apk
adb: failed to install ./app-debug-over.apk: Failure [INSTALL_PARSE_FAILED_NO_CERTIFICATES: Scanning Failed.: No signature found in package of version 2 or newer for package cn.mik.myservicedemo]
```
这是因为当`targetSdkVersion` 版本号, 只要大于30时, 需要使用v2进行签名, 签名方式如下。
```
apksigner sign --ks mykeystore.keystore app-debug-over.apk
```
重新再安装apk, 又换成了一个新错误。
```
adb install ./app-debug-over.apk
Exception occurred while executing 'install-incremental':
java.lang.IllegalArgumentException: Incremental installation not allowed.
at com.android.server.pm.PackageInstallerSession.< init > (PackageInstallerSession.java:1082)
at com.android.server.pm.PackageInstallerService.createSessionInternal(PackageInstallerService.java:787)
at com.android.server.pm.PackageInstallerService.createSession(PackageInstallerService.java:519)
at com.android.server.pm.PackageManagerShellCommand.doCreateSession(PackageManagerShellCommand.java:3143)
at com.android.server.pm.PackageManagerShellCommand.doRunInstall(PackageManagerShellCommand.java:1341)
at com.android.server.pm.PackageManagerShellCommand.runIncrementalInstall(PackageManagerShellCommand.java:1299)
at com.android.server.pm.PackageManagerShellCommand.onCommand(PackageManagerShellCommand.java:197)
at com.android.modules.utils.BasicShellCommandHandler.exec(BasicShellCommandHandler.java:97)
at android.os.ShellCommand.exec(ShellCommand.java:38)
at com.android.server.pm.PackageManagerService.onShellCommand(PackageManagerService.java:24612)
at android.os.Binder.shellCommand(Binder.java:950)
at android.os.Binder.onTransact(Binder.java:834)
at android.content.pm.IPackageManager$Stub.onTransact(IPackageManager.java:4818)
at com.android.server.pm.PackageManagerService.onTransact(PackageManagerService.java:8506)
at android.os.Binder.execTransactInternal(Binder.java:1184)
at android.os.Binder.execTransact(Binder.java:1143)
```
这是因为旧版本不支持流式安装,所以需要禁用增量安装,增量安装是一种优化技术,它只安装已更改的文件和资源,而不是重新安装整个应用程序。使用 `--no-incremental` 选项可以确保在安装应用程序时, 所有文件都被完全重新安装, 使用下面的命令安装apk。
```
adb install -r --no-incremental app-debug-over.apk
```
2023-03-13 21:09:47 +08:00
### 7.3.5 如何脱壳
## 7.4 简单脱壳实现
## 7.5 自动化脱壳