前言
Java 反编译,一听可能觉得高深莫测,其实反编译并不是什么特别高级的操作,Java 对于 Class 字节码文件的生成有着严格的要求,如果你非常熟悉 Java 虚拟机规范,了解 Class 字节码文件中一些字节的作用,那么理解反编译的原理并不是什么问题。
甚至像下面这样的 Class 文件你都能看懂一二。
一般在逆向研究和代码分析中,反编译用到的比较多。不过在日常开发中,有时候只是简单的看一下所用依赖类的反编译,也是十分重要的。
恰好最近工作中也需要用到 Java 反编译,所以这篇文章介绍目前常见的的几种 Java 反编译工具的使用,在文章的最后也会通过编译速度、语法支持以及代码可读性三个维度,对它们进行测试,分析几款工具的优缺点。
Procyon
Github 链接:github.com/mstrobel/pr…
Procyon 不仅仅是反编译工具,它其实是专注于 Java 代码的生成和分析的一整套的 Java 元编程工具。
主要包括下面几个部分:
- Core Framework
- Reflection Framework
- Expressions Framework
- Compiler Toolset (Experimental)
- Java Decompiler (Experimental)
可以看到反编译只是 Procyon 的其中一个模块,Procyon 原来托管于 bitbucket,后来迁移到了 GitHub,根据 GitHub 的提交记录来看,也有将近两年没有更新了。不过也有依赖 Procyon 的其他的开源反编译工具如** decompiler-procyon**,更新频率还是很高的,下面也会选择这个工具进行反编译测试。
使用 Procyon
1 | xml复制代码<!-- https://mvnrepository.com/artifact/org.jboss.windup.decompiler/decompiler-procyon --> |
写一个简单的反编译测试。
1 | java复制代码package com.wdbyte.decompiler; |
Procyon 在反编译时会实时输出反编译文件数量的进度情况,最后还会统计反编译成功和失败的 Class 文件数量。
1 | shell复制代码.... |
Procyon GUI
对于 Procyon 反编译来说,在 GitHub 上也有基于此实现的开源 GUI 界面,感兴趣的可以下载尝试。
Github 地址:github.com/deathmarine…
CFR
GitHub 地址:github.com/leibnitz27/…
CFR 官方网站:www.benf.org/other/cfr/(可能需要FQ)
Maven 仓库:https://mvnrepository.com/artifact/org.benf/cfr
CFR(Class File Reader) 可以支持 Java 9、Java 12、Java 14 以及其他的最新版 Java 代码的反编译工作。而且 CFR 本身的代码是由 Java 6 编写,所以基本可以使用 CFR 在任何版本的 Java 程序中。值得一提的是,使用 CFR 甚至可以将使用其他语言编写的的 JVM 类文件反编译回 Java 文件。
CFR 命令行使用
使用 CFR 反编译时,你可以下载已经发布的 JAR 包,进行命令行反编译,也可以使用 Maven 引入的方式,在代码中使用。下面先说命令行运行的方式。
直接在 GitHub Tags 下载已发布的最新版 JAR. 可以直接运行查看帮助。
1 | shell复制代码# 查看帮助 |
如果只是反编译某个 class.
1 | shell复制代码# 反编译 class 文件,结果输出到控制台 |
反编译某个 JAR.
1 | shell复制代码# 反编译 jar 文件,结果输出到 output_jar 文件夹 |
反编译结果会按照 class 的包路径写入到指定文件夹中。
CFR 代码中使用
添加依赖这里不提。
1 | json复制代码<!-- https://mvnrepository.com/artifact/org.benf/cfr --> |
实际上我在官方网站和 GitHub 上都没有看到具体的单元测试示例。不过没有关系,既然能在命令行运行,那么直接在 IDEA 中查看反编译后的 Main 方法入口,看下命令行是怎么执行的,就可以写出自己的单元测试了。
1 | java复制代码package com.wdbyte.decompiler; |
JD-Core
GiHub 地址:github.com/java-decomp…
JD-core 官方网址:java-decompiler.github.io/
JD-core 是一个的独立的 Java 库,可以用于 Java 的反编译,支持从 Java 1 至 Java 12 的字节码反编译,包括 Lambda 表达式、方式引用、默认方法等。知名的 JD-GUI 和 Eclipse 无缝集成反编译引擎就是 JD-core。
JD-core 提供了一些反编译的核心功能,也提供了单独的 Class 反编译方法,但是如果你想在自己的代码中去直接反编译整个 JAR 包,还是需要一些改造的,如果是代码中有匿名函数,Lambda 等,虽然可以直接反编译,不过也需要额外考虑。
使用 JD-core
1 | xml复制代码 <!-- https://mvnrepository.com/artifact/org.jd/jd-core --> |
为了可以反编译整个 JAR 包,使用的代码我做了一些简单改造,以便于最后一部分的对比测试,但是这个示例中没有考虑内部类,Lambda 等会编译出多个 Class 文件的情况,所以不能直接使用在生产中。
1 | java复制代码package com.wdbyte.decompiler; |
JD-GUI
GitHub 地址:github.com/java-decomp…
JD-core 也提供了官方的 GUI 界面,需要的也可以直接下载尝试。
Jadx
GitHub 地址:github.com/skylot/jadx
Jadx 是一款可以反编译 JAR、APK、DEX、AAR、AAB、ZIP 文件的反编译工具,并且也配有 Jadx-gui 用于界面操作。
Jadx 使用 Grade 进行依赖管理,可以自行克隆仓库打包运行。
1 | shell复制代码git clone https://github.com/skylot/jadx.git |
根据 HELP 信息,如果想要反编译 decompiler.jar 到 out 文件夹。
1 | shell复制代码./build/jadx/bin/jadx -d ./out ~/Desktop/decompiler.jar |
Fernflower
GitHub 地址:github.com/fesh0r/fern…
Fernflower 和 Jadx 一样使用 Grade 进行依赖管理,可以自行克隆仓库打包运行。
1 | shell复制代码➜ fernflower-master ./gradlew build |
Fernflower 在反编译 JAR 包时,默认反编译的结果也是一个 JAR 包。Jad
反编译速度
到这里已经介绍了五款 Java 反编译工具了,那么在日常开发中我们应该使用哪一个呢?又或者在代码分析时我们又该选择哪一个呢?我想这两种情况的不同,使用时的关注点也是不同的。如果是日常使用,读读代码,我想应该是对可读性要求更高些,如果是大量的代码分析工作,那么可能反编译的速度和语法的支持上要求更高些。
为了能有一个简单的参考数据,我使用 JMH 微基准测试工具分别对这五款反编译工具进行了简单的测试,下面是一些测试结果。
测试环境
环境变量 | 描述 |
---|---|
处理器 | 2.6 GHz 六核Intel Core i7 |
内存 | 16 GB 2667 MHz DDR4 |
Java 版本 | JDK 14.0.2 |
测试方式 | JMH 基准测试。 |
待反编译 JAR 1 | procyon-compilertools-0.5.33.jar (1.5 MB) |
待反编译 JAR 2 | python2java4common-1.0.0-20180706.084921-1.jar (42 MB) |
反编译 JAR 1:procyon-compilertools-0.5.33.jar (1.5 MB)
Benchmark | Mode | Cnt | Score | Units |
---|---|---|---|---|
cfr | avgt | 10 | 6548.642 ± 363.502 | ms/op |
fernflower | avgt | 10 | 12699.147 ± 1081.539 | ms/op |
jdcore | avgt | 10 | 5728.621 ± 310.645 | ms/op |
procyon | avgt | 10 | 26776.125 ± 2651.081 | ms/op |
jadx | avgt | 10 | 7059.354 ± 323.351 | ms/op |
反编译 JAR 2: python2java4common-1.0.0-20180706.084921-1.jar (42 MB)
JAR 2 这个包是比较大的,是拿很多代码仓库合并到一起的,同时还有很多 Python 转 Java 生成的代码,理论上代码的复杂度会更高。
Benchmark | Cnt | Score |
---|---|---|
Cfr | 1 | 413838.826ms |
fernflower | 1 | 246819.168ms |
jdcore | 1 | Error |
procyon | 1 | 487647.181ms |
jadx | 1 | 505600.231ms |
语法支持和可读性
如果反编译后的代码需要自己看的话,那么可读性更好的代码更占优势,下面我写了一些代码,主要是 Java 8 及以下的代码语法和一些嵌套的流程控制,看看反编译后的效果如何。
1 | java复制代码package com.wdbyte.decompiler; |
此处本来贴出了所有工具的反编译结果,但是碍于文章长度和阅读体验,没有放出来,不过我在个人博客的发布上是有完整代码的,个人网站排版比较自由,可以使用 Tab 选项卡的方式展示。如果需要查看可以访问 www.wdbyte.com 进行查看。
Procyon
看到 Procyon 的反编译结果,还是比较吃惊的,在正常反编译的情况下,反编译后的代码基本上都是原汁原味。唯一一处反编译后和源码语法上有变化的地方,是一个集合的初始化操作略有不同。
1 | java复制代码// 源码 |
而其他部分代码, 比如装箱拆箱,Switch 语法,Lambda 表达式,流式操作以及流程控制等,几乎完全一致,阅读没有障碍。
装箱拆箱操作反编译后完全一致,没有多余的类型转换代码。
1 | java复制代码// 源码 |
Switch 部分也是一致,流程控制部分也没有变化。
1 | java复制代码// 源码 switch |
Lambda 表达式和流式操作完全一致。
1 | java复制代码// 源码 |
流程控制,反编译后发现丢失了无意义的代码部分,阅读来说并无障碍。
1 | java复制代码// 源码 |
鉴于代码篇幅,下面几种的反编译结果的对比只会列出不同之处,相同之处会直接跳过。
CFR
CFR 的反编译结果多出了类型转换部分,个人来看没有 Procyon 那么原汁原味,不过也算是十分优秀,测试案例中唯一不满意的地方是对 while continue
的处理。
1 | java复制代码// CFR 反编译结果 |
JD-Core
JD-Core 和 CFR 一样,对于装箱拆箱操作,反编译后不再一致,多了类型转换部分,而且自动优化了数据类型。个人感觉,如果是反编译后自己阅读,通篇的数据类型的转换优化影响还是挺大的。
1 | java复制代码// JD-Core 反编译 |
Jadx
首先 Jadx 在反编译测试代码时,报出了错误,反编译的结果里也有提示不能反编 Lambda 和 Stream 操作,反编译结果中变量名称杂乱无章,流程控制几乎阵亡,如果你想反编译后生物肉眼阅读,Jadx 肯定不是一个好选择。
1 | java复制代码// Jadx 反编译 |
Fernflower
Fernflower 的反编译结果总体上还是不错的,不过也有不足,它对变量名称的指定,以及 Switch 字符串时的反编译结果不够理想。
1 | java复制代码//反编译后变量命名不利于阅读,有很多 var 变量 |
总结
五种反编译工具比较下来,结合反编译速度和代码可读性测试,看起来 CFR 工具胜出,Procyon 紧随其后。CFR 在速度上不落下风,在反编译的代码可读性上,是最好的,主要体现在反编译后的变量命名、装箱拆箱、类型转换,流程控制上,以及对 Lambda 表达式、Stream 流式操作和 Switch 的语法支持上,都非常优秀。根据 CFR 官方介绍,已经支持到 Java 14 语法,而且截止写这篇测试文章时,CFR 最新提交代码时间实在 11 小时之前,更新速度很快。
文章中部分代码已经上传 GitHub :github.com/niumoo/lab-…
最后的话
文章有帮助可以点个「赞」或「分享」,都是支持,我都喜欢!
文章每周持续更新,,可以关注「 未读代码 」公众号或者我的博客,也可以加我微信:wn8398。
本文转载自: 掘金