动态库重定向
每个进程都可以拥有一个独立的虚拟地址空间,所以对于可执行文件,他可以有一个固定的虚拟基地址,但是对于动态库,为每个动态库划分固定的虚拟地址范围会非常麻烦,而且可能无法做到:比如库的大小变了、要增加新的库、某个库废弃不用了,等等情况都要重新划分。另外当以类似插件的形式运行时要增加一个新库时,无法找到一个固定可用的虚拟地址范围。因为无法预知所以无法事先预留,因此需要动态链接器在运行时进行重定向。本文后面讨论的都是针对position independent code
。
GOT
GOT表简介
GOT:Global Offset Table,是用于访问全局变量的。
GOT表中存的是变量的虚拟地址,当访问全局变量时,会先从相应got表项中获取变量的地址,然后再从该地址中读出值,或者向该地址中写入新值。
引入GOT表的优缺点
优点
- 引入got表后,重定向时,文本段不需要修改,因此文本段可以在多个进程中共享,可减少内存使用
- 引入got表后,可显著减少重定位项的数目(如果是对文本段重定位,每处访问变量的地方都需要一个重定位项,而引入got表后,仅每个目标变量一个重定位项),可减少动态连接器重定位的耗时
缺点
- 访问变量时多了一次间接操作(需要先从got项中加载变量的地址),速度稍有影响
看个访问外部库变量的例子
object file 中文本段重定向
1 | c复制代码extern int value; |
反编译后的指令:
1 | yaml复制代码Disassembly of section .text: |
- 第一条和第二条指令用于加载
value
变量的地址到x0
寄存器中。(备注:因为 aarch64 是定长指令集,每条指令固定4字节,使用这两条指令,可以访问PC +/-4GB的范围) - 第三条指令从
x0
所表示的地址中读出数据放到w0
寄存器中。(备注:int是32位,所以保存到w0
,x0
的高32位会自动清0)
上面第一条,第二条加载地址的指令是“不完整”的,实际情况应该是:
1 | css复制代码adrp x0, pageAddr |
但是因为外部符号value
的地址在其库运行时被加载后才能确定,编译时是无法知晓的,因此编译的时候pageAddr
和 pageOffset
都留空(填0),等待重定向,可以看下重定向信息:
1 | sql复制代码Relocation section '.rela.text' at offset 0x1e0 contains 2 entries: |
从offset可以看到这两条重定位项分别是针对上面第一条、第二条指令的。
对于文本段(.text section)重定向很直接,也好理解,但是这意味着会改动文本段,那么就不能在多个进程中共享了,内存占用会增加。
动态库GOT表重定向
将上面的 object file(.o)链接(program linker,区别于dynamic linker)一下,反编译看看:
1 | yaml复制代码Disassembly of section .text: |
从前两条指令可以看到是从相对pc 0x1ffe0
的位置读取value
的地址,来看下重定向信息:
1 | sql复制代码Relocation section '.rela.dyn' at offset 0x220 contains 1 entry: |
从上面重定位项可以看到0x1ffe0
处重定向后正是存入value
的地址,同时文本段不需要重定位。从section header table
中可以看出0x1ffe0
位于.got
section。
1 | less复制代码Section Headers: |
从上面可知.got section
是由链接器(program linker)生成的,那么链接器是怎么知道要创建 got 项的呢?回顾一下上面 object file 的重定位信息:
1 | sql复制代码Relocation section '.rela.text' at offset 0x1e0 contains 2 entries: |
可以看到object file中有一个R_AARCH64_ADR_GOT_PAGE
类型的重定位项,正是这个类型的重定位项告知链接器要创建相应的 got 项,以及对应该 got 项的 R_AARCH64_GLOB_DAT
类型的重定位项。
PLT
PLT表简介
PLT(Procedure Linkage Table),用于调用非static函数的。PLT中的代码也会用到GOT表,对应于PLT的GOT表通常会单独一个section:.got.plt
调用非static函数时,会先跳转到对应的PLT项,然后PLT项中的跳板代码会跳转到对应的.got.plt
项中的地址,而这个地址是动态链接器填入的目标函数的地址。
延迟绑定
由于库中很多函数运行时可能用不到,比如崩溃处理的函数多数情况下是用不到的,另外像libc中提供了大量的函数,但是app可能只使用其中很少的一部分,因此加载动态库时绑定所有的函数就有点浪费了,因此就引入了延迟绑定:当第一次调用函数时才触发动态链接器去查找目标函数地址。
引入PLT的优缺点
优点
- 引入plt表(
.got.plt
)后,重定向时,文本段不需要修改,因此文本段可以在多个进程中共享,可减少内存使用 - 引入plt表(
.got.plt
)后,可显著减少重定位项(跟上面GOT类似) - 引入plt表后,方便实现延迟绑定
缺点
- 调用函数时多了一层间接,性能稍有影响
备注:其实上面提到的优缺点主要都是 .got.plt
带来的,.plt
section 本身并不一定要存在,编译时甚至可以通过 -fno-plt
来禁止生成 .plt
section。只是将跳板代码(尤其是支持延迟绑定的情况)抽出来放到单独的 .plt
section ,指令体积会减小,并且.got.plt
中的初始值计算更方便。
看个调用外部库函数的例子
object file文本段重定向
1 | c复制代码#include<stdlib.h> |
反编译后的指令:
1 | yaml复制代码Disassembly of section .text: |
bl
的目标地址 0 是因为编译时不知道malloc
函数的地址,需要重定向:
1 | sql复制代码Relocation section '.rela.text' at offset 0x1f8 contains 1 entry: |
跟上面一样,在object file中是不存在.got
.plt
这些section的,重定向是直接针对文本段来的,.plt
.got.plt
section 是由链接器(program linker)创建的。
动态库PLT GOTPLT表
将object file链接后反编译如下:
1 | yaml复制代码Disassembly of section .plt: |
从反编译可以看到:
- malloc_proxy 改为调用 malloc@plt 的跳板代码(
bl 270
,偏移 0x270 处的符号:malloc@plt) - malloc@plt 中前两条指令将 PC 偏移 0x20000 处的值读入
x17
寄存器中,第4条指令挑转到x17
对应的地址处。(先忽略x16
)
来看下重定向信息:
1 | sql复制代码Relocation section '.rela.plt' at offset 0x230 contains 1 entry: |
从重定向信息可以看到,动态链接器会在偏移0x20000
处存入 malloc
函数的地址。
(备注:malloc 后面的 @GLIBC_2.17
是symbol versioning,本文忽略)
因此 br x17
就跳转到了 malloc
函数中,实现了对 malloc 的调用。
(备注:因为 plt 中的跳板代码是通过 br
而不是 blr
,没有修改 lr
寄存器,因此目标函数返回后能回到最初调用位置的下一条指令)
- 从
section header table
中可以看到偏移 0x20000 处于.got.plt
section中。
1 | less复制代码Section Headers: |
另外我们可以看下 .got.plt
section 中,0x20000处的值(动态库中静态的值,动态链接器绑定该符号前):
1 | makefile复制代码<.got.plt>: |
从这个地址可以看到:.got.plt
项(除了前3个项)中的初始值对应的是 .plt
section中的第一个项:
1 | yaml复制代码0000000000000250 <.plt>: |
adrp
&ldr
是将 PC 偏移0x1fff8
处的值(也就是.got.plt
的第3项)加载到x17
寄存器中.got.plt
中的第3项是动态链接器存入的用来查找符号的函数的地址stp
保存x16
lr
到栈上,因为动态链接器符号查找方法内部会修改lr寄存器,所以先保存到栈上br x17
就是跳转到动态链接器符号查找函数去解析目标方法地址,并填入.got.plt
对应的项中,从栈上恢复寄存器(lr
),并跳入该地址执行目标方法
回顾一下上面1,2,3,可知通过plt调用非static方法的流程如下:
- 调用 plt 中目标方法对应的跳板方法:xxx@plt
- xxx@plt 方法跳转到
.got.plt
对应项中的地址 - 如果目标符号已经绑定过
.got.plt
中对应项的地址就是目标函数的地址,调用过程完成 - 如果目标符号未绑定过,
.got.plt
中对应项的地址指向.plt
中的另一段跳板代码,该代码跳转到动态链接器的符号查找代码,会将查找到的符号地址填入.got.plt
的对应项中,并跳转到目标符号地址以完成方法执行
动态库 BIND_NOW
Android 平台(arm架构)动态库默认是 立即绑定(bind now)的。但Linux平台上默认是延迟绑定的(上面已经提到过延迟绑定的优缺点),对于一个指定的动态库如何判断是否是立即绑定的呢?
- 如果动态库
.dynamic
section中存在DT_BIND_NOW
项,那么会立即绑定 - 如果动态库
.dynamic
section中DT_FLAGS
value设置了DT_BIND_NOW
或者DT_FLAGS_1
value设置了DF_1_NOW
的话,会立即绑定 - 如果运行时环境变量包含
LD_BIND_NOW
,会立即绑定 - 如果调用dlopen时,指定
RTLD_NOW
的话,会立即绑定
延迟绑定时获取函数地址
上面讲过了对于延迟绑定的情况下,等到第一次调用函数时才会调用动态链接器的方法去查找符号。那么如果在调用函数之前,先要获取函数地址怎么办呢?其实这个很简单,获取函数地址跟变量访问一样,会在.got
表中有一个单独的表项存储对应函数的地址,也会有一个单独的重定位项,对于变量地址,动态链接器都是立即绑定的。因此对于同一个函数,在同一个库中可能会同时存在 plt(.got.plt) 项 & got 项。
看一个获取外部函数地址的例子:
1 | c复制代码#include<stdlib.h> |
看下他的重定位项:
1 | sql复制代码Relocation section '.rela.dyn' at offset 0x3b8 contains 8 entries: |
全局符号介入
前文提到,访问全局变量、非static函数需要从相应的got项中取出符号的地址,对于外部库的符号这个好理解,对于同一个库中的符号,访问代码与被访问的符号之间的距离是确定的,为什么也要从got中获取地址呢?
原因就是“全局符号介入”的存在:当向全局符号表加入符号时,如果同名符号已存在,则忽略后面的符号。因此访问同一个库中的全局变量或者非static的函数,运行时实际访问的可能是先加载的库中的同名符号。
因此如果某个符号,设计上并不希望外部使用的话,应该将其设置为 static 的,或者放到C++匿名命名空间中,或者将他的 visibility 设置为 hidden。这样还可以优化性能。
本文转载自: 掘金