Optimize App Startup Time

前言

启动时间包括 main 执行之前的时间,以及 main 执行之后的时间。

main 执行之后的时间通过 Time Profiler 查看即可,之前写过文章,详情点击这里

这篇文章主要讨论 main 执行之前的时间。

main 之前 的加载过程

Load dylibs => Rebase => Binding => ObjC => Initializers

在 Xcode 中 Edit scheme -> Run -> Auguments 中设置 DYLD_PRINT_STATICS 环境变量可以输出 main 之前执行的时间

Load dylibs

要了解第一个阶段的 dylibs,先要介绍下 OS X 的可执行文件 Mach-O

Mach-O 二进制格式

系统判断一个文件是否可以执行,是通过将文件读入内存,然后寻找一个头签名,头签名通常被称为 魔数 magic,通过 magic 可以判断文件的二进制格式,如果是被支持的二进制格式,那么就可以执行该文件。

在很多种可执行文件格式中, OS X 目前只支持:解释器脚本格式、通用二进制格式以及 Mach-O 格式。Mach-Object,简称 Mach-O,是苹果在 OS X 中维护的一种独有的二进制格式。

Mach-O 的文件头 mach_header 中包含magic、CPU 类型和子类型等。mach_header 其后包含了很多指令,这些指令被调用时清晰地指导了如何设置并加载二进制数据,这些指令被称为“加载指令”。加载指令包括将文件中的段映射到进程地址空间、调用 dyld、开启线程、代码签名等。

OS X 上几乎所有的程序都是动态链接的,仅有非常少量的进程只需要内核加载起就可以完成加载。通常情况下,使用 dyld 作为动态连接器。

Loading Dylibs 的加载过程又分为

Parse list of dependent dylibs => Find requested mach-o file => Open and read start of file => Validate mach-o => Register code signature => Call mmap() for each segment

上面说过 mach_header 中包含很多指令,其中包含了 LC_CODE_SIGNATURE 用于数字签名,iOS 强制要求代码签名,且代码签名和沙盒机制是绑定在一起的,也就是说必须放到沙盒中经过签名才能运行,非越狱的机器无法自行下载一个动态库并执行。

mmap的作用是将一个文件或者其他对象映射进内存,普通文件被映射到进程地址空间后,进程可以像访问普通内存一样对文件进行访问。

通常一个 App 需要加载 100 - 400 个 dylibs,但是其中的系统库加载会被优化,能在很快的时间内加载完成

优化 Load dylibs 过程

减少非系统库的依赖
合并非系统库

Rebase / Binding

由于进程是在自己私有的虚拟地址空间中启动,按照传统方式,该地址是固定可预见的,这样黑客只要找到一段进程的地址,就很容易推算出整个程序的地址空间布局。所以大部分操作系统都采用了地址空间布局随机化 (ASLR) 的技术,避免攻击防护。

Rebase 就是系统为了解决动态虚拟地址冲突,在加载动态库时进行的基地址重定位操作,Rebase 是如何工作呢?我们先看下内存中的段 (segment) 是什么样的。

内存分为以下几个段

__PAGEZERO:32位系统中,这是内存中单独的一个页面 (4KB)。64位系统中,这个段对应了一个完整的 32 位地址空间,即前 4GB。这个段有助于捕捉空指针引用,或捕捉将整数当做指针引用。
__TEXT:存放程序代码,只读可执行,由于该段数据是只读的,同一个程序的多个实例可以仅使用一份 __TEXT 副本,从而可以优化内存
__LINKEDIT:由 dyld 使用,包含了字符串、符号表以及其他数据
__DATA:可读可写的数据
...

LINKEDIT 段中保存了 Rebase 的相关信息,dylib 中的 LC_DYLD_INOF_ONLY 指定 rebase info 在文件中的偏移量。

使用以下命令可以输出 rebase 信息
xcrun dyldinfo -rebase -bind -lazy_bind myapp.app/myapp

Mach-O 中包含了很多外部库和符号的引用,使用动态链接器加载外部库和符号的过程叫做符号绑定 binding。Rebasing 处理那些指向 Mach-O 文件内部调整指针的内容,Biding 负责指向 Mac-O 外部库的内容。

优化 Rebase / Binding 过程

减少 DATA 指针,即
减少 OC 的 metadata,可以删除无用的 class/selector/category
减少 C++ 虚函数,因为虚函数会在
DATA 段创建虚函数表
使用 Swift 的 struct
为不需要写的属性添加 readonly

ObjC Setup

大部分 ObjC 的设置工作都在 Rebease 和 Binding 时做完
类的定义被注册
实例变量偏移的更新
Category 被插入到方法列表
Selector 的唯一性

Initializers

C++ 为静态变量初始化
执行 +load 方法
执行 main()

优化 Initializers 过程

减少 +load() 方法,尽量使用 +initialize() 代替
使用 dispatch_one() pthread_once() std::once() 代替 C/C++ attribute(constructor)
减少静态构造函数
初始化方法中不要使用 dlopen()
初始化方法中不要创建线程,由于创建线程后系统不得不加锁,从而影响性能

总结优化的点

减少非系统的 framework依赖,如果framework 在当前 App 支持的所有 iOS 系统版本中都存在则设为 required,否则设置为 optional,optional 会有额外检查
合并非系统库
可以删除无用的 class/selector/category,删除无用的方法调用、静态变量等
减少 C++ 虚函数(减少创建虚函数表时间)
使用 Swift 的 struct (从而减少符号数量)
为不需要写的属性添加 readonly
减少 +load() 方法,尽量使用 +initialize() 代替
使用 dispatch_one() pthread_once() std::once() 代替 C/C++ attribute(constructor)
减少静态构造函数
初始化方法中不要使用 dlopen(),不要创建线程

请我喝汽水儿