重新理解编译器

编译优化

C 语言编译器在进行代码优化时，遵循的基本准则是在不改变程序的语义 (即程序的行为和输出结果) 的前提下，提高程序的执行效率和/或减少程序的资源消耗

int foo(int x) {
    int y = x + 1;
    return y - 1;
}

一些 “不改变语义” 的例子 (编译优化中最重要的 “三板斧”)：

函数内联：将函数调用替换为函数体本身的内容
常量传播：在编译时计算常量表达式的值并替换
死代码消除：删除永远不会被执行到的代码

重新理解编译器

什么是编译器？

编译器的输入

编译器的输出

编译器 = 状态机之间的翻译器

SimpleC: 直接翻译

运算

分支/循环

函数调用

SimpleC: 直接翻译 (cont'd)

所以，C 被称为高级汇编语言

C 语言能实现对机器更好的控制 (例子：Inline Assembly)

编译优化

但如果我们问一个更本质的问题……

给两个程序 $A, B$ ，编译器到底允许不允许把 $A$ 编译成 $B$ ？

考虑一个特殊情况

编译正确性

系统调用是使程序计算结果可见的唯一方法

C 代码中的不可优化部分

有没有觉得这个定义保守了？

凭什么系统调用不能被优化？

把状态机的一部分直接放到操作系统里运行

重新理解编译器

什么是编译器？

编译器的输入

编译器的输出

编译器 = 状态机之间的翻译器

SimpleC: 直接翻译

运算

分支/循环

函数调用

SimpleC: 直接翻译 (cont'd)

所以，C 被称为高级汇编语言

C 语言能实现对机器更好的控制 (例子：Inline Assembly)

编译优化

但如果我们问一个更本质的问题……

给两个程序 A,BA, BA,B，编译器到底允许不允许把 AAA 编译成 BBB？

考虑一个特殊情况

编译正确性

系统调用是使程序计算结果可见的唯一方法

C 代码中的不可优化部分

有没有觉得这个定义保守了？

凭什么系统调用不能被优化？

把状态机的一部分直接放到操作系统里运行

给两个程序 $A, B$ ，编译器到底允许不允许把 $A$ 编译成 $B$ ？