**指令级并行**: CPU 会在一个时钟周期发射多条指令。指令之间的数据依赖关系同样形成了一个计算图。因为电路是天然 “并行” 的,通过合理的电路实现 (Tomasulo 算法),就能实现计算图的并行实现,从而把顺序程序自动 “并行化”。