#System Arch

Chapter 5 优化程序性能¶

约 696 个字 22 行代码 5 张图片预计阅读时间 4 分钟

2023-09-122026-04-09

编译器的能力和局限性¶

内存别名使用：两个指针可能指向同一个内存位置
可能出现这种问题，编译器必须进行检查和处理，这限制了可能的优化
restrict 关键字，可以告知编译器两个指针不能指向同一块内存，编译器可以进行进一步的优化

内联函数替换（inline substitution）¶

将函数调用替换成函数体；减轻调用的深度

消除循环中的低效率¶

比如将复杂的函数加入循环；此时考虑设置局部变量
消除循环中的过程调用；考虑返回值来优化

C

void combine3(vec_ptr v, data_t* dest) {
  long i;
  long length = vec_length(v);
  // 消除过程调用
  data_t* data = get_vec_start(v);

  *dest = IDENT;
  for(int i = 0; i < length; ++i) {
    *dest = *dest OP data[i];
  }
}

上述过程汇编是会发现，每次累积变量的数值都要读入内存再写回内存
解决方案：引入临时变量，该临时变量使用寄存器存储；最后只写入一次内存

C

void combine3(vec_ptr v, data_t* dest) {
  long i;
  long length = vec_length(v);
  // 消除过程调用
  data_t* data = get_vec_start(v);
  data_t acc = IDENT;
  for(int i = 0; i < length; ++i) {
    acc = acc OP data[i];
  }
  *dest = acc;
}