Google Benchmark性能测试

Google Benchmark 是一个用于 C++ 的微基准测试框架，专为测量小块代码的性能而设计。它提供了一种简单而强大的方式来编写、运行和分析基准测试，帮助开发人员识别性能瓶颈并优化代码。本教程将从安装和基本用法开始，逐步深入到高级功能，并通过 C++ 示例演示如何结合测试实践。

1. 安装 Google Benchmark

在 Ubuntu 上安装 Google Benchmark 非常简单。以下是安装步骤：

更新软件包列表：
```
sudo apt-get update
```
安装 Google Benchmark：
```
sudo apt-get install libbenchmark-dev
```
验证安装：
安装完成后，你可以通过编译一个简单的基准测试程序来验证安装是否成功。

2. 基本用法

Google Benchmark 的基本用法是定义一个基准测试函数，并使用 BENCHMARK 宏注册它。以下是一个简单的示例：

示例 1：测量函数执行时间

代码

#include <benchmark/benchmark.h>
#include <chrono>
#include <thread>void BM_Sleep(benchmark::State& state) {for (auto _ : state) {std::this_thread::sleep_for(std::chrono::milliseconds(100));}
}BENCHMARK(BM_Sleep);BENCHMARK_MAIN();

编译和运行

编译：
```
g++ -std=c++11 -O2 -o benchmark_example benchmark_example.cpp -lbenchmark -lpthread
```
- -lbenchmark 链接 Google Benchmark 库。
- -lpthread 链接 pthread 库（Google Benchmark 依赖）。
运行：
```
./benchmark_example
```

输出分析

运行后，你将看到类似以下的输出：

2023-10-01 12:00:00
Running ./benchmark_example
Run on (8 X 4200 MHz CPU s)
CPU Caches:L1 Data 32 KiB (x4)L1 Instruction 32 KiB (x4)L2 Unified 256 KiB (x4)L3 Unified 8192 KiB (x1)
***WARNING*** CPU scaling is enabled, the benchmark real time measurements may be noisy and will incur extra overhead.
---------------------------------------------------------
Benchmark               Time             CPU   Iterations
---------------------------------------------------------
BM_Sleep         100000000 ns    100000000 ns           7

Time：每次迭代的平均时间。
CPU：每次迭代的 CPU 时间。
Iterations：基准测试运行的迭代次数。

示例 2：测量不同参数下的性能

Google Benchmark 允许你通过 Range 或 Args 指定参数，测试不同输入下的性能。

代码

#include <benchmark/benchmark.h>
#include <vector>void BM_VectorPushBack(benchmark::State& state) {for (auto _ : state) {std::vector<int> v;for (int i = 0; i < state.range(0); ++i) {v.push_back(i);}}
}BENCHMARK(BM_VectorPushBack)->Range(8, 8<<10);BENCHMARK_MAIN();

编译和运行

编译：

g++ -std=c++11 -O2 -o benchmark_range benchmark_range.cpp -lbenchmark -lpthread

运行：
```
./benchmark_range
```

输出分析

输出将显示不同 vector 大小下的性能：

---------------------------------------------------------
Benchmark               Time             CPU   Iterations
---------------------------------------------------------
BM_VectorPushBack/8          10 ns          10 ns    10000000
BM_VectorPushBack/64         80 ns          80 ns     1000000
BM_VectorPushBack/512       640 ns         640 ns      100000
BM_VectorPushBack/4096     5120 ns        5120 ns       10000
BM_VectorPushBack/32768   40960 ns       40960 ns        1000

这表明随着 vector 大小的增加，push_back 操作的耗时也相应增加。

3. 高级功能

Google Benchmark 还提供了一些高级功能，帮助你更精细地控制基准测试。

3.1 自定义计时

你可以使用 DoNotOptimize 和 ClobberMemory 来防止编译器优化掉你的代码。

代码

#include <benchmark/benchmark.h>void BM_CustomTiming(benchmark::State& state) {for (auto _ : state) {int result = 0;for (int i = 0; i < 1000; ++i) {result += i;}benchmark::DoNotOptimize(result);benchmark::ClobberMemory();}
}BENCHMARK(BM_CustomTiming);BENCHMARK_MAIN();

DoNotOptimize：防止编译器优化掉 result。
ClobberMemory：确保内存操作不被优化。

3.2 测量内存使用

Google Benchmark 允许你测量内存使用情况。

代码

#include <benchmark/benchmark.h>
#include <vector>void BM_MemoryUsage(benchmark::State& state) {for (auto _ : state) {std::vector<int> v(state.range(0), 0);benchmark::DoNotOptimize(v.data());}state.SetBytesProcessed(state.iterations() * state.range(0) * sizeof(int));
}BENCHMARK(BM_MemoryUsage)->Range(8, 8<<10);BENCHMARK_MAIN();

SetBytesProcessed：设置每次迭代处理的字节数，用于计算吞吐量。

3.3 多线程基准测试

你可以使用 Threads 指定线程数，测试多线程环境下的性能。

代码

#include <benchmark/benchmark.h>
#include <atomic>std::atomic<int> counter(0);void BM_AtomicIncrement(benchmark::State& state) {for (auto _ : state) {counter++;}
}BENCHMARK(BM_AtomicIncrement)->Threads(4);BENCHMARK_MAIN();