当前位置：首页 > C++ > 正文

C++基准测试实战指南（手把手教你用Google Benchmark进行C++性能分析与优化）

主机测评网
C++
2025-12-11
1049

在开发高性能 C++ 应用程序时，了解代码的执行效率至关重要。而 C++基准测试 正是评估和比较不同实现方式性能的关键手段。本教程将带你从零开始，使用业界广泛采用的 Google Benchmark 框架，轻松完成 C++性能优化 所需的性能分析工作。即使你是编程新手，也能一步步跟着操作！

什么是C++基准测试？

C++基准测试（Benchmarking）是指通过运行特定代码片段并测量其执行时间、内存使用等指标，来量化程序性能的过程。它帮助开发者：

比较不同算法或实现的效率
验证优化是否真正提升了性能
发现性能瓶颈

C++基准测试实战指南（手把手教你用Google Benchmark进行C++性能分析与优化） C++基准测试性能分析 C++性能优化 Google Benchmark教程第1张

为什么选择 Google Benchmark？

Google Benchmark 是一个由 Google 开发的开源 C++ 基准测试库，具有以下优点：

简单易用，API 直观
自动处理计时、迭代次数调整
支持参数化测试
输出格式丰富（控制台、JSON 等）
广泛用于工业级项目，如 LLVM、TensorFlow

第一步：安装 Google Benchmark

我们以 Ubuntu/Debian 系统为例（Windows 用户可使用 vcpkg 或 MSYS2）：

# 安装依赖sudo apt-get install build-essential cmake git# 克隆源码git clone https://github.com/google/benchmark.gitcd benchmark# 创建构建目录mkdir build && cd build# 编译安装cmake .. -DCMAKE_BUILD_TYPE=Releasemake -j$(nproc)sudo make install# 同时需要安装 googletest（benchmark 的依赖）cd ../..git clone https://github.com/google/googletest.gitcd googletestmkdir build && cd buildcmake .. -DCMAKE_BUILD_TYPE=Releasemake -j$(nproc)sudo make install

第二步：编写第一个基准测试

创建一个文件 example_benchmark.cpp：

#include <benchmark/benchmark.h>#include <vector>#include <algorithm>// 测试 vector push_back 性能static void BM_VectorPushBack(benchmark::State& state) {  for (auto _ : state) {    std::vector<int> v;    v.reserve(state.range(0)); // 预分配内存    for (int i = 0; i < state.range(0); ++i) {      v.push_back(i);    }    benchmark::DoNotOptimize(v); // 防止编译器优化掉整个循环  }}// 注册基准测试，并指定输入参数（例如 1024, 2048, 4096）BENCHMARK(BM_VectorPushBack)->Range(1024, 4096);// 主函数BENCHMARK_MAIN();

第三步：编译并运行

使用 g++ 编译（注意链接 benchmark 和 pthread）：

g++ -std=c++17 example_benchmark.cpp -lbenchmark -lpthread -O2 -o benchmark_test./benchmark_test

你将看到类似如下输出：

--------------------------------------------------------Benchmark              Time             CPU   Iterations--------------------------------------------------------BM_VectorPushBack/1024   1200 ns       1200 ns       580000BM_VectorPushBack/2048   2300 ns       2300 ns       300000BM_VectorPushBack/4096   4500 ns       4500 ns       150000

关键概念解析

benchmark::State& state：每个测试函数必须接收此参数，用于控制迭代。
for (auto _ : state)：框架会自动决定循环次数，确保统计显著性。
state.range(0)：获取传递给测试的参数值。
benchmark::DoNotOptimize(...)：防止编译器因“未使用变量”而优化掉你的代码。
->Range(1024, 4096)：自动生成 1024、2048、4096 等参数组合。

进阶技巧：比较两种实现

假设你想比较 std::sort 和手写冒泡排序的性能：

static void BM_StdSort(benchmark::State& state) {  std::vector<int> v(state.range(0));  std::iota(v.begin(), v.end(), 0); // 填充 0,1,2,...  std::shuffle(v.begin(), v.end(), std::mt19937{std::random_device{}()});  for (auto _ : state) {    auto copy = v;    std::sort(copy.begin(), copy.end());    benchmark::DoNotOptimize(copy);  }}static void BM_BubbleSort(benchmark::State& state) {  std::vector<int> v(state.range(0));  std::iota(v.begin(), v.end(), 0);  std::shuffle(v.begin(), v.end(), std::mt19937{std::random_device{}()});  for (auto _ : state) {    auto copy = v;    // 冒泡排序实现    for (size_t i = 0; i < copy.size(); ++i) {      for (size_t j = 0; j < copy.size() - i - 1; ++j) {        if (copy[j] > copy[j + 1]) {          std::swap(copy[j], copy[j + 1]);        }      }    }    benchmark::DoNotOptimize(copy);  }}BENCHMARK(BM_StdSort)->Range(8, 1024);BENCHMARK(BM_BubbleSort)->Range(8, 1024);

运行后你会发现，std::sort 在 1024 元素时可能只需几微秒，而冒泡排序则慢几个数量级——这就是 性能分析 的价值！