使用gprof进行c++性能剖析需编译时添加-pg选项生成gmon.out文件,再通过gprof分析该文件获取函数耗时与调用关系,定位性能瓶颈。

使用gprof进行C++程序性能剖析,主要是通过编译时加入特定选项,让程序运行时生成性能数据文件,再用gprof工具分析这些数据,查看函数调用时间和调用关系。整个过程简单直接,适合定位耗时较多的函数。
1. 编译时启用性能分析支持
要使用gprof,必须在编译和链接时加上-pg选项。这个选项会插入计时代码,记录函数调用信息。
例如,有一个C++源文件main.cpp:
- g++ -pg -g -o main main.cpp
其中:
立即学习“C++免费学习笔记(深入)”;
- -pg:启用gprof支持
- -g:建议加上调试信息,便于分析时对应源码行号
2. 运行程序生成性能数据
正常运行编译后的可执行文件,程序退出时会自动生成一个名为gmon.out的文件,里面包含函数调用和时间消耗数据。
- ./main
运行结束后检查当前目录是否有gmon.out。如果没有,可能是程序异常退出或未正确编译。
3. 使用gprof分析性能报告
用gprof命令读取gmon.out并生成分析报告:
- gprof main gmon.out
可以将输出重定向到文件方便查看:
- gprof main gmon.out > profile.txt
输出内容主要包括两部分:
- Flat profile:列出每个函数的总运行时间、调用次数、平均每次耗时等
- Call graph:展示函数之间的调用关系,包括谁调用了它、它调用了谁、调用次数和时间分布
4. 查看关键性能瓶颈
重点关注Flat profile中“self seconds”较高的函数,这些是自身耗时多的部分。同时注意“calls”次数多但单次时间短的函数,可能总体开销也不小。
例如,如果看到某个循环中的函数被调用上万次,即使每次很快,总时间也可能成为瓶颈。
结合call graph可以判断是不是某个高层函数频繁触发了底层耗时操作。
基本上就这些。gprof对C++支持良好,能处理函数重载、构造析构等情况,但不支持多线程精确分析(只统计主线程)。适合用于单线程或主线程主导的程序性能优化。


