如题!
那必然有啊,比如 valgrind,比如 gperftool
我们小伙伴试了,结果一跑 CUDA 的函数就凉凉了。 哎,暂时无解。。。
mtrace 推荐用这个,include 头文件,然后写集成测试的,把要调用的逻辑函数串起来执行一次,写入指定的文件里,后面要自己分析。
恩,好的,谢谢!~