在 AI 推理的实际应用中,尤其是在自动驾驶、工业控制等实时性场景中,最致命的挑战往往不是整体速度慢,而是偶发性的卡顿。
这种不可预测的性能抖动,极易导致系统响应超时,进而引发严峻的安全问题。面对复杂的 C/C++ 底层代码,如何精准找到那些导致程序偶发卡顿的“隐形杀手”?
近日,望获团队正式开源了 Vibe Profiling。这是一款基于 GCC 编译器插桩机制的性能分析工具,专为解决 AI 基础软件在 C/C++ 层面的性能黑盒问题而设计,致力于消除推理过程中的不确定性。
https://www.bilibili.com/video/BV1dqFYzKE9Y/?spm_id_from=333.1387.homepage.video_card.click&vd_source=41989c417a646f5a1e3e053158b8498a
利用vibe-profiling对PyTorch进行性能分析
1.基于编译器的精准插桩
在编译阶段自动为目标程序的每个函数入口和出口植入钩子函数。可精确统计函数耗时和完整还原函数调用关系。
2.零中断的运行时采样
在生产环境或运行任务中,重启服务进行调试往往不切实际。Vibe Profiling 支持信号触发模式。通过发送触发信号,即可进行运行时采样。
3.聚焦 AI 基础软件优化
目前已针对llama.cpp和PyTorch两大主流场景进行了适配。
AI 推理在自动驾驶、工业控制等场景中,必须在规定时间内给出反馈,超时将导致安全问题。
Vibe Profiling 通过找出最大耗时和耗时波动最大的函数,协助开发者消除那些导致卡顿的不确定因素,确保 AI 推理的实时性,从而保证业务逻辑的安全性。
快速开始
该项目已在 GitHub 完全开源,欢迎下载使用。
项目地址:https://github.com/ucas-linux/vibe-profiling