一、声明
本文所述的全部步骤与方法,旨在解决运行官方脚本时因GPU 显存不足(CUDA error:Out‑of‑Memory)而导致的程序崩溃或运行失败问题。
经多次实际验证:严格按照本文提供的部署流程(包括环境配置、参数调整、内存优化策略等)进行操作,用户可以在有限的 GPU 显存资源下,成功完成 LingBot‑MAP 的流式 3D 场景重建任务,避免显存溢出错误。
如您在部署中遇到与本文描述不一致的情况,欢迎反馈以便进一步完善。
特此声明。
———————————————————————————————————————————
官方GitHub 地址:https://github.com/Robbyant/lingbot-map
其他相关资料:
1、【GitHub项目推荐--LingBot-Map:流式 3D 重建的几何上下文 Transformer】
2、【阿里拥抱开源】LingBot-Map:用于流式3D重建的几何上下文转换器
3、 lingbot-map:流式 3D 重建实战指南与解析
二、部署流程
1. 创建 conda 环境
虚拟环境安装教程:最详细!Windows下的CUDA与cuDNN详细安装教程
conda create -n lingbot-map python=3.10 -y conda activate lingbot-map2. 安装 PyTorch (CUDA 12.8)
pip install torch==2.9.1 torchvision==0.24.1 --index-url https://download.pytorch.org/whl/cu1283.安装 LingBot-Map
#从Github上下载lingbot-map源码(解压lingbot-map.zip可以跳过此步骤) git clone https://github.com/Robbyant/lingbot-map.git cd lingbot-map pip install -e .4.安装可视化依赖
pip install -e ".[vis]"5.下载模型
从 ModelScope 下载预训练权重(约 4.63 GB):
官方开源模型:lingbot-map · 模型库
三、如何使用
将下载好的模型复制到lingbot-map目录下,
创建data文件夹,在文件夹内放置视频文件(.mp4)。
运行指令:
python demo.py --model_path lingbot-map.pt --video_path .\data\your.mp4 --fps 10 --offload_to_cpu --keyframe_interval 5 --kv_cache_sliding_window 16 --use_sdpa出现“Streaming inference”即为执行成功
| 指令参数 | 作用 |
|---|---|
--model_path | 指定模型权重文件的路径 |
--video_path | 指定输入的原始视频文件路径 |
--fps 10 | 将视频帧率采样为10 FPS |
--offload_to_cpu | 将预测结果及时转移至CPU内存 |
--keyframe_interval 5 | 每隔4个普通帧设置1个关键帧用于KV缓存 |
--kv_cache_sliding_window 16 | 限制KV缓存仅保留过去16帧的信息 |
--use_sdpa | 允许模型在未安装FlashInfer时,回退至PyTorch原生的SDPA |
访问“http://localhost:8080”
四、总结
本文提供了LingBot-MAP流式3D场景重建的完整部署方案,重点解决GPU显存不足导致的运行失败问题。部署流程包括:1)创建conda环境;2)安装PyTorch(CUDA12.8);3)下载并安装LingBot-MAP源码;4)安装可视化依赖;5)下载预训练模型。使用时需将模型文件放入项目目录,视频文件置于data文件夹,通过指定参数运行demo.py脚本。该方法经实测可有效避免显存溢出,成功完成3D重建任务。