news 2026/4/16 11:07:39

PSD 车位可视化异常总结

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PSD 车位可视化异常总结

下面是截至目前为止的完整排查进度总结,并对“下位机 PSD 车位可视化异常”的根因作出阶段性分析,便于对外汇报与后续推进。


一、问题现象

  • PSD 车位可视化结果异常(部分图片无车位、部分位置异常)
  • RM/FSD 正常
  • 上位机推理正常
  • 模型输入尺寸从 544×480 切换到 608×736 后异常变明显

二、已完成的排查路径与结论(含证据)

1) 确认输入/原图尺寸正确

证据:下位机日志

input_sizes[0]=608, input_sizes[1]=736

Image Pre processing for image of size 480 x 544

结论:输入和原图尺寸无误,非尺寸配置问题。


2) 排除“可视化坐标映射错误”

方法:输出 _model.bmp / _model_swap.bmp 并加入 raw 坐标自适应缩放

证据:draw_tensor2psd_result 多次出现

raw_max 在部分图超原图范围 / 有时在原图内

结论:raw 坐标本身不稳定,不是单纯画图映射问题。


3) 修复输出 tensor 指针生命周期

问题:map 后立即 unmap,再解码

结论:存在悬空指针风险

措施:map → decode → unmap

结果:消除未定义行为,但异常仍存在


4) 输出 tensor 数据类型确认

证据:下位机日志

outElementType(TIDL)=2 vxType=VX_TYPE_UINT16

结论:输出为 uint16,解码端 unsigned short* 匹配 ✅


5) 修复输出 tensor stride(关键)

问题:map 时 stride[0]=1 只适用于 uint8

结论:uint16 必须 stride=2,否则数据错位

措施:按输出类型计算 stride

结果:raw 坐标变合理,部分图可视化变正常


6) 修复检测头索引错位(关键)

问题:模型检测头输出在 output[1..3],解码固定用 0..2

结论:参数与数据错位

措施:1→0, 2→1, 3→2 重新映射

结果:可视化明显改善,但仍有“部分图片无车位”


7) 阈值导致“无车位输出”

证据(0206 日志)

  • 错图对应 max_conf < conf_thresh
  • 检测结果 0 → bin 空 → 可视化无车位

结论:并不是画错,而是被阈值过滤

措施:降低 conf_thresh 到 0.10

结果:部分“原本无车位”的图开始有输出,但带来另一个问题


8) 越界写导致 inf(新问题)

证据(0210 日志)

max_conf=inf max_cls=inf max_score=inf

conf_pass 很大

结论:bbox 数量超过上限 100,数组越界 → 覆盖统计变量

措施:加入越界保护 + overflow 统计

结果:预计 inf 消失,可继续验证


三、阶段性根因分析(当前结论)

✅ 已确认的根因(已修复)

  1. 输出 tensor 映射 stride 错误 → 导致 raw_data 读取错位
  1. 检测头索引错位 → 导致解码使用错头参数
  1. 输出 tensor 提前 unmap → 存在悬空指针风险

这些修复后,部分图片已能正确输出,说明核心解码链路趋于正常。


⚠ 当前仍在影响的原因

  1. 低置信度导致“无车位输出”
  • max_conf 低于阈值 → bin 为空
  • 可视化“空图”是因为没有输出
  1. 阈值降低引发的越界写
  • 过多候选 → bbox_num 超上限
  • 已加 overflow 防护,待验证

四、现阶段结论

“部分图正常、部分图没有车位”的现象已经不是解码错位,而是阈值与候选数量共同作用的结果。

  • 置信度低 → 被过滤 → 无车位输出
  • 降阈值 → 候选多 → 越界 → 统计异常

五、当前进度状态

  • 解码链路已基本修正(stride + head 映射 + map/unmap)
  • 可视化逻辑已稳定
  • 剩余问题集中在 阈值策略与候选数量控制

如果你需要,我可以再提供一版“后续计划 + 风险评估”的汇报页。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/30 23:43:17

cv_unet_image-colorization镜像免配置:Streamlit一键启动开箱即用

cv_unet_image-colorization镜像免配置&#xff1a;Streamlit一键启动开箱即用 1. 项目简介 你是否遇到过这样的情况&#xff1a;翻看老照片时&#xff0c;发现很多珍贵的黑白照片已经泛黄褪色&#xff0c;想要恢复它们原本的色彩却不知道从何下手&#xff1f;或者作为摄影师…

作者头像 李华
网站建设 2026/4/9 21:18:33

代码大模型WizardCoder: EMPOWERING CODE LARGE LANGUAGE MODELS WITH EVOL-

这篇 WizardCoder: EMPOWERING CODE LARGE LANGUAGE MODELS WITH EVOL-INSTRUCT 的核心创新,基本都围绕一个主线:把“Evol-Instruct”从通用对话领域改造成“代码任务专用的指令进化流水线”,用可控地提升指令复杂度来显著抬升 Code LLM 的代码生成能力。 WizardCoder- EMP…

作者头像 李华
网站建设 2026/4/11 1:58:22

DeepSeek-OCR 5分钟快速上手:图片转Markdown零基础教程

DeepSeek-OCR 5分钟快速上手&#xff1a;图片转Markdown零基础教程 你是不是经常遇到这样的烦恼&#xff1f;看到一份精美的PDF文档、一张复杂的表格截图&#xff0c;或者一篇手写的笔记&#xff0c;想要把它整理成电子版&#xff0c;却要一个字一个字地敲键盘&#xff1f;或者…

作者头像 李华
网站建设 2026/4/8 17:02:46

Chandra快速入门:3步完成Gemma模型的本地化部署

Chandra快速入门&#xff1a;3步完成Gemma模型的本地化部署 1. 为什么你需要Chandra——轻量、私有、开箱即用的AI聊天体验 你是否试过在本地跑一个大模型&#xff0c;结果被复杂的环境配置、显存不足、依赖冲突卡在第一步&#xff1f;是否担心把敏感问题发给云端API&#xf…

作者头像 李华
网站建设 2026/4/4 0:20:07

DeepSeek-OCR开源免费!比传统OCR强在哪?实测对比告诉你答案

DeepSeek-OCR开源免费&#xff01;比传统OCR强在哪&#xff1f;实测对比告诉你答案 你有没有遇到过这样的烦恼&#xff1f;拍了一张表格照片&#xff0c;想提取里面的数据&#xff0c;结果识别出来的文字乱七八糟&#xff0c;表格结构全乱了。或者扫描了一份合同&#xff0c;想…

作者头像 李华
网站建设 2026/4/13 18:50:39

PDF-Extract-Kit-1.0快速入门:一键部署PDF解析工具

PDF-Extract-Kit-1.0快速入门&#xff1a;一键部署PDF解析工具 PDF-Extract-Kit-1.0 是一款开箱即用的PDF智能解析工具集&#xff0c;专为科研人员、数据工程师和办公自动化用户设计。它不依赖复杂配置&#xff0c;无需编译环境&#xff0c;也不需要你手动安装几十个Python包—…

作者头像 李华