PSD 车位可视化异常总结-编程阁

下面是截至目前为止的完整排查进度总结，并对“下位机 PSD 车位可视化异常”的根因作出阶段性分析，便于对外汇报与后续推进。

一、问题现象

PSD 车位可视化结果异常（部分图片无车位、部分位置异常）

RM/FSD 正常

上位机推理正常

模型输入尺寸从 544×480 切换到 608×736 后异常变明显

二、已完成的排查路径与结论（含证据）

1) 确认输入/原图尺寸正确

证据：下位机日志

input_sizes[0]=608, input_sizes[1]=736

Image Pre processing for image of size 480 x 544

结论：输入和原图尺寸无误，非尺寸配置问题。

2) 排除“可视化坐标映射错误”

方法：输出 _model.bmp / _model_swap.bmp 并加入 raw 坐标自适应缩放

证据：draw_tensor2psd_result 多次出现

raw_max 在部分图超原图范围 / 有时在原图内

结论：raw 坐标本身不稳定，不是单纯画图映射问题。

3) 修复输出 tensor 指针生命周期

问题：map 后立即 unmap，再解码

结论：存在悬空指针风险

措施：map → decode → unmap

结果：消除未定义行为，但异常仍存在

4) 输出 tensor 数据类型确认

证据：下位机日志

outElementType(TIDL)=2 vxType=VX_TYPE_UINT16

结论：输出为 uint16，解码端 unsigned short* 匹配 ✅

5) 修复输出 tensor stride（关键）

问题：map 时 stride[0]=1 只适用于 uint8

结论：uint16 必须 stride=2，否则数据错位

措施：按输出类型计算 stride

结果：raw 坐标变合理，部分图可视化变正常

6) 修复检测头索引错位（关键）

问题：模型检测头输出在 output[1..3]，解码固定用 0..2

结论：参数与数据错位

措施：1→0, 2→1, 3→2 重新映射

结果：可视化明显改善，但仍有“部分图片无车位”

7) 阈值导致“无车位输出”

证据（0206 日志）

错图对应 max_conf < conf_thresh

检测结果 0 → bin 空 → 可视化无车位

结论：并不是画错，而是被阈值过滤

措施：降低 conf_thresh 到 0.10

结果：部分“原本无车位”的图开始有输出，但带来另一个问题

8) 越界写导致 inf（新问题）

证据（0210 日志）

max_conf=inf max_cls=inf max_score=inf

conf_pass 很大

结论：bbox 数量超过上限 100，数组越界 → 覆盖统计变量

措施：加入越界保护 + overflow 统计

结果：预计 inf 消失，可继续验证

三、阶段性根因分析（当前结论）

✅ 已确认的根因（已修复）

输出 tensor 映射 stride 错误 → 导致 raw_data 读取错位

检测头索引错位 → 导致解码使用错头参数

输出 tensor 提前 unmap → 存在悬空指针风险

这些修复后，部分图片已能正确输出，说明核心解码链路趋于正常。

⚠ 当前仍在影响的原因

低置信度导致“无车位输出”

max_conf 低于阈值 → bin 为空

可视化“空图”是因为没有输出

阈值降低引发的越界写

过多候选 → bbox_num 超上限

已加 overflow 防护，待验证

四、现阶段结论

“部分图正常、部分图没有车位”的现象已经不是解码错位，而是阈值与候选数量共同作用的结果。

置信度低 → 被过滤 → 无车位输出

降阈值 → 候选多 → 越界 → 统计异常

五、当前进度状态

解码链路已基本修正（stride + head 映射 + map/unmap）

可视化逻辑已稳定

剩余问题集中在阈值策略与候选数量控制

如果你需要，我可以再提供一版“后续计划 + 风险评估”的汇报页。

cv_unet_image-colorization镜像免配置：Streamlit一键启动开箱即用

cv_unet_image-colorization镜像免配置：Streamlit一键启动开箱即用 1. 项目简介你是否遇到过这样的情况：翻看老照片时，发现很多珍贵的黑白照片已经泛黄褪色，想要恢复它们原本的色彩却不知道从何下手？或者作为摄影师…

李华

代码大模型WizardCoder: EMPOWERING CODE LARGE LANGUAGE MODELS WITH EVOL-

这篇 WizardCoder: EMPOWERING CODE LARGE LANGUAGE MODELS WITH EVOL-INSTRUCT 的核心创新，基本都围绕一个主线：把“Evol-Instruct”从通用对话领域改造成“代码任务专用的指令进化流水线”，用可控地提升指令复杂度来显著抬升 Code LLM 的代码生成能力。 WizardCoder- EMP…

李华

DeepSeek-OCR 5分钟快速上手：图片转Markdown零基础教程

DeepSeek-OCR 5分钟快速上手：图片转Markdown零基础教程你是不是经常遇到这样的烦恼？看到一份精美的PDF文档、一张复杂的表格截图，或者一篇手写的笔记，想要把它整理成电子版，却要一个字一个字地敲键盘？或者…

李华

Chandra快速入门：3步完成Gemma模型的本地化部署

Chandra快速入门：3步完成Gemma模型的本地化部署 1. 为什么你需要Chandra——轻量、私有、开箱即用的AI聊天体验你是否试过在本地跑一个大模型，结果被复杂的环境配置、显存不足、依赖冲突卡在第一步？是否担心把敏感问题发给云端API&#xf…

李华

DeepSeek-OCR开源免费！比传统OCR强在哪？实测对比告诉你答案

DeepSeek-OCR开源免费！比传统OCR强在哪？实测对比告诉你答案你有没有遇到过这样的烦恼？拍了一张表格照片，想提取里面的数据，结果识别出来的文字乱七八糟，表格结构全乱了。或者扫描了一份合同，想…

李华

PDF-Extract-Kit-1.0快速入门：一键部署PDF解析工具

PDF-Extract-Kit-1.0快速入门：一键部署PDF解析工具 PDF-Extract-Kit-1.0 是一款开箱即用的PDF智能解析工具集，专为科研人员、数据工程师和办公自动化用户设计。它不依赖复杂配置，无需编译环境，也不需要你手动安装几十个Python包—…

李华