news 2026/4/16 11:30:43

AI侦探P.I.项目:计算机视觉与生成式AI协同质检

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI侦探P.I.项目:计算机视觉与生成式AI协同质检

AI侦探P.I.项目:计算机视觉与生成式AI协同质检

一项结合了生成式人工智能和计算机视觉成像隧道的技术正在帮助某中心主动改善客户体验。

尽管某中心的配送中心存储着数亿件商品,但客户报告已发货商品受损的情况非常罕见。然而,对客户体验的极致追求意味着相关团队正在积极努力,力争在为数不多的瑕疵商品送达客户之前发现并移除它们。

其中一个团队由科学家组成,他们正在利用生成式人工智能和计算机视觉(由某机构的Bedrock和SageMaker等服务提供支持)来帮助发现、隔离和移除有缺陷的商品。在遍布北美的某中心配送中心内部,从狗粮、手机壳到T恤和书籍的各种商品会通过成像隧道,用于多种用途,包括根据商品的目的地进行分拣。这些用例已扩展到利用人工智能检查单个商品的缺陷。

例如,光学字符识别技术会检查产品包装上的有效期,以确保过期商品不会发送给客户。计算机视觉模型则会对彩色和单色图像进行仔细检查,以发现产品损坏的迹象,例如弯曲的书籍封面。

此外,近期一项突破性解决方案利用了生成式AI处理多模态信息的能力,通过综合商品履约过程中捕获的图像证据,并结合客户的书面反馈,以触发更快的纠正措施。这项统称为P.I.(意为“私家侦探”)项目的努力,涵盖了该团队的愿景:使用类似侦探的工具集来发现缺陷,并尽可能找出其原因,以便在产品到达客户之前从根源上解决问题。

缺陷检测

P.I.项目是某中心产品质量计划的产物,团队科学家开发的工具和系统包括帮助销售合作伙伴准确录入产品信息的机器学习模型。

早期的解决方案是一个OCR模型,它在库存到达时检查标签信息,并将其与数据库中的信息进行比较。如果出现不匹配,团队可以隔离并检查该批货物,防止任何过期产品到达客户手中。当检测到单个商品存在缺陷时,会采取几个步骤来解决问题,包括调查该商品是否属于一批有缺陷的产品,如果是,则将该批次与其他商品隔离。

利用客户反馈训练模型

尽管团队尽了最大努力,但有时产品质量问题只有在商品交付给客户后才会被发现。在这些情况下,团队会追踪商品所属的批次,核实问题,从配送中心货架上移除这些商品,进行退款,并向卖家沟通问题。

为了在产品包装和发货前更好地识别有缺陷的产品并采取精准、主动的措施,团队开始探索利用成像隧道的图像。该方法早期的挑战之一是训练CV模型以正确识别缺陷。为了解决这个问题,科学团队采用了一种集成方法,将自监督模型与有监督的Transformer模型相结合。通过学习与正常订单相关的配送中心图像中“正确”产品的样子,该模型可以将待包装的商品与其“正常”图像进行比较,并提供差异程度的度量。

这种方法使团队能够更可靠地发现明显的产品缺陷,但仍无法处理一些细节问题,如T恤尺码标签错误或盒子变形。为此,团队转向利用客户反馈来帮助训练多种ML模型,以区分正常和有缺陷的商品。这些更详细、带标签的数据被用于改进模型,以检测客户注意到的缺陷类型。

利用生成式AI

如今,科学团队正在利用生成式AI的突破,使产品缺陷检测更具可扩展性和鲁棒性。例如,团队推出了一个多模态大语言模型,该模型经过训练,可以识别破损的封条、撕裂的盒子和弯曲的书籍封面等损坏,并用通俗语言报告其检测到的损坏。

与传统CV技术需要为每个损坏场景(封条破损、盒子撕裂等)训练一个模型不同,MLLM是一个单一且可扩展的统一解决方案。P.I.团队最近还投入生产了一个生成式AI系统,该系统使用MLLM来调查客户负面体验的根本原因。该系统首先审查客户关于问题的反馈,然后分析隧道收集的产品图像和其他数据源,以确认根本原因。例如,如果客户因为订购了双人床单却收到特大号床单而联系客服,该生成式AI系统会将此反馈与配送中心图像进行交叉验证。系统会询问诸如“产品标签在图像中是否可见?”、“标签上写的是特大号还是双人床单?”等问题。系统的视觉语言模型则会查看图像,从标签中提取文本并回答问题。LLM将答案转换成一份通俗易懂的调查摘要。

配送中心内的概念验证

自2022年5月以来,产品质量团队一直在北美多个配送中心利用成像隧道推广其商品级产品缺陷检测解决方案。结果令人鼓舞。该系统已被证明能够熟练处理每月通过隧道的数百万件商品,并准确识别过期商品以及颜色或尺寸错误等问题。

未来,团队的目标是实现通过本地图像处理进行近乎实时的产品缺陷检测。在这种场景下,有缺陷的商品可以从传送带上取下,并自动订购替换商品,从而消除对履约流程的干扰。

新的研究方向

将这些解决方案无缝集成到整个配送中心网络,需要对AI模型进行改进,例如提高模型区分潜在缺陷误判与实际缺陷的能力。此外,使CV模型适应每个配送中心和地区的独特细微差别也存在挑战,例如配送中心内用于运送商品的料箱的大小和颜色,以及跨多种语言提取数据的能力。随着团队不断深入,他们积累的数据显示,缺陷有时源于配送中心外部发生的情况。团队还计划让销售合作伙伴更容易地获取缺陷数据。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 10:16:32

3、深入理解单神经元:原理、激活函数与线性回归应用

深入理解单神经元:原理、激活函数与线性回归应用 1. 神经元结构概述 深度学习依赖由大量简单计算单元组成的复杂网络。这些基本计算单元被称为神经元,类比大脑中的神经元得名。每个神经元接收一定数量的输入(实数),并计算出一个输出(同样为实数)。输入通常用 (x_i \in…

作者头像 李华
网站建设 2026/4/16 1:35:29

模型换不动?卡在这里!Open-AutoGLM更换大模型常见问题全解析,速看避坑

第一章:智谱的Open-AutoGLM如何更换大模型在使用智谱推出的 Open-AutoGLM 框架进行自动化机器学习任务时,用户常需根据实际需求切换底层大语言模型以提升推理效果或适配特定场景。该框架支持灵活替换模型组件,通过配置文件或代码接口即可完成…

作者头像 李华
网站建设 2026/4/16 10:18:14

Dify平台SQL语句生成准确性测试报告

Dify平台SQL语句生成准确性测试报告 在当今企业数据爆炸式增长的背景下,如何让非技术人员也能轻松访问数据库、快速获取业务洞察,已经成为数字化转型的关键命题。一个典型的场景是:销售主管想了解“上个月哪个区域的订单量最高”,…

作者头像 李华
网站建设 2026/4/16 10:20:27

Dify平台学术论文摘要生成效果评测

Dify平台学术论文摘要生成效果评测 在科研节奏日益加快的今天,研究人员常常面临海量文献阅读与整理的压力。一篇高质量的论文摘要不仅能帮助快速把握研究核心,更是撰写综述、申报项目和发表成果的重要基础。然而,手动撰写结构严谨、语言规范的…

作者头像 李华
网站建设 2026/4/15 16:12:13

Dify平台求职面试问题预测与回答指导功能

Dify平台构建求职面试智能指导系统的实践与思考 在每年数以千万计的求职者中,有多少人因为准备不充分而在最后一轮面试中功亏一篑?又有多少优秀的候选人,明明具备岗位所需能力,却因表达方式不当被误判淘汰?这不仅是个人…

作者头像 李华
网站建设 2026/4/16 0:10:48

Open-AutoGLM开源了!10分钟部署本地AI编程环境,开发者速进

第一章:Open-AutoGLM开源源码Open-AutoGLM 是一个面向自动化自然语言处理任务的开源框架,旨在通过可扩展的模块化设计支持大语言模型的快速部署与微调。该项目基于 PyTorch 构建,提供了从数据预处理到模型推理的一站式解决方案,适…

作者头像 李华