news 2026/4/16 13:58:00

利用大语言模型提升产品目录质量

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
利用大语言模型提升产品目录质量

使用大语言模型改进产品列表

某中心的在线目录包含数亿产品,每天有数百万产品列表被添加和编辑。产品数据——包括图片、标题、描述和使用建议——必须完整、准确且具有吸引力,以便购物者能快速找到他们寻求的产品。

为确保产品数据的质量,某中心传统上依赖于专门的机器学习模型,每个模型针对独立的产品类别(从庭院家具到耳机)进行了优化。这些模型添加或更新信息,识别不准确之处,整合信息,将文本翻译成不同语言,并整合来自第三方来源的数据。

此类模型对于具有较小、结构化属性列表的产品效果最好——例如餐盘,其可以通过尺寸、形状、颜色和材料得到很好的描述。但目录中有许多产品的属性要复杂或细致得多,需要专门训练的机器学习模型或人工审核。

为确保产品列表的质量满足购物者的需求,转向了更具适应性和普适性的大语言模型。当使用目录中的属性数据进行提示时,大语言模型能适应目录结构和词汇,从而能够有效地集成到质量控制流程中。这些目录人工智能解决方案正在以某中心商店的规模纠正和更新产品属性。

提示词调优

为了使大语言模型适应目录质量控制的挑战,需要向其“介绍”关于产品目录的“知识”。换句话说,需要系统地引入属性语义和值,这些语义和值能最准确地描述数百万产品和产品类型。但首先需要构建这些知识。该过程始于按产品类型和属性值对整个目录进行总结和组织,在某种程度上类似于对一张非常庞大且复杂的电子表格的行进行分组。

通过这种重组,可以看到各种产品类型的卖家提供的属性值的范围,重要的是,还可以看到这些值出现的频率和位置的统计数据。这些统计数据是衡量一个值正确性的相当好的指标。例如,如果一个类别中更高数量的产品使用某个属性值,或者具有某个属性值的产品更频繁地被客户查看,就可以信任该属性是正确的。无线耳机可能具有显示为“Bluetooth”、“BT”、“BT 5.1”或“Bluetooth version 5.1”的属性,但统计数据会表明“Bluetooth”是用于告知大语言模型的最佳候选。

虽然属性统计数据对许多属性效果很好,但它们并不适用于所有属性,特别是在涉及更多细微差别时。某些属性的一个挑战是其粒度,即它们描述其产品的精确程度。一个例子是外科手术器械,其某个属性可能具有值“不锈钢”或“440不锈钢”。第二个值更具体;即使“不锈钢”是更可能的属性值,也不希望消除“440不锈钢”。

在目录中保持这种粒度的方法是通过一个称为提示词调优的迭代过程,在此过程中,通用大语言模型会接触到将在其中使用的环境中出现的特定模式、规则和术语。为了给大语言模型增加粒度,可能会用短语“返回的值必须与候选列表中值的粒度或宽泛程度相匹配”来提示它。还可以要求大语言模型解释其响应背后的推理,因为这倾向于提高其性能,同时也为工程师提供了有助于他们进一步微调提示词的见解。

提示词调优也是处理产品描述的其他细微差别的方式。这些包括确保表示的一致性,例如“men’s shirt”与“men shirt”,以及保持有意义的值表示,例如电视的“4K UHD HDR”,这比“4K”提供更多信息。

经过多轮提示词调优后,大语言模型即可接触整个目录,在此执行三项主要任务:识别标准属性值以确立正确性;收集标准值的替代表示或同义词;以及检测错误或无意义的数据条目。

新流程确保最新的卖家值能更快地被纳入目录,并节省了数千小时的人工审核时间。更重要的是,能够使用大语言模型来增加可监控和更新的语言数量。基于大语言模型的方法使得能够将质量控制流程扩展到目录的最远端,而使用之前的流程探索这些领域在成本上是不可行的。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 13:26:18

langchain怎么构造agant

使用 LangChain 构造 Agent(智能体)现在已经变得非常简单,尤其是随着 LangChain 1.0 版本的发布,API 更加统一和易用。你可以根据你的需求选择不同的复杂度。最简单的方式,只需要几行代码就能让大模型“动起来”。这里…

作者头像 李华
网站建设 2026/4/12 0:06:39

区块链应用UI自动化测试的特殊挑战与应对策略

区块链技术的去中心化和不可篡改性为应用开发带来革命性变革,但同时也为UI自动化测试引入独特难题。与传统Web应用不同,区块链UI测试需处理多节点交互、数据一致性保障和安全验证等复杂场景,这对测试从业者的工具选择和策略设计提出更高要求。…

作者头像 李华
网站建设 2026/4/16 10:43:39

智能穿戴设备微型界面测试方法论

一、微型界面特性与测试挑战 智能穿戴设备的屏幕尺寸通常在1-2英寸之间,其界面测试面临三大核心挑战: ‌空间限制‌:在有限像素区域内呈现复杂数据(如健康指标动态图表),需验证信息密度与可读性的平衡。‌…

作者头像 李华
网站建设 2026/4/16 12:18:39

UI测试在DevOps流水线中的卡点设计:质量保障的智能防线

在DevOps高速交付的背景下,UI测试作为用户体验的最终防线,其卡点(Quality Gates)设计直接决定软件质量与发布效率。卡点通过在流水线关键阶段植入自动化检测或人工审核机制,拦截缺陷流入下游,避免因UI问题导…

作者头像 李华
网站建设 2026/4/16 12:21:53

自动化测试中的量子计算潜力探索

在软件工程领域,自动化测试已成为提升开发效率和质量保障的关键手段,但随着系统复杂度的增加,传统测试方法面临处理大规模数据和优化算法的瓶颈。量子计算凭借其独特的并行处理能力和高效性问题求解机制,为自动化测试带来了颠覆性…

作者头像 李华