news 2026/5/14 10:03:51

QDKT5-1Dify 智能体应用产品路演 + 点评

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
QDKT5-1Dify 智能体应用产品路演 + 点评

二、核心项目案例详解

(一)案例一:散户股票简单筛选器

1. 项目核心场景

  • 目标用户:普通散户股民
  • 解决痛点
  • 散户常从自媒体获取股票推荐(多为带水印/冗余信息的表格/图片),需手动筛选可交易股票;
  • 散户受交易权限限制(无法购买创业板、科创板、北证股票),手动筛选几十只股票耗时久(30分钟-1小时);
  • 需保留股票名称、概念解析等关键信息,剔除无交易权限的股票。
  • 预期效果:上传股票推荐图片/表格,自动筛选出仅主板可交易股票,输出包含股票名、概念解析的结构化结果。

2. 项目工作流原设计(问题版)

流程步骤

具体操作

存在问题

1

上传股票推荐图片(支持6-8张)

2

图片筛选器(筛选非图片内容)

冗余:实际无是非图片输入,该节点无效

3

迭代1:大模型提取股票名称

拆分过细:可与后续步骤合并

4

知识库检索股票代码(内置5400+A股名称+代码)

逻辑错误:知识库检索基于语义相似性,股票名称与代码匹配度低,输出为空

5

迭代2:大模型筛选无效股票(剔除创业板/科创板等)

多节点冗余:可与提取、匹配步骤合并

6

迭代3:大模型整理概念解析

重复劳动:前面已提取相关信息,无需二次处理

7

迭代4:大模型总结并生成表格

大模型滥用:共使用11次大模型,TOKEN消耗高、效率低

3. 导师核心点评(零基础必避坑)

  • 致命问题1:大模型节点冗余原本1个大模型节点可完成的结构化输出(提取股票名+匹配代码+筛选权限+整理信息),拆分为4-5个节点,导致TOKEN消耗高、流程冗长。✅ 优化方案:用1个大模型节点,通过结构化输出提示词,让模型直接输出JSON格式结果(包含股票名、代码、是否可交易、概念解析)。
  • 致命问题2:知识库使用逻辑错误知识库适用于“语义相似性检索”(如问答匹配),而非“精准关键词匹配”(股票名→代码)。✅ 优化方案:使用第三方股票API接口,根据股票名称查询代码(百度搜索“股票名称查代码 API”,选择免费/低成本接口,无需写复杂代码)。
  • 致命问题3:流程设计无整体规划边做边加节点(发现结果不好就新增节点),导致流程混乱。✅ 优化方案:先明确最终输出格式(如JSON字段:股票名、代码、权限状态、概念解析),再倒推需要的步骤,避免“堆砌节点”。

4. 零基础优化后的工作流(极简版)

  1. 上传输入:股票推荐图片/表格(支持多格式);
  1. OCR识别:提取图片中的股票名、概念解析等文本(用工具自带OCR节点);
  1. 结构化输出:1个大模型节点,提示词示例:

> “请从以下文本中提取股票名称、概念解析,通过股票名称匹配对应的股票代码(格式:60开头=主板,300=创业板,688=科创板,8开头=北证),判断该股票是否为散户可交易的主板股票(仅60开头为可交易),最终以JSON格式输出:{股票名: string, 代码: string, 可交易: boolean, 概念解析: string}”;

  1. 结果导出:直接将JSON转为表格(用工具自带的格式转换节点)。

(二)案例二:差旅发票审核系统

1. 项目核心场景

  • 目标用户:企业员工/财务人员
  • 解决痛点
  • 差旅发票类型多(火车票、机票、住宿票、餐饮票),手动审核效率低;
  • 不同职级员工在不同城市的住宿/餐饮报销有额度限制(如经理级住宿≤500元/晚);
  • 需校验发票与出差行程匹配(如目的地是否在出差城市内)。
  • 项目亮点:新增额度限制、多发票类型分类、行程匹配校验。

2. 项目工作流原设计

  1. 上传发票(支持图片/PDF);
  1. OCR识别:提取发票类型、金额、日期、出差城市等信息;
  1. 格式整理:代码节点拼接员工信息(预置职级、城市额度);
  1. 规则校验:大模型节点统一审核(判断金额是否超限额、行程是否匹配);
  1. 输出结果:JSON格式(合格/不合格发票清单)。

3. 导师核心点评(零基础重点关注)

  • 优点:场景实用、有业务逻辑(结合企业实际报销规则),适合零基础模仿。
  • 可优化问题1:VL模型负载过高用VL模型(图像+文本混合模型)同时完成“识别发票类型+提取字段+规则判断”,因模型参数量小(几十B),易出现幻觉(胡编信息)、耗时久(单节点3分钟)。✅ 优化方案:拆分任务——VL模型仅负责“图像→文本提取”,文本处理(分类、规则判断)交给普通大模型或代码节点。
  • 可优化问题2:规则校验集中化风险高所有发票统一在1个大模型节点审核,模型注意力分散(需同时判断5种发票+多维度规则),易出错。✅ 优化方案:迭代内审核——每识别1张发票,立即在迭代节点内完成规则校验(如:识别→判断额度→标记合格/不合格),最后统一汇总结果(类似“看1张标1张”)。
  • 可优化问题3:结构化输出不统一不同发票类型输出字段不同(如火车票有车次,机票有航班号),后续处理复杂。✅ 优化方案:统一JSON格式,无关字段留空,示例:

JSON
{
"发票类型": "火车票",
"金额": 200,
"出差城市": "北京",
"职级": "普通员工",
"住宿限额": "", // 火车票无住宿限额,留空
"是否合格": true,
"不合格原因": ""
}

4. 零基础实操技巧

  • 额度规则可预置在代码节点(无需数据库),示例:

> “普通员工:一线城市住宿≤300元/晚,餐饮≤100元/天;经理级:住宿≤500元/晚,餐饮≤150元/天”;

  • 发票类型识别:用大模型输出数字标记(1=火车票,2=机票,3=住宿票),后续通过条件分支自动匹配对应规则;
  • 避免OCR识别错误:火车票红色号码易误读,可在提示词中补充“忽略红色水印文字,仅提取黑色印刷体的发票号码、金额”。

(三)案例三:差旅报销智能助手(学员:燕儿)

1. 项目核心场景(进阶版,零基础可分步模仿)

  • 核心功能
  1. 报销审核:上传发票/行程单,自动校验合规性(额度、行程匹配);
  1. 制度咨询:无发票上传时,可咨询差旅报销规则(如“普通员工去上海住宿限额多少”);
  1. 二次追问:员工可针对审核结果提问(如“为什么这张住宿票不合格”)。
  • 项目亮点:多功能融合(审核+咨询)、用户交互友好。

2. 关键问题与优化方案(零基础重点借鉴)

存在问题

零基础优化方案

PDF发票提取信息错乱(购方名称→销售方)

用专门的发票OCR API(如百度智能云发票识别),而非通用文档提取器

大模型必填字段无信息时出现幻觉

提示词明确“无相关信息则留空,禁止编造”,示例:“若未识别到航班号,字段值填'',不得虚构”

知识库检索报销规则时匹配度低

知识库仅存储“报销规则文本”(如“普通员工一线城市住宿限额300元”),检索时用关键词(如“普通员工 上海 住宿限额”)而非整段发票信息

规则审核依赖大模型易出错

用代码节点实现刚性规则(如“金额>限额→不合格”),大模型仅负责解释原因(如“该住宿票金额400元,超普通员工上海住宿限额300元”)

3. 零基础可复用的核心提示词

  • 结构化输出提示词:

> “请识别以下发票信息,按JSON格式输出:{发票类型: string, 金额: number, 出差城市: string, 开票日期: string, 关键字段: {火车票: {车次: string, 出发地: string, 目的地: string}, 住宿票: {酒店名称: string, 入住日期: string}, 无对应类型则留空}}”;

  • 规则判断提示词(代码节点替代方案):

> “已知规则:普通员工北京住宿限额300元/晚,餐饮限额100元/天。请判断发票是否合规:金额280元,类型住宿票,城市北京,职级普通员工→合规;金额350元→不合规,原因:超住宿限额50元”。

三、零基础通用学习指南

(一)AI工作流搭建核心原则(必记)

  1. 先定输出,再倒推输入:明确最终要输出什么格式(表格/JSON/文本),再确定需要哪些步骤,避免“漫无目的加节点”;
  1. 大模型节点越少越好:能用1个节点解决的,绝不拆成多个,核心靠“提示词结构化”;
  1. 工具选对不选难:知识库、API、代码节点的用途要分清(如下表);

工具/节点

适用场景

不适用场景

知识库

语义相似性检索(如问答、规则匹配)

精准关键词匹配(如股票名→代码)

第三方API

实时数据查询(股票代码、天气、发票识别)

本地静态数据处理(如预置额度规则)

代码节点

刚性规则判断(金额对比、字段匹配)

自然语言理解(如发票类型识别)

大模型节点

自然语言处理(文本提取、结构化输出、解释说明)

精准计算、实时数据查询

(二)零基础实操步骤(以任意项目为例)

  1. 场景定义:用一句话说清“谁+解决什么问题+输出什么结果”(如“散户+筛选可交易主板股票+输出带概念解析的表格”);
  1. 输入输出设计
  • 输入:明确支持的格式(图片/PDF/文本);
  • 输出:明确字段(如表格列:股票名、代码、可交易、概念解析);
  1. 步骤拆解(最多5步)
  • 输入→提取信息(OCR/文本提取)→处理信息(结构化/规则判断)→数据补充(API/知识库)→输出结果(格式转换);
  1. 提示词编写技巧
  • 明确角色:“你是发票信息提取专家”;
  • 明确格式:“按JSON输出,字段包括XXX”;
  • 明确约束:“无信息则留空,禁止编造”;
  1. 测试优化
  • 用少量数据测试(如2-3张发票/股票推荐图);
  • 重点看:是否有冗余节点、TOKEN消耗是否过高、结果是否准确。

(三)常见问题排查清单(零基础必看)

问题现象

可能原因

解决方法

大模型输出格式混乱

未明确结构化要求

提示词中指定JSON/表格格式,给出示例

流程耗时久、TOKEN消耗高

大模型节点过多

合并冗余节点,用代码节点替代部分大模型功能

结果为空或错误

工具用错(如知识库做精准匹配)

更换工具(如用API替代知识库)

出现幻觉(大模型编造信息)

未明确“无信息则留空”

提示词中添加约束条件,减少必填字段

(四)学习资源推荐

  • 第三方API查找:百度搜索“API聚合平台”(如聚合数据、极速数据),选择免费试用的接口;
  • 提示词模板:直接复用本文档中的结构化输出提示词,替换字段即可;
  • 工具操作:优先使用可视化工具(如课程中提到的平台),无需编写复杂代码,拖拽节点即可搭建。

四、总结

重点掌握“场景定义→输入输出设计→工具选对→提示词优化”的逻辑。

关键是记住:AI工作流搭建的核心是“高效解决问题”,而非“堆砌复杂节点”,工具用对、步骤精简、提示词明确,就能做出合格的项目。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/14 10:02:03

Noto Emoji字体:彻底解决跨平台表情符号显示问题的5个步骤

Noto Emoji字体:彻底解决跨平台表情符号显示问题的5个步骤 【免费下载链接】noto-emoji Noto Emoji fonts 项目地址: https://gitcode.com/gh_mirrors/no/noto-emoji Noto Emoji是一款开源的Unicode表情符号字体库,旨在为所有平台提供一致的表情符…

作者头像 李华
网站建设 2026/5/14 10:01:38

AI智能体安全治理:DashClaw平台部署与集成实战指南

1. 项目概述:为AI智能体装上“刹车”与“黑匣子” 如果你正在使用Claude Code、LangChain或者自己构建的AI智能体,有没有过这样的担忧:这个家伙会不会突然执行一个 rm -rf / 命令?或者未经授权就调用生产环境的API?…

作者头像 李华
网站建设 2026/5/14 9:58:03

B站视频下载器终极指南:三步解锁4K大会员高清资源

B站视频下载器终极指南:三步解锁4K大会员高清资源 【免费下载链接】bilibili-downloader B站视频下载,支持下载大会员清晰度4K,持续更新中 项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 想象一下这样的场景&…

作者头像 李华
网站建设 2026/5/14 9:57:04

轻量级数据包中继工具pkrelay:原理、部署与实战应用

1. 项目概述:一个轻量级的数据包中继工具最近在折腾一些网络应用,特别是涉及到跨网络、跨设备的数据流转时,经常会遇到一个头疼的问题:如何在不修改现有应用架构的前提下,让数据包能够“听话地”从一个地方跑到另一个地…

作者头像 李华
网站建设 2026/5/14 9:55:54

三步解锁B站大会员4K视频下载:永久收藏你喜欢的视频内容

三步解锁B站大会员4K视频下载:永久收藏你喜欢的视频内容 【免费下载链接】bilibili-downloader B站视频下载,支持下载大会员清晰度4K,持续更新中 项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 还在为B站视频只能…

作者头像 李华
网站建设 2026/5/14 9:55:54

Unity VFX Graph 的Block添加集合

Spawn的Block集合一. Attribute(属性)Attribute Block 用于设置或修改粒子的基础属性。它是你进行特效设计时最常用的分类之一。1. 基础状态类 (Basic State)这类 Block 定义了粒子生成时的生命时长和基本存活状态。Set SpawnEvent Age: 设置生成事件的初…

作者头像 李华