二、核心项目案例详解
(一)案例一:散户股票简单筛选器
1. 项目核心场景
- 目标用户:普通散户股民
- 解决痛点:
- 散户常从自媒体获取股票推荐(多为带水印/冗余信息的表格/图片),需手动筛选可交易股票;
- 散户受交易权限限制(无法购买创业板、科创板、北证股票),手动筛选几十只股票耗时久(30分钟-1小时);
- 需保留股票名称、概念解析等关键信息,剔除无交易权限的股票。
- 预期效果:上传股票推荐图片/表格,自动筛选出仅主板可交易股票,输出包含股票名、概念解析的结构化结果。
2. 项目工作流原设计(问题版)
流程步骤 | 具体操作 | 存在问题 |
1 | 上传股票推荐图片(支持6-8张) | 无 |
2 | 图片筛选器(筛选非图片内容) | 冗余:实际无是非图片输入,该节点无效 |
3 | 迭代1:大模型提取股票名称 | 拆分过细:可与后续步骤合并 |
4 | 知识库检索股票代码(内置5400+A股名称+代码) | 逻辑错误:知识库检索基于语义相似性,股票名称与代码匹配度低,输出为空 |
5 | 迭代2:大模型筛选无效股票(剔除创业板/科创板等) | 多节点冗余:可与提取、匹配步骤合并 |
6 | 迭代3:大模型整理概念解析 | 重复劳动:前面已提取相关信息,无需二次处理 |
7 | 迭代4:大模型总结并生成表格 | 大模型滥用:共使用11次大模型,TOKEN消耗高、效率低 |
3. 导师核心点评(零基础必避坑)
- 致命问题1:大模型节点冗余原本1个大模型节点可完成的结构化输出(提取股票名+匹配代码+筛选权限+整理信息),拆分为4-5个节点,导致TOKEN消耗高、流程冗长。✅ 优化方案:用1个大模型节点,通过结构化输出提示词,让模型直接输出JSON格式结果(包含股票名、代码、是否可交易、概念解析)。
- 致命问题2:知识库使用逻辑错误知识库适用于“语义相似性检索”(如问答匹配),而非“精准关键词匹配”(股票名→代码)。✅ 优化方案:使用第三方股票API接口,根据股票名称查询代码(百度搜索“股票名称查代码 API”,选择免费/低成本接口,无需写复杂代码)。
- 致命问题3:流程设计无整体规划边做边加节点(发现结果不好就新增节点),导致流程混乱。✅ 优化方案:先明确最终输出格式(如JSON字段:股票名、代码、权限状态、概念解析),再倒推需要的步骤,避免“堆砌节点”。
4. 零基础优化后的工作流(极简版)
- 上传输入:股票推荐图片/表格(支持多格式);
- OCR识别:提取图片中的股票名、概念解析等文本(用工具自带OCR节点);
- 结构化输出:1个大模型节点,提示词示例:
> “请从以下文本中提取股票名称、概念解析,通过股票名称匹配对应的股票代码(格式:60开头=主板,300=创业板,688=科创板,8开头=北证),判断该股票是否为散户可交易的主板股票(仅60开头为可交易),最终以JSON格式输出:{股票名: string, 代码: string, 可交易: boolean, 概念解析: string}”;
- 结果导出:直接将JSON转为表格(用工具自带的格式转换节点)。
(二)案例二:差旅发票审核系统
1. 项目核心场景
- 目标用户:企业员工/财务人员
- 解决痛点:
- 差旅发票类型多(火车票、机票、住宿票、餐饮票),手动审核效率低;
- 不同职级员工在不同城市的住宿/餐饮报销有额度限制(如经理级住宿≤500元/晚);
- 需校验发票与出差行程匹配(如目的地是否在出差城市内)。
- 项目亮点:新增额度限制、多发票类型分类、行程匹配校验。
2. 项目工作流原设计
- 上传发票(支持图片/PDF);
- OCR识别:提取发票类型、金额、日期、出差城市等信息;
- 格式整理:代码节点拼接员工信息(预置职级、城市额度);
- 规则校验:大模型节点统一审核(判断金额是否超限额、行程是否匹配);
- 输出结果:JSON格式(合格/不合格发票清单)。
3. 导师核心点评(零基础重点关注)
- 优点:场景实用、有业务逻辑(结合企业实际报销规则),适合零基础模仿。
- 可优化问题1:VL模型负载过高用VL模型(图像+文本混合模型)同时完成“识别发票类型+提取字段+规则判断”,因模型参数量小(几十B),易出现幻觉(胡编信息)、耗时久(单节点3分钟)。✅ 优化方案:拆分任务——VL模型仅负责“图像→文本提取”,文本处理(分类、规则判断)交给普通大模型或代码节点。
- 可优化问题2:规则校验集中化风险高所有发票统一在1个大模型节点审核,模型注意力分散(需同时判断5种发票+多维度规则),易出错。✅ 优化方案:迭代内审核——每识别1张发票,立即在迭代节点内完成规则校验(如:识别→判断额度→标记合格/不合格),最后统一汇总结果(类似“看1张标1张”)。
- 可优化问题3:结构化输出不统一不同发票类型输出字段不同(如火车票有车次,机票有航班号),后续处理复杂。✅ 优化方案:统一JSON格式,无关字段留空,示例:
JSON |
4. 零基础实操技巧
- 额度规则可预置在代码节点(无需数据库),示例:
> “普通员工:一线城市住宿≤300元/晚,餐饮≤100元/天;经理级:住宿≤500元/晚,餐饮≤150元/天”;
- 发票类型识别:用大模型输出数字标记(1=火车票,2=机票,3=住宿票),后续通过条件分支自动匹配对应规则;
- 避免OCR识别错误:火车票红色号码易误读,可在提示词中补充“忽略红色水印文字,仅提取黑色印刷体的发票号码、金额”。
(三)案例三:差旅报销智能助手(学员:燕儿)
1. 项目核心场景(进阶版,零基础可分步模仿)
- 核心功能:
- 报销审核:上传发票/行程单,自动校验合规性(额度、行程匹配);
- 制度咨询:无发票上传时,可咨询差旅报销规则(如“普通员工去上海住宿限额多少”);
- 二次追问:员工可针对审核结果提问(如“为什么这张住宿票不合格”)。
- 项目亮点:多功能融合(审核+咨询)、用户交互友好。
2. 关键问题与优化方案(零基础重点借鉴)
存在问题 | 零基础优化方案 |
PDF发票提取信息错乱(购方名称→销售方) | 用专门的发票OCR API(如百度智能云发票识别),而非通用文档提取器 |
大模型必填字段无信息时出现幻觉 | 提示词明确“无相关信息则留空,禁止编造”,示例:“若未识别到航班号,字段值填'',不得虚构” |
知识库检索报销规则时匹配度低 | 知识库仅存储“报销规则文本”(如“普通员工一线城市住宿限额300元”),检索时用关键词(如“普通员工 上海 住宿限额”)而非整段发票信息 |
规则审核依赖大模型易出错 | 用代码节点实现刚性规则(如“金额>限额→不合格”),大模型仅负责解释原因(如“该住宿票金额400元,超普通员工上海住宿限额300元”) |
3. 零基础可复用的核心提示词
- 结构化输出提示词:
> “请识别以下发票信息,按JSON格式输出:{发票类型: string, 金额: number, 出差城市: string, 开票日期: string, 关键字段: {火车票: {车次: string, 出发地: string, 目的地: string}, 住宿票: {酒店名称: string, 入住日期: string}, 无对应类型则留空}}”;
- 规则判断提示词(代码节点替代方案):
> “已知规则:普通员工北京住宿限额300元/晚,餐饮限额100元/天。请判断发票是否合规:金额280元,类型住宿票,城市北京,职级普通员工→合规;金额350元→不合规,原因:超住宿限额50元”。
三、零基础通用学习指南
(一)AI工作流搭建核心原则(必记)
- 先定输出,再倒推输入:明确最终要输出什么格式(表格/JSON/文本),再确定需要哪些步骤,避免“漫无目的加节点”;
- 大模型节点越少越好:能用1个节点解决的,绝不拆成多个,核心靠“提示词结构化”;
- 工具选对不选难:知识库、API、代码节点的用途要分清(如下表);
工具/节点 | 适用场景 | 不适用场景 |
知识库 | 语义相似性检索(如问答、规则匹配) | 精准关键词匹配(如股票名→代码) |
第三方API | 实时数据查询(股票代码、天气、发票识别) | 本地静态数据处理(如预置额度规则) |
代码节点 | 刚性规则判断(金额对比、字段匹配) | 自然语言理解(如发票类型识别) |
大模型节点 | 自然语言处理(文本提取、结构化输出、解释说明) | 精准计算、实时数据查询 |
(二)零基础实操步骤(以任意项目为例)
- 场景定义:用一句话说清“谁+解决什么问题+输出什么结果”(如“散户+筛选可交易主板股票+输出带概念解析的表格”);
- 输入输出设计:
- 输入:明确支持的格式(图片/PDF/文本);
- 输出:明确字段(如表格列:股票名、代码、可交易、概念解析);
- 步骤拆解(最多5步):
- 输入→提取信息(OCR/文本提取)→处理信息(结构化/规则判断)→数据补充(API/知识库)→输出结果(格式转换);
- 提示词编写技巧:
- 明确角色:“你是发票信息提取专家”;
- 明确格式:“按JSON输出,字段包括XXX”;
- 明确约束:“无信息则留空,禁止编造”;
- 测试优化:
- 用少量数据测试(如2-3张发票/股票推荐图);
- 重点看:是否有冗余节点、TOKEN消耗是否过高、结果是否准确。
(三)常见问题排查清单(零基础必看)
问题现象 | 可能原因 | 解决方法 |
大模型输出格式混乱 | 未明确结构化要求 | 提示词中指定JSON/表格格式,给出示例 |
流程耗时久、TOKEN消耗高 | 大模型节点过多 | 合并冗余节点,用代码节点替代部分大模型功能 |
结果为空或错误 | 工具用错(如知识库做精准匹配) | 更换工具(如用API替代知识库) |
出现幻觉(大模型编造信息) | 未明确“无信息则留空” | 提示词中添加约束条件,减少必填字段 |
(四)学习资源推荐
- 第三方API查找:百度搜索“API聚合平台”(如聚合数据、极速数据),选择免费试用的接口;
- 提示词模板:直接复用本文档中的结构化输出提示词,替换字段即可;
- 工具操作:优先使用可视化工具(如课程中提到的平台),无需编写复杂代码,拖拽节点即可搭建。
四、总结
重点掌握“场景定义→输入输出设计→工具选对→提示词优化”的逻辑。
关键是记住:AI工作流搭建的核心是“高效解决问题”,而非“堆砌复杂节点”,工具用对、步骤精简、提示词明确,就能做出合格的项目。