RexUniNLU Web界面协作教程:多人共享Schema模板与结果版本管理
1. 为什么你需要这个协作能力?
你有没有遇到过这些情况?
- 团队里三个人同时在做命名实体识别,各自定义了一套“人物”“公司”“地点”的Schema,格式五花八门,最后合并结果时字段对不上;
- 上周跑出的文本分类结果,今天想复现却记不清当时用的Schema长什么样,只能凭印象重试;
- 同一个新闻语料,实习生抽了5版实体,产品经理改了3次标签体系,但没人知道哪一版最准、哪一版被谁覆盖过;
- 想把“客户反馈情感分析”的Schema模板分享给客服组直接复用,却得截图发微信、再手动复制粘贴——错一个逗号就报错。
RexUniNLU Web界面不是只让你“点一下就出结果”的玩具。它真正解决的是团队级NLU工程落地中的隐性成本:Schema不统一、结果难追溯、协作靠人肉。这篇教程不讲模型原理,不跑命令行,只带你用Web界面完成三件关键协作动作:
把你调好的Schema保存为可复用的模板
让同事一键加载、修改、另存,不污染原版
对每一次抽取/分类结果自动打标、归档、对比差异
全程无需写代码,不碰配置文件,所有操作都在浏览器里完成——就像用在线协作文档一样自然。
2. 共享Schema模板:告别复制粘贴的混乱时代
2.1 什么是Schema模板?它和普通JSON有什么不同?
先说清楚一个误区:Schema不是“随便写的字典”。在RexUniNLU里,{"人物": null, "公司": null}这样的结构,本质是一份任务契约——它告诉模型:“请从文本中找出符合‘人物’定义的内容,类型名必须严格匹配,大小写、空格、中英文都不能错”。
而“模板”,就是把这份契约固化下来,带名称、带描述、带使用记录。比如你创建一个叫“电商评论实体”的模板,它会包含:
- 名称:电商评论实体(别人一眼看懂用途)
- Schema内容:
{"产品名": null, "品牌": null, "缺陷描述": null, "购买渠道": null} - 创建者/时间:自动记录,谁建的、什么时候建的
- 使用说明(可选):比如“注意:‘缺陷描述’需包含具体问题词,如‘卡顿’‘发热’‘掉色’,避免泛泛而谈‘不好用’”
关键区别:普通JSON是“一次性的输入”,模板是“可发现、可复用、可迭代的知识资产”。
2.2 三步创建并共享你的第一个模板
步骤1:在NER或文本分类Tab中完成一次成功抽取/分类
打开Web界面 → 切换到“命名实体识别”Tab → 输入一段测试文本(比如:“iPhone 15 Pro在京东首发,用户反馈边框易刮花,屏幕显示效果惊艳”)→ 在Schema框中输入:
{"产品名": null, "平台": null, "用户反馈问题": null, "评价维度": null}点击“抽取”,确认结果合理(如“iPhone 15 Pro”归入“产品名”,“京东”归入“平台”,“刮花”归入“用户反馈问题”)。
步骤2:点击右上角「保存为模板」按钮
别急着关页面!看到Schema输入框右上角那个小图标了吗?它不是装饰——点击后弹出对话框:
- 模板名称:填“电商评论实体-v1”(建议加v1,方便后续迭代)
- 描述:简单写一句,比如“用于提取电商用户评论中的核心要素,已验证对手机类目有效”
- 是否公开:勾选✔(这是共享的关键!不勾选只有你自己可见)
点击“保存”,页面顶部会提示“模板保存成功”。
步骤3:生成分享链接,发给同事
鼠标悬停在刚保存的模板名称上 → 出现「分享」图标 → 点击 → 复制生成的链接(形如https://.../template?id=abc123)。
发给同事后,他们只需:
① 打开链接(无需登录同一账号)
② 点击“加载到当前Schema” → 框内自动填充完整JSON
③ 可直接运行,也可点击“另存为新模板”进行微调(比如把“平台”改成“购买平台”,不影响原版)
实测提醒:模板共享不依赖账号体系,纯链接驱动。即使对方没用过RexUniNLU,只要能访问Web界面,就能零门槛复用你的Schema逻辑。
3. 结果版本管理:让每一次NLU输出都可追溯、可对比
3.1 为什么结果需要“版本”?——一个真实场景
假设你负责监控某款APP的用户反馈。每周一上午9点,你用同一段Schema跑上周新增的1000条评论,生成一份“问题分布报告”。但第三周,运营同事说:“咦?‘闪退’问题占比怎么从12%降到5%了?是修复了还是漏抽了?”
你翻记录:
- 第一周:Schema是
{"功能异常": null, "UI问题": null, "性能问题": null} - 第二周:同事悄悄把“性能问题”拆成
{"卡顿": null, "闪退": null, "耗电快": null} - 第三周:你又改回原Schema,但忘了备注……
没有版本管理,这就是一笔糊涂账。
3.2 Web界面如何自动帮你管好版本?
RexUniNLU Web界面会在你每次点击“抽取”或“分类”后,自动生成一条结果记录,并关联以下信息:
- 唯一ID:如
res_7f8a2b1c(用于精准定位) - 时间戳:精确到秒,谁在什么时候运行的
- 所用Schema:直接显示模板名称+ID(如“电商评论实体-v1 | id: abc123”),点进去能看原始定义
- 输入文本摘要:前50字符+省略号,快速确认是不是同一语料
- 结果快照:JSON内容直接存储,不依赖本地缓存
所有记录按时间倒序排列在左侧「历史结果」面板,支持:
🔹关键词搜索:搜“闪退”“v2”“张三”都能快速定位
🔹双击对比:选中两条记录 → 点击「对比」按钮 → 左右分屏高亮差异(比如A版抽到3个“闪退”,B版只抽到1个,差异处标红)
🔹导出为JSON/CSV:一键下载,供下游系统分析
3.3 实操:用版本对比揪出Schema改动的影响
我们来模拟一次排查:
- 用原始Schema
{"问题类型": null}跑10条含“闪退”的评论 → 得到结果A(记录ID: res_a1) - 将Schema改为
{"崩溃": null, "卡顿": null, "闪退": null}→ 跑同样10条 → 得到结果B(记录ID: res_b2) - 在「历史结果」中找到这两条 → 点击「对比」
你会看到:
- 左侧(res_a1):
"问题类型": ["闪退", "闪退", "崩溃"] - 右侧(res_b2):
"崩溃": ["崩溃"], "闪退": ["闪退", "闪退"] - 差异提示:右侧多出1个“崩溃”字段,左侧“问题类型”里的“崩溃”被拆分到了新字段——这说明:Schema粒度变细后,原字段不再覆盖新类别,需同步更新统计口径。
不用翻聊天记录、不用问同事,界面自己告诉你变化在哪、影响多大。
4. 协作工作流实战:从需求到交付的完整闭环
现在,把模板共享和版本管理串起来,走一遍真实团队协作流。场景:为新上线的智能客服系统构建意图识别Schema。
4.1 角色分工与界面操作映射
| 角色 | 核心任务 | Web界面关键操作 |
|---|---|---|
| 算法同学 | 设计初始Schema,验证基础效果 | 创建模板“客服意图-v1”,定义{"咨询类": null, "投诉类": null, "办理类": null},跑通100条样本 |
| 业务专家 | 基于实际对话补充细分意图 | 加载“客服意图-v1” → 点击「另存为新模板」→ 改名“客服意图-业务细化-v2” → 新增{"资费咨询": null, "故障报修": null, "套餐变更": null}→ 提交审核 |
| 测试同学 | 验证新Schema在全量语料上的稳定性 | 用v2模板跑1万条历史对话 → 查看「历史结果」中最新记录 → 点击「导出」生成测试报告 |
| 运维同学 | 确保生产环境使用正确版本 | 登录Web界面 → 查看「当前生效模板」栏 → 确认显示“客服意图-业务细化-v2” → 复制模板ID给开发部署 |
4.2 关键协作技巧(避坑指南)
- 模板命名要有“时间+场景+版本”:推荐格式
【2024Q3】客服意图-业务细化-v2,比单纯“v2”更易管理 - 慎用“覆盖保存”:Web界面默认是“另存为”,如果误点“覆盖”,原模板会被改写——重要模板建议创建后立即复制ID,写进团队Wiki备份
- 结果导出时勾选「包含Schema元数据」:生成的CSV会多两列:“模板名称”“模板ID”,下游分析时能直接关联到定义源头
- 清理旧版本:在「模板管理」页,可批量删除已废弃模板(如v0.1、v0.2),但删除后无法恢复,操作前务必确认
4.3 一个被忽略的协作价值:降低新人上手门槛
新同事入职第一天,不需要:
花2小时读文档理解Schema语法
翻Git历史找上个月的JSON样例
担心改错Schema导致服务报错
只需要:
① 打开团队共享的模板链接(如“客服意图-业务细化-v2”)
② 点击“加载到当前Schema”
③ 粘贴一段新对话,点击“分类”
④ 看结果是否合理 → 不合理?点「另存为新模板」微调,再提交
整个过程5分钟,且所有操作留痕可溯。这才是真正的“开箱即协作”。
5. 进阶协作:与外部工具联动的轻量方案
Web界面虽强,但团队可能已有自己的知识库或项目管理工具。RexUniNLU提供两个轻量集成点,无需开发:
5.1 模板ID即API钥匙:嵌入Confluence/Wiki
将模板ID(如abc123)直接写进团队Wiki的Schema规范页:
当前标准Schema:
【2024Q3】客服意图-业务细化-v2(ID:abc123)
使用方式:在Web界面右上角「模板管理」→ 输入IDabc123→ 点击「加载」
同事点击ID即可跳转到对应模板页,比截图更可靠,比文档更实时。
5.2 结果ID对接Jira:把NLU问题变成工单
当「历史结果」中某条记录出现明显漏抽/错抽(比如该抽“资费咨询”却归到“投诉类”),直接:
- 复制结果ID(如
res_7f8a2b1c) - 在Jira新建Bug工单,标题写:“【NLU】res_7f8a2b1c 意图识别错误”
- 描述中粘贴:
- 输入文本(前100字)
- 当前Schema(JSON片段)
- 期望结果 & 实际结果(用Web界面的「对比」功能截图)
算法同学收到工单,粘贴IDres_7f8a2b1c到Web界面,瞬间复现问题现场,无需额外沟通上下文。
6. 总结:让NLU协作从“人肉接力”走向“系统协同”
回顾这篇教程,你实际掌握了三个层次的能力:
🔹操作层:知道在哪里点「保存为模板」、怎么用ID分享、如何对比结果版本;
🔹流程层:理解了从Schema设计→业务细化→测试验证→生产部署的协作链条;
🔹思维层:意识到NLU工程中,Schema和结果本身也是需要版本化管理的一等公民,和代码、文档同等重要。
这不是一个“高级功能”的炫技,而是把RexUniNLU Web界面真正用深、用透的关键。当团队不再为“谁改了Schema”“哪版结果准”争论,而是聚焦在“如何让Schema更贴近业务”“如何让结果更有业务解释力”时,NLU才真正从技术实验走向业务赋能。
下一次,当你面对一堆未标注的文本,别急着点“抽取”——先问问自己:这个Schema,值得被保存为模板吗?这次结果,需要被标记为正式版本吗?答案,就在Web界面右上角那几个不起眼的按钮里。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。