news 2026/4/16 11:50:44

知识图谱(三)之知识查询语言

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
知识图谱(三)之知识查询语言

一:查询语言介绍

1.为什么不使用sql

关系型数据库查询语言——SQL

方式:数据以表的形式存在, 有比较强的schema定义, 表和表之间的数据关联以join的方式实现.

缺点:MySQL主要是存储和查询二维表数据,对三元组数据没有单独意义;

多跳关联查询需要多表连接,效率低

2.图数据查询语言的区别

二:命名实体识别(NER)

2.1基础知识

2.1.1什么是NER
  • 实体:文本之中承载信息的语义单元。

  • 常见的实体包括七种类别:人名、地名、机构名、时间、日期、货币、百分比。

  • 实体抽取:又称为命名实体识别,指的是从文本之中抽取出命名性实体,并把这些实体划分到指定的类别。

2.1.2识别后格式

原文本:

命名实体后的文本:

总体是字典格式,里面的命名实体是双层列表嵌套格式,下标是左闭右开.

补充:文本分类后的格式

2.2命名实体识别的方法

2.2.1基于规则的方法实现NER

使用自定义规则匹配NER:

eg:使用正则表达式匹配NER

优点:方便,快捷

缺点:泛用性差,后期格式越来越复杂,难以维护

2.2.2基于机器学习方法实现NER

机器学习把NER转换为序列标注任务

1.实现步骤:
  • 人工选择特征

  • 训练模型

  • 预测实体

2.模型选择

机器学习的方法是把实体抽取任务转换为序列任务,每个token做标注(理论上所有分类模型都可以作为标注模型,但是效果最好的是条件随机场(CRF)):

B:开头

E:结尾

3.缺点:

缺点:依赖特征的选择,特征选择的不好,很难有好的效果.

2.2.3基于深度学习的方法实现NER

深度学习也是把NER转换为序列标注任务

1.概念:

基于深度学习的方法主要使用神经网络模型,结合条件随机场模型。常用的神经网络模型包括卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)等,其中BiLSTM-CRF是目前最为常用的命名实体识别模型

2.原理:

3.优缺点

优点:特征靠模型自己提取

缺点:需要大量的标注文本

2.3NER评测标准

精确率:模型识别出来的实体中,被所有预测为正的样本中实际为正样本的概率

召回率:模型识别出来的实体中,实际为正的样本中被预测为正样本的概率

F1值: 准确率和召回率的调和平均值,可以对系统的性能进行综合性的评价

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 8:20:42

2026最新!8个降AI率工具测评,本科生必看

2026最新!8个降AI率工具测评,本科生必看 2026年降AI率工具测评:为什么你需要这份榜单? 随着高校和科研机构对AIGC内容的检测标准日益严格,越来越多本科生在论文写作过程中遭遇了AI率超标的问题。无论是课程论文、毕业设…

作者头像 李华
网站建设 2026/4/13 14:10:00

‌AI测试实战:用通义灵码+Testim,实现UI自愈全流程

‌一、传统UI自动化测试的致命痛点‌ 在现代敏捷开发与持续交付的节奏下,UI自动化测试曾被视为保障质量的“最后一道防线”。然而,其高昂的维护成本正成为团队的沉重负担: ‌元素定位脆弱‌:前端迭代频繁,ID、Class、…

作者头像 李华
网站建设 2026/4/16 9:06:54

东京电子 OYDK-155 41V 板

东京电子 OYDK-155 41V 相关信息东京电子(Tokyo Electron Limited, TEL)是半导体制造设备领域的领先企业,其产品涵盖刻蚀、沉积、清洗等关键工艺设备。关于型号 OYDK-155 41V 的具体信息如下:设备类型与用途OYDK-155 41V 可能是东…

作者头像 李华
网站建设 2026/4/16 9:04:10

SimpleQA 详解:如何用短问答基准衡量大模型的事实性

摘要 短文本事实性(short-form factuality)是大语言模型在实际应用中的关键能力:模型能否在简短、明确的问题上给出唯一且无可争议的答案?OpenAI 的 SimpleQA 基准专注于这一维度——它收集了 4,326 个“只有单一正确答案”的问题…

作者头像 李华
网站建设 2026/4/16 9:09:10

‌Python+LangChain实战:构建你的第一个AI测试生成器

测试工程师的AI转型窗口期‌2025年,全球软件测试行业正经历一场静默革命。传统手工编写测试用例、维护脚本、分析日志的模式,正被大语言模型(LLM)驱动的智能测试生成器逐步取代。根据《IEEE Software》2025年行业报告,…

作者头像 李华