news 2026/4/16 19:52:57

85_Spring AI 干货笔记之 Apache Cassandra 向量存储

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
85_Spring AI 干货笔记之 Apache Cassandra 向量存储

一、Apache Cassandra 向量存储

本节将引导您设置 CassandraVectorStore 以存储文档嵌入并执行相似性搜索。

二、什么是 Apache Cassandra?

Apache Cassandra® 是一个真正的开源分布式数据库,以其线性可扩展性、经过验证的容错性和低延迟而闻名,使其成为关键任务事务数据的完美平台。

其向量相似性搜索(VSS)基于 JVector 库,确保了一流的性能和相关性。

在 Apache Cassandra 中进行向量搜索就像这样简单:

SELECTcontentFROMtableORDERBYcontent_vector ANNOFquery_embedding;

更多相关文档可以在这里 阅读。

此 Spring AI 向量存储设计用于全新的 RAG 应用程序,并且能够基于现有数据和表进行改造。

该存储还可用于现有数据库中的非 RAG 用例,例如语义搜索、地理邻近搜索等。

存储将根据其配置自动创建或增强所需的模式。如果您不希望修改模式,请使用 initializeSchema 配置存储。

使用 spring-boot-autoconfigure 时,根据 Spring Boot 标准,initializeSchema 默认为 false,您必须通过在 application.properties 文件中设置 …​initialize-schema=true 来选择加入模式创建/修改。

三、什么是 JVector?

JVector 是一个纯 Java 嵌入式向量搜索引擎。

与其他 HNSW 向量相似性搜索实现相比,它之所以脱颖而出,是因为:

  • 算法快速:JVector 使用受 DiskANN 和相关研究启发的最先进图算法,提供高召回率和低延迟。

  • 实现快速:JVector 使用 Panama SIMD API 来加速索引构建和查询。

  • 内存高效:JVector 使用产品量化压缩向量,以便在搜索期间它们可以保留在内存中。

  • 磁盘感知:JVector 的磁盘布局设计为在查询时进行最少必要的 IOPS。

  • 并发:索引构建至少可线性扩展到 32 个线程。线程数加倍,构建时间减半。

  • 增量:在构建索引的同时查询索引。在添加向量和能够在搜索结果中找到它之间没有延迟。

  • 易于嵌入:API 设计易于嵌入,由在生产中使用它的人设计。

四、先决条件

一个 EmbeddingModel实例 来计算文档嵌入。这通常配置为 Spring Bean。有几种选择:

  • Transformers 嵌入- 在您的本地环境中计算嵌入。默认是通过 ONNX 和 all-MiniLM-L6-v2 句子转换器。这可以直接使用。

  • 如果您想使用 OpenAI 的嵌入- 使用 OpenAI 嵌入端点。您需要在 OpenAI 注册 创建账户,并在 API 密钥 生成 api-key 令牌。

  • 还有许多其他选择,请参阅嵌入 API 文档。

一个 Apache Cassandra 实例,版本为 5.0-beta1 或更高

  • DIY 快速入门

  • 对于托管服务,Astra DB 提供了一个相当不错的免费层级服务。

五、依赖项

Spring AI 自动配置、启动器模块的工件名称发生了重大变化。请参阅升级说明以获取更多信息。

对于 依赖管理,我们建议使用 Spring AI BOM,如依赖管理部分所述。

将这些依赖项添加到您的项目中:

  • 仅用于 Cassandra 向量存储:
<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-cassandra-store</artifactId></dependency>

或者,用于 RAG 应用程序中所需的一切(使用默认的 ONNX 嵌入模型):

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-vector-store-cassandra</artifactId></dependency>

六、配置属性

您可以在 Spring Boot 配置中使用以下属性来自定义 Apache Cassandra 向量存储。

七、使用

7.1 基本用法

创建一个 CassandraVectorStore 实例作为 Spring Bean:

@BeanpublicVectorStorevectorStore(CqlSessionsession,EmbeddingModelembeddingModel){returnCassandraVectorStore.builder(embeddingModel).session(session).keyspace("my_keyspace").table("my_vectors").build();}

一旦有了向量存储实例,您就可以添加文档并执行搜索:

// 添加文档vectorStore.add(List.of(newDocument("1","内容1",Map.
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 9:22:43

蚂蚁最新8B小模型拿下SOTA

前言 在大模型技术日趋同质化的今天&#xff0c;算力堆砌和参数规模已不再是决定产品成败的核心变量。真正的竞争焦点&#xff0c;正在悄然转向一个更本质的问题&#xff1a;如何让AI系统精准理解并服务每一个具体的用户&#xff1f;过去十年&#xff0c;推荐系统和对话模型依…

作者头像 李华
网站建设 2026/4/16 9:24:02

来自 Nimbus-7 SMMR 和 DMSP SSM/I-SSMIS 被动微波数据的海冰浓度 V002

Sea Ice Concentrations from Nimbus-7 SMMR and DMSP SSM/I-SSMIS Passive Microwave Data V002 简介 该数据集由亮温数据生成&#xff0c;旨在提供涵盖多个被动微波仪器观测范围的连续海冰浓度时间序列。数据采用极地立体投影&#xff0c;网格单元大小为 25 x 25 公里。数据…

作者头像 李华
网站建设 2026/4/16 9:22:47

程序员如何从 0 到 1 自己开发一个 AI Agent?

程序员如何从 0 到 1 自己开发一个 AI Agent? ——偏工程、偏实战的保姆级指南 一句话结论: 自己开发一个 AI Agent,最关键的不是模型多强,而是—— 选一个具体场景,用成熟工具链,把“想法”变成“能自动干活的程序”。 这篇文章不是 AI 科普文,也不是产品说明书,而是…

作者头像 李华
网站建设 2026/4/16 9:21:38

大数据毕设选题推荐:基于Hadoop的某篮球队各个球员数据分析系统的设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/4/16 11:13:50

jsp二手车评估检测平台系统90i84程序+源码+数据库+调试部署+开发环境

本系统&#xff08;程序源码数据库调试部署开发环境&#xff09;带论文文档1万字以上&#xff0c;文末可获取&#xff0c;系统界面在最后面。 系统程序文件列表 用户,检测师傅,汽车品牌,二手车信息,师傅信息,预约信息,取消预约,完成订单,关于我们 开题报告内容 一、研究背景…

作者头像 李华
网站建设 2026/4/16 12:34:16

例说FPGA:可直接用于工程项目的第一手经验【3.0】

12.ycbcr2rgb.v模块代码解析 该模块的内部功能框图如图12-40所示。YCrCb输入视频流经过该模块内部缓存排序、乘累积运算(放大256倍)、加法运算以及溢出与缩小(256倍)处理后,输出RGB视频流。 在视频图像显示、处理时,采用的颜色空间主要有RGB和YCrCb两种。RGB基于三基色…

作者头像 李华