news 2026/6/10 11:48:51

SpringAI+Deepseek大模型应用开发实战笔记

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SpringAI+Deepseek大模型应用开发实战笔记

Spring AI + DeepSeek 大模型应用开发实战笔记(2026年最新实践总结)

目前(2026年初)Spring AI 集成国产最强推理模型DeepSeek(尤其是DeepSeek-R1DeepSeek-V3)已经非常成熟,主要有以下几种主流打法,按推荐度排序:

排名接入方式优点缺点/限制推荐场景难度
1OpenAI兼容接口(最推荐)配置最简单、切换模型方便、生态最全需要联网,费用(但非常便宜)生产环境、企业项目★☆☆☆☆
2Ollama本地部署完全免费、私有化、无网络依赖硬件要求高、响应速度慢(尤其是大模型)开发测试、内网、隐私要求极高★★★☆☆
3阿里云百炼/硅基流动中转高可用、限速宽松、可选很多模型多了一层转发、偶尔延迟预算充足、追求稳定★★☆☆☆
4Spring AI 官方DeepSeek starter(快照版)原生支持、最优雅目前还是快照版,不够稳定尝鲜党、追求最新特性★★☆☆☆

方式一:最常用、最推荐 - OpenAI兼容模式(硅基流动/DeepSeek官方/阿里百炼)

目前绝大多数生产项目都在用这种方式

spring:ai:openai:# 下面三选一(强烈推荐硅基流动,新用户有超多免费token)# 1. 硅基流动(最推荐,性价比最高)base-url:https://api.siliconflow.cn/v1api-key:sk-xxxxxxxxxxxxxxxxxxxxxxxx# 2000w免费token# 2. DeepSeek官方# base-url: https://api.deepseek.com# api-key: sk-xxxxxxxxxxxxxxxxxxxxxxxxchat:options:# 目前最强组合(2026年1月主流选择)model:deepseek-ai/DeepSeek-R1# 最强推理(类o1)# model: deepseek-ai/DeepSeek-V3 # 最强通用/性价比之王# model: deepseek-ai/DeepSeek-R1-Distill-Qwen-32B # 蒸馏版,速度更快temperature:0.6max-tokens:8192top-p:0.95

最常用代码模板(ChatClient流式写法)

@RestController@RequestMapping("/ai")@RequiredArgsConstructorpublicclassAiController{privatefinalChatClientchatClient;// Spring AI 自动注入// 普通调用@GetMapping("/chat")publicStringsimpleChat(@RequestParamStringmsg){returnchatClient.prompt().user(msg).call().content();}// 流式返回(前端打字机效果,必用!)@GetMapping(value="/stream",produces=MediaType.TEXT_EVENT_STREAM_VALUE)publicFlux<String>streamChat(@RequestParamStringmsg){returnchatClient.prompt().user(msg).stream().content();}// 带历史记忆(最实用)@GetMapping("/memory")publicStringchatWithMemory(@RequestParamStringsessionId,@RequestParamStringmsg){returnchatClient.prompt().system("你是一位精通Spring Boot和AI的高级架构师,用结构化markdown回答").user(msg).advisors(MessageChatMemoryAdvisor.builder().chatMemory(newInMemoryChatMemory()).build()).call().content();}}

方式二:本地私有化(Ollama + DeepSeek-R1)——适合内网/演示/毕设

步骤概览(2026最新流程)

  1. 安装 Ollama(官网一键安装)
  2. 拉取模型(显存够就直接上7B,显存少就用1.5B蒸馏版)
ollama run deepseek-r1:1.5b# 极轻量,1.5B蒸馏版,推理速度快# 或ollama run deepseek-r1:7b# 强推理,推荐16G+显存
  1. Spring Boot 配置(只需改下面几行)
spring:ai:ollama:base-url:http://localhost:11434# 本机默认chat:options:model:deepseek-r1:1.5b# 必须与ollama pull的tag一致

R1模型最大亮点:原生思维链(可以看到完整思考过程)

// 让R1把思考过程完整返回(效果非常震撼)Stringprompt=""" 请用最严谨的逻辑,一步一步思考并解决这个问题: xxx数学/算法/推理题xxx 请按照以下格式严格输出: <thinking> 完整的思考过程(多步、自我质疑、验证)... </thinking> <answer> 最终答案 </answer> """;chatClient.prompt(prompt).call().content();

快速进阶功能对比表(生产必备)

功能实现方式难度推荐指数
流式打字机效果.stream().content()★☆☆★★★★★
会话记忆MessageChatMemoryAdvisor★★☆★★★★★
RAG(知识库问答)+ PGVector / Milvus / Elasticsearch★★★★★★★★☆
Function Calling@Tool/FunctionCallback★★★★★★★☆
Agent(智能体)AiServices.create()★★★★★★★☆☆
结构化输出BeanOutputConverter / Json模式★★★★★★★☆
多模态(图文)目前DeepSeek暂不支持,需等待V3后续-★★☆☆☆

2026年一句话总结(最实用组合推荐)

生产环境首选
Spring Boot 3.3+ / Spring AI 1.0+

  • 硅基流动/DeepSeek官方 OpenAI兼容接口
  • deepseek-ai/DeepSeek-R1(复杂推理) / DeepSeek-V3(万能)
  • ChatClient流式 + MemoryAdvisor + 结构化输出

演示/学习/内网
Ollama + deepseek-r1:7b(或1.5b)

  • Spring AI Ollama starter

需要我针对某个具体场景(智能客服、RAG知识库、代码生成、Agent工具调用、结构化输出…)给出更详细的代码模板吗?
直接告诉我你的需求方向~ 😄

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 3:14:03

轻松入门SpringAI-SpringAI综合案例

轻松入门 Spring AI 综合案例 &#xff08;2025-2026 比较实用且完整的入门组合示例&#xff09; 以下是一个相对完整的、适合初学者到中级的 Spring AI 综合案例&#xff0c;包含目前最常用的几种核心能力&#xff1a; 功能清单&#xff1a; 1. 普通对话&#xff08;ChatCli…

作者头像 李华
网站建设 2026/6/6 3:19:46

轻松入门SpringAI-SpringAI实战入门案例

Spring AI 实战入门案例 &#xff08;2026年初 零基础到能跑完整小应用的路径&#xff09; 目标&#xff1a;用最短时间让你能自己跑通一个包含以下功能的 Spring AI 小应用&#xff1a; 普通聊天流式输出&#xff08;打字机效果&#xff09;带记忆的对话简单 RAG&#xff0…

作者头像 李华
网站建设 2026/6/9 16:20:39

导师严选2026继续教育TOP10一键生成论文工具测评

导师严选2026继续教育TOP10一键生成论文工具测评 学术写作工具测评&#xff1a;2026年继续教育用户如何高效选型 在继续教育领域&#xff0c;论文撰写已成为许多学员必须面对的挑战。从选题构思到文献整理&#xff0c;再到内容创作与格式规范&#xff0c;每一步都可能成为阻碍进…

作者头像 李华
网站建设 2026/6/9 23:48:10

GPU 单挑 CPU:从矩阵乘法到并行计算的入门

为什么神经网络离不开 GPU&#xff1f; 我们已经在现实中见过太多神经网络的应用了&#xff1a;图像识别、语音转文字、大模型推理。这些看起来“很智能”的任务&#xff0c;底层其实并不神秘。 本质上&#xff0c;它们都是一连串的矩阵乘法。 前一次运算的输出&#xff0c;…

作者头像 李华
网站建设 2026/5/22 18:22:13

吐血推荐9个AI论文工具,助本科生轻松写毕业论文!

吐血推荐9个AI论文工具&#xff0c;助本科生轻松写毕业论文&#xff01; AI工具让论文写作不再难 在如今的学术环境中&#xff0c;越来越多的学生开始借助AI工具来提升论文写作的效率和质量。尤其是在面对毕业论文时&#xff0c;时间紧迫、内容繁杂&#xff0c;很多同学都感到无…

作者头像 李华
网站建设 2026/6/6 22:52:09

Python+Vue的 美食分享论坛的设计和实现 django Pycharm flask

目录 这里写目录标题目录项目介绍项目展示详细视频演示技术栈文章下方名片联系我即可~解决的思路开发技术介绍性能/安全/负载方面python语言Django框架介绍技术路线关键代码详细视频演示收藏关注不迷路&#xff01;&#xff01;需要的小伙伴可以发链接或者截图给我 项目介绍 …

作者头像 李华