【人工智能通识专栏】第二讲：学会使用DeepSeek-编程阁

【人工智能通识专栏】第二讲：学会使用DeepSeek

DeepSeek是中国AI公司深度求索（DeepSeek AI）开发的开源大型语言模型系列，以高性价比、强大推理能力和开源精神著称。截至2026年初，DeepSeek已成为全球最受欢迎的开源LLM之一，尤其在数学、代码和复杂推理任务上表现出色，常被视为OpenAI o1系列的开源替代品。其代表模型包括DeepSeek-V3（通用模型）和DeepSeek-R1（专注重推理模型），最新版本如V3.2进一步优化了代理（Agent）能力和工具调用。

本讲聚焦实用：如何快速上手DeepSeek，包括网页聊天、API调用和本地部署。无论你是初学者还是开发者，都能轻松掌握。

1. DeepSeek简介与核心优势

主要模型：
- DeepSeek-V3系列：MoE（专家混合）架构，总参数671B，仅激活37B，高效且成本低。适合日常聊天、写作、代码生成。最新V3.2（2025年底发布）强化了“思考模式”和工具集成，适用于构建AI代理。
- DeepSeek-R1系列：基于V3，通过大规模强化学习（RL）训练，擅长逐步推理。性能媲美OpenAI o1，在数学（AIME）和代码基准上领先开源模型。
优势：
- 开源（MIT许可），支持商业使用和修改。
- 价格极低：API调用远低于GPT系列。
- 高性能：推理能力强，支持长上下文（128K+ tokens）。
- 社区活跃：Hugging Face上有大量衍生模型。

官方网站：https://www.deepseek.com/ 或 https://platform.deepseek.com/（API平台）
聊天界面：https://chat.deepseek.com/

2. 最简单方式：网页聊天界面

无需注册或安装，直接浏览器使用。

打开 https://chat.deepseek.com/
选择模型：
- DeepSeek-V3.2：通用任务，速度快。
- DeepSeek-R1（或开启“DeepThink”/思考模式）：复杂推理、数学、代码。
输入问题，开始对话。
- 支持文件上传（文档分析）、长对话。
- 对于推理任务，建议提示模型“逐步思考”或直接选R1模式。

示例提示（数学题）：

使用DeepSeek-R1：一步步思考，解决这个方程：x^3 - 6x^2 + 11x - 6 = 0

网页版免费额度充足，适合学习和日常使用。

3. 通过API使用（开发者推荐）

DeepSeek API兼容OpenAI格式，切换base_url即可无缝迁移代码。

注册与获取API Key：
- 访问 https://platform.deepseek.com/
- 注册账号，获取API Key（免费额度高，付费超低价）。
模型名称：
- 通用：deepseek-chat (V3.2)
- 推理：deepseek-reasoner (R1系列)

Python示例（使用OpenAI SDK）：

fromopenaiimportOpenAI client=OpenAI(api_key="your_deepseek_api_key",base_url="https://api.deepseek.com")response=client.chat.completions.create(model="deepseek-chat",# 或 "deepseek-reasoner"messages=[{"role":"system","content":"你是一个helpful助手。"},{"role":"user","content":"解释量子计算的基本原理，并举例。"}],stream=False# 支持流式输出)print(response.choices[0].message.content)

对于推理模型，可添加参数启用“thinking”模式（更高推理努力）。

API支持工具调用、JSON输出，适合集成到App或代理系统中。

4. 本地运行DeepSeek（高级用户）

DeepSeek模型开源，可在个人电脑/服务器运行（需足够GPU）。

推荐工具：
- Ollama：最简单（支持Mac/Windows/Linux）。
  - 安装Ollama：https://ollama.com/
  - 运行：ollama run deepseek-r1或ollama run deepseek-v3
- LM Studio或Open WebUI：提供ChatGPT-like界面，支持文件上传。
- Hugging Face下载权重：https://huggingface.co/deepseek-ai
硬件要求：
- 小型蒸馏版（7B/8B）：消费级GPU（如RTX 4090）即可。
- 全尺寸（671B MoE）：需多卡服务器，但激活参数少，推理高效。
优势：完全离线、私密、无限使用。

5. 使用技巧与最佳实践

激发推理能力：
- 对R1模型：直接提问复杂问题，它会自动“内部思考”。
- 提示示例：“请逐步推理，解释答案。”
常见场景：
- 数学/代码：优先R1。
- 日常/创作：V3.2更快。
- 代理构建：V3.2支持工具调用。
注意事项：
- 如所有LLM，可能有幻觉：验证重要输出。
- API限速：付费提升额度。
- 社区资源：Hugging Face、GitHub搜索“DeepSeek”获取fine-tune版本。

总结与展望

DeepSeek以开源和高性价比颠覆了LLM格局，让前沿AI触手可及。从网页聊天到API集成，再到本地部署，你现在就能上手！它特别适合学生、开发者探索推理模型。

实践建议：立即去chat.deepseek.com试试一个数学难题，感受其强大。

下一讲，我们将探讨Transformer的核心机制与注意力计算。欢迎分享你的DeepSeek使用经验！

语音合成灰度数据分析：量化评估新版本收益

语音合成灰度数据分析：量化评估新版本收益在智能客服逐渐从“能听会说”迈向“懂情绪、有个性”的今天，语音合成系统早已不再是简单的文字朗读工具。用户不再满足于“听得清”，更希望“听得好”——音色像真人、语气有温度、发音够准确。这种…

李华

为什么90%的PHP低代码项目失败？：流程建模中的5个致命误区

第一章：PHP低代码流程设计的现状与挑战在当前快速迭代的软件开发环境中，PHP作为广泛应用的服务器端脚本语言，正逐步融入低代码开发范式。低代码平台通过可视化建模和组件拖拽方式降低开发门槛，提升交付效率，但其在PHP生…

李华

如何通过物流执行系统提升库存周转率并优化仓储空间利用率？

在制造业加速迈向智能化的今天，物流执行系统已从传统的辅助性工具，跃升为重塑供应链逻辑、提升企业核心竞争力的战略级智能中枢。它不再局限于简单的仓储管理或运输调度，而是通过物联网、数字孪生与人工智能的深度融合，构建起“感…

李华

Docker Compose中PHP与Nginx网络不通？手把手教你7步定位并解决

第一章：PHP容器化网络配置的核心挑战在将PHP应用迁移到容器化环境时，网络配置成为决定服务可用性与性能的关键因素。容器的网络隔离机制虽然提升了安全性，但也引入了服务间通信、外部访问和DNS解析等复杂问题。服务发现与通信障碍当多个PHP容…

李华

GLM-TTS在消防指挥调度中的清晰度强化处理

GLM-TTS在消防指挥调度中的清晰度强化处理在一场高层建筑火灾的紧急调度中，时间以秒计算。当指挥中心通过广播系统下达“请特勤一中队立即前往海淀区中关村大街128号”的指令时，任何一个发音偏差——比如“中”被误读为“zhōng”而非“chng”&#xff…

李华

西门子1200PLC与KTP触摸屏配合的电池涂布机浆料输送系统博途V16程序案例

西门子1200PLC加KTP触摸屏画面博途程序案例，博图版本V16,程序具体为电池涂布机浆料输送系统新能源项目。程序结构分： 1.配料系统物料分配输送 2.模拟量转换，监测压力，称重，液位控制 3.KTP1200Basic画面制作 4.配方控制…

李华