news 2026/4/16 13:36:31

【人工智能通识专栏】第二讲:学会使用DeepSeek

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【人工智能通识专栏】第二讲:学会使用DeepSeek

【人工智能通识专栏】第二讲:学会使用DeepSeek

DeepSeek是中国AI公司深度求索(DeepSeek AI)开发的开源大型语言模型系列,以高性价比、强大推理能力和开源精神著称。截至2026年初,DeepSeek已成为全球最受欢迎的开源LLM之一,尤其在数学、代码和复杂推理任务上表现出色,常被视为OpenAI o1系列的开源替代品。其代表模型包括DeepSeek-V3(通用模型)和DeepSeek-R1(专注重推理模型),最新版本如V3.2进一步优化了代理(Agent)能力和工具调用。

本讲聚焦实用:如何快速上手DeepSeek,包括网页聊天、API调用和本地部署。无论你是初学者还是开发者,都能轻松掌握。

1. DeepSeek简介与核心优势
  • 主要模型
    • DeepSeek-V3系列:MoE(专家混合)架构,总参数671B,仅激活37B,高效且成本低。适合日常聊天、写作、代码生成。最新V3.2(2025年底发布)强化了“思考模式”和工具集成,适用于构建AI代理。
    • DeepSeek-R1系列:基于V3,通过大规模强化学习(RL)训练,擅长逐步推理。性能媲美OpenAI o1,在数学(AIME)和代码基准上领先开源模型。
  • 优势
    • 开源(MIT许可),支持商业使用和修改。
    • 价格极低:API调用远低于GPT系列。
    • 高性能:推理能力强,支持长上下文(128K+ tokens)。
    • 社区活跃:Hugging Face上有大量衍生模型。

官方网站:https://www.deepseek.com/ 或 https://platform.deepseek.com/(API平台)
聊天界面:https://chat.deepseek.com/

2. 最简单方式:网页聊天界面

无需注册或安装,直接浏览器使用。

  1. 打开 https://chat.deepseek.com/
  2. 选择模型:
    • DeepSeek-V3.2:通用任务,速度快。
    • DeepSeek-R1(或开启“DeepThink”/思考模式):复杂推理、数学、代码。
  3. 输入问题,开始对话。
    • 支持文件上传(文档分析)、长对话。
    • 对于推理任务,建议提示模型“逐步思考”或直接选R1模式。

示例提示(数学题):

使用DeepSeek-R1:一步步思考,解决这个方程:x^3 - 6x^2 + 11x - 6 = 0

网页版免费额度充足,适合学习和日常使用。

3. 通过API使用(开发者推荐)

DeepSeek API兼容OpenAI格式,切换base_url即可无缝迁移代码。

  1. 注册与获取API Key
    • 访问 https://platform.deepseek.com/
    • 注册账号,获取API Key(免费额度高,付费超低价)。
  2. 模型名称
    • 通用:deepseek-chat (V3.2)
    • 推理:deepseek-reasoner (R1系列)
  3. Python示例(使用OpenAI SDK):
    fromopenaiimportOpenAI client=OpenAI(api_key="your_deepseek_api_key",base_url="https://api.deepseek.com")response=client.chat.completions.create(model="deepseek-chat",# 或 "deepseek-reasoner"messages=[{"role":"system","content":"你是一个helpful助手。"},{"role":"user","content":"解释量子计算的基本原理,并举例。"}],stream=False# 支持流式输出)print(response.choices[0].message.content)
    • 对于推理模型,可添加参数启用“thinking”模式(更高推理努力)。

API支持工具调用、JSON输出,适合集成到App或代理系统中。

4. 本地运行DeepSeek(高级用户)

DeepSeek模型开源,可在个人电脑/服务器运行(需足够GPU)。

  1. 推荐工具
    • Ollama:最简单(支持Mac/Windows/Linux)。
      • 安装Ollama:https://ollama.com/
      • 运行:ollama run deepseek-r1ollama run deepseek-v3
    • LM StudioOpen WebUI:提供ChatGPT-like界面,支持文件上传。
    • Hugging Face下载权重:https://huggingface.co/deepseek-ai
  2. 硬件要求
    • 小型蒸馏版(7B/8B):消费级GPU(如RTX 4090)即可。
    • 全尺寸(671B MoE):需多卡服务器,但激活参数少,推理高效。
  3. 优势:完全离线、私密、无限使用。
5. 使用技巧与最佳实践
  • 激发推理能力
    • 对R1模型:直接提问复杂问题,它会自动“内部思考”。
    • 提示示例:“请逐步推理,解释答案。”
  • 常见场景
    • 数学/代码:优先R1。
    • 日常/创作:V3.2更快。
    • 代理构建:V3.2支持工具调用。
  • 注意事项
    • 如所有LLM,可能有幻觉:验证重要输出。
    • API限速:付费提升额度。
    • 社区资源:Hugging Face、GitHub搜索“DeepSeek”获取fine-tune版本。
总结与展望

DeepSeek以开源和高性价比颠覆了LLM格局,让前沿AI触手可及。从网页聊天到API集成,再到本地部署,你现在就能上手!它特别适合学生、开发者探索推理模型。

实践建议:立即去chat.deepseek.com试试一个数学难题,感受其强大。

下一讲,我们将探讨Transformer的核心机制与注意力计算。欢迎分享你的DeepSeek使用经验!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 22:29:59

语音合成灰度数据分析:量化评估新版本收益

语音合成灰度数据分析:量化评估新版本收益 在智能客服逐渐从“能听会说”迈向“懂情绪、有个性”的今天,语音合成系统早已不再是简单的文字朗读工具。用户不再满足于“听得清”,更希望“听得好”——音色像真人、语气有温度、发音够准确。这种…

作者头像 李华
网站建设 2026/4/16 10:40:33

为什么90%的PHP低代码项目失败?:流程建模中的5个致命误区

第一章:PHP低代码流程设计的现状与挑战在当前快速迭代的软件开发环境中,PHP作为广泛应用的服务器端脚本语言,正逐步融入低代码开发范式。低代码平台通过可视化建模和组件拖拽方式降低开发门槛,提升交付效率,但其在PHP生…

作者头像 李华
网站建设 2026/4/16 12:21:20

如何通过物流执行系统提升库存周转率并优化仓储空间利用率?

在制造业加速迈向智能化的今天,物流执行系统已从传统的辅助性工具,跃升为重塑供应链逻辑、提升企业核心竞争力的战略级智能中枢。它不再局限于简单的仓储管理或运输调度,而是通过物联网、数字孪生与人工智能的深度融合,构建起“感…

作者头像 李华
网站建设 2026/4/13 23:16:14

Docker Compose中PHP与Nginx网络不通?手把手教你7步定位并解决

第一章:PHP容器化网络配置的核心挑战在将PHP应用迁移到容器化环境时,网络配置成为决定服务可用性与性能的关键因素。容器的网络隔离机制虽然提升了安全性,但也引入了服务间通信、外部访问和DNS解析等复杂问题。服务发现与通信障碍 当多个PHP容…

作者头像 李华
网站建设 2026/4/13 13:30:11

GLM-TTS在消防指挥调度中的清晰度强化处理

GLM-TTS在消防指挥调度中的清晰度强化处理 在一场高层建筑火灾的紧急调度中,时间以秒计算。当指挥中心通过广播系统下达“请特勤一中队立即前往海淀区中关村大街128号”的指令时,任何一个发音偏差——比如“中”被误读为“zhōng”而非“chng”&#xff…

作者头像 李华