从0开始学大模型：Qwen3-1.7B新手入门全攻略-编程阁

从0开始学大模型：Qwen3-1.7B新手入门全攻略

你是不是也对大模型跃跃欲试，但一想到动辄几十GB显存、复杂配置就望而却步？别担心，今天我们就来手把手带你用仅1.7B参数的轻量级大模型 Qwen3-1.7B，完成从零到第一次调用的完整流程。它不仅能在普通笔记本上跑起来，还支持“思考模式”这种黑科技，真正实现小身材大智慧。

本文专为完全零基础的新手设计，不需要你懂深度学习、也不需要买高端GPU，只要你会点鼠标、会复制粘贴代码，就能跟着一步步操作，快速上手这个来自阿里通义千问团队的最新开源力作。

1. 认识你的第一个大模型：Qwen3-1.7B 是什么？

在动手之前，先来简单认识下我们要用的这位“智能助手”——Qwen3-1.7B。

它是阿里巴巴在2025年4月发布的通义千问第三代模型中的轻量级明星选手，虽然只有17亿参数，但能力可一点都不弱：

双模式智能：支持“思考模式”和“直接回答模式”，复杂问题能一步步推理，日常对话又足够快。
超长记忆：上下文长度高达32,768 tokens，能处理整本小说或超长文档。
高效架构：采用GQA（分组查询注意力）技术，推理速度更快，资源占用更少。
开源免费：基于Apache-2.0协议发布，个人和企业都能免费使用，甚至用于商业项目。

这意味着你可以用它来做：

智能问答、写文案、写邮件
数学题解题过程推演
代码生成与解释
构建自己的AI助手（Agent）

最关键的是，它足够轻，部署成本低，非常适合初学者练手和中小项目落地。

2. 第一步：启动镜像并进入Jupyter环境

我们不需要自己安装Python、CUDA、PyTorch这些复杂的依赖，平台已经为我们准备好了预配置的镜像环境，一键即可开始。

2.1 启动Qwen3-1.7B镜像

登录你使用的AI开发平台（如CSDN星图AI等）。
搜索镜像名称Qwen3-1.7B。
点击“启动”或“部署”按钮，系统会自动为你分配资源并初始化环境。
等待几秒钟到一分钟，状态变为“运行中”。

提示：整个过程无需任何命令行操作，就像打开一个App一样简单。

2.2 打开Jupyter Notebook

镜像启动成功后，通常会提供一个Web访问地址。点击“打开Jupyter”链接，你会看到熟悉的文件浏览器界面。

这是你的编程工作台，在这里你可以：

创建新的Python脚本
运行代码测试模型
查看输出结果

现在，你已经拥有了一个完整的大模型开发环境，接下来就可以开始调用了。

3. 调用模型：用LangChain三步搞定Qwen3-1.7B

虽然可以直接调用API，但我们推荐使用LangChain——这是一个让大模型调用变得极其简单的框架，特别适合新手。

下面这段代码就是调用Qwen3-1.7B的核心方法，我们来一步步拆解。

3.1 完整调用代码示例

from langchain_openai import ChatOpenAI import os chat_model = ChatOpenAI( model="Qwen3-1.7B", temperature=0.5, base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", # 替换为你的实际Jupyter地址，注意端口8000 api_key="EMPTY", extra_body={ "enable_thinking": True, "return_reasoning": True, }, streaming=True, ) # 发送问题并获取回复 response = chat_model.invoke("你是谁？") print(response)

别被代码吓到，我们逐行讲解，保证你能看懂。

3.2 关键参数详解（小白也能懂）

参数	作用说明	小白理解
`model="Qwen3-1.7B"`	告诉系统你要用哪个模型	就像点餐时说“我要一份牛肉面”
`temperature=0.5`	控制回答的“创意程度”	数值越低越稳重，越高越天马行空，0.5是平衡点
`base_url=...`	模型服务的实际地址	类似于网站网址，必须替换成你自己的Jupyter地址
`api_key="EMPTY"`	认证密钥，这里留空即可	因为是本地服务，不需要密码
`extra_body={...}`	高级功能开关	开启“思考模式”的关键！
`streaming=True`	流式输出	回答一字一字冒出来，像真人打字

3.3 特别注意：替换 base_url

base_url必须替换成你当前 Jupyter 实例的真实地址。怎么找？

看浏览器地址栏，格式通常是：
```
https://xxx.web.gpu.csdn.net/
```
把它改成：
```
https://xxx.web.gpu.csdn.net/v1
```
并确保端口号是8000（有些平台会显示端口）

例如：

base_url="https://gpu-podabc123-8000.web.gpu.csdn.net/v1"

这一步错了就会连不上模型，务必仔细核对！

4. 动手实践：让Qwen3-1.7B说第一句话

现在，让我们真正运行一次，看看效果。

4.1 在Jupyter中创建新Notebook

点击右上角【New】→ 【Python 3】
输入以下完整代码：

from langchain_openai import ChatOpenAI # 配置模型 chat_model = ChatOpenAI( model="Qwen3-1.7B", temperature=0.5, base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", # 记得替换！ api_key="EMPTY", extra_body={"enable_thinking": True}, streaming=True ) # 调用模型 result = chat_model.invoke("请用三句话介绍你自己。") print("模型回复：", result)

按Shift + Enter运行。

如果一切正常，你会看到类似这样的输出：

模型回复： 我是Qwen3-1.7B，通义千问系列的轻量级语言模型。我能回答问题、创作文字，也能进行逻辑推理。我支持思考模式，可以展示解题过程。

恭喜！你已经成功完成了第一次大模型调用！

5. 玩转“思考模式”：让AI像人一样推理

Qwen3-1.7B最酷的功能就是“思考模式”。开启后，它不会直接给答案，而是先一步步推理，再得出结论。

5.1 思考模式 vs 普通模式对比

我们来做个实验：让它解一道小学数学题。

场景：小明有5个苹果，吃了2个，又买了3个，还剩几个？

普通模式（关闭思考）

extra_body={"enable_thinking": False}

输出可能直接是：

小明还剩6个苹果。

思考模式（开启）

extra_body={"enable_thinking": True}

输出可能是：

<think> 小明一开始有5个苹果。 他吃了2个，剩下5 - 2 = 3个。 他又买了3个，所以现在有3 + 3 = 6个。 因此，小明现在有6个苹果。 </think> 小明还剩6个苹果。

看到了吗？多了<think>...</think>中间的推理过程，就像老师一步步教你解题。

5.2 什么时候该用思考模式？

使用场景	是否推荐开启思考模式
日常聊天、写文案	❌ 关闭，响应更快
解数学题、逻辑题	开启，能看到思路
写代码、调试问题	开启，有助于发现错误
创意写作	❌ 关闭，避免过度分析
教学辅导	开启，可作为“解题演示”工具

你可以根据任务类型灵活切换，这就是“双模式”的真正价值。

6. 常见问题与解决方案（新手必看）

刚上手难免遇到问题，以下是高频坑点及解决办法。

6.1 连接失败：ConnectionError 或 404 Not Found

原因：base_url地址不对。

解决方法：

确认Jupyter地址是否包含-8000端口
确保末尾加了/v1
检查是否漏掉https://

正确格式：

https://gpu-podxxxxxx-8000.web.gpu.csdn.net/v1

6.2 返回空内容或乱码

原因：api_key错误或未设置为"EMPTY"

正确写法：

api_key="EMPTY" # 注意是字符串 EMPTY，不是 None

6.3 模型响应特别慢

可能原因：

服务器资源紧张（高峰期常见）
开启了streaming=True但终端不支持流式显示

建议：

可暂时关闭流式输出：streaming=False
换非高峰时间尝试

6.4 如何确认模型真的在运行？

最简单的验证方式：

print(chat_model.invoke("你好"))

如果返回了合理回复，说明连接成功；如果报错，则检查网络和地址。

7. 总结：你已经迈出了大模型第一步

通过这篇教程，你应该已经：

成功启动 Qwen3-1.7B 镜像
进入 Jupyter 环境并运行代码
掌握 LangChain 调用基本语法
实现了首次模型对话
理解并体验了“思考模式”的强大之处
解决了常见连接问题

不要小看这一步，很多资深开发者也是从这样一行代码开始的。你现在拥有的，不只是一个模型调用能力，而是一扇通往AI世界的大门。

下一步你可以尝试：

让它帮你写一封邮件
解一道更难的数学题
生成一段Python代码
把它集成到自己的项目中

记住，最好的学习方式就是不断动手。Qwen3-1.7B 这样的轻量级模型，正是为你这样的探索者准备的绝佳起点。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

从0开始学大模型：Qwen3-1.7B新手入门全攻略