Qwen3-1.7B快速上手：Jupyter Notebook调用保姆级教程-编程阁

Qwen3-1.7B快速上手：Jupyter Notebook调用保姆级教程

1. 技术背景与学习目标

随着大语言模型在自然语言处理、代码生成和智能对话等领域的广泛应用，如何快速部署并调用开源模型成为开发者关注的核心问题。Qwen3（千问3）是阿里巴巴集团于2025年4月29日开源的新一代通义千问大语言模型系列，涵盖6款密集模型和2款混合专家（MoE）架构模型，参数量从0.6B至235B，覆盖轻量级推理到复杂任务生成的全场景需求。

本文聚焦其中的Qwen3-1.7B模型——一款兼具高效推理速度与良好语义理解能力的中等规模模型，特别适合在资源受限环境下进行本地实验与原型开发。通过本教程，你将掌握：

如何在 Jupyter Notebook 环境中启动并连接 Qwen3-1.7B 模型服务
使用 LangChain 框架调用模型完成基础对话交互
配置流式输出、思维链（Reasoning）返回等高级功能
实际运行结果解析与常见问题排查思路

完成本教程后，你将具备独立部署和调用该模型的能力，为后续构建 RAG 系统、Agent 应用或微调训练打下坚实基础。

2. 环境准备与镜像启动

2.1 获取预置镜像环境

为了简化依赖管理和 GPU 驱动配置，推荐使用 CSDN 提供的 AI 预置镜像环境。该镜像已集成以下组件：

Python 3.10 + JupyterLab
PyTorch 2.3 + CUDA 12.1
Transformers 4.38 + vLLM 或 TGI 推理框架
LangChain 0.1.17 + langchain-openai 兼容包

访问 CSDN星图镜像广场搜索 “Qwen3” 关键词，选择带有“Qwen3-1.7B + Jupyter”标签的镜像进行部署。支持主流云平台一键拉起 GPU 实例。

2.2 启动 Jupyter Notebook 服务

部署完成后，进入实例控制台执行以下命令启动服务：

jupyter lab --ip=0.0.0.0 --port=8000 --allow-root --no-browser

注意：
端口号8000必须与后续 API 调用中的base_url保持一致
若防火墙开启，请确保开放对应端口
访问地址通常形如：https://<instance-id>.web.gpu.csdn.net

成功启动后，浏览器打开链接即可进入 Jupyter Lab 界面，创建新的.ipynb文件开始编码。

3. 基于 LangChain 调用 Qwen3-1.7B

3.1 安装必要依赖

在 Jupyter Notebook 中首先安装langchain_openai包（它不仅支持 OpenAI，也兼容符合 OpenAI API 协议的模型服务）：

!pip install langchain_openai --upgrade

确认安装无误后导入核心模块：

from langchain_openai import ChatOpenAI import os

3.2 初始化模型客户端

使用ChatOpenAI类初始化对 Qwen3-1.7B 的调用实例。关键参数说明如下：

参数	说明
`model`	指定模型名称，此处为`"Qwen3-1.7B"`
`temperature`	控制生成随机性，`0.5`表示适度多样性
`base_url`	指向本地运行的模型推理服务地址
`api_key`	因服务无需认证，设为`"EMPTY"`
`extra_body`	扩展字段，启用思维链相关功能
`streaming`	开启流式响应，实现逐字输出效果

完整初始化代码如下：

chat_model = ChatOpenAI( model="Qwen3-1.7B", temperature=0.5, base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", # 替换为实际 Jupyter 地址 api_key="EMPTY", extra_body={ "enable_thinking": True, "return_reasoning": True, }, streaming=True, )

重要提示：
base_url中的域名需替换为你实际获得的服务地址
确保末尾包含/v1路径前缀，否则会报错404 Not Found
若未开启enable_thinking，则不会返回中间推理过程

3.3 发起首次对话请求

调用invoke()方法发送一条简单消息测试连通性：

response = chat_model.invoke("你是谁？") print(response.content)

预期输出应包含类似以下内容：

我是通义千问3（Qwen3），由阿里云研发的大规模语言模型。我可以回答问题、创作文字、编程以及进行逻辑推理。

若出现连接超时或ConnectionError，请检查：

模型服务是否正在后台运行
base_url是否拼写正确（含协议https://和端口）
网络策略是否允许出站请求

3.4 启用流式输出与思维链功能

流式输出演示

设置streaming=True后，可通过回调函数实现实时打印生成文本。示例如下：

def on_chunk(chunk): print(chunk.content, end="", flush=True) for chunk in chat_model.stream("请解释什么是机器学习？"): on_chunk(chunk)

此方式可模拟“打字机”效果，提升用户体验，尤其适用于 Web 前端集成。

思维链（Chain-of-Thought）输出

通过extra_body中的enable_thinking和return_reasoning参数，模型可在回答前先输出推理路径。例如：

chat_model_with_reasoning = ChatOpenAI( model="Qwen3-1.7B", temperature=0.3, base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", api_key="EMPTY", extra_body={ "enable_thinking": True, "return_reasoning": True, }, ) result = chat_model_with_reasoning.invoke("小明有5个苹果，吃了2个，又买了3个，还剩几个？") print(result.content)

部分输出可能如下：

思考过程： 1. 初始数量：5 个苹果 2. 吃掉 2 个：5 - 2 = 3 3. 又买 3 个：3 + 3 = 6 最终答案：小明现在有 6 个苹果。

这使得模型决策更具可解释性，适用于教育、审计、医疗等高可信场景。

4. 进阶技巧与最佳实践

4.1 自定义系统提示（System Prompt）

虽然ChatOpenAI默认不直接暴露system角色设置，但可通过构造消息列表实现：

from langchain_core.messages import HumanMessage, SystemMessage messages = [ SystemMessage(content="你是一个数学老师，需要用分步讲解的方式解答问题。"), HumanMessage(content="解方程：2x + 4 = 10") ] result = chat_model.invoke(messages) print(result.content)

输出将自动遵循系统指令风格，增强行为可控性。

4.2 批量调用与异步处理

对于需要处理多个输入的任务，建议使用abatch()方法提高效率：

async def async_invoke(): inputs = ["讲个笑话", "写一首五言诗", "解释牛顿第一定律"] results = await chat_model.abatch(inputs) for r in results: print(r.content + "\n---\n") # 运行异步函数 import asyncio await async_invoke()

注意：需在支持异步执行的 Jupyter 内核中运行（如ipykernel）。

4.3 错误处理与重试机制

生产环境中建议添加异常捕获与自动重试逻辑：

from tenacity import retry, stop_after_attempt, wait_exponential @retry(stop=stop_after_attempt(3), wait=wait_exponential(multiplier=1, max=10)) def safe_invoke(prompt): try: return chat_model.invoke(prompt) except Exception as e: print(f"调用失败：{e}") raise # 使用示例 response = safe_invoke("介绍一下你自己")

结合tenacity库可有效应对临时网络抖动或服务过载问题。

5. 常见问题与解决方案

5.1 模型无法响应或返回空内容

可能原因： -base_url地址错误或服务未启动 - 推理服务绑定 IP 不匹配（如只监听localhost）

解决方法： - 检查服务日志：tail -f logs/inference.log- 确认服务监听地址为0.0.0.0:8000- 使用curl测试接口连通性：

curl https://gpu-pod.../v1/models -H "Authorization: Bearer EMPTY"

5.2 出现`Invalid model specified`错误

表示服务端未加载Qwen3-1.7B模型。请确认：

镜像是否正确下载了模型权重
启动脚本中是否指定了正确的--model-id参数
多模型场景下是否启用了路由机制

5.3 输出乱码或编码错误

极少数情况下可能出现中文乱码，建议统一设置环境变量：

os.environ["PYTHONIOENCODING"] = "utf-8"

并在启动 Jupyter 前确保终端编码为 UTF-8。

6. 总结

本文系统介绍了如何在 Jupyter Notebook 环境中调用 Qwen3-1.7B 模型的完整流程，涵盖从镜像部署、服务启动到 LangChain 集成的各个环节。我们重点实现了：

使用langchain_openai.ChatOpenAI兼容方式调用非 OpenAI 模型
配置base_url和api_key实现本地服务对接
启用streaming实现流式输出体验
利用extra_body参数激活思维链推理能力

此外，还提供了系统提示定制、异步批量调用、错误重试等进阶技巧，并总结了常见问题的排查方案。

Qwen3-1.7B 凭借其小巧体积与强大性能，在边缘设备、教学演示、快速原型设计等领域具有显著优势。结合 LangChain 生态，可轻松构建智能问答、文档摘要、代码生成等应用。

下一步建议尝试： 1. 将模型接入 Gradio 或 Streamlit 构建可视化界面 2. 结合 FAISS 或 Chroma 实现本地知识库检索增强 3. 使用 LlamaIndex 构建结构化数据查询代理

掌握这些技能后，你将能灵活运用 Qwen3 系列模型解决真实业务问题。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

Qwen3-1.7B快速上手：Jupyter Notebook调用保姆级教程