Qwen3-4B-Instruct部署教程：CentOS/Ubuntu双平台防火墙开放7860端口指南-编程阁

Qwen3-4B-Instruct部署教程：CentOS/Ubuntu双平台防火墙开放7860端口指南

1. 模型简介

Qwen3-4B-Instruct-2507是Qwen3系列的端侧/轻量旗舰模型，具备强大的文本理解和生成能力。该模型原生支持256K token（约50万字）上下文窗口，并可扩展至1M token，能够轻松处理整本书、大型PDF、长代码库等长文本任务。

2. 部署前准备

2.1 系统要求

在开始部署前，请确保您的系统满足以下最低要求：

操作系统：CentOS 7+/Ubuntu 18.04+
GPU：NVIDIA显卡（至少8GB显存）
内存：16GB以上
存储空间：至少20GB可用空间

2.2 环境检查

在部署前，建议先检查系统环境：

# 检查GPU驱动 nvidia-smi # 检查Python版本 python --version # 检查Conda是否安装 conda --version

3. 部署步骤详解

3.1 下载模型文件

模型默认存放在/root/ai-models/Qwen/Qwen3-4B-Instruct-2507路径下。如果您需要手动下载：

mkdir -p /root/ai-models/Qwen cd /root/ai-models/Qwen git lfs install git clone https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507

3.2 创建Conda环境

项目使用torch29环境，包含以下关键依赖：

conda create -n torch29 python=3.10 conda activate torch29 pip install torch==2.9.0 transformers==5.5.0 gradio accelerate

3.3 启动WebUI服务

使用Gradio启动Web界面：

cd /root/Qwen3-4B-Instruct python webui.py

服务启动后默认监听7860端口，可通过http://localhost:7860访问。

4. 防火墙配置

4.1 CentOS/RHEL系统配置

# 添加防火墙规则 firewall-cmd --add-port=7860/tcp --permanent # 重新加载防火墙 firewall-cmd --reload # 验证端口是否开放 firewall-cmd --list-ports | grep 7860

4.2 Ubuntu/Debian系统配置

# 允许7860端口通过防火墙 ufw allow 7860/tcp # 启用防火墙规则 ufw enable # 查看防火墙状态 ufw status

5. 服务管理

5.1 使用Supervisor管理服务

建议使用Supervisor来管理服务进程：

# 查看服务状态 supervisorctl status qwen3-4b-instruct # 重启服务 supervisorctl restart qwen3-4b-instruct # 停止服务 supervisorctl stop qwen3-4b-instruct # 启动服务 supervisorctl start qwen3-4b-instruct

5.2 日志查看

# 查看实时日志 tail -f /root/Qwen3-4B-Instruct/logs/webui.log # 查看完整日志 cat /root/Qwen3-4B-Instruct/logs/webui.log

6. 常见问题解决

6.1 端口冲突问题

如果7860端口被占用：

# 检查端口占用情况 ss -tlnp | grep 7860 # 终止占用进程 kill -9 <PID>

6.2 GPU显存不足

# 查看GPU显存使用情况 nvidia-smi --query-gpu=memory.used --format=csv # 实时监控GPU使用 watch -n 1 nvidia-smi

6.3 依赖缺失问题

如果遇到ModuleNotFoundError错误：

source /opt/miniconda3/bin/activate torch29 pip install <package_name>

7. 总结

通过本教程，您已经完成了Qwen3-4B-Instruct模型在CentOS/Ubuntu系统上的部署，并成功配置了防火墙规则开放7860端口。现在您可以通过浏览器访问http://<服务器IP>:7860来使用模型服务。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

构建城市生命线：基于WebGIS的跨行业管线三维在线编辑与管理

1. 城市生命线的三维革命：为什么我们需要WebGIS？ 想象一下，你正站在城市中心的地下30米处。头顶是错综复杂的电力管线，左侧是直径1.2米的供水主干管，右手边燃气管道与热力管网交织缠绕——这就是每天为城市输送能量的&…

李华

Windows 10/11 右键菜单找回经典CMD：修改注册表一键恢复“在此处打开命令窗口”

Windows右键菜单深度定制：从恢复经典CMD到打造高效工作流引言：当技术演进遇上用户习惯每次Windows的重大更新，总会在效率工具上做出调整，而PowerShell逐步取代CMD就是其中一个典型例子。作为一名长期与Windows系统打交道的开发者…

李华

新电脑配置Node.js环境？我推荐你先装nvm（Mac/Linux/Windows全平台指南） 刚拿到新电脑的开发者们，是否曾为Node.js版本冲突而头疼？当你需要在不同项目间切换时，是否遇到过全局模块混乱的困扰？nv…

李华

软件流程图管理化的过程可视化

软件流程图管理化的过程可视化：提升开发效率的利器在软件开发过程中，流程图是描述逻辑、梳理流程的重要工具。随着项目复杂度提升，传统的手绘或静态流程图管理方式已难以满足团队协作和高效迭代的需求。软件流程图管理化的过程可视化&#…

李华

UVM验证老手也容易踩的坑：深入Seq-Sqr-Driver握手时序，解决“卡死”与数据竞争

UVM验证高手避坑指南：Seq-Sqr-Driver交互时序的深度解析与实战优化在芯片验证领域，UVM框架的Sequence-Sequencer-Driver（Seq-Sqr-Driver）交互机制堪称验证环境的核心引擎。这套机制看似简单直观——Sequence产生事务（…

李华

FLUX.1-Krea-Extracted-LoRA代码实例：Streamlit调用+LoRA动态加载

FLUX.1-Krea-Extracted-LoRA代码实例：Streamlit调用LoRA动态加载 1. 项目概述 FLUX.1-Krea-Extracted-LoRA 是一个专为真实感图像生成设计的模型，它通过LoRA（Low-Rank Adaptation）技术为FLUX.1-dev基础模型注入了独特的写实风格…

李华