news 2026/4/25 5:09:19

Qwen3-4B-Instruct部署教程:CentOS/Ubuntu双平台防火墙开放7860端口指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Qwen3-4B-Instruct部署教程:CentOS/Ubuntu双平台防火墙开放7860端口指南

Qwen3-4B-Instruct部署教程:CentOS/Ubuntu双平台防火墙开放7860端口指南

1. 模型简介

Qwen3-4B-Instruct-2507是Qwen3系列的端侧/轻量旗舰模型,具备强大的文本理解和生成能力。该模型原生支持256K token(约50万字)上下文窗口,并可扩展至1M token,能够轻松处理整本书、大型PDF、长代码库等长文本任务。

2. 部署前准备

2.1 系统要求

在开始部署前,请确保您的系统满足以下最低要求:

  • 操作系统:CentOS 7+/Ubuntu 18.04+
  • GPU:NVIDIA显卡(至少8GB显存)
  • 内存:16GB以上
  • 存储空间:至少20GB可用空间

2.2 环境检查

在部署前,建议先检查系统环境:

# 检查GPU驱动 nvidia-smi # 检查Python版本 python --version # 检查Conda是否安装 conda --version

3. 部署步骤详解

3.1 下载模型文件

模型默认存放在/root/ai-models/Qwen/Qwen3-4B-Instruct-2507路径下。如果您需要手动下载:

mkdir -p /root/ai-models/Qwen cd /root/ai-models/Qwen git lfs install git clone https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507

3.2 创建Conda环境

项目使用torch29环境,包含以下关键依赖:

conda create -n torch29 python=3.10 conda activate torch29 pip install torch==2.9.0 transformers==5.5.0 gradio accelerate

3.3 启动WebUI服务

使用Gradio启动Web界面:

cd /root/Qwen3-4B-Instruct python webui.py

服务启动后默认监听7860端口,可通过http://localhost:7860访问。

4. 防火墙配置

4.1 CentOS/RHEL系统配置

# 添加防火墙规则 firewall-cmd --add-port=7860/tcp --permanent # 重新加载防火墙 firewall-cmd --reload # 验证端口是否开放 firewall-cmd --list-ports | grep 7860

4.2 Ubuntu/Debian系统配置

# 允许7860端口通过防火墙 ufw allow 7860/tcp # 启用防火墙规则 ufw enable # 查看防火墙状态 ufw status

5. 服务管理

5.1 使用Supervisor管理服务

建议使用Supervisor来管理服务进程:

# 查看服务状态 supervisorctl status qwen3-4b-instruct # 重启服务 supervisorctl restart qwen3-4b-instruct # 停止服务 supervisorctl stop qwen3-4b-instruct # 启动服务 supervisorctl start qwen3-4b-instruct

5.2 日志查看

# 查看实时日志 tail -f /root/Qwen3-4B-Instruct/logs/webui.log # 查看完整日志 cat /root/Qwen3-4B-Instruct/logs/webui.log

6. 常见问题解决

6.1 端口冲突问题

如果7860端口被占用:

# 检查端口占用情况 ss -tlnp | grep 7860 # 终止占用进程 kill -9 <PID>

6.2 GPU显存不足

# 查看GPU显存使用情况 nvidia-smi --query-gpu=memory.used --format=csv # 实时监控GPU使用 watch -n 1 nvidia-smi

6.3 依赖缺失问题

如果遇到ModuleNotFoundError错误:

source /opt/miniconda3/bin/activate torch29 pip install <package_name>

7. 总结

通过本教程,您已经完成了Qwen3-4B-Instruct模型在CentOS/Ubuntu系统上的部署,并成功配置了防火墙规则开放7860端口。现在您可以通过浏览器访问http://<服务器IP>:7860来使用模型服务。

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 5:06:58

构建城市生命线:基于WebGIS的跨行业管线三维在线编辑与管理

1. 城市生命线的三维革命&#xff1a;为什么我们需要WebGIS&#xff1f; 想象一下&#xff0c;你正站在城市中心的地下30米处。头顶是错综复杂的电力管线&#xff0c;左侧是直径1.2米的供水主干管&#xff0c;右手边燃气管道与热力管网交织缠绕——这就是每天为城市输送能量的&…

作者头像 李华
网站建设 2026/4/25 5:05:17

软件流程图管理化的过程可视化

软件流程图管理化的过程可视化&#xff1a;提升开发效率的利器 在软件开发过程中&#xff0c;流程图是描述逻辑、梳理流程的重要工具。随着项目复杂度提升&#xff0c;传统的手绘或静态流程图管理方式已难以满足团队协作和高效迭代的需求。软件流程图管理化的过程可视化&#…

作者头像 李华
网站建设 2026/4/25 4:54:50

FLUX.1-Krea-Extracted-LoRA代码实例:Streamlit调用+LoRA动态加载

FLUX.1-Krea-Extracted-LoRA代码实例&#xff1a;Streamlit调用LoRA动态加载 1. 项目概述 FLUX.1-Krea-Extracted-LoRA 是一个专为真实感图像生成设计的模型&#xff0c;它通过LoRA&#xff08;Low-Rank Adaptation&#xff09;技术为FLUX.1-dev基础模型注入了独特的写实风格…

作者头像 李华