news 2026/6/10 20:01:42

打造私人定制开发利器:Qwen Code、vLLM与Qwen3-Coder强强联合!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
打造私人定制开发利器:Qwen Code、vLLM与Qwen3-Coder强强联合!

一、Qwen Code

Qwen Code是一款类似于Claude CodeAI编程助手,由阿里通义千问团队推出,一定程度上可以作为Claude Code的平替工具,本文通过Qwen Code+vLLM+Qwen3-Coder-30B-A3B-Instruct构建纯内网下私服级开发辅助引擎,主要流程如下所示:

实验主要依赖的版本如下:

torch==2.6.0transformers==4.51.3modelscope==1.23.1vllm==0.8.4

二、vLLM 部署 Qwen3-Coder-30B-A3B-Instruct

使用modelscope下载Qwen3-Coder-30B-A3B-Instruct模型到本地:

modelscope download --model="Qwen3-Coder-30B-A3B-Instruct" --local_dir Qwen3-Coder-30B-A3B-Instruct

然后使用vLLM读取模型启动API服务。

export CUDA_VISIBLE_DEVICES=0,1vllm serve "Qwen3-Coder-30B-A3B-Instruct" \ --host 0.0.0.0 \ --port 8060 \ --dtype bfloat16 \ --tensor-parallel-size 2 \ --cpu-offload-gb 0 \ --gpu-memory-utilization 0.8 \ --max-model-len 65536 \ --api-key token-abc123 \ --enable-prefix-caching \ --enable-auto-tool-choice \ --tool-call-parser hermes \ --trust-remote-code

关键参数说明:

  • export CUDA_VISIBLE_DEVICES=0,1:指定所使用的GPU
  • dtype: 数据类型,其中bfloat1616位浮点数,适合NVIDIA A100等设备。
  • tensor-parallel-sizeTensor并行的数量,当多GPU分布式推理时使用,建议和GPU的数量一致。
  • cpu-offload-gb:允许将部分模型权重或中间结果卸载到CPU的内存中,单位为GB,模拟GPU内存扩展,如果部署的模型大于了显存大小可以设置该参数,但是推理速度会大大下降。
  • gpu-memory-utilization:设置GPU内存利用率的上限。
  • max-model-len:允许模型最大处理的Token数,该参数越大占用显存越大。
  • enable-prefix-caching:启用前缀缓存减少重复计算。
  • enable-auto-tool-choice:启用 function call 模式。
  • tool-call-parser hermes:设置 function call 的解析器。

显存占用情况:

如果启动显存不足,可适当调整gpu-memory-utilizationmax-model-len参数,或通过cpu-offload-gb将部分模型权重卸载到内存中(速度会大大折扣)。

启动成功后,可通过/v1/models接口可查看模型列表:

curl http://127.0.0.1:8060/v1/models -H "Authorization: Bearer token-abc123" ```![](http://cdn.zhipoai.cn/a6f6beab.jpg) 测试`API`交互: ```plaintext curl http://127.0.0.1:8060/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer token-abc123" \ -d '{ "model": "Qwen3-Coder-30B-A3B-Instruct", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "你是谁"} ] }' ```![](http://cdn.zhipoai.cn/06c56868.jpg) 三、安装和配置 Qwen Code ----------------- 首先安装 Qwen Code 组件,这里采用 npm: ```plaintext npm install -g @qwen-code/qwen-code@latest ```![](http://cdn.zhipoai.cn/4b4d3ee7.jpg) 安装好后,可以输入 `qwen` 进入窗口: ![](http://cdn.zhipoai.cn/d46e8335.jpg) 配置上面部署的私有模型: 在项目目录下创建 `.env` 文件, 内容如下所示: ```plaintext OPENAI_BASE_URL=http://127.0.0.1:8060/v1/OPENAI_API_KEY=token-abc123OPENAI_MODEL=Qwen3-Coder-30B-A3B-Instruct

然后在.env文件同级的目录下唤醒qwen:

i进入插入模式,然后输入/auth切换认证方式,选择OpenAI,确认信息后即配置成功:

四、 Vibe Coding 测试

这里简单测试下 Vibe Coding ,开发一个H5小游戏和一个前端页面。

4.1 测试 h5 小游戏开发

输入指令:创建一个H5五子棋小游戏

默认情况下,对文件的修改都要用户授权,这里可以先选择是,总是允许

最终运行使用效果:

4.2 测试 前端页面开发

输入指令:实现一个科技感十足的数据分析洞察的前端展示页面,使用H5绘制,需要包含炫酷的图表和动画

最终运行使用效果:

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 13:53:55

GLM-TTS在智能家居中的落地场景设想

GLM-TTS在智能家居中的落地场景设想 你有没有遇到过这样的情况:清晨被冰冷的电子音闹钟吵醒,心里莫名烦躁;家里的智能音箱提醒老人吃药,可对方却因为“普通话太标准”听不懂而忽略;孩子对每天重复的机械语音越来越抵触…

作者头像 李华
网站建设 2026/6/10 14:01:16

用AI分析测试失败日志:自动归因的开源工具全景指南

AI驱动的日志归因已从“概念验证”走向“工程落地”‌ 在2026年的软件测试实践中,‌AI自动根因分析(Root Cause Analysis, RCA)‌ 已不再是实验室里的研究课题,而是大型互联网团队提升MTTR(平均故障修复时间&#xff…

作者头像 李华
网站建设 2026/6/10 13:41:41

【PHP跨域Cookies实战指南】:彻底解决前后端分离架构中的认证难题

第一章:PHP跨域Cookies实战指南在现代Web开发中,前后端分离架构日益普及,跨域请求成为常态。当涉及用户身份认证时,Cookie作为常见的会话管理手段,其跨域使用面临浏览器同源策略的限制。正确配置PHP与前端协作机制&…

作者头像 李华
网站建设 2026/6/10 12:59:45

揭秘PHP图像识别精度瓶颈:5步实现模型精准度翻倍

第一章:揭秘PHP图像识别精度瓶颈的根源在构建基于PHP的图像识别系统时,开发者常遭遇识别准确率不达预期的问题。尽管上层算法看似合理,但性能瓶颈往往深藏于底层实现与环境配置之中。原生PHP缺乏高效的数值计算能力 PHP作为Web开发主流语言之…

作者头像 李华
网站建设 2026/6/10 14:36:46

揭秘PHP实现视频流实时转码:3种高并发场景下的优化策略

第一章:PHP实现视频流实时转码的技术背景在现代多媒体应用中,用户对视频内容的即时性与兼容性提出了更高要求。随着直播、在线教育和短视频平台的兴起,服务器端需要高效处理来自不同设备的原始视频流,并实时转换为多种格式与分辨率…

作者头像 李华
网站建设 2026/6/10 15:47:44

百考通AI:您的智能问卷设计专家,让调研从未如此简单高效

在信息爆炸的时代,数据是洞察市场、理解用户、优化管理的核心驱动力。然而,如何设计一份科学、有效、能精准捕捉关键信息的问卷,却常常成为企业、研究机构乃至个人面临的巨大挑战。传统问卷设计耗时费力,问题设置容易出现偏差&…

作者头像 李华