news 2026/4/16 14:11:27

【Qwen3-VL】手把手教程|用Ollama在本地部署Qwen3-VL,免费使用多模态大模型(附详细步骤)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Qwen3-VL】手把手教程|用Ollama在本地部署Qwen3-VL,免费使用多模态大模型(附详细步骤)
一、Ollama概述

Ollama,这是是一个开源的大语言模型平台,它允许用户在本地环境中运行、创建和共享大型语言模型。Ollama提供了丰富的功能和特性,使得用户可以在自己的计算机上轻松地部署和运行大型语言模型。

链接 https://ollama.com/download

下载安装即可。

默认情况下,ollama模型的存储目录如下:

  • macOS: ~/.ollama/models
  • Linux: /usr/share/ollama/.ollama/models
  • Windows: C:\Users.ollama\models

设置新的下载路径

如果想更改这个默认路径,需要设置一个新的环境变量OLLAMA_MODELS。

这个环境变量应该指向想要保存模型的新目录。

如何设置环境变量:

你可以通过Windows的“系统属性”来设置环境变量。

右键点击“此电脑”或“计算机”,选择“属性”。

点击“高级系统设置”,在弹出的窗口中点击“环境变量”按钮。

在“系统变量”或“用户变量”部分,点击“新建”来创建一个新的环境变量。

输入变量名OLLAMA_MODELS和你选择的目录路径(例如D:\OllamaModels)。

重启Ollama:

设置完环境变量后,需要重启Ollama以使更改生效。

或者重启电脑:为确保更改生效,建议重启电脑。

验证新路径:

可以打开命令提示符(CMD),输入echo %ollama_models%来检查环境变量是否设置成功

启动Ollama后,检查指定的新目录,确保模型被下载并保存在那里。

C:\WINDOWS\system32>echo %ollama_models%D:\ollama

在CMD中输入ollama list命令,查看当前已经存在的模型:

C:\Users\Daniel>ollama listNAME ID SIZE MODIFIEDqwen3:0.6b 7df6b6e09427 522 MB 4 weeks ago
二、Ollama上的Qwen3-VL大模型

Ollama上的Qwen3-VL地址:https://ollama.com/library/qwen3-vl

Qwen3-VL 模型要求 Ollama 0.12.7 版本。

Qwen3-VL 是迄今为止通义千问(Qwen)系列中功能最强大的视觉 - 语言模型。

这一代模型在多个领域实现了升级:文本理解与生成、视觉内容感知与推理、更长上下文支持、空间关系与动态视频理解、AI 智能体交互 ——Qwen3-VL 在每个领域都展现出显著进步。

模型版本

  • 20 亿参数(2B):ollama run qwen3-vl:2b
  • 40 亿参数(4B):ollama run qwen3-vl:4b
  • 80 亿参数(8B):ollama run qwen3-vl:8b
  • 300 亿参数(30B):ollama run qwen3-vl:30b
  • 320 亿参数(32B):ollama run qwen3-vl:32b
  • 2350 亿参数(235B):ollama run qwen3-vl:235bollama run qwen3-vl:235b-cloud

核心特性

  • 视觉智能体能力:可操作电脑与移动设备界面,识别图形用户界面(GUI)元素、理解按钮功能、调用工具并完成任务。在 OS World 等基准测试中取得全球顶尖成绩,工具使用显著提升细粒度感知任务表现。
  • 卓越的文本中心性能:采用文本与视觉模态早期联合预训练,持续强化语言能力。文本任务表现与旗舰语言模型 Qwen3-235B-A22B-2507 持平,成为下一代视觉 - 语言模型中真正 “以文本为基础的多模态 powerhouse”。
  • 大幅升级的视觉编程:可从图像或视频生成代码,例如将设计原型转化为 Draw.io、HTML、CSS 或 JavaScript 代码,实现 “所见即所得” 的视觉编程。
  • 更优的空间理解:支持从绝对坐标到相对坐标的二维定位,能判断物体位置、视角变化和遮挡关系。新增三维定位功能,为复杂空间推理和具身智能应用奠定基础。
  • 长上下文与长视频理解:所有模型原生支持 25.6 万个词元(token)上下文,可扩展至 100 万个词元。能输入数百页技术文档、整本书籍甚至两小时长视频,精准记忆并检索细节(含视频精确到秒的内容)。
  • 更强的多模态推理(思考版):专为理工科(STEM)和数学推理优化。面对复杂学科问题时,可捕捉细节、分步拆解、分析因果,给出符合逻辑的实证答案。在 MathVision、MMMU、MathVista 等推理基准测试中表现优异。
  • 升级的视觉感知与识别:通过优化预训练数据的质量和多样性,可识别更广泛的对象 —— 涵盖名人、动漫角色、产品、地标、动植物等,满足日常生活与专业场景的 “万物识别” 需求。
  • 多语言及复杂场景下的 OCR 优化:光学字符识别(OCR)支持语言从 10 种扩展至 32 种,覆盖更多国家和地区。在弱光、模糊、文本倾斜等复杂真实场景中表现更稳定,生僻字、古文字和专业术语的识别准确率显著提升,长文档理解与精细结构重建能力进一步增强。
三、升级Ollama版本

由于Qwen3-VL要求Ollama的版本0.1.7,我们在安装Qwen3-VL前先通过ollama --version检查当前安装的版本。

C:\Users\Daniel>ollama --versionollama version is 0.12.3

我们需要升级或者重新安装Ollama。以Windows操作系统为例:

  1. 访问 Ollama 官网:https://ollama.com/

点击Download for Windows即可。如果下载太慢,可以将地址复制到迅雷下载。

  1. 运行安装程序,它会自动覆盖旧版本,最新版本为0.12.10。

安装完成后,查看此时的版本。

C:\WINDOWS\system32>ollama --versionollama version is 0.12.10

之前下载的qwen3:0.6b模型还在。

C:\WINDOWS\system32>ollama listNAME ID SIZE MODIFIEDqwen3:0.6b 7df6b6e09427 522 MB 4 weeks ago
四、安装Qwen3-VL大模型

我们运行ollama run qwen3-vl:2b安装Qwen3-VL大模型

ollama run qwen3-vl:2b

安装完毕后,我们输入问题你是谁,查看回答。

五、使用Ollama界面进行智能问答

安装好Ollama后,会有一个Ollama可视化界面,我们点击打开。

我们在聊天窗口的右下角选择刚刚安装成功的qwen3-vl:2b大模型。

在聊天窗口输入你是谁,查看回答。

本地上传一张图片,让其理解。

可见,2b大小的模型完成了对图片的理解,但大概花了43秒,后续将介绍如何调用Ollama 云端的Qwen3-VL大模型进行图片理解。

​最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 11:08:32

2025最新!9个AI论文工具测评:继续教育科研写作全攻略

2025最新!9个AI论文工具测评:继续教育科研写作全攻略 2025年AI论文工具测评:助力科研写作高效升级 随着人工智能技术的不断进步,AI论文工具在学术研究中的应用愈发广泛。对于继续教育领域的学习者和研究者而言,如何选…

作者头像 李华
网站建设 2026/4/15 15:24:24

Open-AutoGLM部署成功率提升80%,这7个关键参数设置你调对了吗

第一章:Open-AutoGLM开源部署操作电脑可以吗环境准备与依赖安装 在本地电脑上部署 Open-AutoGLM 前,需确保系统满足基本运行条件。推荐使用 Linux 或 macOS 系统,Windows 用户可通过 WSL2 环境支持。首先安装 Python 3.10 及 pip 包管理工具&…

作者头像 李华
网站建设 2026/4/16 11:12:16

C语言读取文本中的图像数据转为BMP

C语言读取文本中的图像数据转为BMP 在嵌入式开发、固件分析或逆向工程中,经常会遇到这样的场景:图像数据并非以常规的 .jpg 或 .png 格式存储,而是被编码成十六进制字符串保存在文本文件里。比如从单片机调试日志中提取的帧缓冲区快照、OTA升…

作者头像 李华
网站建设 2026/4/11 18:51:00

Open-AutoGLM实战指南(新手必看手册)

第一章:Open-AutoGLM实战指南概述Open-AutoGLM 是一个面向自动化自然语言处理任务的开源框架,专为简化大语言模型(LLM)在实际业务场景中的部署与调优而设计。该框架支持任务自动拆解、提示工程优化、多模型协同调度以及执行结果验…

作者头像 李华
网站建设 2026/4/11 0:07:55

部署Open-AutoGLM需要什么配置:实测8款主流PC能否跑通AI推理

第一章:Open-AutoGLM开源部署操作电脑可以吗Open-AutoGLM 是一个基于 AutoGLM 架构的开源项目,旨在为本地化大模型推理与微提供轻量化部署方案。得益于其模块化设计和对消费级硬件的优化,用户完全可以在普通个人电脑上完成项目的部署与运行。…

作者头像 李华