news 2026/4/16 15:06:22

Open-AutoGLM安装教程:Windows/Mac都能轻松上手

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Open-AutoGLM安装教程:Windows/Mac都能轻松上手

Open-AutoGLM安装教程:Windows/Mac都能轻松上手

1. 引言

随着AI智能体技术的快速发展,AutoGLM-Phone作为智谱开源的手机端AI Agent框架,正逐步成为自动化操作领域的创新代表。该框架基于视觉语言模型(VLM),能够以多模态方式理解手机屏幕内容,并通过ADB实现自动操控设备。用户只需输入自然语言指令,如“打开小红书搜索美食”,系统即可自动解析意图、识别界面元素并执行完整操作流程。

本文将围绕Open-AutoGLM提供一份详尽的本地部署与使用指南,覆盖Windows和macOS平台,帮助开发者快速搭建环境、连接真机或模拟器,并成功启动AI代理服务。无论你是初学者还是有经验的工程师,都能通过本教程顺利上手。


2. 环境准备与依赖配置

2.1 系统要求与基础工具

在开始前,请确保满足以下硬件与软件条件:

项目要求
操作系统Windows 10+ 或 macOS Monterey 及以上版本
Python 版本建议 Python 3.10 或更高版本
安卓设备Android 7.0+ 的真实手机或安卓模拟器
ADB 工具Android Debug Bridge,用于设备通信

提示:推荐使用虚拟环境管理Python依赖,避免包冲突。

```bash python -m venv autoglm-env source autoglm-env/bin/activate # macOS/Linux

或 autoglm-env\Scripts\activate # Windows

```

2.2 安装并配置 ADB

ADB 是控制安卓设备的核心工具。以下是不同系统的配置方法:

Windows 配置步骤:
  1. 下载 Android SDK Platform Tools 并解压。
  2. 打开“系统属性” → “高级” → “环境变量”。
  3. 在“系统变量”中找到Path,点击编辑,添加解压目录路径(例如:C:\platform-tools)。
  4. 打开命令行,运行adb version验证是否安装成功。
macOS 配置方法:

在终端中执行以下命令(假设 platform-tools 解压至 Downloads 目录):

export PATH=${PATH}:~/Downloads/platform-tools

为永久生效,可将上述命令写入 shell 配置文件(如.zshrc.bash_profile):

echo 'export PATH=${PATH}:~/Downloads/platform-tools' >> ~/.zshrc source ~/.zshrc

验证安装:

adb version # 正常输出应包含 ADB 版本号

3. 手机端设置与权限开启

要让 AI 成功控制手机,必须正确配置设备调试权限。

3.1 开启开发者选项与USB调试

  1. 进入手机“设置” → “关于手机”。
  2. 连续点击“版本号”7次,直到提示“您已进入开发者模式”。
  3. 返回设置主界面,进入“开发者选项”。
  4. 启用“USB调试”功能。

注意:部分厂商(如小米、华为)可能还需额外授权“USB安装”或“安全设置”。

3.2 安装 ADB Keyboard 输入法

由于 AutoGLM 需要向应用输入文本(如搜索框),而多数输入法不支持 ADB 文本注入,因此需安装专用输入法:

  1. 下载 ADB Keyboard APK。
  2. 安装后,在“语言与输入法”中将其设为默认输入法。
  3. 测试是否生效:连接电脑后运行bash adb shell am startservice --user 0 -n hk.edu.cuhk.cse.adbkeyboard/.AdbIME adb shell input text "Hello_AutoGLM"若屏幕上出现文字,则配置成功。

4. 部署 Open-AutoGLM 控制端代码

4.1 克隆项目仓库

在本地电脑上克隆官方 GitHub 仓库:

git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM

4.2 安装 Python 依赖

项目依赖通过requirements.txt管理,建议在虚拟环境中安装:

pip install -r requirements.txt pip install -e .

-e .表示以可编辑模式安装,便于后续开发调试。

常见依赖包括: -torch,transformers: 支持模型推理 -fastapi,uvicorn: 构建本地API服务(若启用) -adbutils: 封装 ADB 操作接口 -Pillow,opencv-python: 图像处理与OCR辅助


5. 设备连接方式详解

5.1 USB 连接方式(推荐新手)

  1. 使用数据线将手机连接至电脑。
  2. 手机会弹出“允许USB调试?”对话框,勾选“始终允许”并确认。
  3. 在终端运行:bash adb devices输出示例:List of devices attached 1234567890ABCDEF device

出现device状态即表示连接成功。

5.2 WiFi 远程连接(适合无线调试)

若希望脱离数据线进行远程控制,可使用 ADB over TCP/IP:

第一步:通过 USB 启动 TCP 模式
adb tcpip 5555

此命令将设备监听在 5555 端口。

第二步:断开 USB,使用 IP 连接

获取手机局域网 IP 地址(可在“设置-网络-WiFi”中查看),然后执行:

adb connect 192.168.x.x:5555

再次运行adb devices查看是否显示设备。

提示:重启手机后需重新执行adb tcpip 5555


6. 启动 AI 代理并执行任务

6.1 命令行方式运行任务

当云服务端已部署好模型(如autoglm-phone-9b)并通过 vLLM 暴露 API 接口后,可在本地调用:

python main.py \ --device-id 1234567890ABCDEF \ --base-url http://<your-server-ip>:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"

参数说明:

参数说明
--device-id来自adb devices的设备ID或IP:端口
--base-url云端模型服务地址,格式为http://IP:Port/v1
--model指定使用的模型名称
最后字符串用户自然语言指令

注意:请确保云服务器防火墙开放对应端口(如 8800),否则连接会被拒绝。

6.2 使用 Python API 实现远程控制

对于集成到其他系统的场景,可直接调用 SDK 中的 ADB 接口:

from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备 success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出所有连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}") # 获取设备IP(适用于动态IP环境) ip = conn.get_device_ip() print(f"当前设备IP: {ip}") # 断开连接 conn.disconnect("192.168.1.100:5555")

该方式适用于构建 Web 控制台、自动化测试平台等高级应用。


7. 常见问题排查与解决方案

7.1 ADB 连接失败

问题现象可能原因解决方案
unauthorized未授权调试重新插拔数据线,确认手机端弹窗已允许
offlineADB 守护进程异常执行adb kill-server && adb start-server
connection refused网络不通或端口未开检查路由器防火墙、确认设备在同一局域网

7.2 模型无响应或乱码

  • 检查 base-url 是否正确:确保 URL 格式为http://x.x.x.x:port/v1,且服务正在运行。
  • 验证 vLLM 启动参数bash python -m vllm.entrypoints.openai.api_server \ --model zhipu-autobots/autoglm-phone-9b \ --max-model-len 4096 \ --gpu-memory-utilization 0.9特别注意max-model-len应足够大以支持长上下文推理。

7.3 敏感操作无法继续

AutoGLM 内置安全机制,在涉及支付、删除等敏感操作时会暂停并提示人工接管。这是正常行为,可通过以下方式处理:

  • 在日志中查看中断点;
  • 手动完成关键步骤;
  • 继续发送后续指令。

8. 总结

本文详细介绍了如何在 Windows 和 macOS 系统上部署Open-AutoGLM,从环境准备、ADB 配置、手机权限设置,到代码拉取、设备连接及最终任务执行,形成了一套完整的实践路径。通过该框架,开发者可以轻松实现基于自然语言的手机自动化操作,极大提升效率。

核心要点回顾: 1. ✅ 正确安装并配置 ADB,是控制设备的前提; 2. ✅ 开启开发者模式与 ADB Keyboard,保障输入能力; 3. ✅ 使用 USB 初次连接后再切换为 WiFi,提高灵活性; 4. ✅ 云端模型服务需稳定暴露 OpenAI 兼容接口; 5. ✅ 注意安全策略设计,合理处理人工介入环节。

未来,随着多模态模型能力的增强,此类 AI Agent 将在自动化测试、无障碍辅助、数字员工等领域发挥更大价值。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 13:02:44

Qwen3-VL-2B降本部署案例:无GPU也能跑视觉大模型实战

Qwen3-VL-2B降本部署案例&#xff1a;无GPU也能跑视觉大模型实战 1. 背景与挑战&#xff1a;视觉大模型的落地瓶颈 近年来&#xff0c;多模态大模型在图文理解、视觉问答&#xff08;VQA&#xff09;、OCR识别等场景中展现出强大能力。以Qwen系列为代表的视觉语言模型&#x…

作者头像 李华
网站建设 2026/4/16 10:18:51

VibeThinker-1.5B vs GPT-OSS-20B:小模型数学推理能力谁更强?

VibeThinker-1.5B vs GPT-OSS-20B&#xff1a;小模型数学推理能力谁更强&#xff1f; 1. 引言&#xff1a;小参数模型的推理能力之争 随着大语言模型在数学推理和代码生成任务中的广泛应用&#xff0c;业界普遍认为模型参数规模是决定性能的关键因素。然而&#xff0c;近期微…

作者头像 李华
网站建设 2026/4/16 3:52:46

FSMN-VAD模型离线使用:无网络环境部署实战

FSMN 语音端点检测 (VAD) 离线控制台部署指南 本镜像提供了一个基于 阿里巴巴 FSMN-VAD 模型构建的离线语音端点检测&#xff08;Voice Activity Detection&#xff09;Web 交互界面。该服务能够自动识别音频中的有效语音片段&#xff0c;并排除静音干扰&#xff0c;输出精准的…

作者头像 李华
网站建设 2026/4/16 10:18:53

IQuest-Coder-V1自动化重构:技术债务清理工具实战

IQuest-Coder-V1自动化重构&#xff1a;技术债务清理工具实战 1. 引言&#xff1a;软件工程中的技术债务挑战 在现代软件开发中&#xff0c;技术债务&#xff08;Technical Debt&#xff09;已成为影响系统可维护性、扩展性和交付效率的核心瓶颈。随着项目迭代加速&#xff0…

作者头像 李华
网站建设 2026/4/16 10:20:51

AI证件照工坊输出格式控制:JPG/PNG质量压缩参数设置指南

AI证件照工坊输出格式控制&#xff1a;JPG/PNG质量压缩参数设置指南 1. 引言 1.1 业务场景描述 在数字化办公与在线身份认证日益普及的今天&#xff0c;高质量、标准化的证件照成为简历投递、考试报名、政务办理等场景中的刚需。传统照相馆流程繁琐、成本高&#xff0c;而市…

作者头像 李华
网站建设 2026/4/16 10:20:10

Supertonic极速TTS实战:设备端语音合成新体验

Supertonic极速TTS实战&#xff1a;设备端语音合成新体验 在人工智能驱动的语音交互时代&#xff0c;文本转语音&#xff08;Text-to-Speech, TTS&#xff09;技术正广泛应用于智能助手、有声读物、无障碍服务和边缘设备中。然而&#xff0c;传统云依赖型TTS系统普遍存在延迟高…

作者头像 李华