news 2026/4/16 13:31:22

Open-AutoGLM + 定时任务,打造24小时待命AI助理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Open-AutoGLM + 定时任务,打造24小时待命AI助理

Open-AutoGLM + 定时任务,打造24小时待命AI助理

1. 让AI替你操作手机:从一句话开始

你有没有想过,只要说一句“帮我打开小红书搜美食”,手机就能自动完成所有点击、输入和滑动?这不是科幻电影,而是Open-AutoGLM已经实现的现实。

这个由智谱AI开源的手机端AI Agent框架,正在重新定义人与设备的交互方式。它不仅能“听懂”你的指令,还能“看懂”屏幕内容,通过ADB自动执行操作,真正实现“动口不动手”的智能体验。

更进一步——结合定时任务,你可以让这位AI助理7×24小时在线值守,在指定时间自动执行任务。无论是每天早上的健康打卡、抢购限量商品,还是定期备份数据、发送提醒消息,它都能准时完成,像一个永不疲倦的数字助手。

本文将带你一步步部署Open-AutoGLM,并教你如何用定时任务让它变成全天候AI助理,彻底解放双手。


2. Open-AutoGLM 是什么?

2.1 核心能力:多模态理解 + 自动化执行

Open-AutoGLM 的核心是AutoGLM-Phone框架,它基于视觉语言模型(VLM),具备以下关键能力:

  • 多模态感知:通过截图理解当前手机界面,识别按钮、输入框、图标等元素。
  • 自然语言解析:将用户的一句话指令拆解为可执行的操作序列。
  • 自动化控制:通过 ADB(Android Debug Bridge)模拟点击、滑动、输入等操作。
  • 智能规划:根据当前界面状态动态调整下一步动作,具备“思考”能力。

比如你说:“打开抖音,搜索‘科技测评’,点赞第一个视频。”
AI会:

  1. 打开抖音App
  2. 找到搜索框并点击
  3. 输入“科技测评”
  4. 进入结果页
  5. 找到第一个视频并双击点赞

整个过程无需人工干预,完全自动化。

2.2 安全设计:敏感操作人工确认

为了防止误操作,系统内置了敏感操作拦截机制。当检测到支付、删除、转账等高风险行为时,AI会暂停执行,等待你手动确认。所有操作都在本地完成,数据不上传云端,保障隐私安全。

2.3 部署灵活:支持本地与远程

你可以选择多种部署方式:

  • 本地运行:在自己的电脑上部署vLLM服务,完全离线使用。
  • 云端调用:连接已部署好的云服务器,通过WiFi远程控制手机。
  • API接入:支持接入智谱BigModel、Hugging Face等平台的API。

3. 快速部署:三步让AI接管手机

3.1 环境准备

你需要准备以下环境:

组件要求
电脑Windows / macOS / Linux,Python 3.10+
手机Android 7.0+,开启开发者模式和USB调试
工具ADB工具、ADB Keyboard输入法
安装ADB(以Windows为例)
  1. 下载 Android SDK Platform Tools
  2. 解压后将路径添加到系统环境变量Path
  3. 命令行输入adb version验证是否安装成功
手机设置
  1. 进入“设置 → 关于手机”,连续点击“版本号”7次开启开发者模式。
  2. 返回“设置 → 开发者选项”,启用“USB调试”。
  3. 下载并安装 ADB Keyboard APK,设置为默认输入法。

为什么需要ADB Keyboard?
因为AI无法直接调用手机软键盘输入文字。ADB Keyboard允许通过ADB命令发送文本,实现自动输入。

3.2 部署控制端代码

在本地电脑执行以下命令:

git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM pip install -r requirements.txt pip install -e .

3.3 连接设备

确保手机通过USB连接电脑,然后运行:

adb devices

如果看到设备ID后跟device状态,说明连接成功。

使用WiFi远程连接(推荐)

如果你希望摆脱USB线束缚,可以启用WiFi ADB:

# 先用USB连接,开启TCP模式 adb tcpip 5555 # 断开USB,通过IP连接 adb connect 192.168.1.100:5555

之后即可无线控制手机。


4. 启动AI代理:让AI开始工作

4.1 命令行运行示例

假设你已经在云服务器上部署了vLLM模型服务,地址为http://123.45.67.89:8800,则运行:

python main.py \ --device-id 192.168.1.100:5555 \ --base-url http://123.45.67.89:8800/v1 \ --model "autoglm-phone-9b" \ "打开微信,给文件传输助手发一条消息:今天天气真好"

AI会自动:

  • 启动微信
  • 找到“文件传输助手”聊天窗口
  • 点击输入框
  • 输入文字并发送

4.2 Python API调用(适合集成)

你也可以在自己的脚本中调用:

from phone_agent.adb import ADBConnection from phone_agent.agent import PhoneAgent # 连接设备 conn = ADBConnection() conn.connect("192.168.1.100:5555") # 创建AI代理 agent = PhoneAgent( device_id="192.168.1.100:5555", base_url="http://123.45.67.89:8800/v1", model="autoglm-phone-9b" ) # 执行任务 result = agent.run("打开美团,搜索附近的咖啡店") print(result)

这种方式便于与其他系统集成,比如Web后台、企业OA等。


5. 打造24小时AI助理:定时任务实战

真正的价值在于自动化+定时执行。我们可以结合操作系统的定时任务功能,让AI每天自动完成固定流程。

5.1 场景一:每日健康打卡

很多公司要求员工每天上午9点前完成健康打卡。手动操作容易忘记,AI可以帮你准时完成。

编写脚本daily_checkin.py

from phone_agent.agent import PhoneAgent def do_daily_checkin(): agent = PhoneAgent( device_id="192.168.1.100:5555", base_url="http://123.45.67.89:8800/v1", model="autoglm-phone-9b" ) agent.run("打开企业微信,进入工作台,点击健康打卡,提交今日信息") if __name__ == "__main__": do_daily_checkin()
添加定时任务(Linux/macOS)

使用crontab设置每天9:00执行:

crontab -e

添加一行:

0 9 * * * cd /path/to/Open-AutoGLM && python daily_checkin.py
Windows任务计划程序
  1. 打开“任务计划程序”
  2. 创建基本任务,设置触发时间为“每天”
  3. 操作选择“启动程序”,填写:
    • 程序:python
    • 参数:daily_checkin.py
    • 起始目录:项目路径

保存后,每天早上9点AI会自动打卡。

5.2 场景二:电商抢购助手

双十一、618期间,很多商品限时抢购。AI可以提前监控页面,在开售瞬间自动下单。

agent.run("打开淘宝,进入iPhone 15 Pro商品页,等待开售,一旦可购买立即点击下单并跳转支付")

注意:支付环节需手动确认,避免误购。

5.3 场景三:社交媒体运营

自媒体创作者可以设置:

  • 每天中午12点发布一条微博
  • 每晚8点回复粉丝评论
  • 每周日自动生成周报并发送邮件

只需一句指令,AI自动完成App切换、内容编辑、发布全流程。


6. 常见问题与优化建议

6.1 常见问题排查

问题可能原因解决方案
ADB连接失败防火墙阻止、USB调试未开启检查手机设置,关闭防火墙
AI乱点屏幕模型响应异常或延迟高检查vLLM服务是否正常,调整max-model-len参数
输入中文失败ADB Keyboard未启用检查输入法设置,确保ADB Keyboard为默认
WiFi断连网络不稳定改用USB连接,或优化路由器信号

6.2 性能优化建议

  • 使用GPU加速:推荐NVIDIA显卡(RTX 3090及以上),显著提升推理速度。
  • 降低截图频率:在config.yaml中调整screen_update_interval,减少不必要的截图请求。
  • 预加载常用App:在任务开始前先启动目标App,减少等待时间。
  • 设置最大步数:使用--max-steps 20防止AI陷入死循环。

7. 应用前景与未来可能

Open-AutoGLM 不只是一个玩具项目,它打开了AI原生操作系统的大门。未来我们可能会看到:

  • 老年人数字助手:子女远程配置任务,AI帮父母挂号、购物、视频通话。
  • 企业流程自动化:财务报销、数据录入、审批流转全部由AI完成。
  • 无障碍辅助:视障人士通过语音指令操控手机,提升生活质量。
  • 自动化测试:测试人员用自然语言描述用例,AI自动执行回归测试。

更重要的是,它是开源的。任何人都可以下载、修改、部署,构建属于自己的AI助理生态。


8. 总结

Open-AutoGLM 正在将“AI助手”的概念从“回答问题”升级为“执行任务”。它不再只是聊天机器人,而是一个能真正帮你做事的数字员工。

通过本文的部署指南和定时任务实践,你已经掌握了如何:

  • 搭建Open-AutoGLM运行环境
  • 连接手机并启动AI代理
  • 编写自动化脚本
  • 设置定时任务,打造24小时待命AI助理

下一步,你可以尝试:

  • 将多个任务组合成复杂流程
  • 接入企业内部系统,实现办公自动化
  • 为家人配置专属AI助手,解决实际生活难题

技术的价值在于改变生活。现在,轮到你来定义它的边界了。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 2:05:36

LaWGPT终极实战指南:从概念解析到企业级法律AI部署

LaWGPT终极实战指南:从概念解析到企业级法律AI部署 【免费下载链接】LaWGPT LaWGPT - 一系列基于中文法律知识的开源大语言模型,专为法律领域设计,增强了法律内容的理解和执行能力。 项目地址: https://gitcode.com/gh_mirrors/la/LaWGPT …

作者头像 李华
网站建设 2026/4/15 17:46:12

Java SpringBoot+Vue3+MyBatis 学生干部管理系统系统源码|前后端分离+MySQL数据库

摘要 随着高校学生管理工作的日益复杂化,传统的人工管理模式已难以满足高效、精准的管理需求。学生干部作为高校管理的重要力量,其信息管理、任务分配、考核评价等工作亟需系统化、数字化的解决方案。学生干部管理系统的开发旨在通过信息化手段优化管理流…

作者头像 李华
网站建设 2026/4/16 12:00:06

SpringBoot+Vue Spring Boot智能无人仓库管理管理平台源码【适合毕设/课设/学习】Java+MySQL

摘要 随着物流行业的快速发展,智能无人仓库管理成为提升仓储效率、降低人力成本的重要研究方向。传统仓库管理依赖人工操作,存在效率低下、错误率高、管理成本高等问题,难以满足现代物流的高效需求。智能无人仓库管理系统通过自动化设备、物联…

作者头像 李华
网站建设 2026/4/16 11:57:00

5步搞定黑苹果:OpCore Simplify让技术小白也能轻松配置

5步搞定黑苹果:OpCore Simplify让技术小白也能轻松配置 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 还在为复杂的EFI配置而头疼吗&…

作者头像 李华
网站建设 2026/4/15 21:46:59

Qwen-Image-Layered性能优化:提升推理速度的小技巧

Qwen-Image-Layered性能优化:提升推理速度的小技巧 你是否在使用 Qwen-Image-Layered 时遇到过生成图层太慢、显存占用高、交互卡顿的问题?尤其是在处理高清图像或进行多层递归分解时,等待时间动辄几分钟,严重影响创作效率。本文…

作者头像 李华
网站建设 2026/4/16 12:53:04

如何用unet实现真人转卡通?Python调用详细步骤解析

如何用unet实现真人转卡通?Python调用详细步骤解析 1. 功能概述 本工具基于阿里达摩院 ModelScope 的 DCT-Net 模型,结合 UNet 网络结构设计,能够将真实人物照片自动转换为卡通风格图像。该模型在大量人像与卡通数据对上进行训练&#xff0…

作者头像 李华