Open-AutoGLM实战指南：自动打卡健康码，1块钱试用

你是不是也遇到过这样的情况？每天早上刚到社区办公室，第一件事就是打开手机，登录各种政务App，手动填报居民的体温、行程、疫苗接种情况……一来二去，光是“健康码打卡”这一项，就得花掉半个多小时。更头疼的是，单位配的老电脑跑不动新软件，自己手机又不敢随便装测试工具，生怕出问题影响工作。

别急，今天我要分享一个真正能帮你“解放双手”的神器——Open-AutoGLM。它是一个开源的AI手机智能体框架，能像真人一样操作你的安卓手机，自动完成点击、滑动、输入、截图等动作。最关键的是，它支持通过自然语言指令控制，比如你只要说一句：“帮我打开健康宝，完成今日打卡”，它就能自动执行全流程。

而最让小白用户安心的是：现在你不需要在本地部署复杂环境，也不用担心老旧电脑带不动。借助CSDN算力平台提供的预置镜像，你可以花1块钱试用GPU资源，一键部署Open-AutoGLM远程控制环境，全程无需改动个人设备设置，安全又高效。

这篇文章就是为你量身打造的《Open-AutoGLM实战指南》。我会从零开始，手把手教你如何利用云端算力快速搭建自动化打卡系统，哪怕你是技术小白，也能轻松上手。学完之后，你不仅能实现健康码自动打卡，还能举一反三，把这套方法用在其他重复性手机操作上，比如每日疫情数据上报、居民信息核对、消息群发提醒等。

准备好了吗？我们马上开始！

1. 理解Open-AutoGLM：你的AI手机助理到底是什么？

1.1 它不是脚本，而是会“看”会“想”的AI操作员

很多人一听“自动操作手机”，第一反应可能是“不就是写个自动化脚本吗？”但Open-AutoGLM和传统自动化工具（比如Auto.js）有本质区别。

传统的脚本是“死”的——你得事先告诉它每个按钮的坐标、什么时候点、点几次。一旦界面变了（比如App更新了），脚本就失效了。而Open-AutoGLM是一个基于大模型的多模态智能体，它具备三项核心能力：

看得懂屏幕：能理解当前手机屏幕上显示的内容，识别文字、图标、按钮位置。
听得懂指令：接受自然语言输入，比如“打开健康码并截图”。
做得出决策：根据当前状态判断下一步该做什么，具有一定的逻辑推理能力。

你可以把它想象成一个坐在你手机对面的“虚拟助手”。你不需要教它每一个细节，只需要下命令，它自己会观察屏幕、分析路径、执行操作。

举个生活化的例子：
如果你让一个实习生去打印文件，你会怎么说？
❌ “走到打印机前，按电源键，等绿灯亮，放入A4纸，按‘开始’按钮。”
✅ “帮我把桌面上的防疫日报打印一份。”

Open-AutoGLM就是那个能听懂第二句话的“聪明实习生”。

1.2 技术原理揭秘：它是怎么做到“一句话控制手机”的？

虽然我们面向的是小白用户，但简单了解背后的技术逻辑，有助于你更好地使用和调试系统。

Open-AutoGLM的工作流程可以分为四个步骤：

设备连接：通过ADB（Android Debug Bridge）协议，将安卓手机与运行环境建立连接。这就像给手机接上一根“神经线”，让外部程序能控制它。
屏幕采集：定时获取手机屏幕截图，并传送给AI模型进行分析。
指令理解与规划：你输入的自然语言指令（如“打卡健康码”）会被GLM大模型解析，结合当前屏幕内容，生成一系列操作步骤（如“打开微信 → 进入服务页面 → 点击健康码”）。
动作执行：系统将这些操作转化为具体的点击、滑动、输入等ADB命令，发送到手机执行。

整个过程形成了一个“感知-思考-行动”的闭环，类似于人类的操作方式。

⚠️ 注意：Open-AutoGLM本身并不直接运行在手机上，而是作为一个“大脑”运行在远程服务器或电脑上，通过网络控制手机。这样既能保证性能，又能避免对手机系统做过多修改。

1.3 支持哪些App？能不能用在政务场景？

根据官方文档和社区实测，Open-AutoGLM目前已支持50+款主流中文App，涵盖多个高频使用场景：

类别	支持的App示例
社交沟通	微信、QQ、钉钉、微博
生活服务	支付宝、美团、饿了么、滴滴出行
购物电商	淘宝、京东、拼多多
出行导航	高德地图、百度地图、12306
内容平台	抖音、小红书、知乎

那么重点来了：它能不能操作政务类App？

答案是：可以，但需要适配。

目前Open-AutoGLM对微信、支付宝这类通用平台的支持非常成熟。而很多地区的“健康码”功能正是集成在这两个App中的（如北京健康宝、上海随申码）。因此，只要你所在社区使用的健康码是通过微信或支付宝调用的，Open-AutoGLM就能自动完成打卡流程。

对于一些独立开发的政务App（如“XX省疫情防控平台”），虽然默认未被支持，但Open-AutoGLM是开源框架，允许开发者自行训练或微调模型来适配新应用。后续我们也会介绍如何添加自定义操作逻辑。

1.4 为什么必须用GPU？没有显卡能跑吗？

这是很多用户关心的问题：我家里没显卡，能不能用笔记本跑Open-AutoGLM？

简单回答：本地运行强烈建议有GPU；远程部署则完全不用担心。

原因在于，Open-AutoGLM的核心是GLM大模型（类似GPT的大语言模型），它负责理解你的指令并做出决策。这类模型在推理时对计算资源要求较高，尤其是涉及图像识别和多轮对话时。

CPU模式：勉强可运行，但响应速度极慢，可能几秒甚至十几秒才返回一个动作，用户体验很差。
GPU模式：借助CUDA加速，推理速度提升5~10倍，操作流畅度接近实时。

好消息是，CSDN算力平台提供了预装Open-AutoGLM环境的GPU镜像，你只需一键启动，就能获得高性能计算资源。这意味着你不需要自己的显卡，也能享受GPU带来的高速体验。而且按小时计费，试用成本低至1块钱，非常适合短期验证和学习。

2. 快速部署：1块钱搞定远程自动化环境

2.1 为什么推荐使用CSDN算力平台？

前面提到，Open-AutoGLM需要较强的计算能力，而大多数社区工作者的办公电脑配置偏低，难以胜任。如果强行在本地安装，可能会出现卡顿、崩溃、无法连接设备等问题。

这时候，云端GPU算力平台就成了最佳选择。而CSDN提供的星图镜像服务，特别适合像你这样的非技术用户，主要有三大优势：

预置环境，开箱即用：镜像中已安装好PyTorch、CUDA、ADB、GLM模型、Open-AutoGLM框架等全套组件，省去繁琐的依赖配置。
一键部署，操作简单：无需编写代码或命令行操作，图形化界面几步完成创建。
按需付费，成本极低：最低档位每小时不到1元，试用几小时也不会产生高额费用。

更重要的是，所有操作都在远程服务器完成，你的个人手机和电脑不会留下任何敏感数据或修改痕迹，安全性高。

2.2 详细部署步骤：5分钟启动你的AI助理

接下来我带你一步步完成部署。整个过程不需要任何编程基础，跟着截图操作即可。

第一步：访问CSDN星图镜像广场

打开浏览器，进入 CSDN星图镜像广场（建议使用Chrome或Edge浏览器）。

在搜索框中输入“Open-AutoGLM”或“AutoGLM-GUI”，找到对应的镜像条目。通常标题会包含“Open-AutoGLM”、“AutoGLM GUI”、“手机自动化”等关键词。

第二步：选择合适的资源配置

点击镜像后，会进入部署页面。你需要选择实例规格。对于Open-AutoGLM这种中等负载任务，推荐以下配置：

参数	推荐选项	说明
GPU类型	RTX 3060 / T4	性价比高，足以流畅运行GLM模型
显存	≥8GB	确保模型加载不报错
CPU核心	4核以上	协助处理ADB通信和后台任务
内存	16GB	避免因内存不足导致中断
存储空间	50GB SSD	足够存放模型和日志

💡 提示：首次试用建议选择最低档可用GPU实例，先验证功能是否正常，再决定是否升级。

第三步：启动实例并等待初始化

确认配置后，点击“立即创建”或“启动实例”。系统会自动分配资源并拉取镜像，这个过程大约需要3~5分钟。

等待状态变为“运行中”后，你会看到一个Web访问地址（通常是http://<IP>:<端口>的形式），点击即可进入Open-AutoGLM的图形界面。

第四步：连接你的安卓手机

现在回到物理设备端：

使用USB数据线将安卓手机连接到你正在操作的电脑（注意：不是服务器！）
在手机上弹出的“是否允许USB调试？”提示中，点击“允许”
回到Web界面，在“设备管理”区域点击“扫描设备”
正常情况下，系统会识别出你的手机序列号

如果未识别，请检查：

手机是否开启“开发者模式”和“USB调试”
数据线是否支持数据传输（有些仅充电）
是否安装了正确的驱动程序（Windows用户）

一旦连接成功，你就能在Web界面上实时看到手机屏幕画面了。

2.3 首次运行测试：让AI帮你打开微信

为了验证环境是否正常，我们可以做一个简单的测试：让AI打开微信。

在Web界面的指令输入框中，输入：

请打开微信App

然后点击“执行”按钮。

观察屏幕变化：

AI会先分析当前桌面布局
找到微信图标的位置
自动模拟点击
成功打开微信后，界面会显示“操作成功”提示

如果一切顺利，恭喜你！你的远程自动化环境已经搭建成功。接下来就可以尝试更复杂的任务了。

⚠️ 注意：首次运行可能需要下载模型权重文件，会有短暂延迟。后续操作将明显加快。

3. 实战演练：实现健康码自动打卡全流程

3.1 明确打卡流程：拆解每一步操作

不同地区的健康码入口略有差异，但大多数都集成在微信或支付宝中。以常见的“微信→服务→健康码”路径为例，完整打卡流程如下：

解锁手机（如有锁屏）
打开微信App
进入底部“我” → “服务”（或“支付”）
在常用服务中找到“健康码”并点击
等待页面加载，确认姓名和状态显示正常
（可选）截图保存或分享给指定群聊

我们的目标是让Open-AutoGLM自动完成这六个步骤。

3.2 编写自然语言指令：怎么“说话”最有效？

Open-AutoGLM接受自然语言指令，但为了让AI更准确地理解意图，建议采用“动词+对象+补充说明”的结构。

❌ 不推荐的说法：

“打卡一下”
“弄个健康码”

这类说法太模糊，AI不知道具体要做什么。

✅ 推荐的标准指令格式：

请解锁手机，然后打开微信，进入服务页面，点击“健康码”按钮，等待加载完成后截图并保存。

更进一步，你还可以加入条件判断：

如果当前不在桌面，请先返回主屏幕；然后打开微信，进入服务页面，查找“健康码”入口并点击；等待两秒后截图，保存为“今日健康码.jpg”。

你会发现，这种指令更像是在“指挥一个人”，而不是写代码。这也是Open-AutoGLM最大的魅力所在——降低自动化门槛。

3.3 执行自动打卡：见证AI完成全过程

现在我们在Web界面输入上述指令，点击“执行”。

系统会逐步展示操作日志：

[INFO] 当前屏幕分析完成，未检测到锁屏 [INFO] 正在查找微信图标... [INFO] 找到微信，坐标(200, 350)，执行点击 [INFO] 检测到微信启动，等待页面加载... [INFO] 进入“我”页面，查找“服务”入口... [INFO] 点击“服务”，跳转中... [INFO] 屏幕刷新，查找“健康码”... [INFO] 找到“健康码”按钮，执行点击 [INFO] 等待2秒... [INFO] 执行截图，保存至 /output/today_health_code.jpg [SUCCESS] 全部操作完成！

与此同时，你连接的手机上会真实上演这一系列操作，速度快且稳定。

3.4 处理异常情况：AI也会“迷路”怎么办？

尽管Open-AutoGLM很聪明，但在实际使用中仍可能遇到意外情况，比如：

App弹出更新提示遮挡了按钮
网络延迟导致页面未及时加载
健康码入口位置发生变化

这时AI可能会“卡住”或执行错误操作。

解决方法有两种：

方法一：增加容错指令

在原始指令中加入异常处理逻辑：

如果弹出“版本更新”提示，请点击“取消”； 如果5秒内未进入健康码页面，则重新点击一次； 如果仍然失败，停止操作并发出警报。

方法二：启用“视频流”显示模式

在Web界面切换到“视频流”模式，可以实时查看手机屏幕动态。一旦发现AI走偏，你可以立即暂停并手动干预。

此外，Open-AutoGLM的GUI界面还支持“回放”功能，可以逐帧查看历史操作，方便排查问题。

4. 进阶技巧：让自动化更智能、更实用

4.1 定时自动执行：每天早上8点准时打卡

手动输入指令毕竟还是麻烦。我们可以设置定时任务，让系统每天固定时间自动打卡。

Open-AutoGLM本身不提供调度功能，但我们可以通过Linux系统的cron来实现。

在终端执行：

crontab -e

添加一行：

0 8 * * * curl -X POST http://localhost:8080/api/v1/execute -d '{"command":"请打开微信，进入服务页面，点击健康码，截图保存"}'

这表示每天上午8:00自动触发一次打卡请求。前提是你的实例保持运行状态。

💡 小贴士：如果你不想全天开机，也可以设置弹性计费实例，在需要时自动启动，完成任务后自动关机。

4.2 多设备批量操作：同时管理多台手机

作为社区工作者，你可能需要为多位老人代操作健康码。Open-AutoGLM支持多设备并发控制。

只需将多台安卓手机通过USB集线器连接到同一台服务器，在Web界面的设备列表中选择“全部设备”或指定设备组，然后下发统一指令即可。

例如：

请为所有设备执行：打开微信 → 进入服务 → 点击健康码 → 截图保存

系统会并行处理每台设备，大幅提高效率。

当然，要注意服务器的GPU和内存资源是否足够支撑多实例运行。一般建议单卡最多同时控制3~4台设备。

4.3 结合OCR增强识别：应对复杂界面变化

有些政务App界面设计不规范，按钮文字不清晰，或者经常变动位置。这时可以结合OCR（光学字符识别）技术提升AI的理解能力。

幸运的是，Open-AutoGLM的镜像中已集成PaddleOCR模块，可以直接调用。

例如，你可以这样写指令：

使用OCR识别屏幕上的所有文本，查找包含“健康码”或“防疫”的按钮，优先点击蓝色背景的选项。

这种方式不再依赖固定的坐标或图标匹配，而是基于语义识别，适应性更强。

4.4 安全与权限管理：保护隐私不泄露

最后强调一点：自动化不能以牺牲安全为代价。

在使用过程中请注意：

不要在自动化流程中输入银行卡密码、身份证号等敏感信息
避免授权永久性权限，每次使用后可关闭USB调试
定期清理服务器上的截图和日志文件
使用完毕后及时停止实例，防止被他人滥用

CSDN平台的隔离环境本身具备一定安全性，但仍需养成良好的操作习惯。

5. 总结

Open-AutoGLM是一款强大的开源AI手机助手，能通过自然语言指令自动操作安卓设备，特别适合处理重复性任务。
借助CSDN算力平台的预置镜像，即使没有高性能电脑，也能以极低成本（1块钱起）快速搭建远程自动化环境。
实测表明，该系统可稳定实现健康码自动打卡，支持微信、支付宝等主流入口，操作流畅且易于上手。
通过添加定时任务、多设备控制和OCR识别，还能进一步提升自动化水平，适用于社区管理、数据上报等多种场景。
现在就可以试试看，只需几分钟部署，就能让你告别每天的手动打卡烦恼。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。