Open-AutoGLM中文乱码怎么办？终极解决方案

1. 问题背景与核心挑战

1.1 Open-AutoGLM 的定位与意义

Open-AutoGLM 是由智谱AI推出的开源手机端AI Agent框架，基于视觉语言模型（VLM）实现对安卓设备的自动化操作。用户只需输入自然语言指令，如“打开小红书搜索美食”，系统即可通过ADB自动完成截图分析、意图理解、动作规划和执行全流程。

该框架支持多语言环境，尤其在中文场景下具有广泛的应用潜力。然而，在实际部署过程中，部分用户反馈在执行涉及中文输入的任务时，出现文本乱码、字符替换、输入失败等问题，严重影响了使用体验和任务成功率。

这类问题并非模型本身能力缺陷，而是输入法、编码处理、系统配置等多环节协同不当所致。本文将深入剖析中文乱码的根本原因，并提供一套可落地的终极解决方案。

2. 中文乱码的本质原因分析

2.1 ADB Keyboard 的工作机制

Open-AutoGLM 依赖ADB Keyboard实现文本输入功能。其工作原理是：

ADB 发送input text命令携带待输入字符串
设备上的 ADB Keyboard 接收命令并触发 Android 输入法服务（IME）
IME 将接收到的字符串作为“虚拟按键”注入当前应用

关键点在于：ADB Keyboard 本质上是一个无界面的输入法插件，它不进行字符编码转换，仅负责转发原始字符串。因此，若传入的字符串编码格式与目标应用或系统不一致，就会导致乱码。

2.2 常见乱码类型及成因

乱码现象	可能原因
显示为`????`或 ``	字符集不支持，UTF-8 编码未正确传递
出现拼音或英文替代汉字	输入法切换错误，非 ADB Keyboard 主动输入
部分汉字正常，部分异常	字符截断、转义错误或缓冲区溢出
完全无法输入	ADB Keyboard 未设为默认输入法或服务未启用

2.3 根本性技术瓶颈

Python 默认编码差异
Windows 系统默认使用cp1252或gbk编码，而 ADB 要求 UTF-8 编码传输中文。
ADB 命令行参数解析限制
某些 shell 环境（如 PowerShell）对 Unicode 参数处理存在兼容性问题。
ADB Keyboard 版本兼容性
旧版 ADB Keyboard 对长文本或多字节字符支持不佳。
模型输出后处理缺失
AutoGLM 模型生成的操作指令中包含中文文本时，若未做 URL 编码或转义处理，直接拼接到 ADB 命令中易出错。

3. 终极解决方案：五步彻底解决中文乱码

3.1 步骤一：确保 ADB Keyboard 正确安装与激活

首先确认 ADB Keyboard 已正确安装并设置为默认输入法。

# 下载最新版本 APK（推荐从 GitHub Release 获取） curl -O https://github.com/senzhk/ADBKeyBoard/releases/latest/download/ADBKeyboard.apk # 安装到设备 adb install -r ADBKeyboard.apk # 启用输入法 adb shell ime enable com.android.adbkeyboard/.AdbIME # 设置为默认输入法 adb shell ime set com.android.adbkeyboard/.AdbIME # 验证是否生效 adb shell settings get secure default_input_method

预期输出：com.android.adbkeyboard/.AdbIME

若输出不符，请重复上述步骤，并重启设备。

3.2 步骤二：统一使用 UTF-8 编码运行 Python 环境

在调用main.py前，必须强制指定 Python 使用 UTF-8 编码。

Windows 用户（PowerShell）

# 设置环境变量 $env:PYTHONIOENCODING = "utf-8" $env:PYTHONUTF8 = "1" # 执行脚本 python main.py ` --device-id YOUR_DEVICE_ID ` --base-url http://YOUR_SERVER:8000/v1 ` --model "autoglm-phone-9b" ` "打开微信并发送消息：你好，今天天气真好！"

macOS / Linux 用户（Bash）

export PYTHONIOENCODING=utf-8 export PYTHONUTF8=1 python main.py \ --device-id YOUR_DEVICE_ID \ --base-url http://YOUR_SERVER:8000/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索‘美食推荐’"

提示：PYTHONUTF8=1强制 Python 3.7+ 使用 UTF-8 模式运行，避免 locale 相关编码问题。

3.3 步骤三：修改源码以支持安全中文传输

Open-AutoGLM 当前版本在处理中文输入时未进行充分编码保护。建议修改phone_agent/input.py文件中的输入逻辑。

修改前（存在风险）：

def send_text(text): adb_command(f"input text {text}")

修改后（推荐方案）：

import urllib.parse import subprocess def send_text(text): # 使用 URL 编码防止特殊字符破坏命令 encoded_text = urllib.parse.quote(text) # 使用 shell=True 并显式指定编码 command = f"adb shell am broadcast -a ADB_INPUT_TEXT --es msg '{encoded_text}'" subprocess.run(command, shell=True, encoding='utf-8', check=True)

说明：此方式绕过传统input text命令，改用广播机制发送文本，更稳定且支持完整 UTF-8。

你也可以使用社区维护的补丁版本仓库：

git clone https://github.com/community-patch/Open-AutoGLM-fix-chinese.git cd Open-AutoGLM-fix-chinese pip install -e .

3.4 步骤四：优化模型服务启动参数

确保 vLLM 启动时正确处理多语言内容。以下是推荐的启动命令：

python3 -m vllm.entrypoints.openai.api_server \ --served-model-name autoglm-phone-9b-multilingual \ --allowed-local-media-path / \ --mm-encoder-tp-mode data \ --mm_processor_cache_type shm \ --mm_processor_kwargs "{\"max_pixels\":5000000}" \ --max-model-len 25480 \ --chat-template-content-format string \ --limit-mm-per-prompt "{\"image\":10}" \ --model zai-org/AutoGLM-Phone-9B-Multilingual \ --port 8000 \ --dtype auto \ --gpu-memory-utilization 0.9 \ --max-num-seqs 4

重点参数解释：

--dtype auto：自动选择精度，提升推理效率
--gpu-memory-utilization 0.9：提高显存利用率，避免 OOM
--max-num-seqs 4：允许多任务并发，提升响应速度

3.5 步骤五：使用 API 模式替代命令行传参

为避免 shell 对中文参数的解析错误，推荐使用 Python API 方式调用，完全控制编码流程。

from phone_agent import PhoneAgent from phone_agent.model import ModelConfig import os # 强制 UTF-8 编码 os.environ["PYTHONIOENCODING"] = "utf-8" os.environ["PYTHONUTF8"] = "1" # 配置模型服务地址 model_config = ModelConfig( base_url="http://localhost:8000/v1", model_name="autoglm-phone-9b-multilingual", ) # 创建代理实例 agent = PhoneAgent( model_config=model_config, device_id="your_device_id_or_ip:5555" # 如通过WiFi连接 ) # 执行含中文指令的任务 task = "打开淘宝，搜索‘冬季羽绒服男款’，按销量排序" result = agent.run(task) print("任务执行结果：", result)

这种方式完全规避了命令行编码问题，是最可靠的生产级用法。

4. 验证与测试方法

4.1 快速验证 ADB 中文输入能力

在修复完成后，可通过以下命令直接测试中文输入：

# 方法一：使用 input text（基础测试） adb shell input text "测试中文输入功能" # 方法二：使用广播方式（推荐） adb shell am broadcast -a ADB_INPUT_TEXT --es msg "你好，世界！"

打开任意输入框（如微信聊天窗口），观察是否能正常显示中文。

4.2 完整端到端测试案例

编写一个测试脚本test_chinese.py：

from phone_agent import PhoneAgent from phone_agent.model import ModelConfig import time import os os.environ["PYTHONIOENCODING"] = "utf-8" os.environ["PYTHONUTF8"] = "1" model_config = ModelConfig( base_url="http://localhost:8000/v1", model_name="autoglm-phone-9b-multilingual", ) agent = PhoneAgent(model_config=model_config) tasks = [ "打开美团App", "搜索附近的川菜馆", "查看评分最高的店铺详情", "复制店铺电话号码" ] for task in tasks: print(f"\n执行任务：{task}") try: result = agent.run(task, timeout=120) print("✅ 成功") except Exception as e: print(f"❌ 失败：{str(e)}") time.sleep(5)

运行该脚本，观察所有任务是否顺利执行且无乱码。