Open-AutoGLM网络配置:云服务器防火墙端口开放设置教程

Open-AutoGLM网络配置:云服务器防火墙端口开放设置教程

1. 引言

1.1 技术背景与应用场景

Open-AutoGLM 是智谱开源的一款面向手机端的 AI Agent 框架,旨在通过多模态理解与自动化操作能力,实现自然语言驱动的智能设备控制。其核心项目 AutoGLM-Phone 和 Phone Agent 均基于视觉语言模型(VLM)构建,能够实时感知安卓屏幕内容,并结合 ADB(Android Debug Bridge)完成点击、滑动、输入等操作。

用户只需用自然语言下达指令,如“打开小红书搜索美食”或“关注抖音号为 dycwo11nt61d 的博主”,系统即可自动解析意图、识别界面元素、规划执行路径并完成任务。该框架特别适用于自动化测试、辅助操作、远程控制以及低代码机器人流程自动化(RPA)场景。

1.2 网络通信架构概述

在实际部署中,Open-AutoGLM 通常采用客户端-服务端分离架构

  • 本地客户端:运行在开发者电脑上,负责 ADB 设备连接、屏幕截图采集和动作下发。
  • 云端服务端:部署在云服务器上,运行 vLLM 或其他推理引擎,提供大模型 API 接口(如/v1/completions)。

两者通过 HTTP 协议进行通信,客户端将截图和指令发送至云端模型,接收结构化动作指令后在本地执行。因此,确保云服务器的指定端口对外可访问是整个系统正常运行的前提。


2. 云服务器防火墙配置详解

2.1 防火墙基本概念

云服务器默认启用防火墙机制以保障安全,常见的包括:

  • 安全组(Security Group):云平台层面的虚拟防火墙规则,控制进出实例的流量。
  • 系统级防火墙(如 firewalld、ufw):操作系统内部的防火墙服务,进一步过滤网络请求。

若未正确配置,即使模型服务已启动,本地客户端也无法通过公网 IP 访问,导致连接超时或被拒绝。

2.2 获取服务监听信息

首先确认你的模型服务正在监听的地址和端口。以使用 vLLM 启动为例:

python -m vllm.entrypoints.openai.api_server \ --host 0.0.0.0 \ --port 8800 \ --model zhipu/autoglm-phone-9b

关键参数说明:

  • --host 0.0.0.0:表示服务绑定到所有网络接口,允许外部访问。
  • --port 8800:指定服务端口,后续需在防火墙中放行此端口。

可通过以下命令验证服务是否就绪:

curl http://localhost:8800/v1/models

预期返回包含模型信息的 JSON 响应。


3. 安全组规则配置(以主流云厂商为例)

3.1 阿里云 ECS 安全组设置

  1. 登录 阿里云控制台。
  2. 进入目标实例详情页,点击“安全组”标签。
  3. 点击“配置规则” → “添加安全组规则”。
  4. 添加入方向规则:
参数
授权策略允许
协议类型自定义 TCP
端口范围8800/8800
授权对象0.0.0.0/0(或限制为开发机公网 IP)

建议:生产环境避免使用0.0.0.0/0,应限定为可信 IP 地址段。

  1. 保存规则。

3.2 腾讯云 CVM 安全组设置

  1. 登录 腾讯云控制台。
  2. 找到对应云服务器,进入“安全组”页面。
  3. 点击“入站规则” → “添加规则”。

配置如下:

  • 协议:TCP
  • 端口:8800
  • 来源:0.0.0.0/0 或指定 IP
  • 策略:允许

提交后等待几秒生效。

3.3 AWS EC2 安全组设置

  1. 登录 AWS 控制台,进入 EC2 服务。
  2. 在左侧导航栏选择“Security Groups”。
  3. 选中实例关联的安全组,点击“Edit inbound rules”。
  4. 添加新规则:
Type: Custom TCP Protocol: TCP Port range: 8800 Source: 0.0.0.0/0

保存更改。


4. 操作系统级防火墙配置

4.1 Ubuntu 使用 ufw

Ubuntu 默认可能启用ufw(Uncomplicated Firewall),需手动放行端口:

# 查看当前状态 sudo ufw status # 开放 8800 端口 sudo ufw allow 8800/tcp # 可选:仅允许特定 IP 访问(更安全) sudo ufw allow from 192.168.1.100 to any port 8800 proto tcp # 重新加载规则 sudo ufw reload

4.2 CentOS/RHEL 使用 firewalld

CentOS 系统常用firewalld管理防火墙:

# 查看当前区域 firewall-cmd --get-active-zones # 永久开放 8800 端口(假设使用 public 区域) sudo firewall-cmd --zone=public --add-port=8800/tcp --permanent # 重载配置 sudo firewall-cmd --reload # 验证端口是否开放 sudo firewall-cmd --list-ports | grep 8800

4.3 验证端口可达性

从本地电脑测试端口连通性:

telnet <云服务器公网IP> 8800

或使用nc

nc -zv <云服务器公网IP> 8800

如果提示“Connection refused”或超时,则说明防火墙仍存在拦截。


5. 客户端与真机连接(本地电脑)

5.1 硬件与环境准备

  • 操作系统:Windows / macOS
  • Python 版本:建议 Python 3.10+
  • 安卓设备:Android 7.0+ 手机或模拟器
  • ADB 工具:Android SDK Platform Tools
ADB 环境变量配置

Windows

  1. 下载 Platform Tools 并解压。
  2. Win + R输入sysdm.cpl→ 高级 → 环境变量。
  3. 在“系统变量”中的Path添加 ADB 解压路径(如C:\platform-tools)。
  4. 打开命令行输入adb version验证安装成功。

macOS

在终端执行:

# 替换为实际路径 export PATH=${PATH}:~/Downloads/platform-tools

可将其写入~/.zshrc~/.bash_profile实现持久化。


6. 手机端设置

6.1 开启开发者模式与调试

  1. 进入手机“设置” → “关于手机” → 连续点击“版本号”7次,启用开发者选项。
  2. 返回设置主菜单 → “开发者选项” → 启用“USB 调试”。
  3. 若提示授权,确认电脑指纹并允许调试。

6.2 安装 ADB Keyboard(可选但推荐)

用于文本输入支持:

  1. 下载 ADB Keyboard APK 并安装。
  2. 进入“语言与输入法”设置 → 当前输入法 → 切换为“ADB Keyboard”。

这样可通过 ADB 发送中文字符,避免原生输入法干扰。


7. 部署控制端代码(Open-AutoGLM)

在本地电脑执行以下步骤:

# 1. 克隆仓库 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 2. 安装依赖 pip install -r requirements.txt pip install -e .

确保phone_agent包正确安装,且能导入模块。


8. 连接设备方式

8.1 USB 连接方式

  1. 使用数据线连接手机与电脑。
  2. 执行命令查看设备状态:
adb devices

输出示例:

List of devices attached ABCDEF1234567890 device

若显示unauthorized,请在手机上确认调试授权。

8.2 WiFi 远程连接方式

适用于无线调试或远程部署:

# 1. 先通过 USB 连接,开启 TCP/IP 模式 adb tcpip 5555 # 2. 断开 USB,获取手机 IP(可在设置 → WLAN 中查看) adb connect 192.168.x.x:5555

连接成功后,adb devices将显示 IP 地址形式的设备。


9. 启动 AI 代理

9.1 命令行运行示例

Open-AutoGLM根目录下执行:

python main.py \ --device-id ABCDEF1234567890 \ --base-url http://<云服务器公网IP>:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"

参数说明:

  • --device-id:来自adb devices输出的设备标识。
  • --base-url:必须指向云服务器的公网 IP 和映射端口(如http://47.98.123.45:8800/v1)。
  • 最后字符串:自然语言指令,支持复杂语义表达。

9.2 Python API 远程连接示例

from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备 success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出已连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}") # 在 USB 设备上启用 TCP/IP success, message = conn.enable_tcpip(5555) ip = conn.get_device_ip() print(f"设备 IP: {ip}") # 断开连接 conn.disconnect("192.168.1.100:5555")

可用于集成到自定义控制面板或 Web UI 中。


10. 常见问题排查

10.1 连接被拒绝(Connection Refused)

可能原因:

  • 云服务器未开放对应端口(检查安全组)
  • 模型服务未监听0.0.0.0
  • 系统防火墙未放行端口

解决方法:

  1. 确认服务启动命令包含--host 0.0.0.0
  2. 检查安全组和系统防火墙是否放行端口
  3. 使用netstat -tuln | grep 8800确认端口监听状态

10.2 ADB 掉线频繁

可能原因:

  • WiFi 信号不稳定
  • 手机休眠或断开调试

建议:

  • 使用 USB 线连接进行稳定性测试
  • 设置手机“不锁定屏幕”或使用“保持唤醒”功能

10.3 模型响应乱码或无响应

可能原因:

  • vLLM 启动参数错误(如max_model_len不匹配)
  • 显存不足导致推理失败
  • 输入图像尺寸超出模型处理范围

建议:

  • 检查日志输出是否有 CUDA OOM 错误
  • 调整--max-model-len至合理值(如 4096)
  • 确保截图分辨率适配(建议 720p~1080p)

11. 总结

本文系统讲解了 Open-AutoGLM 框架在云服务器部署过程中,如何正确配置防火墙与端口开放,确保本地客户端能顺利调用远程 AI 模型服务。我们覆盖了从云平台安全组设置、操作系统防火墙配置,到 ADB 连接、控制端部署及常见问题排查的完整链路。

关键要点总结如下:

  1. 服务必须绑定0.0.0.0才能接受外部请求
  2. 云服务器安全组和系统防火墙均需放行目标端口
  3. 推荐使用固定端口(如 8800)并限制访问来源 IP 提升安全性
  4. ADB 支持 USB 与 WiFi 两种连接模式,后者便于远程开发
  5. 通过telnetnc工具可快速验证端口连通性

只要严格按照上述步骤操作,即可顺利完成 Open-AutoGLM 的跨网络部署,实现真正的“远端模型 + 本地执行”的智能代理架构。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1175608.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qwen3Guard-Gen支持流式审核?与Stream版本对比实战

Qwen3Guard-Gen支持流式审核&#xff1f;与Stream版本对比实战 1. 引言&#xff1a;安全审核模型的演进需求 随着大语言模型在开放场景中的广泛应用&#xff0c;内容安全成为不可忽视的核心议题。传统批量式安全审核机制在面对实时对话、流式生成等交互场景时&#xff0c;往往…

YOLOv9 weights=‘‘ 空值含义:从零开始训练配置说明

YOLOv9 weights 空值含义&#xff1a;从零开始训练配置说明 在使用 YOLOv9 进行模型训练时&#xff0c;weights 是一个常见但容易被误解的参数配置。尤其是在官方提供的训练与推理镜像中&#xff0c;这一设置频繁出现在从头训练&#xff08;scratch training&#xff09;的命令…

零基础教程:用DeepSeek-R1-Distill-Qwen-1.5B搭建智能问答系统

零基础教程&#xff1a;用DeepSeek-R1-Distill-Qwen-1.5B搭建智能问答系统 1. 引言 1.1 学习目标 本文旨在为零基础开发者提供一套完整、可落地的实践指南&#xff0c;帮助你从零开始在本地环境中部署 DeepSeek-R1-Distill-Qwen-1.5B 模型&#xff0c;并基于该模型构建一个具…

电商订单查询如何提速?SGLang结构化输出实战

电商订单查询如何提速&#xff1f;SGLang结构化输出实战 1. 引言&#xff1a;电商场景下的大模型响应挑战 在现代电商平台中&#xff0c;用户对服务响应速度的要求日益提高。尤其是在订单查询、物流追踪、售后咨询等高频交互场景中&#xff0c;系统不仅要快速返回结果&#x…

GLM-4.6V-Flash-WEB金融科技:票据识别与反欺诈应用

GLM-4.6V-Flash-WEB金融科技&#xff1a;票据识别与反欺诈应用 1. 技术背景与应用场景 随着金融行业数字化进程的加速&#xff0c;传统纸质票据仍广泛存在于信贷审批、保险理赔、财务报销等业务流程中。如何高效、准确地从复杂格式的票据图像中提取关键信息&#xff0c;并识别…

中文逆文本标准化全攻略|利用科哥开发的FST ITN-ZH镜像高效处理

中文逆文本标准化全攻略&#xff5c;利用科哥开发的FST ITN-ZH镜像高效处理 在语音识别&#xff08;ASR&#xff09;系统的实际落地过程中&#xff0c;一个常被忽视却至关重要的环节是逆文本标准化&#xff08;Inverse Text Normalization, ITN&#xff09;。当用户说出“二零…

FSMN-VAD与WebSocket实时通信:在线检测服务构建

FSMN-VAD与WebSocket实时通信&#xff1a;在线检测服务构建 1. 引言 随着语音交互技术的普及&#xff0c;语音端点检测&#xff08;Voice Activity Detection, VAD&#xff09;作为语音识别系统中的关键预处理环节&#xff0c;其重要性日益凸显。传统VAD方法在高噪声环境或长…

Qwen2.5-7B智能搜索增强:语义理解与结果优化

Qwen2.5-7B智能搜索增强&#xff1a;语义理解与结果优化 1. 技术背景与核心价值 随着大语言模型在自然语言处理领域的广泛应用&#xff0c;传统关键词匹配的搜索方式已难以满足用户对精准、上下文感知和语义化信息获取的需求。Qwen2.5-7B-Instruct 作为通义千问系列中经过指令…

亲测腾讯混元翻译模型,网页一键启动太方便了

亲测腾讯混元翻译模型&#xff0c;网页一键启动太方便了 1. 引言&#xff1a;从“能用”到“好用”的翻译体验跃迁 在跨语言交流日益频繁的今天&#xff0c;机器翻译已不再是科研实验室中的抽象概念&#xff0c;而是切实影响着教育、政务、医疗和文化传播的实际工具。然而&am…

Qwen3-1.7B安全指南:云端临时环境比本地更防数据泄露

Qwen3-1.7B安全指南&#xff1a;云端临时环境比本地更防数据泄露 你是不是也遇到过这样的困扰&#xff1a;在医疗行业工作&#xff0c;手头有一些需要分析的脱敏患者数据&#xff0c;想用大模型辅助做些文本归纳、趋势预测或报告生成&#xff0c;但又担心把数据放到本地电脑上…

零基础入门UART协议数据帧硬件解析过程

从电平跳变到数据还原&#xff1a;手把手拆解UART数据帧的硬件解析全过程你有没有过这样的经历&#xff1f;在开发板上按下按键&#xff0c;串口助手突然跳出一个字符&#xff1b;示波器探头一接&#xff0c;屏幕上跑出一串整齐的高低电平——但你看得懂它到底“说”了什么吗&a…

Qwen3-0.6B教育场景落地:智能批改系统搭建教程

Qwen3-0.6B教育场景落地&#xff1a;智能批改系统搭建教程 1. 引言 随着大语言模型在自然语言理解与生成能力上的持续突破&#xff0c;其在教育领域的应用正逐步从理论探索走向实际落地。尤其是在作业批改、作文评分、错题分析等高频教学场景中&#xff0c;自动化、智能化的辅…

CAM++负载均衡:多实例部署下的流量分配策略

CAM负载均衡&#xff1a;多实例部署下的流量分配策略 1. 引言 1.1 业务背景与挑战 随着语音识别和声纹验证技术在金融、安防、智能客服等领域的广泛应用&#xff0c;对高可用、高性能的说话人识别系统需求日益增长。CAM 作为一款基于深度学习的高效说话人验证模型&#xff0…

Qwen3-VL-2B-Instruct WebUI美化升级:前端定制部署教程

Qwen3-VL-2B-Instruct WebUI美化升级&#xff1a;前端定制部署教程 1. 引言 1.1 项目背景与技术定位 随着多模态大模型的快速发展&#xff0c;视觉语言模型&#xff08;Vision-Language Model, VLM&#xff09;正逐步从研究走向实际应用。Qwen3-VL系列作为通义千问在多模态理…

Z-Image-Turbo校服细节生成:人物服饰准确性实战验证

Z-Image-Turbo校服细节生成&#xff1a;人物服饰准确性实战验证 1. 引言&#xff1a;AI图像生成中的人物服饰挑战 在当前AI图像生成技术快速发展的背景下&#xff0c;人物形象的生成已成为广泛应用场景中的核心需求之一。无论是虚拟角色设计、教育宣传素材制作&#xff0c;还…

Unsloth游戏NPC:用微调模型打造智能角色对话系统

Unsloth游戏NPC&#xff1a;用微调模型打造智能角色对话系统 1. 技术背景与应用价值 在现代游戏开发中&#xff0c;非玩家角色&#xff08;NPC&#xff09;的智能化水平直接影响用户体验。传统的NPC对话系统多基于预设脚本或有限状态机&#xff0c;缺乏上下文理解能力和个性化…

Z-Image-Turbo一文详解:与其他蒸馏模型的速度对比

Z-Image-Turbo一文详解&#xff1a;与其他蒸馏模型的速度对比 Z-Image-Turbo是阿里巴巴通义实验室开源的高效AI图像生成模型&#xff0c;作为Z-Image的蒸馏版本&#xff0c;它在保持高质量图像输出的同时&#xff0c;显著提升了推理速度。该模型仅需8步即可完成图像生成&#…

未来AI工作流:Z-Image-Turbo与LangChain集成部署前瞻

未来AI工作流&#xff1a;Z-Image-Turbo与LangChain集成部署前瞻 1. 技术背景与集成动因 近年来&#xff0c;生成式AI在图像和语言两个模态上取得了突破性进展。阿里通义实验室推出的Z-Image-Turbo模型以其高效的推理速度和高质量的图像生成能力&#xff0c;在WebUI层面实现了…

DeepSeek-OCR部署案例:法院卷宗电子化系统

DeepSeek-OCR部署案例&#xff1a;法院卷宗电子化系统 1. 背景与需求分析 随着司法信息化建设的不断推进&#xff0c;各级法院面临大量纸质卷宗的数字化处理压力。传统的人工录入方式效率低、成本高、错误率高&#xff0c;难以满足现代智慧法院对数据可检索、可管理、可追溯的…

Llama3-8B科研写作助手:学术场景应用部署完整指南

Llama3-8B科研写作助手&#xff1a;学术场景应用部署完整指南 1. 引言 1.1 科研写作的智能化需求 在当前人工智能快速发展的背景下&#xff0c;科研人员面临日益增长的文本生成、文献综述撰写、实验设计描述与论文润色等任务。传统手动写作方式效率低、重复性高&#xff0c;…