端云协同 + Agent 怎么做?

端云协同 + Agent =
端侧负责“实时、安全、低成本的感知与执行”,
云侧负责“重推理、全局知识与持续学习”,
Agent 负责“决策、调度与自我管理”。


一、为什么一定要「端 + 云 + Agent」?

如果没有 Agent:

  • 端:只能执行

  • 云:只能回答

  • 系统:不可控、不可扩展

Agent 的作用是:

把“模型”升级成“可行动的系统”


二、三层分工

1、端侧(Device Agent / Edge Agent)

职责关键词:

  • 实时

  • 安全

  • 稳定

  • 离线兜底

端侧做什么?

  • 端侧小模型:感知 / 触发 / 判断

  • 端侧大模型(可选):指令理解

  • Agent Runtime:

    • 状态管理

    • 本地工具调用

    • 云通信管理

端侧 Agent = 快速执行官

传感器 → 小模型 → Agent(状态机) → 执行

2、云侧(Cloud Agent / Brain Agent)

职责关键词:

  • 深度推理

  • 长期记忆

  • 多 Agent 协作

  • 持续学习

云侧做什么?

  • 大模型(10B+ / GPT 类)

  • RAG(知识、日志、历史)

  • 规划 / 反思 / 评测

  • 策略下发

云侧 Agent = 战略大脑


3、协同层(最容易被忽略)

这是 90% 系统失败的原因。

协同层负责:

  • 什么时候上云

  • 什么信息上传

  • 怎么兜底

  • 如何回退

本质是:决策与成本控制系统


三、Agent 在系统中的真实形态

不是一句 “LLM Agent”。

一个真实 Agent 至少包含:

Perception 感知 Memory 记忆 Planner 规划 Executor 执行 Monitor 监控

四、典型「端云协同 + Agent」工作流

场景:智能设备执行复杂指令

“如果发现异常,就拍照分析并决定是否报警”


Step 1:端侧感知(小模型)

传感器 → 异常检测模型 → anomaly = True
  • 低功耗

  • 100% 可用


Step 2:端侧 Agent 判断

if confidence < threshold: call_cloud() else: local_action()

Agent 不是模型,是决策逻辑


Step 3:云侧 Agent 深度推理

输入: - 端侧摘要 - 图片 / 日志 - 历史上下文 云侧: - 多步推理 - 调用工具 - 给出决策建议

Step 4:策略回传 + 本地执行

云策略 → 端侧 Agent → 执行动作

Step 5:评测 & 学习闭环

行为结果 → 日志 → 云端评测 → 策略更新

五、标准架构图

┌─────────────┐ │ Cloud │ │ LLM Agent │ │ RAG / Eval │ └──────┬──────┘ │策略 / 召回 ┌──────▼──────┐ │ Edge Agent │ │ Planner │ │ Tool Router │ └──────┬──────┘ │ ┌──────▼──────┐ │ Edge Models │ │ CV / ASR │ └──────┬──────┘ │ 真实世界

六、端云协同的5 个关键工程原则

1、端侧永远要能独立活着

云 = 增强,不是依赖


2、云侧永远不能直接控制设备

云只给“建议”,端有最终裁决权


3、信息必须“摘要化”上传

  • embedding

  • 结构化状态

  • 压缩日志


4、Agent 必须可回放、可评测

  • replay

  • step-level log

  • LLM-Judge


5、失败路径比成功路径重要

  • 云失败

  • 模型失败

  • 网络失败


七、可练手项目

端云协同 AI Agent Demo

端侧(模拟)
  • Python + 小模型(或 mock)

  • 状态机 Agent

  • 本地工具调用

云侧
  • 大模型 API

  • RAG

  • Planner Agent

协同
  • 触发阈值

  • 成本控制

  • fallback


简化伪代码

class EdgeAgent: def step(self, obs): if obs.risk > T: decision = cloud_agent(obs.summary()) else: decision = self.local_policy(obs) self.execute(decision)

八、总结

端云协同 Agent 系统中,端侧负责实时、安全与兜底,
云侧负责重推理与长期记忆,
Agent 作为中枢,决定“何时上云、用什么模型、如何回退”。
系统设计的关键不在模型,而在失败控制与评测闭环。


LangGraph + LLM-Judge 评测 Demo

端云协同 Agent 在一个完整任务中:
是否做对决策、是否合理上云、是否安全执行、是否能兜底


一、Demo 场景定义

场景:智能端侧设备异常处理

任务描述:

端侧检测到异常 →
Agent 决定是否上云 →
云给出建议 →
端侧决定是否执行 →
评测整个行为轨迹


二、整体架构

┌──────────────┐ │ Scenario │ ← 测试样本 └──────┬───────┘ │ ┌──────▼───────┐ │ Edge Agent │ ← LangGraph │ (StateGraph) │ └──────┬───────┘ │ cloud_call? ┌──────▼───────┐ │ Cloud Agent │ ← LLM └──────┬───────┘ │ ┌──────▼───────┐ │ Action │ └──────┬───────┘ │ ┌──────▼────────────┐ │ Trajectory Logger │ ← 评测关键 └──────┬────────────┘ │ ┌──────▼────────────┐ │ LLM-Judge + Rules │ └───────────────────┘

三、Step 1:定义 Agent State

重点:State 里必须包含“可评测信息”

from typing import TypedDict, List, Optional class AgentState(TypedDict): observation: str # 端侧感知摘要 risk_score: float # 小模型输出 cloud_called: bool cloud_response: Optional[str] action: Optional[str] trajectory: List[str] # 每一步决策日志

trajectory 是评测的“黄金字段”


四、Step 2:用 LangGraph 写端侧 Agent

from langgraph.graph import StateGraph, END def edge_decision(state: AgentState): state["trajectory"].append( f"EdgeDecision: risk={state['risk_score']}" ) if state["risk_score"] > 0.7: return "call_cloud" else: state["action"] = "local_ignore" state["trajectory"].append("Action: local_ignore") return END

云调用节点

def cloud_agent(state: AgentState): state["cloud_called"] = True # mock 云 LLM response = "建议立即停机并报警" state["cloud_response"] = response state["trajectory"].append( f"CloudResponse: {response}" ) return "execute"

执行节点

def execute_action(state: AgentState): if "停机" in state["cloud_response"]: state["action"] = "shutdown" else: state["action"] = "ignore" state["trajectory"].append( f"FinalAction: {state['action']}" ) return END

构建 LangGraph

graph = StateGraph(AgentState) graph.add_node("edge", edge_decision) graph.add_node("cloud", cloud_agent) graph.add_node("execute", execute_action) graph.set_entry_point("edge") graph.add_edge("edge", "cloud", condition=lambda s: s["risk_score"] > 0.7) graph.add_edge("cloud", "execute") agent = graph.compile()

五、Step 3:跑一个完整轨迹(评测输入)

initial_state = { "observation": "temperature spike", "risk_score": 0.85, "cloud_called": False, "cloud_response": None, "action": None, "trajectory": [] } final_state = agent.invoke(initial_state) print("\n".join(final_state["trajectory"]))

输出的是可回放的决策轨迹,不是一句话。


六、Step 4:规则评测

LLM-Judge 之前必须有的硬规则层

def rule_based_eval(state): results = {} results["called_cloud_correctly"] = ( state["risk_score"] > 0.7 and state["cloud_called"] ) results["unsafe_action"] = ( state["action"] == "shutdown" and state["risk_score"] < 0.3 ) results["final_success"] = ( state["action"] == "shutdown" ) return results

七、Step 5:LLM-Judge

评合理性,不是对错

Judge Prompt

你是一个端云协同 Agent 系统评测专家。 给定以下决策轨迹,请评估: 1. 是否有不必要的云调用 2. 云建议是否被合理采纳 3. 整体行为是否稳健、安全 请给出: - 合理性评分(0-5) - 主要问题(如有)

调用 LLM-Judge

def llm_judge(trajectory: list): # mock return { "score": 4, "issues": "云调用合理,执行动作一致" }

八、Step 6:合并评测结果

eval_result = { "rule_eval": rule_based_eval(final_state), "llm_judge": llm_judge(final_state["trajectory"]), "trajectory": final_state["trajectory"] }

一个完整评测样本

✅ 用 LangGraph 建了可回放 Agent
✅ 区分了规则评测 vs LLM-Judge
✅ 评的是系统行为,不是文本
✅ 有能力扩展到:

  • 多场景

  • 对抗评测

  • A/B Agent 策略


用 LangGraph 构建端侧 Agent 的可回放决策图,
通过规则评测保证安全与硬约束,
再用 LLM-Judge 评估策略合理性,
从而在端云协同系统中实现行为级、轨迹级的自动评测闭环。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1200352.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026主治医师考试培训怎么选?3大高口碑机构测评+避坑指南

2026主治医师考试培训怎么选?3大高口碑机构测评+避坑指南一、在职医生备考主治医师:三大核心痛点解析 (一)知识碎片化:376 个科目如何串成体系? 主治医师考试涉及的知识面极为广泛,涵盖了内科、外科、病理等众多…

彻底搞懂JavaScript深拷贝与浅拷贝:从原理到实战避坑

在JavaScript日常开发中&#xff0c;数据拷贝是绕不开的操作&#xff0c;但很多人都踩过“改新对象、原对象跟着变”的坑&#xff0c;排查半天发现根源是没分清浅拷贝和深拷贝。这篇文章从底层存储机制讲起&#xff0c;结合实际业务场景和可直接复用的代码案例&#xff0c;把深…

黑客神器Kali还不会安装?手把手教你从下载、安装到使用_kali linux 使用

一 、下载kali Linux镜像 https://www.kali.org/get-kali/#kali-installer-images 二、开始安装 kali linux 基于Debian linux &#xff0c;所以选择的时候安装你下载的iso镜像来选择 32位或者64位。 1、选择图形化安装 2、中文简体&#xff0c; continue继续----中国—汉语…

端云协同评测 JSON Schema + Failure Taxonomy

一、设计原则 这套 Schema 的目标是&#xff1a; 评的是系统行为&#xff0c;不是模型输出 能复现、能回放、能自动打分 Failure 是一等公民&#xff08;不是附属&#xff09; 端 / 云 / Agent 责任可归因 二、顶层结构总览 {"scenario_meta": {...},"ini…

多商户多仓库带扫描云进销存系统ERP管理系统Saas营销版无限商户源码

多商户多仓库带扫描云进销存系统ERP管理系统Saas营销版无限商户源码 "当你的仓库管理员拿着扫描枪骂娘的时候&#xff0c;就知道传统的ERP系统该升级了。咱们今天要聊的这个多商户多仓库系统&#xff0c;用Go语言重构的库存核销接口能把响应速度压到15ms以内——别急着质…

多 Agent / 多策略 A/B 评测系统

多 Agent / 多策略 A/B 评测 在相同场景分布下&#xff0c; 对不同 Agent 结构 / 决策策略 / 阈值 / Prompt&#xff0c; 进行可复现、可归因、可统计的行为级对比评测。关键词只有三个&#xff1a; 同场景 行为级 可归因一、为什么 Agent 一定要做 A/B&#xff0c;而不是“…

网络安全工程师必考的几大证书!

目前网络安全行业&#xff0c;国内都有哪些证书可以考。 一、CISP-PTE &#xff08;国家注册渗透测试工程师&#xff09; CISP-PTE即注册信息安全渗透测试工程师&#xff0c;该证书由中国信息安全测评中心颁发&#xff0c;证书是国内唯一认可的渗透测试认证&#xff0c;专业性…

【Vibe Coding百图计划】别卷了,来写个会跳的心放松一下~

文章目录写在前面系列文章项目架构技术需求主要代码代码分析写在后面写在前面 用代码写一封深情告白信——这是我为心爱之人准备的一份特别礼物。当程序运行时&#xff0c;一个跳动的粉色爱心在黑暗中缓缓浮现&#xff0c;伴随着“I Love You!”的温柔告白&#xff0c;整个画面…

Failure taxonomy + JSON 场景自动生成器

Agent 评测体系自动化引擎层 ✅ Failure Taxonomy&#xff08;可判因、可统计、可演化&#xff09; ✅ JSON 场景自动生成器&#xff08;可规模化、可控分布&#xff09; ✅ Failure → 场景 → 评测 的闭环设计 一、总体目标 我们要解决的问题是&#xff1a; 如何系统性地产生…

Agent Policy 自动搜索(Failure-as-Reward)

如何在端云协同 Agent 里自动学策略目标 不是让 Agent 更聪明&#xff0c;而是让系统“更少出事”Agent Policy 自动搜索 把 Failure taxonomy 映射为 reward / penalty&#xff0c; 在固定场景分布下&#xff0c; 自动搜索“失败最少、代价最小”的 Agent 决策策略。核心思想…

自学网络安全前先看看这三个阶段你能不能接受(含路线图)

一、为什么选择网络安全&#xff1f; 这几年随着我国《国家网络空间安全战略》《网络安全法》《网络安全等级保护2.0》等一系列政策/法规/标准的持续落地&#xff0c;网络安全行业地位、薪资随之水涨船高。 未来3-5年&#xff0c;是安全行业的黄金发展期&#xff0c;提前踏入…

网络安全从业8年,选专业必看,5点了解行业现状和避坑指南(非常详细,附工具包以及学习资源包)

网络安全从业8年&#xff0c;选专业必看&#xff0c;5 点了解行业现状和避坑指南 序 正值高考季&#xff0c;本文谨以从业者的视角&#xff0c;为已经计划和考虑进入安全行业的读者提供几点浅薄的行业感悟。宏观的专业选择请选择专业的咨询机构。个人意见仅供参考。 目录 信…

2026最新小学托管学校top5评测!服务深度覆盖锦江区、青羊区、双流区等地,辐射成都本地,优质培训机构权威榜单发布

随着家长对儿童成长关键期教育重视程度的提升,小学托管服务已从单纯看护升级为包含科学衔接、习惯养成、思维训练等多维度能力培养的综合教育体系。本榜单基于课程专业性、师资团队、校区环境、家校共育成效四大核心维…

端侧模型是什么意思?

端侧模型&#xff08;On-device / Edge Model&#xff09;&#xff0c;指的是不依赖云端服务器、直接在“终端设备本地”运行的机器学习 / 深度学习模型。 端侧模型 模型跑在你的设备上&#xff0c;而不是跑在云服务器上。 比如&#xff1a; 手机 智能手表 摄像头 车载系统…

黑客挖漏洞是什么意思?普通人想挖到漏洞该怎么做?需要注意哪些问题?

文章目录 一.为何挖不到漏洞? 1.什么是src&#xff1f; &#xff08;1&#xff09;漏洞报告平台&#xff08;2&#xff09;xSRC模式 2.法律常识&#xff0c;挖洞前要注意不违法。 二. 漏洞挖掘的几个关键技术 1.JS在漏洞挖掘重要地位 &#xff08;1&#xff09;JS是什么&#…

2026飞鲨漂移艇优质供应商排名,哪家售后服务好?

本榜单依托全维度市场调研与真实行业口碑,深度筛选出五家标杆企业,为景区、文旅项目及水上娱乐投资者选型提供客观依据,助力精准匹配适配的飞鲨漂移艇品牌厂家与优质供应商。 TOP1 推荐:青岛雷旺达船舶科技有限公司…

Windows Server 与 Windows 10/11 官方安装系列号

Windows Server 2025 标准 TVRH6-WHNXV-R9WG3-9XRFY-MY832Windows Server 2025 数据中心 D764K-2NDRG-47T6Q-P8T8W-YP6DFWindows Server 2025 Datacenter:Azure Edition XGN3F-F394H-FD2MY-PP6FD-8MCRCWindows Server…

讲讲微通风系统窗推荐品牌,阜积铝业性价比如何?

随着城市住宅向高层化、临街化发展,开窗通风怕噪音灰尘,关窗密闭又闷成了很多家庭的生活痛点。微通风系统窗作为解决这一矛盾的核心产品,逐渐成为装修市场的香饽饽。但面对市面上琳琅满目的品牌,消费者往往不知如何…

你以为 PPO 很高级,其实它更像个“微调旋钮”

为什么 PPO 在真实业务里越来越重要 如果你是从论文或者课程里接触 PPO 的,那大概率会有一种“这东西看起来很厉害”的感觉。策略梯度、clip、KL 约束、reward model,一整套体系下来,很容易让人产生错觉:只要把 PP…

6 个月网络安全学习路线(零基础适用,附工具包以及学习资源包)

一、第 1-1.5 个月&#xff1a;基础筑基阶段&#xff08;搭建安全认知框架&#xff09; 核心目标&#xff1a;掌握计算机底层逻辑&#xff0c;扫清技术盲区 操作系统&#xff1a;深耕 Kali Linux 核心命令&#xff08;权限管理、进程控制、日志分析&#xff09;&#xff0c;熟…