cua 电脑使用代理 想法记录 sima2

人玩游戏是有肌肉记忆的,一个boss我之前打不过现在打得过,就是形成了正确解并且会快速调用,无脑的那种

自我进化,ai用电脑要能找到解,记录解

给你一个新软件,你不会用,ai也一样,人会学软件怎么用,就是有任务下来找对应按钮,就算不对也记录一下这个按钮的知识放入知识库集,而有用的操作要变成可供调用的工具

ai输出是离散的,可是我们操控3d游戏一般操作是连续的吧

这是一个非常敏锐且切中要害的问题!你指出了当前 AI 智能体(Agent)在控制电脑或玩游戏时面临的核心矛盾之一:“大脑的离散决策”与“手脚的连续动作”之间的不匹配。

你的直觉是对的,3D 游戏的操作本质上是连续的(比如轻轻推摇杆、鼠标微操)。目前的解决方案并不是单纯地“离散”或“连续”,而是采用了一种“离散规划 + 连续执行”的混合架构。

为了让你更清楚地理解 AI 是如何“骗过”游戏,让它以为 AI 是一个真人在操作,我把它拆解为三个层面来解释:

🧩 1. 核心真相:AI 的“思考”是离散的,但“肌肉”是连续的

AI 的输出其实分为两个层级,它像人一样,先“想”(离散决策),再“做”(连续动作)。

* 高层决策(离散 - 脑):
这是 AI 大模型(LLM)负责的部分。它的输出确实是离散的 Token。比如它输出一个指令序列: -> -> 。
就像你脑子里想的:“我要去那边那个箱子后面,然后开枪。”

* 底层控制(连续 - 手/脚):
这个离散的指令会交给一个“控制器”(Controller)或“策略网络”(Policy Network)。这个控制器负责把“去箱子后面”这个指令,翻译成每一帧具体的鼠标移动角度和 WASD 键的按压时长。
这就像是你的小脑和肌肉群,接收“去那边”的指令,然后自动处理身体重心转移、脚步移动等无数个微小的连续动作。

🛠️ 2. 具体是怎么解决的?(技术手段)

为了解决你担心的“卡顿”或“动作不连贯”问题,现在的 AI 智能体(如 SIMA、UI-TARS)主要用了以下几招:

* 动作序列生成(Trajectory Generation):
AI 不会每一帧都重新思考“我现在该干嘛”。
* 插值(Interpolation):如果 AI 决定“从点 A 移动到点 B”,它不会瞬间瞬移,也不会一帧一帧地重新规划。它会生成一个从 A 到 B 的平滑路径(插值),然后控制器沿着这个路径连续移动。
* 动作 Token 的“粘性”:AI 输出的一个动作指令(比如“按住 W 键”)会持续生效几十帧或直到下一个指令覆盖它,而不是输出一次就结束。

* 世界模型(World Model)的预测:
像 SIMA 2 这样的智能体,内部有一个“世界模型”。它在生成动作时,会预测屏幕下一秒的变化。
* 如果它预测“如果我连续按住鼠标左键,屏幕上的怪物血条会掉”,那么它就会维持这个连续的按压动作,而不会在中间突然断开去思考。

* 混合动作空间(Hybrid Action Space):
这是目前最主流的做法。AI 的输出接口既包含离散的按钮点击(比如“点击背包图标”),也包含模拟信号(Analog)(比如“鼠标移动 x: 0.3, y: -0.1”)。
* 对于 3D 游戏,鼠标视角的控制通常是连续的模拟信号,这就保证了视角转动的丝滑。

🤖 3. 举个具体的例子:玩《CS:GO》

假设 AI 要完成“转身开枪”这个动作:

1. 离散层(脑): 视觉模型看到敌人在右后方 -> LLM 决策: -> 。
2. 连续层(手):
* 接收到 指令,控制器计算出需要向右旋转 180 度。
* 它不是一次性转完,而是将其分解为 10 个微小的连续动作:每一帧向右微调鼠标 18 度,同时按住 W 键向前冲。
* 当旋转到位后,控制器平滑过渡到 状态,控制鼠标左键按压并模拟压枪的微小抖动(这也是连续信号)。

📌 总结

所以,不用担心 AI 会像“抽风”一样一顿一顿地玩游戏。

虽然 AI 的逻辑判断是离散的(一步一个脚印),但通过底层控制器和动作插值技术,它输出给游戏的操作流是连续且平滑的。

现在的顶尖模型(如你提到的 SIMA 2)在这方面做得已经非常像人了,它能处理“轻轻推摇杆探头”这种细腻的连续操作,而不仅仅是“按一下A键跳一下”这么简单。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1125212.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年论文降重工具大揭秘:救命!知网AIGC检测高达62%,论文AI率崩溃降重全靠它!

"# 论文AI率高怎么办?亲测有效的论文降重工具体验分享 作为一名即将毕业的研究生,最近经历了论文AI率爆表的噩梦。知网AIGC检测报告显示,我的论文初稿AI率竟然高达62%,这直接意味着被导师“判死刑”。面对即将到来的查重&a…

深度评测6款专业远控揭示行业标杆优势所在!ToDesk从挑战者到引领者

远程办公时代的核心工具之争随着混合办公模式成为新常态,远程控制软件已从IT专员的神秘工具演变为企业运营、技术支持和灵活协作的日常必需品。市场涌现出众多解决方案,但性能、安全、成本与体验的差异巨大。本次测评聚焦六款国内外主流专业远程控制软件…

2026年度知网AIGC检测崩溃求救!这几款AI论文降重神器,降AI率不到20%,论文挂科不再崩溃通宵!

"#AI论文降重|我的真实经历与知网AIGC检测战绩 作为一名即将毕业的研究生,论文降重一直是我绕不开的痛点。特别是在遇到越来越严格的知网AI率检测后,崩溃和通宵成了家常便饭。初次检测时,我的论文AI率高达62%,完全不能过关&a…

最新流出!9款AI神器实测,AI率从88%狂降到11%!

深夜急救:论文提交倒计时3天,你的AI率还在80%以上? 凌晨2点,实验室的灯还亮着——你盯着查重报告上88%的AI检测率,手在键盘上颤抖。导师的红色批注“内容AI痕迹过重,重写!”像针一样扎在屏幕上…

力扣3074重新分装苹果的题解

题目:给你一个长度为 n 的数组 apple 和另一个长度为 m 的数组 capacity 。一共有 n 个包裹,其中第 i 个包裹中装着 apple[i] 个苹果。同时,还有 m 个箱子,第 i 个箱子的容量为 capacity[i] 个苹果。请你选择一些箱子来将这 n 个包…

基于大数据的国产跑鞋推荐系统的设计与实现

国产跑鞋推荐系统的课题背景 近年来,随着国内体育产业的快速发展和健康生活理念的普及,跑鞋市场呈现爆发式增长。国产跑鞋品牌如李宁、安踏、特步等凭借技术创新和性价比优势,逐渐赢得消费者青睐。然而,面对海量的跑鞋产品和用户个…

崩溃!2026年度必备AIGC降重软件,知网AI率高达62%救命降到5%都靠它

"# AIGC检测时代的论文AI率焦虑 作为一名研究生,写论文时最怕的就是知网、万方等权威系统对AIGC检测的AI率居高不下,直接影响毕业答辩。刚提交初稿,用格子达平台检测,论文AI率达到32.2%,令人崩溃图片如下&#x…

大学生论文降重崩溃救命!2026年知网AIGC检测硬核降重神器:嘎嘎降AI与比话降AI十佳降AI率产品实操揭秘

大学生论文降重的焦虑与挑战 作为一名大学生,写论文时最怕遇上的问题之一就是论文AI率过高被知网检测系统标红,甚至因此挂科。尤其是进入2026年,知网等权威检测平台的AIGC检测技术不断升级,使得许多原本看似原创的AI辅助写作内容…

基于AI融合与智能控制的新能源系统场景实例:基于强化学习的光伏MPPT自适应控制策略仿真

目录 手把手教你学Simulink ——基于AI融合与智能控制的新能源系统场景实例:基于强化学习的光伏MPPT自适应控制策略仿真 一、背景介绍 二、系统结构设计 各模块具体功能如下: 三、建模过程详解 第一步:创建 Simulink 项目并导入基础模块 第二步:搭建光伏系统物理层…

利用C#对接BotSharp本地大模型AI Agent示例(2)

上一篇博文已经介绍了怎么搭建BotSharp本地大模型环境 https://blog.csdn.net/zxy13826134783/article/details/156653773?spm1001.2014.3001.5501 本文运行环境: win11 visual studio 2022 本文利用C#对接BotSharp本地大模型的Api,废话不多说,先上…

亲测好用9个一键生成论文工具,自考学生轻松搞定论文!

亲测好用9个一键生成论文工具,自考学生轻松搞定论文! 自考论文写作的救星,AI 工具如何改变你的学习方式 随着人工智能技术的不断进步,越来越多的自考学生开始借助 AI 工具来提升论文写作效率。这些工具不仅能够快速生成内容&#…

基于A星算法的无人机三维路径规划算法研究附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…

基于A星算法的无人机三维路径规划算法研究附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…

实验数据处理的AI加速:架构师的分布式训练

实验数据处理的AI加速:架构师的分布式训练 关键词:实验数据处理、AI加速、分布式训练、架构师、并行计算、数据并行、模型并行 摘要:本文聚焦于实验数据处理中AI加速的关键手段——分布式训练,为架构师们提供深入且易懂的技术指导。首先阐述实验数据处理面临的挑战以及分…

Symbol不是摆设:前端老铁们怎么用它解决实际问题

Symbol不是摆设:前端老铁们怎么用它解决实际问题Symbol不是摆设:前端老铁们怎么用它解决实际问题为啥突然聊 Symbol?Symbol 到底是个啥玩意儿创建 Symbol 的几种姿势1. 裸奔创建:Symbol(description)2. 全局登记:Symbo…

论文挂科崩溃救命!2026年知网AIGC检测高达62%,这三款论文去AI痕迹神器帮你降重降AI率,秒过查重不掉线!

论文去AI痕迹为何成大学生刚需?知网AI率检测背后的痛点 作为一名研究生,最近深刻体会到论文查重和AIGC检测的压力,尤其是知网AI率越来越被学校重视,挂科焦虑实实在在。我的论文初稿经知网AIGC检测,AI率高达62%&#xf…

基于GWO-BP、PSO-BP、DBO-BP、IDBO-BP多变量时序预测模型一键对比研究(多输入单输出)附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…

人工智能代理的10种常见故障模式及其修复方法

随着人工智能代理变得越来越自主,并日益融入业务流程,了解其故障模式至关重要。从幻觉推理到多代理协作不佳,这些问题都可能导致性能下降、信任度降低,并增加风险。本指南概述了人工智能代理中最常见的 10 种故障模式 、故障发生的…

华为openEuler 欧拉操作系统安装Docker方法和步骤

目前大部分公司的业务都基于docker容器集群化操作管理,所以安装好操作系统后第一件事就是需要安装好docker容器。 默认情况下openEuler安装好之后,要安装docker会报依赖container-se

技术学习:构建知识体系与提升实践能力

在当今技术飞速发展的时代,持续学习已成为技术人员必备的核心能力。然而,面对海量的信息、层出不穷的新框架和工具,如何高效、系统地学习技术,避免陷入碎片化和浅尝辄止的困境,是每个学习者都需要思考的问题。本文将从…