当游戏NPC有了“灵魂”,网易伏羲解码游戏智能交互场景新实践

news/2025/10/11 15:54:21/文章来源:https://www.cnblogs.com/wyfx/p/19135233

全球AI产业正经历深刻的技术范式转变,行业不仅关注基于通用模型的应用搭建,也愈发关注如何构建真正符合产业需求的模型能力体系,其中,“后训练”技术(Post-Training)至关重要。2025云栖大会《大模型后训练:打造企业专属智能引擎》论坛汇聚行业顶尖后训练专家,聚焦Data、Evaluation、Reward、Scaling、Infra五大关键要素,深入探讨后训练在真实场景中的关键技术瓶颈、方法论演进与行业实践范式。

会上,网易伏羲语言智能组负责人张荣升带来题为 《网易伏羲在游戏智能交互场景的应用实践》的演讲,系统展现了大模型后训练技术如何打破传统NPC(Non-Player Character,非玩家角色)的交互局限,为游戏世界注入更具生命力的智能交互体验。

wechat_2025-10-11_154225_629

1、游戏智能NPC:从“提线木偶”到“有灵魂的居民”

NPC作为游戏交互的关键载体,不仅承担推动剧情发展、丰富游戏世界的功能,还能提升玩家的游戏沉浸感。传统NPC依赖策划预设的固定脚本运行,行为逻辑单一、交互深度有限,虽然开发成本低,但游戏体验易陷入同质化;而智能NPC能依据游戏环境的动态变化自主决策,让玩家每一次交互都充满新鲜感,其主要开发成本集中于模型推理环节。张荣升认为,传统NPC是游戏里的提线木偶,智能NPC则是游戏世界里有灵魂的居民

智能NPC背后,是一套以AI为核心驱动的Agent技术架构。智能NPC被定义为具备感知、认知、决策与记忆能力的Agent,通过跟游戏环境不断交互,来影响游戏世界。这些能力的打造离不开AI后训练。例如,结合不同游戏的专属设定进行后训练,确保NPC行为与游戏场景高度契合;针对高表现力NPC的个性化需求,团队为定制NPC做模型的后训练;面对海量玩家带来的服务部署压力,团队综合考量全链路部署成本等因素,通过“大模型蒸馏小模型+后训练”的策略满足服务性能。

2、《新倩女幽魂》端游:会“讨价还价”的家臣系统

《新倩女幽魂》端游的家臣系统中,玩家可招募家园NPC作为家臣,NPC则会综合参考自身基准薪资、与玩家的关系亲疏及自身出身背景等信息,最终判断是否接受玩家报价。例如,NPC基准薪资为1000文,若玩家出价900文会被明确拒绝,而出价950文则会经过思考后应允。招募完成后,玩家与NPC的交互进一步深化:既可以开展日常对话,也能向NPC索要游戏道具,但NPC并非 “有求必应”,其回应会根据玩家态度、双方实时关系等游戏状态动态调整。这种“讨价还价”背后,是针对游戏场景的AI预训练与后训练在精准调控。

该系统涵盖意图识别、任务分发、决策生成以及对话生成等核心能力,围绕游戏智能NPC场景,在基座大模型上做后训练以满足智能体交互的需求。以意图识别为例,训练数据覆盖《新倩女幽魂》中索要物品、交易协商等行为,团队在数据构建中既注重不同场景的均衡性,又根据模型Bad Case持续迭代优化,同时通过 “模型标注+人工标注” 的方式确保数据的准确性

此外,团队在决策环节创新性地引入了CoT(思维链),不仅让NPC的决策过程更易被玩家理解,还能为对话场景提供支撑。比如,当玩家试图用“双倍薪资”策反其他玩家的NPC时,NPC会思考决策,并通过对话模型和心理状态描写呈现给玩家,让玩家清晰感知到NPC的“权衡”与“妥协”。为避免小模型对话与决策 “言行不一”,团队采用对比训练:相同上下文给定不同决策结果,由能力更强的基座模型生成对应回复,再通过对比训练强化小模型的言行一致性。

3、《永劫无间》手游:会聊又能打的AI队友

如果说家臣系统侧重“深度交互”,《永劫无间》手游的AI队友则聚焦“实时陪伴”。在《永劫无间》手游的 AI 队友系统中,玩家不仅可通过语音指令让AI队友执行集火敌人、捡装备等操作,还能获得即时情绪反馈。这种带有情感温度的交互,大幅提升了玩家的游戏陪伴感。其背后是各技术模块围绕《永劫无间》手游进行的场景化后训练:

  • 语音识别。团队需解决多机型硬件适配(如iPhone、华为、小米等)、复杂环境噪音过滤,以及游戏专业话术理解(如跑毒、吃花)等问题。为此,团队建立了覆盖游戏术语与指令的标准测试集,在基座模型上持续开展游戏话术训练,并通过数据闭环对SFT(监督微调)数据进行迭代优化;
  • 指令理解。将玩家语音输入解析为战斗模块所需的核心要素(如动作类型、目标队友、目标物品),后训练重点强化了游戏领域指令与多轮指令的理解能力;
  • 人设打造。团队采用两阶段后训练策略:第一阶段基于伏羲沉淀数据打造文娱知识增强模型,提升其文娱知识储备;第二阶段在SFT环节引入多源对话数据(真人创作数据、文娱领域语料、人机交互数据等),增强角色扮演能力;
  • 记忆感知。团队专门针对记忆抽取进行后训练,让AI队友抓取玩家感知更强的记忆点,为玩家带来意外惊喜;
  • 语音合成。通过基座模型持续训练实现音色与情感的精准把控,并借助网易有灵众包平台形成 “数据标注-模型迭代” 的闭环,让交互更自然。

 

最后,张荣升特别致谢通义开源生态,其提供的多尺寸、多模态的模型选型,为智能NPC的技术研发提供了重要基础。

在AI与游戏产业深度融合的趋势下,网易伏羲以智能NPC为突破口,推动游戏交互从“功能实现”向“情感联结”升级,为玩家构建更鲜活、更沉浸的虚拟世界,助力游戏产业打开“有灵魂的交互”新篇章。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/934858.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025最新微信公众号文章数据批量导出excel工具1.0版

之前的老粉应该都知道我已经开发过一款:微信公众号文章批量下载的软件了,可以将文章导出成word文档、pdf、markdown、html等格式, 而今天这款软件主要是批量导出文章数据为excel表格用的,用法上和之前的软件差不多…

磊科N60Pro刷机

磊科N60Pro刷机命令网线,一头连接千兆网口,一头电脑ssh 192.168.0.1useradmin密码:就是你设置的登录密码# 备份 BL2 引导分区(mtd1)dd if=/dev/mtd1 of=/tmp/mtd1_BL2.bin备份 u-boot-env 环境变量(mtd2)dd if=…

Mac端查词翻译工作流:基于欧路词典与Raycast

目录Mac端欧路词典配置Raycast整合欧路词典效果演示快速查词翻译OCR下载Easy Dictionary插件软件配置 Mac端欧路词典配置 默认读者已经有一定的词典配置经验,下面直接列出一些好用的资源: 词典pj:Mac端突破注册限制…

m3u8格式在直播场景中的应用

M3U8作为一种基于文本的播放列表格式,其核心作用在于将多个视频或音频片段组织成一个连续的播放序列,广泛应用于流媒体传输,尤其在实时直播领域扮演着关键角色。以下是M3U8在直播中的主要应用方式: 实现实时流媒体…

C# ProgressBar 进度条控件

原文链接:https://blog.csdn.net/qq_29406323/article/details/86291763 1 继承关系 Object→MarshalByRefObject→Component→Control→ProgressBarProgressBar表示Windows进度栏控件。 2 重要属性3 示例 3.1 制作简…

随手写的一个子进程

主进程 import ClearTouchGroundCacheCode from ../utils/workers/clearTouchGroundCache.worker.js; const blob = new Blob([ClearTouchGroundCacheCode], { type: application/javascript });this.clearTouchGrou…

来追梦-D1295 小F过河

前言 依旧是固定的前言。 拿下了第四名,和第三名同分结果提交次数多了。 发现第三名是我的同学并且比我弱之后大胆猜测他使用的奇怪的方法。 结果看了他T3的代码,的确如此,他居然转移的时候只转移前面和后面的 \(50…

P3605解题报告

前言 毕竟是解题报告,自然只是个报告了 最近再刷树状数组的题,但是线段树很多时候也能维护这个东西 当然,有些题目还可以使用主席树解决,看个人习惯了 题目意思 给出一颗带点权树,对于每一个节点求出他的子孙节点…

P13763 解题报告

前言 非常好的树上问题,使我的大脑旋转 不难,思维难度也不高,但是如果没有想到真的很难说 广告 同步发布于洛谷专栏,不确定有更好的阅读体验 题意 给出一颗树,不带边权点权,每次询问给出 \(s,t\) 问连接 \(s,t\)…

CF1082E 解题报告

题目意思 至多进行一次操作,一个操作定义为将 \(i\in{[l,r]}\) 的 \(a_i = a_i + b\) 这个 \(b\) 自定,无限制,询问至多一次操作之后,至多有多少个 \(i\in{[1,n]}\) 满足 \(a_i=c\) 其中 \(c\) 为给定的一个数。 思…

国标GB28181算法算力平台EasyGBS具备哪些核心流媒体技术?

国标GB28181算法算力平台EasyGBS具备哪些核心流媒体技术?在当今快速发展的智能监控时代,国标GB28181视频平台EasyGBS,作为一款基于国标GB28181、RTSP、onvif等协议接入的AI算法算力平台,凭借其强大的视频接入、处理…

2025 年净化车间源头厂家最新推荐排行榜:精选实力企业,助力企业精准选择优质净化车间服务商无尘/gmp/新能源/锂电池净化车间厂家推荐

当前净化行业蓬勃发展,企业对净化车间的需求愈发旺盛,涵盖电子、医药、食品、科研等多个关键领域。然而,市场上净化车间源头厂家数量繁杂,部分厂家存在施工不规范、技术实力薄弱、售后服务缺失等问题,导致工程质量…

如何复制获取无法复制的页面内容

如何复制获取无法复制的页面内容有的隐私页面条款不让复制,如何解决呢? 🧰 步骤:使用开发者工具复制网页内容 ✅ 适用场景:页面禁止右键复制 页面内容是动态加载的(如 Keep 的隐私政策页面)操作步骤 1. 打开网…

C语言的“动态数组”

C语言的“动态数组”掩码结构体宏的实现本质上就是使用一个掩码数组 chMask 把结构体保护起来。见《大佬的PLOOC使用示例及其基于C语言的面向对象编程-傻孩子.pdf》1 /* 公众号:嵌入式大杂烩 */2 #ifndef __DYNAMIC_A…

详细介绍:Spring Boot 应用示例

详细介绍:Spring Boot 应用示例pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco&qu…

(Sigcomm25) Stellar: 阿里新一代云AI RDMA网络

创新点主要有: 1. PVDMA:带参数的虚拟化直接地址访问,降低系统启动时间。 2. eMTT:扩展内存翻译表,从而更大化地利用GDR性能。 3. Packet Spray:有效地利用RDMA多路,提升RDMA通信性能。(严格上不是创新而是实验…

背包 dp 历年真题:做题记录

整理了 NOIP 与某些省份省选的背包题。 NOIP 的背包题 [NOIP 2006 提高组] 金明的预算方案 树形背包似乎也是可做的,但是由于最多有两个附件,并且是分为两类,也就是附件不会再有附件,这个问题就成了最简单的背包问…

【触想智能】什么是工业平板电脑以及工业平板电脑对制造业具有什么意义

随着技术的不断进步,工业平板电脑正逐渐成为了现代制造业的重要工具。它们与传统消费级平板电脑相比,具备更强大的功能和更强的可靠性,能够在恶劣的工作环境中使用,并满足制造业中特定的应用需求。触想工业平板电脑…

2025 年国内无尘车间源头厂家最新推荐排行榜:聚焦无菌洁净领域优选企业助力企业精准选型万级/十万级/洁净/食品厂/千级无尘车间厂家推荐

在半导体、微电子、GMP 制药等关键行业中,无尘车间的洁净度与稳定性直接决定产品质量,是企业生产的核心保障。当前市场上无尘车间厂家数量繁杂,部分企业存在技术不成熟、服务体系不完善等问题,导致企业在选择合作方…

高效工作,五步工作法

高效工作,五步工作法1、第一步质疑所有需求2、第二步删除不必要的流程何部件3、第二步优化或简化它4、第四步任何给定的事物,都能加速5、第五步一切都自动化