一、Agent定义
能通过传感器感知环境,并且能通过执行器对环境产生影响的任意事物都可以被称为Agent。
Agent=Agent程序+运行Agent程序的物理系统
Agent函数
从感知历史P*到动作A的一种映射f。即f:P*→A。是感知历史到行为决策这个映射的抽象描述,体现Agent的智能
Agent函数依托Agent程序运行
物理系统包括
- 感知环境的传感器
- 施加作用于环境的执行器
- 运行Agent程序的计算与存储装置
Agent的三要素
- 感知环境的能力
- 对环境施加作用的能力
- 感知信息与动作决策之间的映射机制
二、理性Agent
对每一个可能的感知序列,根据已知的感知序列提供的证据和Agent具有的先验知识,理性Agent应该选择能使其性能测度最大化的行动
性能测度
性能测度的作用:
- 选择与定义要体现人的设计意图
- 衡量Agent行为好坏的评价指标
三、Agent的PEAS描述方法
- P:Performance性能
- E:Environment环境
- A:Actuators执行器
- S:Sensors传感器
四、Agent的任务环境类型
任务环境的七个维度
- 完全可观察与部分可观测:在每个时间点上获得环境的完整状态
- 确定的与随机的:是否有不确定的外部输入
- 片段式的与延续性的:当前行为是否影响到未来决策
- 静态的与动态的:任务环境在Agent计算决策过程中是否变化
- 离散的与连续的
- 单Agent与多Agent
- 已知的与未知的:行动后果是否给定
五、Agent基本类型
简单反射Agent
不关注感知历史、行为后果,是短视的Agent
基于模型的反射Agent
收到感知能力限制,Agent一般是局部可观察的。规则的前提是根据感知信息,基于模型获得的可能发生后果的判断,能对未来做出一定预测,缺乏目标导向
世界模型:世界是如何独立发展的,Agent对世界环境的影响
基于目标的Agent
将预期结果与设定目标对比获得自身行为对环境产生的影响
基于效用的Agent
对多个能达成目标的行为,能够权衡利弊得失
学习Agent
复合式Agent:在一个Agent中组合多种相对独立、并行执行的智能形态
问题描述的抽象层次
- 原子:世界的每个状态都没有内部结构
- 要素化:状态表示为变量或特征的集合
- 结构化:状态表示为对象及对象关系的集合