【人工智能引论期末复习】第3章 搜索求解2 - 对抗搜索

一、核心概念与定义(填空/选择题高频)

1. 对抗搜索(博弈搜索)

  • 定义:在竞争环境中,多个智能体通过竞争实现相反利益的过程

  • 典型场景:两人对决、零和博弈

  • 常见算法

    • 最小最大搜索(Minimax Search)

    • Alpha-Beta 剪枝搜索

    • 蒙特卡洛树搜索(MCTS)

2. 零和博弈

  • 一方收益 = 另一方损失,总和为0

  • 不存在合作可能

  • 与“非零和博弈”对比

3. 博弈树

  • 用于表示博弈过程中所有可能状态的树结构

  • 节点表示游戏状态,边表示玩家的动作

  • 深度优先遍历常用


二、算法原理与流程(计算题与简答题重点)

1. 最小最大搜索(Minimax)

  • 基本思想

    • MAX玩家希望最大化自身利益

    • MIN玩家希望最小化MAX的利益

    • 交替进行,递归计算每个节点的“效用值”

  • 算法流程

    • 从当前状态出发,深度优先遍历博弈树

    • 在MAX层选择子节点中最大值

    • 在MIN层选择子节点中最小值

    • 叶子节点使用评价函数(如胜负、得分)

2. Alpha-Beta 剪枝

  • 目的:减少Minimax搜索的节点数,提高效率

  • 剪枝条件

    • α剪枝(在MIN节点):若父节点(MAX)的α值 ≥ 当前节点β值,剪枝

    • β剪枝(在MAX节点):若父节点(MIN)的β值 ≤ 当前节点α值,剪枝

  • α与β的含义

    • α:当前路径上MAX玩家的最佳选择(下界)

    • β:当前路径上MIN玩家的最佳选择(上界)

  • 效果:不影响最终结果,显著减少搜索节点


三、典型例题与考点(对应回忆卷题型)

1. 计算题示例(类似回忆卷三.3)

题目会给出一棵博弈树,叶节点有评价值,要求:

  • (1)写出Minimax搜索后各中间节点的值

  • (2)在图上标出Alpha-Beta剪枝的位置(用“×”表示)

2. 简答题示例

  1. 解释Minimax和Alpha-Beta剪枝的关系
    Alpha-Beta剪枝是对Minimax算法的优化,通过剪去不影响最终决策的分支,减少搜索空间,但得到的结果与Minimax一致。

  2. 为什么Alpha-Beta剪枝能提高搜索效率?
    通过维护α和β值,提前判断某些分支不会影响最终决策,从而避免展开这些分支,减少节点访问次数。

  3. 什么是博弈树?为什么对抗搜索常用深度优先?
    博弈树是表示博弈过程中所有可能状态的树结构。深度优先节省内存,适合递归实现,便于进行Alpha-Beta剪枝。


四、与试卷中其他章节的关联

  • 与启发式搜索对比

    • 启发式搜索用于单智能体寻优

    • 对抗搜索用于多智能体竞争

  • 与蒙特卡洛树搜索(MCTS)关联

    • MCTS也常用于博弈,通过采样代替穷举

    • 在非完全信息博弈中更常用

  • 与虚拟遗憾值最小化算法关联

    • 后者用于非完全信息博弈,对抗搜索常用于完全信息博弈


五、复习建议

  1. 掌握算法流程

    • 能手动模拟Minimax计算过程

    • 能画出Alpha-Beta剪枝过程图

  2. 理解剪枝原理

    • 明确α、β值的传递与更新规则

    • 能判断何时剪枝、剪哪一侧分支

  3. 联系实际应用

    • 如井字棋、象棋、围棋等游戏的AI实现思路

  4. 注意概念辨析

    • 零和 vs 非零和

    • 完全信息 vs 非完全信息

    • Minimax vs MCTS



对抗搜索 · 模拟练习题

一、填空题(每空1分)

  1. 对抗搜索也称为________搜索,适用于________博弈环境。

  2. 在最小最大搜索中,MAX玩家希望________效用值,MIN玩家希望________效用值。

  3. Alpha-Beta剪枝中,α表示________玩家的最佳选择(下界),β表示________玩家的最佳选择(上界)。

  4. 若在MIN节点处发现父节点的α值 ≥ 当前节点的β值,则进行________剪枝。

  5. 在完全信息、零和、两人轮流行动的博弈中,常用________算法求解最优策略。

  6. 博弈树中,叶子节点常用________函数评估状态优劣。

  7. 若博弈树分支因子为b,深度为d,Minimax算法的时间复杂度为________。

  8. Alpha-Beta剪枝最优情况下时间复杂度可降至________。


二、选择题(每题2分)

  1. 下列哪种情况一定会触发Alpha-Beta剪枝?
    A) α < β
    B) α > β
    C) α = β
    D) α ≤ β

  2. 在Minimax搜索中,某一层为MAX层,其子节点返回值分别为[3, 5, 1],则该层节点的值为:
    A) 1
    B) 3
    C) 5
    D) 9

  3. 关于零和博弈的描述,错误的是:
    A) 一方收益等于另一方损失
    B) 总收益和为0
    C) 双方可能合作
    D) 常用于对抗搜索建模

  4. 以下哪种算法通过随机采样代替穷举搜索?
    A) Minimax
    B) Alpha-Beta剪枝
    C) 蒙特卡洛树搜索
    D) A*搜索

  5. 在Alpha-Beta剪枝中,α和β的初始值通常设为:
    A) α=+∞, β=-∞
    B) α=-∞, β=+∞
    C) α=0, β=1
    D) α=1, β=0


三、计算与画图题(10分)

给定如下博弈树,叶节点为评价值,MAX先手:

text

A(MAX) / | \ B C D(MIN) / \ / \ / \ 3 5 2 9 1 8
  1. 使用Minimax算法计算节点A、B、C、D的值。

  2. 使用Alpha-Beta剪枝从A开始搜索,在图上标出被剪枝的分支(用“×”表示),并写出α、β值更新过程。


四、简答题(每题5分)

  1. 简述Minimax算法的基本思想及其局限性。

  2. 为什么Alpha-Beta剪枝能显著提升搜索效率?剪枝是否会影响最终结果?

  3. 对抗搜索与启发式搜索(如A*)的主要区别是什么?


参考答案

一、填空题

  1. 博弈,零和

  2. 最大化,最小化

  3. MAX,MIN

  4. α剪枝

  5. Minimax(或Alpha-Beta剪枝)

  6. 评价(或效用)

  7. O(bd)O(bd)

  8. O(bd/2)O(bd/2)

二、选择题

  1. B

  2. C

  3. C

  4. C

  5. B

三、计算与画图题

  1. Minimax计算

    • B = max(3,5) = 5

    • C = max(2,9) = 9

    • D = min(1,8) = 1

    • A = min(5, 9, 1) = 1

  2. Alpha-Beta剪枝过程

    • A: α=-∞, β=+∞

    • 扩展B → 得值5,A: α=5

    • 扩展C → 第一个子节点2,C: α=2,继续第二个子节点9,C: α=9,返回9

    • A: β=min(+∞,5,9)=5

    • 扩展D → 第一个子节点1,D: β=1,此时α=5 ≥ β=1,触发剪枝,不再扩展第二个子节点

    • D返回值1

    • A最终值 = min(5,9,1) = 1

剪枝位置:D节点的第二个子节点(值为8)被剪枝。

四、简答题

  1. Minimax思想:MAX玩家最大化收益,MIN玩家最小化MAX收益,递归计算。
    局限性:搜索空间大,需遍历整棵树,时间复杂度高。

  2. 剪枝提升效率:通过α、β值提前排除不影响最终决策的分支,减少搜索节点。
    不影响结果:剪枝仅去掉不会改变根节点值的分支,结果与Minimax一致。

  3. 主要区别

    • 对抗搜索:多智能体竞争,考虑对手行为(如Minimax)

    • 启发式搜索:单智能体寻优,利用启发函数(如A*)

一、零和 vs 非零和

维度零和博弈非零和博弈
定义一方收益等于另一方损失,总和为0各方收益与损失之和不等于0,可能存在共赢或共损
关系严格竞争,对立可能存在竞争、合作或混合
合作可能不存在可能存在合作
典型例子棋类游戏(象棋、围棋)囚徒困境、资源分配谈判
对抗搜索适用性常用(如Minimax)一般不用标准对抗搜索,常用博弈论或谈判模型

二、完全信息 vs 非完全信息

维度完全信息博弈非完全信息博弈
信息状态所有玩家均知道游戏全部历史与当前状态部分信息不公开(如手牌、隐藏状态)
决策依据基于完整状态树需考虑信息集、概率推断
常用算法Minimax、Alpha-Beta、MCTS(确定性版本)虚拟遗憾最小化、贝叶斯博弈、部分可观测MCTS
典型例子象棋、围棋、井字棋扑克、麻将、星际争霸(部分信息)
搜索树结构确定性树,每个状态唯一信息集树,多个状态归属同一信息集

三、Minimax vs MCTS(蒙特卡洛树搜索)

维度Minimax(含Alpha-Beta剪枝)MCTS
搜索方式穷举或剪枝后的确定性搜索随机采样 + 逐步构建搜索树
适用场景完全信息、零和、状态空间较小完全信息或部分信息、状态空间大、分支多
是否需评价函数是(叶节点需静态评价)否(通过模拟对局结果评估)
时间效率随深度指数增长可通过模拟次数控制时间
内存使用需保存整棵树或部分路径仅保存构建的部分树结构
最优性保证在完全搜索下最优渐进收敛至最优(需足够模拟)
典型应用象棋、跳棋围棋(AlphaGo)、即时战略游戏

四、辨析小结(可用于简答题)

  1. 零和博弈一定是完全信息吗?
    不一定。例如扑克是零和但非完全信息。

  2. Minimax能用于非完全信息博弈吗?
    不能直接使用,因为Minimax依赖完整状态树。非完全信息需扩展为信息集或使用随机化策略。

  3. MCTS在哪些方面比Minimax更灵活?

    • 无需静态评价函数

    • 适合大规模状态空间

    • 可用于部分可观测环境

    • 支持实时决策(可随时中断)

  4. 完全信息博弈是否一定可用Minimax求解?
    理论上是,但实际受状态空间限制。围棋等游戏状态数太多,需结合剪枝、启发式或MCTS。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1149990.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

零代码启动中文情感分析|StructBERT镜像集成Flask服务,CPU也可跑

零代码启动中文情感分析&#xff5c;StructBERT镜像集成Flask服务&#xff0c;CPU也可跑 1. 引言&#xff1a;为什么需要轻量级中文情感分析方案&#xff1f; 在当前自然语言处理&#xff08;NLP&#xff09;广泛应用的背景下&#xff0c;中文情感分析已成为客服系统、舆情监…

CV-UNet Universal Matting镜像核心优势解析|附实战案例

CV-UNet Universal Matting镜像核心优势解析&#xff5c;附实战案例 TOC 1. 技术背景与痛点分析 在图像处理领域&#xff0c;图像抠图&#xff08;Image Matting&#xff09; 是一项基础但极具挑战性的任务。传统方法依赖于绿幕拍摄或手动精细标注&#xff0c;成本高、效率低…

如何高效实现中文情绪识别?试试这款轻量级CPU友好型StructBERT镜像

如何高效实现中文情绪识别&#xff1f;试试这款轻量级CPU友好型StructBERT镜像 1. 引言&#xff1a;中文情绪识别的现实挑战与技术演进 在社交媒体、电商评论、客服对话等场景中&#xff0c;自动识别用户情绪倾向已成为企业洞察用户体验、优化服务策略的关键能力。传统方法依…

移动端多模态推理新突破|基于AutoGLM-Phone-9B的轻量化部署实践

移动端多模态推理新突破&#xff5c;基于AutoGLM-Phone-9B的轻量化部署实践 1. 引言&#xff1a;移动端多模态AI的挑战与机遇 随着智能手机、可穿戴设备等边缘终端的算力不断提升&#xff0c;在本地实现高质量的多模态大模型推理已成为现实可能。然而&#xff0c;传统大模型通…

告别复杂环境配置|一键启动中文情感分析Web应用(CPU版)

告别复杂环境配置&#xff5c;一键启动中文情感分析Web应用&#xff08;CPU版&#xff09; 1. 背景与痛点&#xff1a;中文情感分析的落地难题 在自然语言处理&#xff08;NLP&#xff09;的实际项目中&#xff0c;中文情感分析是客服系统、舆情监控、用户评论挖掘等场景的核…

无需GPU!用中文情感分析镜像实现高效正面负面判断

无需GPU&#xff01;用中文情感分析镜像实现高效正面负面判断 1. 引言&#xff1a;为什么需要轻量级中文情感分析&#xff1f; 在社交媒体、电商评论、用户反馈等场景中&#xff0c;中文情感分析已成为企业洞察用户情绪的核心技术手段。传统方案往往依赖高性能GPU和复杂的部署…

GTE中文语义匹配全解析|集成WebUI的轻量级CPU推理镜像实践

GTE中文语义匹配全解析&#xff5c;集成WebUI的轻量级CPU推理镜像实践 1. 项目概览&#xff1a;GTE 中文语义相似度服务是什么&#xff1f; 在自然语言处理&#xff08;NLP&#xff09;领域&#xff0c;语义相似度计算是构建智能问答、文本去重、推荐系统等应用的核心能力。传…

uniad模型输出参数详细解释

nuScenes 数据集评测结果中所有变量&#xff08;指标&#xff09;的具体含义&#xff0c;这些指标覆盖了目标跟踪、目标检测、运动预测和场景理解等多个核心维度。 一、目标跟踪核心指标&#xff08;MOTA/MOTP 系列&#xff09; 这类指标用于评估多目标跟踪&#xff08;MOT&…

AutoGLM-Phone-9B核心优势解析|附多模态模型安装与验证教程

AutoGLM-Phone-9B核心优势解析&#xff5c;附多模态模型安装与验证教程 1. AutoGLM-Phone-9B 核心优势深度解析 1.1 轻量化设计&#xff1a;90亿参数下的高效推理能力 AutoGLM-Phone-9B 是一款专为移动端和资源受限设备优化的多模态大语言模型&#xff0c;其最显著的技术特征…

无需GPU!轻量级中文情感分析镜像,开箱即用

无需GPU&#xff01;轻量级中文情感分析镜像&#xff0c;开箱即用 1. 背景与需求&#xff1a;为什么需要轻量级中文情感分析&#xff1f; 在当前AI应用快速落地的背景下&#xff0c;中文情感分析已成为客服系统、舆情监控、用户反馈处理等场景中的核心能力。传统方案往往依赖…

11.3 Pandas 模块功能概览

文章目录前言一、 核心功能定位二、 核心数据结构2.1 Series&#xff08;一维数组&#xff09;2.2 DataFrame&#xff08;二维表格&#xff09;三、 主要功能模块3.1 数据输入/输出3.2 数据清洗3.3 数据转换3.4 数据统计与分析3.5 数据可视化集成3.6 时间序列处理&#xff08;特…

HY-MT1.5-7B翻译模型深度应用|融合民族语言与格式化翻译

HY-MT1.5-7B翻译模型深度应用&#xff5c;融合民族语言与格式化翻译 随着全球化进程加速&#xff0c;跨语言交流需求激增&#xff0c;传统云端翻译服务在隐私保护、网络依赖和响应延迟方面的局限日益凸显。腾讯开源的混元翻译大模型 HY-MT1.5-7B 正是为应对这一挑战而生——它…

从单图到批量抠图全攻略|基于CV-UNet大模型镜像的实用化落地实践

从单图到批量抠图全攻略&#xff5c;基于CV-UNet大模型镜像的实用化落地实践 随着AI图像处理技术的发展&#xff0c;智能抠图已从实验室走向实际生产环境。传统抠图依赖人工绘制Trimap或复杂后期操作&#xff0c;效率低、成本高。而基于深度学习的自动抠图模型如CV-UNet&#…

从分词到语义匹配|利用GTE模型镜像提升文本相似度计算精度

从分词到语义匹配&#xff5c;利用GTE模型镜像提升文本相似度计算精度 在自然语言处理&#xff08;NLP&#xff09;领域&#xff0c;文本相似度计算是信息检索、问答系统、推荐引擎等应用的核心技术之一。传统方法如基于关键词匹配或词频统计的算法虽然实现简单&#xff0c;但…

【视觉多模态】基于视觉AI的人物轨迹生成方案

【视觉多模态】基于视觉AI的人物轨迹生成方案背景步骤小结背景 基于 Yolo-World v2 把人物从视频每帧中提取出来并分别存储在某路径下。现在的下一步&#xff0c;应该是把这些截图全部转换为向量并存储到向量数据库。 步骤 下载SFace模型 https://github.com/opencv/opencv…

经济领域的第一性原理:资源相对稀缺与人性欲望无穷大

经济领域的第一性原理&#xff1a;资源相对稀缺与人性欲望无穷大在经济学的理论体系中&#xff0c;“资源相对稀缺” 与 “人性欲望无穷大” 的核心矛盾&#xff0c;是当之无愧的第一性原理。这一矛盾并非简单的 “资源不够用”&#xff0c;而是贯穿所有经济活动的底层逻辑 ——…

nt!IopInitializeBootDrivers和ACPI!ACPIInitialize和pci!PciScanBus先后关系

nt!IopInitializeBootDrivers和ACPI!ACPIInitialize和pci!PciScanBus先后关系kd> g Breakpoint 1 hit nt!IopInitializeBootDrivers: 80e68fc6 55 push ebp 1: kd> kc# 00 nt!IopInitializeBootDrivers 01 nt!IoInitSystem 02 nt!Phase1Initialization 0…

零代码部署GTE中文向量模型|Web界面实时计算文本相似度

零代码部署GTE中文向量模型&#xff5c;Web界面实时计算文本相似度 1. 背景与核心价值 在当前的自然语言处理&#xff08;NLP&#xff09;应用中&#xff0c;语义相似度计算已成为搜索、推荐、问答系统和RAG&#xff08;检索增强生成&#xff09;等场景的核心能力。传统的关键…

支持33种语言互译,HY-MT1.5大模型镜像应用全景

支持33种语言互译&#xff0c;HY-MT1.5大模型镜像应用全景 1. 引言&#xff1a;多语言翻译的工程挑战与HY-MT1.5的破局之道 在全球化加速和AI技术深度融合的背景下&#xff0c;高质量、低延迟的机器翻译已成为跨语言交流、内容本地化、智能客服等场景的核心基础设施。然而&am…

【人工智能引论期末复习】第3章 搜索求解1 - 启发式搜索

一、核心概念&#xff08;填空/选择高频&#xff09;1. 搜索算法基础搜索算法的形式化描述&#xff1a;状态、动作、状态转移、路径/代价、目标测试搜索树的概念&#xff1a;从初始状态出发&#xff0c;扩展后继节点&#xff0c;直到找到目标搜索算法的评价指标&#xff1a;完备…