[PaperReading] Mind Search: Mimicking Human Minds Elicits Deep AI Searcher

news/2025/9/22 21:24:13/文章来源:https://www.cnblogs.com/fariver/p/19106068

目录
  • MindSearch: Mimicking Human Minds Elicits Deep AI Searcher
  • TL;DR
  • Method
    • Overall Framework
    • WebPlanner
    • WebSearcher
    • 关键步骤
  • Experiment
  • 总结与思考
  • 相关链接

MindSearch: Mimicking Human Minds Elicits Deep AI Searcher

link
时间:24.07
单位:USTC, 上海AI Lab
相关领域:Search, LLM
作者相关工作:
Zehui Chen 之前有 InternLM
被引次数:46
项目主页:https://github.com/InternLM/MindSearch

TL;DR

之前基于LLM的搜索引擎存在三个问题:a. 复杂的需求通过一次性检索无法得到准确完全的结果;b. 多网页整合信息时存在噪声;c. 很多网页内容太长会超过LLM的context上限。本工作基于人类解决问题的过程,通过WebPlanner与WebSearcher两个关键模块来解决该问题。WebPlanner将用户Query分解为多个子问题,WebSearcher使用搜索引擎针对子问题进行层级检索。通过多agents的设计使得这些步骤可以在3分钟内并行操作,这相当于人类3小时的工作量。效果上提升了搜索的宽度与深度。

Method

Overall Framework

image

WebPlanner

image

WebSearcher

image

关键步骤

  • 问题分解(Query Decomposition): 使用WebPlanner将用户查询分解为多个可以并行解决的原子子问题。
  • 动态图构建(Dynamic Graph Construction): WebPlanner将复杂问题解决过程建模为一个有向无环图(DAG),通过添加节点和边来逐步细化问题。
  • 分层信息检索(Hierarchical Information Retrieval): WebSearcher执行分层检索过程,从大量网页中提取有价值的数据。
  • 多智能体设计(Multi-Agent Design): 通过在不同的智能体之间分配检索和推理任务,减少单个智能体的负载,提高处理长上下文任务的能力。
  • 上下文管理(Context Management): 通过在多智能体之间明确的角色分配和上下文状态转移,有效管理整个过程中所需的上下文。
  • 代码生成与执行(Code Generation and Execution): WebPlanner通过生成代码与图交互,利用LLM在代码任务上的优势。
  • 响应生成(Response Generation): 在收集到所有相关信息后,WebPlanner生成最终的响应。
  • 评估与优化(Evaluation and Optimization): 通过在闭集和开集问答任务上的广泛评估,验证MindSearch的有效性,并通过比较分析进一步优化。

Experiment

image

image

总结与思考

感觉Agent的工作整体都偏向于Framework,即设计一个Framework能够更经济、更高质量地满足用户需求。

相关链接

https://zhuanlan.zhihu.com/p/711958651
https://zhuanlan.zhihu.com/p/713774006

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/910420.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Automatically Naming the Screenshots to Steam

Automatically Naming the Screenshots to Steam The Problem I want to upload my own screenshot to steam, but I found that the methods I found are a bit tedious. Steam expects screenshots to follow a spec…

穷举法(c语言版)

我们的日常生活中,经常会遇到一些需要解决的小问题,这些问题可能并不需要复杂的算法,但是如果我们能够运用穷举算法的思想,就能够轻松地找到问题的答案。本文将介绍穷举算法的基本思想,并通过程序示例来深入了解它…

ZYNQ PS 端 UART 接收数据素材帧(初学者友好版)嵌入式编程 C语言 c++ 软件开发

ZYNQ PS 端 UART 接收数据素材帧(初学者友好版)嵌入式编程 C语言 c++ 软件开发pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-…

01 Tasking IDE软件安装及新建工程

01 Tasking IDE软件安装及新建工程1.Tasking简介 Tasking IDE是由Altium公司开发的一款专注于嵌入式系统开发的集成开发环境(IDE),特别适合于英飞凌(Infineon)微控制器的开发作。官方网址:https://www.tasking.c…

义乌网站推广学院网站建设目的与意义

1、你的真心很珍贵,别再不值得的人身上卑微 ,爱应该是让你笑的开怀,而不是哭的崩溃。爱必须是温情的依赖,而不是冷漠的伤害。想要找你的人走遍了全世界也能找到你,等到了年华老去也会等着你。 2、大冬天的时候给你送吃…

寻找网站建设员广州网站建设专注乐云seo

基于WIN10的64位系统演示 一、写在前面 本期开始,我们继续学习深度学习图像目标检测系列,SSD(Single Shot MultiBox Detector)模型。 二、SSD简介 SSD(Single Shot MultiBox Detector)是一种流行的目标检…

做花茶网站解说大庆市住房和城乡建设局网站

该知识领域涉及如下考点,具体内容分布于如下各个子章节: 理解安全并将其融入软件开发生命周期 (SDLC) 中在软件开发环境中识别和应用安全控制评估软件安全的有效性评估获得软件对安全的影响定义并应用安全编码准则和标准 6.1. 系统开发控制 6.1.1. 软…

网站支付链接怎么做张家港网页设计培训

同时在线访问量继续增大 对于1G内存的服务器明显感觉到吃力严重时甚至每天都会死机 或者时不时的服务器卡一下 这个问题曾经困扰了我半个多月MySQL使用是很具伸缩性的算法,因此你通常能用很少的内存运行或给MySQL更多的被存以得到更好的性能。 安装好mysql后&#x…

河北邢台解封了吗seo网络优化师招聘

1、说说 Redis 都有哪些应用场景?缓存:这应该是 Redis 最主要的功能了,也是大型网站必备机制,合理地使用缓存不仅可以加 快数据的访问速度,而且能够有效地降低后端数据源的压力。共享Session:对于一些依赖 …

百度site app网站添加到网站首页源文件中的代码是哪些?网站新类型

人脸对比 人脸对比,顾名思义,就是对比两个人脸的相似度。本文将用Paddle实现这一功能。 PS:作者肝了整整3天才稍微搞明白实现方法 数据集准备 这里使用百度AI Studio的开源数据集: 人脸数据_数据集-飞桨AI Studio星河社区 (b…

上海做网站的多吗wordpress小说站数据库

队列(Queue) 在Python的queue模块中,Queue类是一个线程安全的队列实现,用于在多线程编程中安全地交换信息。它遵循先入先出(FIFO)的原则。Queue类提供了几种主要的方法: put(item): 将一个项目…

详细介绍:深入理解Kafka事务

详细介绍:深入理解Kafka事务pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco"…

能碳园区 / 工厂系统 - 智慧园区

智慧能碳园区 / 工厂:能碳协同驱动的低碳高效运营新范式 在 “双碳” 目标与产业数字化深度融合的背景下,智慧能碳园区 / 工厂已成为企业绿色转型的核心载体 —— 它并非 “智慧能源” 与 “碳管理” 的简单叠加,而…

郑州网站推广营销wordpress 修改邮箱

我们做接口测试时候,会发现通常需要测试的接口类型有好几种,比较多的是http类型的接口,其他还有webservice接口,rpc接口等等,本次主要说下http类型的接口我们该怎么测试,还有该测试哪些东西。HTTP接口概念:…

上海工程建设执业资格注册中心网站网站建设排名北京

在计算机科学的世界里,排序是一项基本而重要的操作。无论是数据库管理、搜索引擎,还是日常编程,高效的排序算法都是提高性能的关键。本文将介绍四种基本的排序算法:冒泡排序、选择排序、插入排序和快速排序,并探讨它们…

有什么免费开发网站建设软件有哪些做外贸有哪些好的网站有哪些

java8根据某个id删选Java 8带有新的Optional类型,类似于其他语言中可用的类型。 这篇文章将介绍这种新类型的使用方式,即主要用途。 什么是可选类型? 可选的是新容器类型,如果有可用值,则该容器类型将包装单个值。 因…

汕头网站优化公司沈阳电商网站建设

本章主要讲解微信公众号自定义菜单、微信网页开发、模板消息推送等功能的实现;发福利了,下方关注公众号,就能免费获取项目源码1、自定义菜单开发前需要了解以下几点:1、微信公众号的自定义菜单最多包括3个一级菜单,每个…

深圳网站建设与设计制作笑话小网站模板html

它们都是对表达式的记法,因此也被称为前缀记法、中缀记法和后缀记法。它们之间的区别在于运算符相对与操作数的位置不同:前缀表达式的运算符位于与其相关的操作数之前;中缀和后缀同理。举例:(3 4) 5 - 6 就是中缀表达式- 3 4 …

dell公司网站设计特色石油 技术支持 东莞网站建设

上篇文章介绍了如何利用pyhook模块监听鼠标键盘的事件,接下来如果需要通过监听的事件内容,来做对应的操作,需要对event的内容进行相应的判断。 如果仅仅通过event.key来进行判断,可以写成str(evnet.key) F12等,如果需…