MiroThinker:开源搜索代理模型助力高效研究

MiroThinker 是一个开源的搜索代理模型,旨在通过工具增强推理和现实世界信息搜索的能力,实现与 OpenAI Deep Research 和 Gemini Deep Research 之间的深度研究体验相匹配。

🚀 MiroThinker 概述

MiroThinker 是 MiroMind 的旗舰研究代理模型,旨在提升工具辅助推理和信息搜寻的能力,使复杂的现实研究工作流能够应对各种挑战。其核心功能包括:

  • MiroThinker:开放源代码的搜索模型,原生支持工具辅助推理,在多个基准测试中取得领先性能。
  • MiroFlow:开放源代码的研究代理框架,提供可复现的尖端性能。
  • MiroVerse:支持研究代理训练的优质开放源数据集,包含 147,000 个样本。
  • MiroTrain / MiroRL:支撑研究代理模型稳健高效训练的基础设施。

✨ 主要特点

1. MiroThinker v1.5

MiroThinker v1.5 是全球领先的开源搜索代理,支持 256K 上下文窗口、长期推理和深入的多步骤分析。它的特点包括:

  • 处理每个任务最多400 次工具调用,相较于之前的代理实现了显著提升。
  • 提供30B 和 235B参数规模的多种可扩展选项,适应不同的研究环境和计算预算。
模型名称基础模型最大上下文最大工具调用HuggingFace 链接
MiroThinker-v1.5-30BQwen3-30B-A3B-Thinking-2507256K400🤗 link
MiroThinker-v1.5-235BQwen3-235B-A22B-Thinking-2507256K400🤗 link

MiroThinker v1.5 在多个基准上实现了强劲的研究表现,如 HLE-Text 达到 39.2%,BrowseComp 达到 69.8%,并在 GAIA-Val-165 中达到了 80.8%。这些结果超越了之前的开放源代理,并设立了新的世界领先水平。

2. MiroThinker v1.0

与之前仅依赖模型规模或上下文长度进行扩展的模型不同,MiroThinker v1.0 引入了交互式扩展,系统性地训练模型处理更深和更频繁的代理-环境交互。

其特点包括:

  • 600 次工具调用,极大地拓展了可处理的信息量。
  • 8B、30B 和 72B参数规模发布,提供全面的工具和工作流套件,灵活支持多样的研究设置与计算预算。
模型名称基础模型最大上下文最大工具调用HuggingFace 链接
MiroThinker-v1.0-8BQwen3-8B256K600🤗 link
MiroThinker-v1.0-30BQwen3-30B-A3B-Thinking-2507256K600🤗 link
MiroThinker-v1.0-72BQwen2.5-72B-Instruct256K600🤗 link

MiroThinker v1.0 在 HLE-Text 和 BrowseComp 上的性能也显示出显著提高,分别达到 37.7% 和 55.6%。

3. 训练数据与基础设施

MiroVerse 提供丰富的训练数据集,支持高清晰度的研究代理训练。利用 MiroTrain 和 MiroRL,用户可以轻松构建稳定的训练环境,确保研究代理模型效率最大化。

📈 基准测试表现

MiroThinker 在各项基准测试中的表现令人瞩目,特别是在复杂任务中的准确性和深度推理能力上,展示了其在现实应用场景中的强大适应性。

🚀 快速开始

环境要求

  • Python 3.10+
  • uv 包管理器(安装指南)
  • 需要的 API 密钥(请参阅配置部分)

安装步骤

# 克隆仓库gitclone https://github.com/MiroMindAI/MiroThinkercdMiroThinker# 设置环境cdapps/miroflow-agent uvsync# 配置 API 密钥cp.env.example .env# 编辑 .env 文件以添加您的 API 密钥(如 SERPER_API_KEY, JINA_API_KEY 等)

工具配置

MiroThinker 的工具配置涉及多个 API 集成,以支持搜索、信息抽取和代码执行等功能。

示例配置
# 最小配置示例SERPER_API_KEY=your_serper_keySERPER_BASE_URL="https://google.serper.dev"JINA_API_KEY=your_jina_keyJINA_BASE_URL="https://r.jina.ai"E2B_API_KEY=your_e2b_key

运行第一个任务

设置完环境后,运行main.py来测试默认问题:“今天计算机科学领域的 arxiv 论文标题是什么?”

cdapps/miroflow-agent# 使用 MiroThinker 模型uv run python main.pyllm=qwen-3agent=mirothinker_v1.5_keep5_max200 llm.base_url=http://localhost:61002/v1

对比同类项目

MiroThinker 作为一个开源项目,其具有与其他研究代理模型的竞争优势。例如,WebThinkerWebAgents也专注于提供高效的信息检索和处理能力。MiroThinker 的优势在于对交互式扩展的支持,它能在模型规模和上下文长度外,通过实时反馈进一步提升性能,满足更为复杂的任务要求。

如需了解更多关于类似项目的信息,可以访问他们的 GitHub 页面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1201206.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在吴忠,一位国家二级运动员的教练如何用科技与专业重塑羽毛球学习

清晨的阳光透过吴忠码上羽毛球俱乐部的玻璃窗,洒在整洁的球场上。国家二级运动员韩宁波教练正与一位学员进行多球训练,他每一次喂球都精准地落在学员最舒适的回击位置。01 专业教练团队,国家二级运动员领衔教学韩宁波教练作为国家二级运动员&…

MongoDB开源mongot引擎源码,助力RAG和AI工作负载

MongoDB已在服务端公共许可证(SSPL)下发布了mongot引擎的源码。mongot是驱动MongoDB搜索和向量搜索功能的核心引擎。分析师表示,此举将帮助自管理版本数据库的开发者更好地规划AI用例的RAG系统,因为源码将提供更多的透明度、可调试…

宏智树 AI 双降攻略:破解查重与 AIGC 检测的双重学术关卡

“查重率 8% 却被 AIGC 检测标红 90%”“越改越生硬,反而暴露 AI 痕迹”…… 随着高校查重系统与 AIGC 识别技术同步升级,论文安全早已不是 “重复率低” 就能通关。作为深耕论文写作科普的教育博主,我实测发现宏智树 AI(官网&…

2026年市场靠谱的重型货架批发厂家推荐排行榜,自动化立体库货架/穿梭式货架/层板货架,重型货架供应商推荐排行榜

行业背景:重型货架市场迎来技术驱动与场景深化新阶段 随着制造业智能化升级与物流效率需求提升,重型货架行业正从单一存储功能向“空间优化+流程自动化”方向转型。据第三方机构统计,2025年国内重型货架市场规模突破…

复合运动绕线机设计

第2章 复合运动绕线机基本设计方案 2.1 传统绕线机设备的局限性 原有机械式绕线机的绕线过程:电机转动通过齿轮降速将转动传递到绕线轴 ,在由绕线轴带著绕线模低速匀速转动,最终完成线圈的绕制。图1.1为机械式绕线机的机械结构示意图。随着线…

fixedbug:Lombok@Builder 构造 方法生成

文章目录 前言一、Lombok的一些常用注解二、Builder 构造 方法问题2.1 Builder 生成私有的构造方法:2.2 处理方式: 总结 前言 本文记录在使用:LombokBuilder 时 ,发送Post 请求,后端在接收参数时报 无法找到 构造方法…

还能火多久?电动冲浪板行业迎来“新品时代”

水上运动这行当,今年彻底变天了。那些还在热衷于传统冲浪板的人,可能还没醒过味儿来——现在电动冲浪板正以不可阻挡之势席卷而来,电动冲浪板行业已然迎来了“新品时代”。 GOYOJO作为肇庆市天科机电有限公司的核心…

拒稿率 80%?宏智树 AI 拆解期刊论文 “隐形加分项”,新手也能精准踩中审稿偏好

作为深耕论文写作科普的教育博主,后台每天都被粉丝的期刊投稿难题刷屏:“选题自嗨式写作,初审直接被拒”“格式改了 3 遍仍不达标”“文献引用踩坑,审稿人质疑学术严谨性”…… 其实期刊投稿的核心,是精准拿捏审稿人关…

Springboot 缓存@Cacheable 使用

文章目录前言一、Cacheable 是什么?二、Springboot 项目中如何使用2.1 基于内存实现:2.1.1 Cacheable 引入并使用:2.1.2 Cacheable 配置参数2.2 Cacheable 基于redis 缓存2.3 Cacheable 注解属性总结前言 一、Cacheable 是什么? …

2026 运动鞋品牌科普新篇:五大专业标杆的技术革新与选购指南

​一、2026 运动鞋行业:三大新趋势引领消费变革 2026 年,全球运动鞋市场规模预计突破 2800 亿美元,行业发展呈现三大核心新趋势:一是技术场景化融合,不再是单一技术堆砌,而是针对具体运动场景实现 “技术精准匹配…

风力发电的调研报告

三.风力发电机的分类 根据基本结构以及运行原理,发电机通常可分为直流电机、感应异步电机和同步电机几大类。风力发电系统中电机类型繁多,包括以下类型。 (一)在CSCF 风电系统中常用的发电机包括异步机感应电机和电励磁…

基于Java+SpringBoot+SSM幼儿园管理系统(源码+LW+调试文档+讲解等)/幼儿园管理软件/幼儿园管理平台/幼儿园信息化系统/幼儿园教务系统/幼儿园管理系统软件/幼儿园管理解决方案

博主介绍 💗博主介绍:✌全栈领域优质创作者,专注于Java、小程序、Python技术领域和计算机毕业项目实战✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 2025-2026年最新1000个热门Java毕业设计选题…

靠谱的电动冲浪板品牌,太酷了吧!

在水上运动的世界里,电动冲浪板正以一种酷炫的姿态吸引着众多爱好者的目光。想象一下,在湛蓝的海面上,冲浪者踩着电动冲浪板,风驰电掣般地穿梭,那场景简直太酷了!今天,我们就来深入探讨一下靠谱的电动冲浪板品牌…

双目三维重建的步骤与核心算法

双目三维重建的步骤与核心算法 双目三维重建是模拟人类双眼视觉原理,通过两个固定位置的相机拍摄同一场景,利用视差计算三维坐标的技术,广泛应用于机器人导航、自动驾驶、三维建模等领域。其流程可分为六大核心步骤…

2026年变压器绕组变形测试仪知名品牌实力对比与战略选购指南

在全球能源转型与新型电力系统建设加速的宏观背景下,电力设备的状态检测与智能运维已从“可选”升级为“必选”。变压器作为电网的核心资产,其绕组的机械健康状况直接关系到整个电网的稳定与安全。变压器绕组变形测试…

别再凑字数!宏智树 AI 教你把课程论文写成 “高分范本”

作为深耕论文写作科普的教育博主,每到期末就被学生们的课程论文难题包围:“选题要么太泛要么太偏,凑够字数都难”“文献堆了一堆,却不知道怎么整合出逻辑”“查重改到崩溃,结果还是被导师说‘缺乏思考’”…… 其实课程…

手动磨题 VS 智能生成?宏智树 AI 解锁问卷设计的学术高效范式

做社科实证论文时,你是否经历过这样的窘境:花一周时间翻文献、磨题项,设计出的问卷却被导师批 “信效度不足”;用普通表单工具生成问卷,又因题项诱导性强、逻辑混乱,导致回收的数百份数据沦为 “无效样本”…

vtb|blog|auto

这周在尝试一些事情,做新东西的感觉很刺激很开心,但一天下来就感觉脑子像被打了一样… vtb 模型整合的差不多了…还有一些小问题 不知道什么时候可以做好 随缘吧 好了应该会用小号在b站上播着玩玩个人网站 博客网站写的 简单-花哨-简单-花哨… 还在寻找一…

2026液氮速冻机市场盘点:哪些品牌更受青睐?液氮/制氧机/汽化器/液氮速冻机/真空管/液氩,液氮速冻机厂商找哪家

在消费升级与食品安全标准日益提升的背景下,食品工业对加工技术的要求不断攀高。液氮速冻技术,以其极速冷冻(-196℃)、最大程度锁住食材原鲜、抑制微生物活动及有效减少细胞冰晶损伤等显著优势,正成为高端食品加工…

适合学生二次开发的轮式机器人需求深度分析与产品选型指南

随着人工智能与机器人技术的深度融合,高校在开展教学、竞赛及科研活动时,对轮式机器人底盘的二次开发需求呈现出显著的分层化与专业化趋势。学生开发的核心需求已从简单的遥控移动转向“感知-决策-执行”全链路的深度…