Deep research深度研究:ChatGPT/ Gemini/ Perplexity/ Grok哪家最强?(实测对比分析)

目前推出深度研究和深度检索的AI大模型有四家:
OpenAI和Gemini 的deep research,以及Perplexity 和Grok的deep search,都能生成带参考文献引用的主题报告。

致力于“几分钟之内生成一份完整的主题调研报告,解决人力几小时甚至几天的工作量。大大提升研究效率。”           

本文娜姐会针对一个文献综述主题,来测试对比一下这四家的实际生成效果。           

首先,这几款工具技术参数和价格对比如下:    

图片

2 各家效果测试对比:           

下面娜姐以一篇综述主题“炎症相关脂肪因子与痴呆的研究进展”为例,详细对比一下各家的输出效果:           

我要求按照如下框架内容展开,并包含一个总结性表格:

1 炎症相关脂肪因子的具体分类;2 脂肪因子在神经炎症中的作用机制;3 脂肪因子与不同类型痴呆的关系;4 临床研究和动物实验的最新进展;5 潜在的治疗靶点及干预策略            

2.1 Perplexity:

为防止用中文对话,Perplexity查找的都是中文信息源,我强调要查找英文文献,并用中文撰写综述,Perplexity听懂了:           

图片

但是,对于不同脂肪因子与痴呆症的作用机制,并没有深入讨论,只列举了相关性:

图片

    

最后听话照做输出了总结性表格,只是内容总结的不够全面:

图片

总结一下:

Perplexity deep search的优点是生成带参考文献引文的报告。内容的准确度还可以(对比刚上线时候功能似乎有改进),但是不够全面,对于研究型主题来说,深度也不够。好在它末尾的“关联问题”很有启发性,你可以继续深挖,补全信息,比如继续让它深度思考机制问题:    

图片

           

2.2 Grok3 deep search:

虽然我强调了检索英文文献,但是最后用中文输出报告,但是Grok还是检索的中文信息源:    

图片

           

然后换成用英文提问,要求中文回复,这下可以了。

Grok的深度搜索检索了20篇学术文献,并汇总结果用中文呈现给我。对比Perplexity的文献大多来自Pubmed、Semantic Scholar,Grok的文献来源更学术和多样化:包括ScienceDirect、Wiley、Oxford Academic等学术出版机构。           

但是它的参考文献没有在报告中引用,不好确认相关性:

图片

    

Grok表格总结和Perplexity总结的主要脂肪因子种类一样,但其他类目不同。Perlexity比Grok的总结更符合学术论文风格:

图片

           

2.3 Gemini deep research:           

Gemini和OpenAI的深度研究都是智能体驱动的,Gemini的底层模型是1.5 pro,在输出报告之前,都会先出一个内容框架,和你对齐需求,最终生成一份带参考文献来源的3000多字综述报告。 

图片

      

图片

脂肪因子和痴呆的作用机制探讨,Gemini比Perplexity和Grok深入一点,但是对于学术论文的文献综述,还太浅了:

图片

表格总结方面,Gemini总结的是所有炎症相关脂肪因子,而不是和痴呆相关的,对主题的理解有偏差:               

图片

           

2.4 OpenAI deep research:

用时7分钟,调研了35篇文献后,deep research给我输出了一份2万多字的完整综述:    

图片

     

图片

图片

毫无疑问,这份报告的质量是最高的,不是因为字数最多,而是它的报告足够有深度、准确性高、文献是最新的。      

表格总结,OpenAI deep research是最全面准确和最有深度的,并且全部带有引文链接:               

图片

    

图片

相比之下,Perplexity和Grok deep search脂肪因子总结不够全面,且分析较浅;Gemini Deep Research总结更全面,但是准确度有待核实,有一些不相关的脂肪因子总结进来。且表格其他项目没有OpenAI总结深入。           

总结一下:

Perplexity和Grok的深度搜索工具重在搜索和汇总信息,两者结果呈现相当。Groq搜索来源更广泛,但是文中不带引文,不好核实来源;Perplexity会在文中和文末同时附带参考文献。           

Gemini和OpenAI的深度研究相比,Gemini虽然背靠谷歌搜索,但是由于底层大模型1.5 pro不够给力,充其量只能算deep search的升级版,因为一份深度的研究报告除了对信息的检索,还包括对信息的判断、分析和汇总。               

OpenAI deep research胜在其底层模型o3,专门针对深度研究的使用场景,采用 “端到端的强化训练”方法,获得了很好的效果。    

3 OpenAI deep research特点分析      

该智能体从用户的问题出发,直接学习每一步该怎么办:例如应该搜索什么关键词、点击哪个链接、在页面中寻找哪些信息、何时结束搜索开始撰写报告等等。整个决策链条都是通过强化学习一体化学得的。           

不需要人为告诉它该搜索什么关键词、点击哪个链接、在页面中寻找哪些信息、什么时候结束搜索开始撰写报告等等 。    

图片

     (OpenAI deep research自主创建关键词,检索、分析、汇总信息的过程)      

正因为o3模型在信息判断和分析综合能力的提升,它特别适合学术类文献综述任务。           

当然,正如娜姐之前那篇关于OpenAI deep research文章的总结,它也不是没有缺点的: 

OpenAI deep research全面开放:如何更好的用它进行文献综述?(深度使用经验分享)

              

1 完成一个任务要多次尝试,速度慢,deep research完成一份报告要5-30分钟;且需要较高的算力支持(所以收费贵,plus用户每月才10次)。 

2 在文献来源方面,存在单篇文献过度引用和引用不全面的问题。在阐述某一个观点时,找到契合观点的文献可能一整段都会只引用1-2篇文献。所以,deep research出的报告一般都是20-30篇参考文献。即使你要求更多,也不会超出50篇。           

你看它的智能体运行过程,会发现,它在找到某一个观点的支撑文献之后,就会进入下一个任务,并不会就这个关键词继续全面检索文献。         

但是,不同于Gemini的一次性深度研究报告,OpenAI的deep research可以在同一个对话框继续对话,你可以针对报告中的某一个主题继续拓展,还能添加附件资料让它学习。           

图片

    

图片

4 学员群提问关于deep research的问题汇总:           

4.1 怎么样算是调用了deep research,我的是不是被降智了?

Deep research的回复分为两步,第一步对齐需求,第二步开始研究。进度条开启就是成功调用deep research,就会算一次(plus每月10次额度),最后生成的报告一定是带参考文献引用的。           

如果没有分两步进行,直接在第一次就回答了你的问题,且没有进度条展示和参考文献。那就是被降智了。概率问题,无解。           

4.2 该如何选择运行deep research的大模型?               

现在ChatGPT也有五六款模型可以选择了,用哪一个模型进行深度研究效果最好呢?

deep research的回答分为两步:第一步是根据你的提问和你对其需求,这一步可以自由选择模型,默认是4o,还可以选择其他推理模型o1;第二步是启动深度分析,这一步是调用专门训练用于深度研究的o3来完成的,选其他的也没用。   

4.3 报告怎么下载?

不同于Gemini的deep research,可以直接生成谷歌文档,以附件形式下载。OpenAI的深度研究报告不能以附件形式下载,只能在报告末尾左下角点“复制”按钮,复制到word文档查看。

图片

           

并且,参考文献都是附在文中,链接有时候还不能跳转。好在,有标题信息,都能溯源。               

好了,以上就是近期四款主流的AI大模型ChatGPT/ Gemini/ Perplexity/ Grok的深度搜索和深度研究功能对比。我们可以根据场景和自己的需求选择不同的深度研究工具,提升科研效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/73224.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android SharedPreference 详解

前提:基于 Android API 30 1. 认识 SharedPreference SharedPreference 是 Android 提供的轻量级的,线程安全的数据存储机制,使用 key-value 键值对的方式将数据存储在 xml 文件中,存储路径为 /data/data/yourPackageName/share…

自动化测试脚本语言选择

测试人员在选择自动化测试脚本语言时面临多种选项。Python、Java、C#、JavaScript 和 Ruby 都是常见选择,但哪种语言最适合?本文将详细分析这些语言的特点、适用场景和优劣势,结合行业趋势和社会现象,为测试人员提供全面指导。 选…

【Java项目】基于JSP的KTV点歌系统

【Java项目】基于JSP的KTV点歌系统 技术简介:采用JSP技术、B/S结构、MYSQL数据库等实现。 系统简介:KTV点歌系统的主要使用者分为管理员和用户,实现功能包括管理员:个人中心、用户管理、歌曲库管理、歌曲类型管理、点歌信息管理&a…

element-plus文档解析之Layout布局(el-row,el-col)

前言 这是element-plus提供的响应式布局组件。可以非常方便的实现响应式布局以及快速按比例分块。 例如实现下面的效果: 第一行:宽度占100% 第二行:宽度1:1 第三行:1:1:1 第四行:1…

【Java】——数据类型和变量

个人主页:User_芊芊君子 🎉欢迎大家点赞👍评论📝收藏⭐文章 文章目录: 1.Java中的注释1.1.基本规则1.2.注释规范 2.标识符3.关键字4.字面常量5.数据类型6.变量6.1变量的概念6.2语法6.3整型变量6.3.1整型变量6.3.2长整…

串口数据记录仪DIY,体积小,全开源

作用 产品到客户现场出现异常情况,这个时候就需要一个日志记录仪、黑匣子,可以记录产品的工作情况,当出现异常时,可以搜集到上下文的数据,从而判断问题原因。 之前从网上买过,但是出现过丢数据的情况耽误…

JVM中是如何定位一个对象的

在 Java 中,对象定位指的是如何通过引用(Reference)在堆内存中找到对象实例及其元数据(如类型信息)。JVM 主要通过 直接指针访问 和 句柄访问 两种方式实现,各有其优缺点和应用场景: 一、直接指…

Mac 如何在idea集成SVN

在windows系统上面有我们最为熟悉的小乌龟TortoiseSVN,在mac系统上面则没有什么好用的svn的工具,而且大部分都付费,需要各种渠道找PJ版,费事费力,作为程序员,大部分人应该都会安装开发工具,本文…

批量测试IP和域名联通性

最近需要测试IP和域名的联通性,因数量很多,单个ping占用时间较长。考虑使用Python和Bat解决。考虑到依托的环境,Bat可以在Windows直接运行。所以直接Bat处理。 方法1 echo off for /f %%i in (E:\封禁IP\ipall.txt) do (ping %%i -n 1 &…

LabVIEW变频器谐波分析系统

随着工业自动化的发展,变频器在电力、机械等领域的应用日益广泛,但谐波问题直接影响系统效率与稳定性。传统谐波检测设备(如Norma5000)精度虽高,但价格昂贵且操作复杂,难以适应现场快速检测需求。本项目基于…

Unity Shader学习总结

1.帧缓冲区和颜色缓冲区区别 用于存储每帧每个像素颜色信息的缓冲区 帧缓冲区包括:颜色缓冲区 深度缓冲区 模板缓冲区 自定义缓冲区 2.ImageEffectShader是什么 后处理用的shader模版 3.computerShader 独立于渲染管线之外,在显卡上运行,大量…

OpenPLC WebServer启动

简述 OpenPLC OpenPLC 可运行在嵌入式系统和普通计算机上,其基本原理是在硬件上安装类似 Linux 的操作系统,并在该环境下运行 OpenPLC 应用程序,从而让用户开发、调试和运行工业自动化控制逻辑。它目前只支持部分 ARM 架构的嵌入式系统&…

【基础知识】回头看Maven基础

版本日期修订人描述V1.02025/3/7nick huang创建文档 背景 项目过程中,对于Maven的pom.xml文件,很多时候,我通过各种参考、仿写,最终做出想要的效果。 但实际心里有些迷糊,不清楚具体哪个基础的配置所实现的效果。 今…

ROS实践(四)机器人SLAM建图(gmapping)

目录 一、SLAM技术 二、常用工具和传感器 三、相关功能包 1. gmapping建图功能包 2. map_server 四、SLAM 建图实验 1. 配置gmapping(launch文件) 2. 启动机器人仿真(含机器人以及传感器) 3. 运行gmapping节点 4. 启动rviz可视化工具 5. 保存地图文件 一、SLAM技…

二进制安装指定版本的MariaDBv10.11.6

一、官网下载mariadb安装包 Download MariaDB Server - MariaDB.org 找到对应的版本 下载安装包后上传到服务器这里不再赘述。 二、安装二进制包 1、解压安装包 2、查看安装包内的安装提示文档根据提示文档进行安装 # 解压安装包 tar xf mariadb-10.11.6-linux-systemd-x8…

【抽奖项目】|第二篇

前言: 高并发的活动预热肯定不可以在数据库操作,需要redis,特别是这种秒杀活动更是需要注意,所以可以在高并发的前夕先进行活动预热。 思路: 1、 通过定时任务调度每分钟查询数据库也没有需要预热的活动 2、采用分布式…

异或和之和 第十四届蓝桥杯大赛软件赛省赛C/C++ 大学 A 组

异或和之和 题目来源 第十四届蓝桥杯大赛软件赛省赛C/C++ 大学 A 组 原题链接 蓝桥杯 异或和之和 https://www.lanqiao.cn/problems/3507/learning/ 问题描述 问题分析 要点1:异或运算 概念 异或(Exclusive OR,简称 XOR)是一种数学运算符,常用于逻辑运算与计算机…

从零到一:如何系统化封装并发布 React 组件库到 npm

1. 项目初始化 1.1 创建项目 首先,创建一个新的项目目录并初始化 package.json 文件。 mkdir my-component-library cd my-component-library npm init -y1.2 安装依赖 安装开发所需的依赖项,如构建工具、测试框架等。 npm install --save-dev webp…

现代互联网网络安全与操作系统安全防御概要

现阶段国与国之间不用对方路由器,其实是有道理的,路由器破了,内网非常好攻击,内网共享开放端口也非常多,更容易攻击。还有些内存系统与pe系统自带浏览器都没有javascript脚本功能,也是有道理的,…

2025-03-12 学习记录--C/C++-PTA 习题8-4 报数

合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下。💪🏻 一、题目描述 ⭐️ 习题8-4 报数 报数游戏是这样的:有n个人围成一圈,按顺序从1到n编好号。从第一个人开…