【GitHub每日速递 250929】告别手动查资料!这两个开源项目(17.8k+星)让 AI 帮你做深度研究,报告自动生成

news/2025/9/29 8:28:56/文章来源:https://www.cnblogs.com/freedom-w/p/19118054

image

原文:https://mp.weixin.qq.com/s/uxRt8xAdWX59n3RkoDJ5Vg

AI + 搜索引擎 = 无敌研究助手?这个开源项目让深度调研效率翻倍

1

项目概述

Open Deep Research 是一个基于 AI 的研究助手,通过结合搜索引擎、网页抓取和大型语言模型,对任何主题进行迭代式深度研究。该项目旨在提供深度研究代理的最简单实现,目标是将仓库大小控制在 500 行代码以内,以便于理解和扩展。

项目地址:https://github.com/dzhng/deep-research

主要语言:TypeScript

stars: 17.8k

核心功能

  • 迭代研究:通过迭代生成搜索查询、处理结果并基于发现进行深入研究
  • 智能查询生成:使用 LLM 根据研究目标和先前发现生成有针对性的搜索查询
  • 深度与广度控制:可配置的参数控制研究的广度和深度
  • 智能跟进:生成后续问题以更好地理解研究需求
  • 综合报告:生成包含发现和来源的详细 markdown 报告
  • 并发处理:并行处理多个搜索和结果,提高效率

工作原理

项目遵循以下工作流程:

  • 接收用户查询、广度参数和深度参数
  • 生成 SERP(搜索引擎结果页)查询
  • 处理搜索结果,提取学习内容和研究方向
  • 根据深度参数决定是否继续深入研究:
    • 如果深度 > 0,基于先前目标、新问题和学习内容生成下一个研究方向
    • 如果深度 = 0,生成最终的 markdown 报告

技术栈

  • 依赖库
    • @ai-sdk/fireworks@ai-sdk/openai:AI 模型集成
    • @mendable/firecrawl-js:网页搜索和内容提取
    • ai:AI 功能支持
    • express:可能用于构建 API 服务
    • p-limit:控制并发处理
    • zod:类型验证

环境要求

  • Node.js 环境(项目指定 Node.js 22.x)
  • 以下 API 密钥:
    • Firecrawl API(用于网页搜索和内容提取)
    • OpenAI API(用于 o3 mini 模型)

安装与设置

Node.js 方式

  • 克隆仓库
  • 安装依赖:npm install
  • .env.local 文件中设置环境变量(FIRECRAWL_KEY 等)

Docker 方式

  • 克隆仓库
  • .env.example 重命名为 .env.local 并设置 API 密钥
  • 构建镜像:docker build -f Dockerfile
  • 运行容器:docker compose up -d
  • 在容器中执行:docker exec -it deep-research npm run docker

社区实现

  • Python 版本:https://github.com/Finance-LLMs/deep-research-python

🦌 DeerFlow 仓库介绍

2

项目概述

DeerFlow(全称 Deep Exploration and Efficient Research Flow,即深度探索与高效研究流程)是一个社区驱动的深度研究框架,基于开源社区的杰出成果构建而成。其核心目标是将语言模型与网络搜索、爬虫、Python 代码执行等专业工具相结合,同时回馈开源社区。

项目地址:https://github.com/bytedance/deer-flow

主要语言:python

stars: 17.2k

主要特点

  • 无缝集成语言模型与各类专业工具,支持网页搜索、数据爬取、Python 代码执行等功能
  • 社区驱动,源于开源并回馈开源社区
  • 提供 Web UI 界面,便于用户操作使用
  • 支持生成全面的研究报告,还能基于报告创建播客音频等内容

应用场景

可用于多种深度研究任务,例如:

  • 分析热门技术(如 OpenAI Sora、Google 的 Agent to Agent 协议等)
  • 追踪 GitHub 热门仓库信息
  • 研究特定主题(如比特币价格波动、LLM 相关知识等)
  • 生成各类专题报告(如南京传统菜肴介绍、出租公寓装饰指南等)

部署与使用

  • 已正式入驻火山引擎的 FaaS 应用中心,用户可通过体验链接在线体验
  • 支持基于火山引擎一键部署
  • 也可本地部署,需满足 Python 3.12+ 和 Node.js 22+ 等环境要求,通过 git 克隆仓库后按照文档进行安装配置

相关资源

  • 官方网站:https://deerflow.tech/
  • 提供多语言文档,包括英文、简体中文、日本语、德语等
  • 仓库中包含多个示例研究报告和使用案例,帮助用户快速了解其功能和使用方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/921569.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业门户网站开发背景韩国小游戏网站

不好意思,我要放大招了! 在今天的杭州云栖大会上,阿里巴巴首次公布人工智能调用规模: 每天调用超 1万亿 次 服务全球 10亿 人 日处理图像 10亿 张 视频 120万 小时 语音 55万 小时 自然语言 5千亿 句 在AI芯片、AI云服务、AI算…

订单模块

首先,订单模块是家政项目的 “核心枢纽”—— 它衔接了用户端(下单需求)、服务端(服务信息)、支付模块(资金流转)和优惠券模块(权益核销),核心目标是管理订单从创建到完成 / 取消的全生命周期,确保流程合规…

网站数据库是什么dz网站模板

在Spring框架中,TransactionSynchronizationManager扮演着事务同步管理的核心角色,它不仅负责跟踪当前活动事务的状态,还提供了在事务生命周期中注册回调方法的能力,使得开发者能够在事务开始、提交、回滚等关键时刻执行自定义逻辑…

PS中如何让文字中两行文字实现左对齐且中间部分文字对齐

背景 见图片:如果仅靠添加空格很难实现,我当时就是空格空格对齐(结果被T了) ============================================================================================== 前面的两个还好,因为前面文字一样…

通王网站内容管理系统安徽建站系统

继续梳理以太网的DMA描述符。 以太网DAM描述符的结构 有两种结构,链式结构和环形结构。 常用的是链式结构。 标准库中,关于DMA描述符的数据结构 以gd32f4xx_enet.c为例。 先说发送描述符。 系统分配了5个发送描述符。每个描述符对应的缓冲区大小为152…

手写MyBatis第78弹:装饰器模式在MyBatis二级缓存中的应用:从LRU到防击穿的全方案实现 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

前端获取接口材料流程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Lucene 8.7.0 版本中dvd、dvm文件详解 - 教程

Lucene 8.7.0 版本中dvd、dvm文件详解 - 教程2025-09-29 08:12 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: b…

APEX实战第5篇:利用APEX程序直观体验向量近似检索能力

APEX实战第5篇:利用APEX程序直观体验向量近似检索能力2025-09-29 08:14 AlfredZhao 阅读(0) 评论(0) 收藏 举报在圈内朋友看来,Oracle 数据库的 多模能力 已经不是什么新鲜话题。它不仅在关系型数据管理方面独树…

告别复制粘贴!Chat2File-DeepSeek 让 DeepSeek 对话成果直接变“成品” - 指南

告别复制粘贴!Chat2File-DeepSeek 让 DeepSeek 对话成果直接变“成品” - 指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-f…

详解 PHP 中的命名空间 Namespace 与 PSR4 自动加载

详解 PHP 中的命名空间 Namespace 与 PSR4 自动加载 随着 PHP 项目规模增长,文件管理和类加载问题逐渐凸显:散乱的目录结构、频繁的 require_once 调用、难以维护的类依赖关系。本文通过 namespace 和自动加载技术,…

html5购物网站模板艾佳工业设计

动态调用的作用 类似于其他语言的反射能够开发框架性代码 Call调用语法 (bool success, bytes data) <address>.call(bytes calldata)call是address的方法call返回值(bool success, bytes data)忽视返回值success&#xff0c;会造成严重问题 calldata的结构 call的…

构建易受攻击的AWS DevOps环境:CloudGoat场景实践

本文详细介绍如何在CloudGoat中构建易受攻击的AWS DevOps环境,包含完整的攻击路径分析,从初始权限提升到供应链安全漏洞利用,展示了真实的云安全测试场景。构建易受攻击的AWS DevOps环境作为CloudGoat场景 CloudGoa…

摩尔线程88天过会,过会当天提交注册:看懂这3个关键,才算懂国产GPU的“生存逻辑”

微信视频号:sph0RgSyDYV47z6快手号:4874645212抖音号:dy0so323fq2w小红书号:95619019828B站1:UID:3546863642871878B站2:UID: 3546955410049087摩尔线程88天冲刺上市:看懂这3个关键,才算懂国产GPU的“生存逻辑…

2025最新四面刨厂家权威推荐排行榜:四面刨厂家实力品牌测评,含定制,高速,重型四面刨优选指南

四面刨作为竹木加工的核心设备,其精度与稳定性直接决定产品合格率与生产效率。当前市场中,既有深耕多年的老牌企业,也涌现出一批技术创新的新锐品牌,但同时存在设备精度参差、定制能力不足、售后响应滞后等问题 —…

Java之泛型使用教程

下面我将为你编写一个使用泛型类的示例代码,这个示例实现了一个通用的"配对"(Pair)类,可以存储两个相同或不同类型的值,并提供基本的操作方法。 这个示例展示了泛型类的几个重要特性:多类型参数:Pair…

单调栈优化DP [ROI 2018] Decryption

题意 要求把一个序列划分成很多段,要求对于每段,最大值是末项,最小值是首项。 求最小划分段数。 解法 我们贪心来思考,若我们要保证一直到 i 是合法的,左端点显然是越往左越好,但是在全局上是并没有这个性质的,…

上海住宅新规调整,背后的野心可大了

微信视频号:sph0RgSyDYV47z6快手号:4874645212抖音号:dy0so323fq2w小红书号:95619019828B站1:UID:3546863642871878B站2:UID: 3546955410049087各位,看到这份文本了吗 添加图片注释,不超过 140 字(可选)没看…

手工调整pip whl 文件内容

手工调整pip whl 文件内容属于一个比较常见的问题,比如我们希望自己修改一个whl 文件的内容,但是还是通过pip install 的模式,不希望通过pip 安装之后再手工进行文件替换,解决方法比较简单 有源码的 可以自己重新构…

魔兽争霸3冰封王座安装包下载

​在即时战略游戏的发展史上,有一款作品如同丰碑般屹立不倒,它就是2003年发布的《魔兽争霸3:冰封王座》。即便时光流转二十余载,这款游戏依旧凭借其深厚的玩法底蕴与强大的玩家粘性,活跃在游戏圈中,成为无数玩家…