LLM应用剖析: 舆情分析多智能体-微舆BettaFish

news/2025/11/14 17:28:55/文章来源:https://www.cnblogs.com/mengrennwpu/p/19222764

1. 背景

近两周github一直霸榜的国产项目-微舆,引起了广泛的关注,113start3.4K,截止今天1114日,start26.6K,火箭原地起飞。

前几个月我也从事了舆情分析的相关项目,遂抱着学习的态度,花费了3天时间研究并调试了其中的运行机制。

2. 特色功能

(1) AI驱动的全网舆情监控系统

基于全天候运行的AI爬虫集群,覆盖微博、小红书、抖音、快手等10余个国内外主流社交平台。该系统不仅能实时追踪热点话题,还可深入挖掘海量用户评论,捕捉真实、多元的公众声音

(2) 超越单一模型的复合分析系统

融合了5类自研专业Agent、微调模型与统计中间件,形成多模型协同的分析架构。通过多模型互补增强,分析结果在深度、准确性与多维度视角上得到有效保证

(3) 多模态信息解析能力

突破图文限制,支持对抖音、快手等平台短视频内容的深度理解,并能精准提取天气、股票、日历等搜索引擎中的结构化多模态信息卡片,为全面把握舆情动态提供支持

(4) 基于Agent“圆桌讨论的协作机制

为不同Agent赋予专属工具与思维模式,并引入主持人模型,通过链式辩论与思维碰撞,打破模型同质化局限,有助于激发更高质量的集体智慧与决策建议

(5) 公私域数据无缝整合

除洞察公开舆情外,还提供高安全性接口,实现内部业务数据与舆情信息的高效融合。此举有助于打破数据孤岛,构建外部趋势+内部实情一体化的垂直业务洞察体系

(6) 轻量灵活的扩展架构

采用纯Python模块化设计,系统具备轻量化部署与灵活扩展的特性。清晰的代码结构使开发者能够快速接入自定义算法与业务逻辑,轻松实现平台定制与功能延展。

3. 整体架构

架构图 

整体流程如下:

(1) Flask接收用户的原始问题,并行调用三个Agent,其中

Insight Agent: 私有舆情数据库深度分析AI代理,用于私有数据库挖掘。

Media Agent: 具备强大多模态能力的AI代理,用于多模态内容分析。

Query Agent: 具备国内外网页搜索能力的AI代理,用于精准信息搜索。

(2) 每个Agent会分别执行以下步骤:

1) 基于用户Query生成报告段落(默认为5)

2) 针对每个段落分别执行初始检索并生成段落报告总结,其中Insight Agent主要检索本地数据库,Media Agent主要通过博查API进行检索,Query Agent主要通过Tavily API进行检索。

3) 检索之后进行多次迭代反思(默认为3),反思的过程是基于上一步的问题及总结等内容,判定是否存在遗漏偏差等情况,每次迭代均优化上一次迭代的段落总结

(3) 论坛Agent通过监控三个Agent的日志,实时收集三者的段落总结内容,且根据最近的5次的段落总结,检测三者是否围绕主题展开,方向是否存偏等问题。且总结后的结果,会同步到初始检索和反思环节,以引导三个Agent围绕主题进行深度研究。

(4) 4Agent执行结束后,再运行报告生成Agent,生成最终的报告。

4. 核心组件

4.1 Insight Agent的执行机制

Insight Agent

(1) 首先生成报告段落结构Plan,默认为5个段落,包含titlecontent

(2) 生成的每个段落迭代执行如下流程:

1) 初始检索并总结

a. 基于titlecontent,针对问题进行改写,以适配不同网站(B站、小红书、抖音、微博、知乎等)的问题风格,并提供诸多查询函数(包括按日期查找热点主题、全局热点主题等方法),输出最适配的查询函数及参数。

b. 基于改写后的问题,生成核心关键词(默认20)

c. 基于关键词以及匹配的查询函数,进行数据库查询,并对数据做去重处理。

d. 针对查询后的结果采用多语言情感分析模型进行分类。

e. 基于titlecontent、以及检索结果,生成段落报告总结。

2) 多次反思迭代及总结

整体执行流程与初始检索并总结的流程大体相同,不同之处在于反思检索的输入除了titlecontent外,还有最新的段落总结(第一次是首次检索后的总结,后续是前次反思迭代后的总结)作为输入。

(3) 多次反思迭代完成后,基于多个段落的内容(title, content, summary),生成最终的舆情报告。

4.2 Media Agent的执行机制

Media Agent

相比Insight Agent,流程相对简单一些,主要的不同之处在于前者查询数据库,后者通过博查API进行搜索调用。

4.3 Query Agent的执行机制

Query Agent 

Media Agent流程几乎一致,不同之处只是在于将博查API,切换到了 Tavily API

5. 源码说明

(1) 借鉴MediaCrawler项目,可以实时收集B站、小红书、抖音、微博、知乎、贴吧等主流网站,采集代码位于项目中的MediaSpider目录下。

(2) 代码比较简单,且不集成任何框架(包括LangGrahp, LangChain, LammaIndex),从头实现了多Agent之间的流程编排及交互。

(3) 代码相对冗余,可能确实是人家20岁小哥的手工作业做出来的。

(4) 后端以Flask提供服务,通过html中的Script部分完成前后端的完整交互,且内部基于streamlit嵌入三个Agent的页面。

6. 系统运行效果

 页面效果

7. 总结

一句话足矣~

本文主要讲解了微舆的整体架构,并通过研读并调试源码,整理了多个Agent各自的执行流程、以及前后端交互。

如项目原理、项目部署、源码等存在疑问,欢迎随时私信或留言交流!

8. 参考

(1) BettaFish: https://github.com/666ghj/BettaFish

(2) MediaCrawler: https://github.com/NanmiCoder/MediaCrawler

(3) DeepWiki: https://deepwiki.com/666ghj/BettaFish/1-overview

 微信

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/965558.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

详细介绍:kafka 4.x docker启动kafka4.0.0 docker-compose启动最新版kafka 如何使用docker容器启动最新版kafka

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

HIPCXX

https://rocm.docs.amd.com/projects/radeon-ryzen/en/latest/docs/install/installryz/native_linux/install-ryzen.html HIPCXX="$(hipconfig -l)/clang" HIP_PATH="$(hipconfig -R)" cmake…

Salesforce AI能理解业务、写代码,程序员还能做什么?

过去几年,Salesforce 一直在说“AI赋能开发”,但今年的 Dreamforce ’25,让这句话第一次真正落地。 这一届大会上,Salesforce 把 AI 从“助手”变成了参与者——能理解上下文、能协作、能写、能测、还能优化。 开发…

AI元人文:岐金兰的回应

AI元人文:岐金兰的回应 岐金兰 2025年11月14日 面对诸多对"AI元人文构想"的质疑,我需要作出如下澄清。这些质疑源于传统思维范式,而我们的构想恰恰是要超越这种范式。 关于价值降解的可行性 有人说价值不…

化工产线再升级,稳定互联profinet转devicenet网关连接技术研究

本案例适用于化工生产过程控制系统,西门子S7-1200PLC通过Profinet总线连接DeviceNet主站网关,网关下联DeviceNet从站型传感器(压力、温度传感器)和执行器(电磁阀),实现现场设备数据的采集与控制信号的下发。核心…

2025 11 14

CF2119D 计数,dp考虑当 \(p_i\) 固定的时候选 a 数组方案数是确定的,即为所有 \(p_i > 0\) 的乘积 考虑 \(p_i <= i\) 这个条件,可以看成带系数的类似于括号匹配的东西 很明显这并不是我想到的,我一直在想怎么…

用户头像文件存储机制是如何实现的?

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年行星减速机十大优质品牌排行榜,RV减速机/伺服减速机/传动减速机/传统减速电机/朕轴器/vgm减速机/精密行星减速机企业有哪些

行业背景与评选标准 随着工业自动化程度不断提升,行星减速机作为精密传动领域的核心部件,其市场需求持续增长。本次排行榜基于企业技术实力、产品性能、市场口碑及服务体系等多个维度,对行业内优质供应商进行综合评…

2025年真空管道软管厂家权威推荐榜单:给排水管道软管/由令波纹软管/快接波纹软管源头厂家精选

在工业自动化与管道输送技术持续发展的背景下,真空管道软管作为连接系统中的关键部件,其性能直接关系到整个系统的密封性能与运行效率。 据行业数据显示,2025年全球工业软管市场规模预计将保持稳定增长,其中耐真空…

2025年家具定制厂家权威推荐榜单:智能全屋定制家居/全屋定制/全屋定制家具源头厂家精选

在消费升级与个性化需求双重驱动下,我国家具定制行业正迎来新一轮发展机遇。据行业数据显示,2025年定制家居市场规模预计将突破6000亿元,消费者对环保、设计、服务的需求持续升级。 本次榜单基于技术实力、生产能力…

OI 笑传 #27

KanataharukaABC 小思维。口胡为主。 ABC407E 反悔贪心题。 由这个题我们导出一个关于合法括号序列的充分必要条件:对于一个长度为 \(2N\) 的合法括号序列 \(S_{2N}\),对于其任意的一个前缀子串 \(S_{1,i},i\in [1,2…

白银滚珠瓶凝胶伺服灌装机

近年来,白银制品及日化凝胶类产品在消费市场持续升温,带动滚珠瓶包装需求激增。然而行业快速扩张的同时,低价劣质设备泛滥、性能与标称严重不符等问题频发,导致终端用户在设备选型时陷入“低投入高维护”的恶性循环…

学习sql笔记

SQL 学习 首先: 练习sql的网址吧:https://sqlbolt.com/lesson/select_queries_introduction 学习地址:https://liaoxuefeng.com/books/sql/introduction/index.html 我是根据学习地址的练习题顺序来进行学习 基本语法…

2025年市场口碑好的河道护坡石笼网厂商口碑推荐榜,抗冲击抗腐蚀石笼网/柔韧抗压石笼网/锌铝合金石厂商推荐

行业背景与评选标准 随着国家水利基础设施建设投入持续加大,河道护坡石笼网作为重要的防护材料,其市场需求呈现稳步增长态势。据行业数据显示,2024年我国石笼网市场规模已突破120亿元,预计2025年将保持8%以上的增速…

2025 最新推荐!莆田自闭症机构推荐榜:行为训练、社交干预、专注力提升权威机构精选孤独症/多动症/多动症训练/孤独症训练矫正机构推荐

依据国际自闭症协会(ISA)最新测评报告,科学干预可使特殊儿童康复有效率提升 68%,而专业机构的干预效果是普通家庭训练的 3.1 倍。本次榜单采用国际通用的五维测评体系,确保推荐权威性与专业性:一是资质认证,核查…

P10360 [PA 2024] Desant 3

又是神秘模 2 计数题。 题意 有 \(n\) 个人,每个人有一个 01 数字,有 \(m\) 次操作,从 \(1\) 开始轮流执行每个操作,操作给出 \(a_i,b_i\),表示说若当前第 \(a_i\) 个人持有数字 1 且第 \(b_i\) 个人持有数字 0 则…

表格2-数组操作方法

表格2-数组操作方法✨ 数组操作方法推荐整理:按功能分类类别 核心功能 主要方法 是否修改原数组(副作用) 学习重点I. 转换/遍历 (The Big 3) 创建新数组,不改变原数组结构,用于数据转换。 map() 否 (No) 用于一对…

2025 最新莆田语言智力机构推荐!语言智力康复机构口碑排行榜 特殊儿童开音训练 / 障碍矫正 / 康复干预权威指南

引言 特殊儿童语言智力发育障碍问题日益凸显,相关国际协会测评数据显示,特定年龄段儿童中,谱系障碍、语言发育迟缓等问题的检出率持续攀升,科学干预成为改善预后的关键。而精准测评是有效康复的前提,当前权威测评…

上课

第一节形势与政策

典枢平台“数据经纪人”功能:打通数据供需,高效实现数据变现

参考:典枢平台 “数据经纪人” 功能:打通数据供需,高效实现数据变现在数据驱动业务的当下,数据流通效率直接影响业务推进节奏。但实际操作中,不少数据从业者都被供需对接难题困扰 —— 优质数据触达不到精准用户,…