马斯克今天,开源了推特 X 的信息流推荐系统的工作代码与原理

news/2026/1/20 23:10:27/文章来源:https://www.cnblogs.com/duyuanshang/p/19509044
img

今天下午,马斯克如约奉告。

本文的完整版原文全文地址:https://www.ccgxk.com/emlog_dev/625.html

当然,这种技术公开,其实价值就不再很大了,马斯克本人说该算法垃圾啊,估计会大改,但依然非常有趣。

不过,马斯克和特朗普一样,都是全球知名后就一直行为离谱的人,他把自己旗下的东西该开源的都开源了,今天竟然把推荐算法也开源了。

(PS:作为一个出海 SaaS AI 网站从业者的我,渴望盼望,谷歌 Google 也能像他一样,如此详细地开放它的排名算法,干 SEO 猜了快 10 年了,每年一更新都要重新猜,永远猜不对.... )

短着看的话,对于运营者来讲,游客行为影响大概就下面这些内容:

img

图片由 @chelsonw_ 整理

四大影响:

一、不要放 外链(链接),这个虽然默许,但暗中惩罚最严重!

二、评论区的评论,很影响帖子的推荐(要多回复、评论,甚至「吵架」),收藏次之。

三、垂直度相对很重要。

四、拉黑、点踩,最不重要!

而一些反常识的真相,点赞和转发反而很低。

(很有意思的是,这个权重,其实早在 2023 年就公布了~ )

怎么看待这件事呢?

我觉得马斯克可能会赢,因为对于社区来讲,这个推荐算法就不应该是一个黑箱,而是应该公开可见。

我还是很期待之后四周一更新,到最后能搞出个什么超级推荐算法。甚至能比最先进的 抖音 Tiktok 算法还厉害。下面说一些细节。

算法的开源仓库是 : https://github.com/xai-org/x-algorithm

(仓库包含部分的真实的生产环境下的工作代码)

首先你的推特首页,给你推荐的帖子,有两个来源:你关注的账号和全局语料库里发现的帖子。

然后这俩内容,会通过 Phoenix (凤凰模型)合并排序。基于马斯克自家的 Grok 改造过的人工智能模型。

这个凤凰模型,主要用于预测贴文的互动概率。并且也强调了,这个模型里面没有人类大拍脑门搞的各种创意规则,而是完全由人工智能推荐。

整个推特 X 的推荐架构是:

img

其中,最上面的核心调度层(Home Mixer),在你刷新首页后,开始为你整理这个信息流。

从 用户的【关注表与互动历史】 和 【凤凰模型】里选数据。如果不够,就用数据填充表 Hydrators 里找数据充数。

现在数据有了,就移除不合格的内容,用过滤器 Filters:

之后用 Scorers 给这些内容打分,用 Selector 选出前 n 项,之后再去重,然后缓存用户的请求,返回这个最终排名,然后你就刷到了!

Thunder 引擎

这个东西,可以在 100 毫秒内,获取用户的所有近期内容,能自动增删查改,它在服务器内存里,而不是服务器里,速度很快。

Phoenix 引擎

这个是机器学习模型,它包括检索相似的帖子的模型 双塔模型(Two-Tower Model),以及排序。预测内容的未来互动概率(即点赞、回复、转发、点击等),并且排序时,会将各个内容分类好,相互紧挨的内容,类别不同,互不相同。

整个过程,就是这个样子!

这些不是什么有趣的东西,毕竟推荐系统这样设计,谁都会。

但是最值钱的,就是这个模型到底是怎么给内容高分、低分的。这在所有算法推荐社媒公司都是机密,被人知道搞清楚后,会被作弊,把低质量内容刷高。

下面是真实的 凤凰模型 打分(预测)指标点:

Predictions
├── 收藏概率
├── 回复概率
├── 转发概率
├── 引用转发概率
├── 点击概率
├── 进入个人主页概率
├── 视频观看概率
├── 图片展开概率
├── 分享概率
├── 停留时长概率
├── 关注作者概率
├── 标记不感兴趣概率
├── 拉黑作者概率
├── 屏蔽作者概率
└── 举报概率Final Score = Σ (weight_i × P(action_i))P(action_i) 是预测值
weight_i 是系统权重(全站固定的,根据效果会慢慢迭代)
累加得出一个最终得分

其中,真正核心的代码,是这个开源仓库的 x-algorithm/phoenix/runners.py 这个 Python 文件。

注意,我上面给出的那个各信号权重,比如点赞权重很小,相互回复,权重很大,是基于这里面的逻辑进行估算的。真正的权重值依然未公开,也无法公开,因为那是 LLMS 大语言模型估算的,即便是工作人员也很难拿到一个精确的值。

但大致根据代码能感受到回复、停留时间的权重很高很高,但点赞几乎微乎其微。

这个并非完全没有线索,早在 2023 年,就已经给出了早些年的权重:

https://github.com/twitter/the-algorithm-ml/blob/main/projects/home/recap/README.mdgithub.com/twitter/the-algorithm-ml/blob/main/projects/home/recap/README.md

后续是在其基础上进行微调:

img

其值为:

点赞的权重是 0.5
转发权重是 1.0。比点赞重要一点。
回复权重是 13.5
高质量的作者主页点击,权重 12.0
视频播放到 50% 的权重是 0.005。几乎可以忽略。
作者参与的回复,权重 75.0。这是极其强的信号。
高质量点击,权重 11.0
改进版的高质量点击,权重 10.0
负反馈的权重是 -74.0
举报的权重是 -369.0

当时没有给出具体排序算法,现在算法有了,因此可以得出上图的那个大概的结论。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1191136.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python(68) : 提前文件夹所有图片, 重名处理

import os import shutil from pathlib import Path# 源目录和目标目录 SOURCE_DIR r"E:\工作台\87_牧原POC\豆包安装包" TARGET_DIR r"E:\工作台\87_牧原POC\豆包素材"# 支持的图片格式 IMAGE_EXTENSIONS {.png, .jpg, .jpeg, .gif, .bmp, .webp, .svg…

0.4 View 工作流程

自定义 View 核心要点总结与代码注释 一、核心知识点总结 1. View 的工作流程measure:确定 View 的测量宽高(onMeasure) layout:确定 View 的最终位置(onLayout,对单一 View 无作用) draw:将内容绘制到屏幕上(…

双向隔离DCDC仿真之Simulink探索

双向隔离DCDC仿真simulink在电力电子领域,双向隔离DC - DC变换器因其能实现能量双向流动且电气隔离的特性,在众多场合如电动汽车、分布式能源存储系统中有着广泛应用。而Simulink作为一款强大的系统级建模与仿真工具,为双向隔离DC - DC变换器…

西门子s7 200smart与3台力士乐变频器通讯程序 原创可直接用于生产的程序,程序带注释...

西门子s7 200smart与3台力士乐变频器通讯程序 原创可直接用于生产的程序,程序带注释,并附送触摸屏程序,有接线方式和设置,通讯地址说明等。 程序采用轮询,可以后续根据要求适当修改后扩展。 器件:西门子s7 …

AI 智能体全攻略:从入门到落地的实战指南

大家好我是菲菲~~如果你关注 2025 年的 AI 领域动态,想必会发现 “智能体(Agents)” 已成行业热词。这种具备自主工作能力的 AI 形态,既能处理日常琐事,也能驾驭企业级复杂多智能体工作流,其发展潜力不可限…

0.3 view 滑动冲突

Android 触摸事件分发与滑动冲突处理 — 完整文档 一、核心知识点总结 1. 事件分发流程(Event Flow)事件传递路径:Activity → Window (DecorView) → ViewGroup → View 若所有子 View 均未消费事件,最终会回传到…

OIFC 2026省选 0120

胜兵必骄 wars 称 \(a=1\) 为黑色,否则为白色。 注意到一次战斗本质是交换颜色,一条边被操作两次不会对颜色产生影响。最初的想法是找到一个黑点 \(u\),与白色儿子交换颜色,递归到子树处理;同色的儿子提前递归,回…

流量累计程序 博途v15编写的西门子流量累计程序,封装好的FB块直接可以拿来用,并且配有视频解说

流量累计程序 博途v15编写的西门子流量累计程序,封装好的FB块直接可以拿来用,并且配有视频解说,轻松学会最近在调试现场流量计项目,发现不少新手对累计流量功能实现总是卡壳。今天就给大家拆解一个我封装好的博途V15流量累计FB块&…

2026年广东比较好的刀塔机定制需要多少钱,Y轴/尾顶机/排刀机/数控4+4/正交Y/动力刀塔/直Y,刀塔机厂家推荐排行

近年来,随着中国制造业向高端化、智能化转型,刀塔机作为数控机床领域的核心设备,其技术迭代与定制化需求持续攀升。据行业统计,2025年国内刀塔机市场规模突破120亿元,广东作为制造业大省,占据全国35%以上的市场份…

qt之实现截图效果

以下是修改后的代码,实现鼠标滑动矩形区域截图功能: #include <QGuiApplication> #include <QScreen> #include <QPixmap> #include

【毕业设计】springboot基于大数据技术的诗词信息系统(源码+文档+远程调试,全bao定制等)

java毕业设计-基于springboot的(源码LW部署文档全bao远程调试代码讲解等) 博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、…

【Python】解决 Windows 下 pip 安装报错 OSError: [Errno 2] No such file or directory (路径过长问题)

目录 【Python】解决 Windows 下 pip 安装报错 OSError: [Errno 2] No such file or directory (路径过长问题) 1. 问题描述 2. 原因分析 3. 解决方案 方案一&#xff1a;修改临时目录路径&#xff08;最快&#xff0c;无需重启&#xff09; 方案二&#xff1a;解除 Wind…

深夜调模型的工程师都懂,燃油车和电动车之间总得有个“和事佬“——增程器。今天咱们聊的这个Cruise仿真模型,就是要把这个中间商做出价值

cruise模型&#xff0c;增程汽车仿真模型&#xff0c;串联混动&#xff0c;基于cruise/simulink联合仿真。 实现增程器多点控制策略&#xff0c;及电制动优先的能量回收策略。 提供cruise模型、控制策略文件以及策略说明文档&#xff0c;方便您在模型基础上进行扩展。先看底盘架…

《把脉行业与技术趋势》-72-伟大的组织,不只是会收割,更要会培育土壤。“春天开荒播种是为了秋天收获果实”。

导入期&#xff08;春&#xff09;&#xff1a;开荒播种&#xff08;技术商业可行&#xff09; 成长期&#xff08;夏&#xff09;&#xff1a;快速成长&#xff08;抢占市场份额&#xff09; 成熟期&#xff08;秋&#xff09;&#xff1a;收获果实&#xff08;获取利润收益&a…

【python实用小脚本-336】HR如何用Python改造敏感信息传递流程?信息安全×代码的化学反应,轻松实现音频隐写术

一、那个差点让我丢饭碗的"保密文件"事件 去年做HR总监助理时&#xff0c;我负责向15位高管同步一份未公布的组织架构调整方案。按照"传统流程"&#xff0c;我加密了PDF&#xff0c;单独发送了解压密码&#xff0c;还特意微信叮嘱"阅后即焚"。结…

【2026开年巨献】Gemini 3.0全面解析:从技术原理到商业落地,开发者不可错过的AI革命指南

&#x1f680; 一、开篇&#xff1a;当Gemini 3.0重塑AI格局&#xff0c;开发者如何把握机遇&#xff1f;&#x1f3af;&#x1f525; 2026年1月20日重磅&#xff1a;Google最新财报披露&#xff0c;Gemini已成公司增长新引擎&#xff01;全球10亿设备搭载Gemini&#xff0c;企…

【GoFrame (GF) 】高性能、模块化、企业级的 Go 语言开发框架

文章目录前言一、核心架构1. 基础层&#xff08;Core Foundation&#xff09;2. 核心层&#xff08;Core Modules&#xff09;3. 扩展层&#xff08;Extended Modules&#xff09;4. 基础设施层&#xff08;Infrastructure&#xff09;二、关键技术特性解析1. 高性能设计2. 易用…

【计算机毕业设计案例】基于springboot+大数据技术旅游商品管理系统大数据毕设选题推荐:基于大数据技术旅游商品管理系统基于springboot+大数据技术旅游商品管理系(程序+文档+讲解+定制)

java毕业设计-基于springboot的(源码LW部署文档全bao远程调试代码讲解等) 博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、…

【2026 深度观察】大模型战国时代:中美双极、四强争霸与生态分化

目录 【2026 深度观察】大模型战国时代&#xff1a;中美双极、四强争霸与生态分化 前言&#xff1a;告别“单体为王”&#xff0c;拥抱“各司其职” 一、 Anthropic&#xff1a;代码与 Agent 的“无冕之王” 二、 OpenAI&#xff1a;逻辑推理与数学的“象牙塔尖” 三、 Go…

同步FIFO的三种写法各有特点。计数器法直接用读写计数器差值判断空满,适合小深度场景。举个例子,当depth=1时可以直接用寄存器存储数据

FIFO verilogIP 包括深度为1的fifo 包括普通同步FIFO和异步FIFO&#xff0c;均为first word fall through模式&#xff0c;同步fifo三种写法&#xff0c;异步fifo三种写法&#xff0c;可参数化配置&#xff0c;接口为fifo的基础接口 提供基础的testbench&#xff0c;两种fif…