推荐系统用户反馈延迟新解法!阿里提出CVR无偏估计算法

e67930c5427c7b337fd871b21c3e2bb3.jpeg

文 | Shona

在广告、电商场景中,流式样本通常只会在一个较短的窗口采样用户的行为,但用户从点击到转化的时间窗口可能很长,比如逛淘宝时,点击一件商品后可能在其他平台对比很久后才会下单,这导致在流式样本采样的时间窗口中并未记录该转化行为,进而该样本被错误地归为正样本,从而影响CVR预估效率,这类问题通常被称作延迟反馈(Delayed Feedback)问题。

延迟反馈是流式样本中的典型问题,理想状态当然是使采样的窗口足够大,但是这会导致很高的存储成本,不是很划算。因此早期针对延迟反馈问题,一般都会引入一个模型预测转化的延迟时间进而利用延迟转化的样本,但是在业界的流式架构中很难避免这个预测转化时间的模型使用无偏样本训练,并且延迟的样本比较稀疏,较难有较高的精度。

现在针对延迟反馈问题,通常聚焦在如何充分利用正样本上。延迟反馈的样本在不同的采样窗口中会分别生成不同label的样本,这两条样本都会参与训练,这会导致训练样本的分布与真实样本分布存在bias,需要使用重要性采样对延迟反馈的样本进行纠偏,尽管这种方式在很多场景下都是有效的,但是这种方式不能解决假负样本也参与训练的问题,可能会影响模型精度。阿里这篇文章通过矫正重要性采样中不同样本的权重优化了延迟反馈问题,在公开数据集以及工业界的数据集上都取得了较好的效果。

论文标题
Asymptotically Unbiased Estimation for Delayed Feedback Modeling via Label Correction

论文链接
https://arxiv.org/pdf/2202.06472.pdf

0c3352bcbbf9af10eb9024095f398aa1.png问题描述4899c436555563fb1dc116f554d3e48a.png

在CVR预测问题中,有以下的符号表示:

:训练样本,为样本特征,为 label,表示是否被转化
:真实样本分布
:流式训练中样本分布
:流式训练采样窗口,一般几十分钟
:特征窗口,一般很长,可能一天到一周

在流式训练中,样本可以划分为如下四类:

1)

402 Payment Required

,在观察窗口内转化的样本
2),在点击后到转化到样本,内的时间窗口中被识别为负样本
3),超过特定时间没有转化的样本
4)

402 Payment Required

,在点击后到转化到样本,后的时间窗口被识别为正样本
3d60d2a43039604a572d8f45e9e73137.png

对于、样本,在训练样本中的分布和真实分布相同,不需要做特殊处理,现主要对、进行纠偏

7c2c2deb5625a657518c1b0fc760d891.png方法845070754e3612fbaa143713969b7387.png

如前文描述,由于、 作为特征相同、label不同的样本重复加入模型训练,在训练样本中的分布和在真实样本中的分布不一致,训练时的loss需要使用重要性采样:

这里在重要性采样时,第一个近似的地方引入了:

第二个近似的地方将化为CVR预估问题中常用的BCE loss。

由此可见,如果要得到准确的重要性采样结果,需要得到、、、四种样本的

文本通过表示样本种类,则表示样本是的概率。从第一次近似的公式出发,我们可以转化问题为:

402 Payment Required

这里用表示不同样本的权重

进一步地,分别带入四种样本,可以将上述公式转化为:

402 Payment Required

其中为引入的延迟参数,用于表示样本是否为FN,令为FN样本的重要性采样权重,对于四种样本的重要性采样权重,则可以推导出以下关系:

其中,因为在训练样本和真实样本中分布一致;

有了以上假设,现在可以针对不同的样本给出准确的loss函数,对于负样本:

402 Payment Required

对于正样本、,可以表示为:

因为也是一个预估模型,预测样本为样本的概率,在中有和项,两个预估项相乘会增大模型的方差,为了减小方差,本文设计了一套多任务学习框架来优化:

e11e3276d9385dac467e562ca361e790.png

对于样本,由于其本身是无偏的,则可以直接训练
对于样本,这部分样本有偏,则会使用上述的重要性采样训练
通过这种两段式的训练,能够降低系统的方差,提高在样本的精度。

4de005dc09066f0c870c6aff25718dfb.png具体实例9612bb4b1b03e42de352a465a4b7a96a.png

本文在Criteo和Taobao Dataset数据集上验证了实验效果,为了模拟线上流式样本的训练范式,每个数据集都拆分成了两个部分,如果第一部分的样本在第二部分转化,则第一部分的label设置为0,然后参照流式训练的方式按照小时训练。使用这种训练范式尝试了多种处理样本的算法:

9ac7a67eea069a5088c258b98412f6fc.png

527ccde1da4f7b9b12dc0e89b7a7966b.png小结ccb4f823e211c9a4222bd66d90904485.png

本文主要减轻了CVR延迟反馈样本带来的训练bias,并且有较严格的证明推导与实验结果。在流式场景下引入额外的模块预测负样本是否为延迟样本,进而能够从理论上近似无偏估计,同时结合多任务学习减轻引入额外模块导致的方差变大的问题,整体比较solid。

0a8f9677f3b6831119876d868762cec4.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

558370dd67cc0ba34d51bca249d93c8e.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477197.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1368. 使网格图至少有一条有效路径的最小代价(BFS最短路径,难)

1. 题目 给你一个 m x n 的网格图 grid 。 grid 中每个格子都有一个数字,对应着从该格子出发下一步走的方向。 grid[i][j] 中的数字可能为以下几种情况: 1 ,下一步往右走,也就是你会从 grid[i][j] 走到 grid[i][j 1]2 &#xf…

Spring Boot工程结构推荐

今天看了一位简书上朋友发来的工程,于是想到应该要写这么一篇。前人总结的最佳实践案例可以帮助我们免去很多不必要的麻烦。花点时间来看一下本文,绝对物超所值。 工程结构(最佳实践) Spring Boot框架本身并没有对工程结构有特别…

GPT-3写了一篇论文

文 | Pine 发自 凹非寺源 | 量子位咦?这篇论文有点不对劲,第一作者看起来不像是人类的名字:一作的署名GPT-3,所属单位OpenAI。是的!你没看错,GPT-3写了一篇关于自己的论文。此前,GPT-3已经撰写过…

程序员面试金典 - 面试题 02.03. 删除中间节点

1. 题目 实现一种算法,删除单向链表中间的某个节点(除了第一个和最后一个节点,不一定是中间节点),假定你只能访问该节点。 示例: 输入:单向链表a->b->c->d->e->f中的节点c 结果…

Spring Boot开发Web应用

Spring Boot快速入门中我们完成了一个简单的RESTful Service,体验了快速开发的特性。在留言中也有朋友提到如何把处理结果渲染到页面上。那么本篇就在上篇基础上介绍一下如何进行Web应用的开发。 静态资源访问 在我们开发Web应用的时候,需要引用大量的j…

双塔模型的最强出装,谷歌又开始玩起“老古董”了?

文 | 兔子酱双塔模型已经证明在搜索和问答任务中是非常有效的建模方法,理论和业务落地已相当成熟。双塔根据参数共享程度不同,通常会归纳成两类:Simese dual encoder和Asymmetric dual encoder,前者参数结构完全对称,后…

LintCode解题目录

看见 LintCode 的代码能力测试CAT(Coding Ability Test)挺好,有倒计时,挺有面试紧迫感。做个记录。 另有本人 LeetCode解题目录、《程序员面试金典》解题目录、《剑指Offer》解题目录 我的 LintCode 主页 75 / 1505 算法问题 …

BERTopic:NLP主题模型的未来!

文| ZenMoore编| 小轶以前我一直以为,主题建模(提取文档的主题词)这种机器学习时代就开始研究的基础工具,现在肯定已经到头了,虽然...有时效果可能不是那么让人满意。但突然看到一则推文:“彻底疯了!不需要预先清洗数据…

K 近邻法(K-Nearest Neighbor, K-NN)

文章目录1. k近邻算法2. k近邻模型2.1 模型2.2 距离度量2.2.1 距离计算代码 Python2.3 kkk 值的选择2.4 分类决策规则3. 实现方法, kd树3.1 构造 kdkdkd 树Python 代码3.2 搜索 kdkdkd 树Python 代码4. 鸢尾花KNN分类4.1 KNN实现4.2 sklearn KNN5. 文章完整代码k近邻法&#xf…

通用人工智能可行吗?组合泛化视角漫谈

"乌鸦为什么像写字台?"因为它们都能produce a few notes (鸟叫/笔记),因为乌鸦和写字台都是思想与记忆的象征(北欧神话),又或者因为,这本身就是一句没有道理的话&#xff…

Transformer 在美团搜索排序中的实践

引言 美团搜索是美团 App 连接用户与商家的一种重要方式,而排序策略则是搜索链路的关键环节,对搜索展示效果起着至关重要的效果。目前,美团的搜索排序流程为多层排序,分别是粗排、精排、异构排序等,多层排序的流程主要…

ACL‘22杰出论文:Prompt范式有bug!

‍文 | pythonGPT-3等超大模型的兴起,也带来了 in-context learning (语境学习)的新范式。在语境学习中,模型并不使用梯度下降,根据监督样本调整参数;而是将监督样本的输入输出接起来作为prompt&#xff08…

程序员面试金典 - 面试题 02.06. 回文链表(快慢指针+链表反转)

1. 题目 编写一个函数,检查输入的链表是否是回文的。 示例 1: 输入: 1->2 输出: false 示例 2: 输入: 1->2->2->1 输出: true 进阶: 你能否用 O(n) 时间复杂度和 O(1)…

美团外卖持续交付的前世今生

0. 前言 美团外卖自2013年创建以来,业务一直在高速发展,目前日订单量已突破3000万单,已成为美团点评最重要的业务之一。美团外卖所承载的业务,从早期单一的美食业务发展成为了外卖平台业务。目前除餐饮业务外,闪购、跑…

百万悬赏!寻找“模型越大,效果越差”的奇葩任务!

文 | 天于刀刀犹记 2018 年底谷歌开源 BERT 后,一大批基于 Attention 机制 Transformer 结构的大模型横空出世。XLNet、MPNet、ERNIE,NLP 任务彻底迈入大规模语料训练 fintune 的时代。之前一段时间爆火的 prompt 概念也离不开大模型中最基本的预训练 M…

程序员面试金典 - 面试题 02.08. 环路检测(快慢指针)

1. 题目 给定一个有环链表,实现一个算法返回环路的开头节点。 有环链表的定义:在链表中某个节点的next元素指向在它前面出现过的节点,则表明该链表存在环路。 示例 1: 输入:head [3,2,0,-4], pos 1 输出&#xff1…

Batch size 没必要设为2的次方!?

文 | 付瑶最近刷到一个话题很有趣,搬来和大家一起讨论下:“batch-size 一定要大小为2的幂吗?不这样设置会有啥差别吗?”发帖人认为大家都进入一个误区。坚持选择batch-size的大小为2的幂次数是因为曾经被告知从计算的角度是对训练效率有益的。但是这个“…

ICDAR 2019论文:自然场景文字定位技术详解

自然场景文字定位是文字识别中非常重要的一部分。与通用的物体检测相比,文字定位更具挑战性,文字在长宽比、尺度和方向上有更大范围的变化。针对这些问题,本文介绍一种融合文字片段及金字塔网络的场景文字定位方法。该方法将特征金字塔机制应…

程序员面试金典 - 面试题 10.01. 合并排序的数组

1. 题目 给定两个排序后的数组 A 和 B,其中 A 的末端有足够的缓冲空间容纳 B。 编写一个方法,将 B 合并入 A 并排序。 初始化 A 和 B 的元素数量分别为 m 和 n。 示例: 输入: A [1,2,3,0,0,0], m 3 B [2,5,6], n 3输出: [1,2,2,3,5,6]来源&…

LeCun论文被指「洗稿」? LSTM之父发文怒怼:抄我的还标原创

编 | 好困 Joey David源 | 新智元LSTM之父、暴脾气大爷Jrgen Schmidhuber又开炮了?这回怼的是LeCun,说最近的新论文是炒了自己20多年前的冷饭,只不过换了种说法而已。图灵奖得主Yann Lecun,作为AI界的三巨头之一,他发表…