文章目录
- 用户行为序列建模
- Din模型
- Din模型的缺点
 
用户行为序列建模

 
 物品ID通过Embedding将会得到一个向量,性质差不多的向量在空间中也会处于差不多的位置,可以用取平均方式得到一个综合所有向量的向量。
 
 取平均后可以作为代表用户的一个特征。
 
 以上的LastN是指用户最后点击的N个商品,采用LastN可以将用户最后点击的N个商品综合起来。
Din模型
所谓的LastN是一种普通版本的平均,他考虑到了每一个物品,但并未考虑到每一个物品所占的重量。
 
 而这个所占的重量/占比,是需要和要查询的候选向量进行比较来得出,也就是所谓的相似度,相似度越大,受其影响也会越大。

 
 
Din模型的缺点

 
 DIN模型只根据过往N个物品进行计算,也就是说过往N个物品之前的物品就没有纳入到计算之中,也就是说会遗忘过往计算出来的特征。
 
 由于序列过大会造成运算次数的增加,而固执地采用后N个则会无法保持长期兴趣的数据,所以可以在保证序列长度固定的前提下,对N个挑选出来的对象进行操作。
 
 
 
 
 
  d i d_i di表示第i个物品的时间戳。
 
 时间越久远,说明这个兴趣是越找之前,但仍有意义。
 
 使用Soft search还是hard search主要看的是公司的基础建设支持哪一种,且hard search写起来会相对容易。