保定网站网站建设仿站网站源码
保定网站网站建设,仿站网站源码,网站建设技术方案,公司电商网站建设方案模板1.背景知识 在讲SVD之前#xff0c;我还是想先回到基于物品相似的协同过滤算法。这个算法基本思想是找出一个用户有过正反馈的物品的相似的物品来给其作为推荐。其公式为#xff1a; 其中 rui 表示预测用户u对物品i的喜爱程度。wij 是物品i#xff0c;j之间的相似度#xf…1.背景知识 在讲SVD之前我还是想先回到基于物品相似的协同过滤算法。这个算法基本思想是找出一个用户有过正反馈的物品的相似的物品来给其作为推荐。其公式为 其中 rui 表示预测用户u对物品i的喜爱程度。wij 是物品ij之间的相似度N(u)代表用户曾经有过正反馈的物品的集合。 就比如说我们现在有三个用户AB和C还有四本书《红楼梦》《史记》《微积分导论》和《时间简史》。用户和书籍之间的阅读关系为 ABC红楼梦1 1史记 微积分导论 1线性代数 1 其中没有标注1的即表示用户没有阅读过此书籍。 那么我们首先需要一种相似度度量方法可以测得任意两本书之间的相似度暂时我们认为方法已经有了并且已经把书籍两两之间的相似度计算出来了其可以用一个对称方阵W表示在我们这个例子中是4X4的矩阵。其具体值假设如下 红楼梦 史记 微积分导论 线性代数 红楼梦10.70.20.1史记0.710.20.2微积分导论0.20.210.8线性代数0.10.20.81 那根据公式我们计算用户C对史记的喜欢程度就是 0.7 0.2/ sqrt(2) 。 2. SVD 原理 上面的方法有一个问题就是相似度度量方法我们不太容易得到也就是我们没法得到W这个矩阵。有一个想法就是我通过迭代优化的方法直接去计算整个W其优化的lost function如下 这样的话就再不需要我们认为去定义一个相似度度量方法。但是一个新的问题又出现了。由于一般推荐系统中物品的个数往往都很多所以W会是一个非常大的矩阵那么这样会给存储和计算带来很大的麻烦。这里我们把条件放宽一点假设W是由两个矩阵X和Y点乘得到的其实就是矩阵分解。那么预测的公式就变成了 其中Xi 和Yj 是矩阵X和Y中第i行和第j行。 那么到此为止我们用了迭代和矩阵分解的方法来处理相似度的信息那么我们将这个相似度影响因素加入我们之前讲的隐因子的矩阵分解方法中去就得到 可以看到这个公式其实就是在隐因子的基础上多加了一项。 但是牛逼的dalao们又发现如果让矩阵P这个是用户的隐参数矩阵和上面提到的W分解得到的X矩阵相等可以防止模型过拟合那么公式又变为 这个公式有点错误其括号中的xi 应该是没有的。太懒了直接截图过来不想改 3.算法实现 INCOMING https://github.com/ccienfall/RecommandSystem/blob/master/script/Factorize.py 先拿代码凑合着看吧。。。。 挖好坑以后来填。10.21 前来填坑11.2 转载于:https://www.cnblogs.com/ccienfall/p/5979003.html
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/91771.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!