协同过滤与矩阵分解讲解(PPT)

总览

你好啊
协同过滤算法,就是一种完全依赖用户和物品之间行为关系的推荐算法。
从字面理解,协同大家的反馈、评价和意见一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息。


知识概括

在这里插入图片描述
从这几个方面进行分析。


一、基于用户的协同过滤

在这里插入图片描述
显示能够直接看出用户的偏好,
隐式需要自己动手挖掘数据,如果方法不够准确,可能找的会有问题。

在这里插入图片描述
从这个图中可以看出,用户一与用户三都喜欢APP1,
这两位用户的兴趣可能是一样的,可以做出推测,用户3可能是喜欢app3的

在这里插入图片描述稀疏是说通常商品非常多,用户购买的只是其中极小一部分

计算讲的是用户和物品的矩阵会非常庞大,此外还有增量数据的同步问题。人们的兴趣一直在变,去同步这种变化的数据就是一种计算问题。
冷启动是指新用户到来,本身没有和其他用户有关联,这种情况该如何推荐

二、基于物品的协同过滤

测试,这是图片描述,好像没事特别
在推荐中,如果用物品1和物品3经常一起出现,也就是说用户购买1的时候也大概率会买3,
那么出现新用户3喜欢物品1,同时也用户3推荐物品3.
在这里插入图片描述

更流行,现阶段各大网站基本都是用户较多,
商品(种类)比用户少的多商品属性通常比较固定,特征获取容易,而且基本不会改变
即便上架了新商品,它自身也有各种标签,不会像用户一样是张白纸
应用场景更适合当下各种网站,APP(实时的除外,例如新闻)的、


三、矩阵分解

在这里插入图片描述
如果有100w的用户,1个亿的产品,这两个组合一个矩阵,数据量太大,计算分析困难。

怎么样能通过一种方法降低这个计算复杂度,将最终目标实现,就是矩阵分解要做的事情。
在这里插入图片描述
这是用户歌曲之间的行为数据,1代表听过个,0代表没有听过。
可以看出是比较稀疏的矩阵,目标是预测空白值是多少。
如果直接算的话,计算效率比较低
在这里插入图片描述
原始矩阵是100w10w,
拆分为两个矩阵:100w
3 与 3*10w两个矩阵,这两个矩阵就相对小很多,
这个3是隐向量,
在这里插入图片描述
最后可以分解成这样的矩阵,
这里的三个特征,就是隐向量,其实就是特征的高维表达,很难去解释。

这里的民谣、儿歌,是为了方便理解,这样写出来的。但其实没有办法解释,如右下角所示。
优化好小矩阵中的数值,最终合并成一个大表。
在这里插入图片描述
如图中所示,通过不断调整参数,最后得到一个计算机能理解的特征,
就是隐向量的一般含义。
在这里插入图片描述
这是最终的表格

在这里插入图片描述
使用矩阵分解,希望还原后的矩阵,和原来是越相似越好。
rui 相当于原来的大矩阵,xy就是分解出来的两个小矩阵,希望他们之间的差异越来越小。

在这里插入图片描述
默认为1,rui当前的指标,比如点击次数,阿尔法相当于是系数,就是权重的设置。
行为越多,置信度的值会越来越大。
置信度的值越大,表示预测的越准确。

需要PPT的私聊

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/163891.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

6个PPT素材网站,让你快速做出好看的PPT

找PPT模板一定要收藏好这6个网站,能让你快速做出好看的PPT,重点十可以免费下载,赶紧收藏! 1、菜鸟图库 https://www.sucai999.com/search/ppt/0_0_0_1.html?vNTYwNDUx 菜鸟图库网有非常丰富的免费素材,像设计类、办公…

力扣labuladong——一刷day48

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、力扣1602. 找到二叉树中最近的右侧节点二、力扣437. 路径总和 III三、力扣560. 和为 K 的子数组 前言 二叉树的递归分为「遍历」和「分解问题」两种思维模式…

第7章-使用统计方法进行变量有效性测试-7.4.2-多元线性回归

目录 多元线性回归模型 总体回归函数 样本回归函数 线性回归模型的假定 普通最小二乘法(Ordinary Least Squares,OLS) 拟合优度指标 F检验 回归系数的t检验 Python中构建多元线性回归模型 数据理解 数据读取 数据清洗 相关分析 …

想考教师编制专业不对口怎么办?

很多人在想要步入教师行业时,会遇到一个问题:专业不对口。这种情况可能会让你感到困惑和沮丧,但不要气馁,因为有很多方法可以让你实现自己的梦想。 可以通过提高自己的教育水平和能力来弥补专业不对口的缺陷。你可以通过参加教师资…

品牌小红书koc投放策略分享,纯干货!

作为中国具有影响力的时尚美妆社交平台,小红书与其充满活力的用户群体成为品牌寻找优质KOC合作的理想平台。本文伯乐网络传媒将探讨品牌如何利用小红书的KOC投放策略,实现更广泛的市场覆盖和更有效的品牌营销。 一、明确目标受众与KOC合作需求 在开始策…

containerd Snapshots功能解析

containerd Snapshots功能解析 snapshot是containerd的一个核心功能,用于创建和管理容器的文件系统。 本篇containerd版本为v1.7.9。 本文以 ctr i pull命令为例,分析containerd的snapshot “创建” 相关的功能。 ctr命令 ctr image相关命令的实现在cmd…

《人件》读书笔记

文章目录 一、书名和作者二、书籍概览2.1 主要论点和结构2.2 目标读者和应用场景 三、核心观点与主题3.1 管理团队主题3.2 改善工作环境主题3.3 正确的人主题3.4 团队项目管理主题 四、亮点与启发4.1 最有影响的观点4.2 对个人专业发展的启示 五、批评与局限性5.1 可能存在争议…

leetcode (力扣) 97. 交错字符串(动态规划)

文章目录 题目描述思路分析完整代码 题目描述 给定三个字符串 s1、s2、s3,请你帮忙验证 s3 是否是由 s1 和 s2 交错 组成的。 两个字符串 s 和 t 交错 的定义与过程如下,其中每个字符串都会被分割成若干 非空 子字符串: s s1 s2 … sn t …

数据库——查询连续的月份

一、GP或PGSQL with recursive t(n) as (select date(2023-01-01) union all select n1 from t where n < now()) select to_char(n, yyyy-mm) as ny from t group by ny order by ny 二、Hive select add_months(FROM_UNIXTIME(unix_timestamp(SUBSTR(start_date, 1, 7…

rdf-file:组件内置协议(SP、DE、FUND、FUND_INDEX)

Rdf-File根据协议布局模板和数据定义模板,来进行文件的解析与生成。通过协议布局和数据定义模板&#xff0c;能够明确计算出头尾占用的行数&#xff0c;这样可以更精确的分离出head&#xff0c;body&#xff0c;tail。 目前组件实现的协议布局模板可以分为如下两大类&#xff…

【深度学习实验】图像处理(一):Python Imaging Library(PIL)库:图像读取、写入、复制、粘贴、几何变换、图像增强、图像滤波

文章目录 一、实验介绍二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 安装 PIL 库1. 图像读取和写入a. 图像读取b. 图像写入c. 构建新图像 2. 图像复制粘贴a. 图像复制b. 图像局部复制c. 图像粘贴 3. 几何变换a. 图像调整大小b. 图像旋转c. 图像翻转 4. 图像增强a.…

cocos creator中AStar算法实例

引擎版本 —— cocos creator2.3.4

高端猫罐头有哪些?精选的5款优质的猫罐头推荐!

很多铲屎官看猫猫吃猫粮吃腻了&#xff0c;或者猫猫平时不喜欢喝水&#xff0c;又或者看猫猫太瘦了就想入手几款猫罐头但是又愁于不会选择&#xff0c;而且现在猫罐头风这么大不知道选什么好~ 作为一个开宠物店7年的店长&#xff0c;对于猫咪的饮食健康我一直都很重视&#xff…

数据结构与算法编程题16

已知长度为n的线性表A&#xff0c;请写一时间复杂度为O(n)、空间复杂度为O(1)的算法&#xff0c;该算法删除线性表中所有值为item的数据元素。 item 3 数组下标 i 0 1 2 3 4 5 6 7 8 顺序表&#xff1a; 1 2 3 4 3 3 5 3 7 #include <iostream> using namespace std;typ…

Linux常用基础命令及重要目录,配置文件功能介绍

目录 一&#xff0c;Linux常用必备基础命令 1&#xff0c;网络类命令 2&#xff0c;文件目录类命令 3&#xff0c;操作类命令 4&#xff0c;关机重启命令 5&#xff0c;帮助命令 6&#xff0c;查看显示类命令 7&#xff0c;命令常用快捷键 二&#xff0c;Linux重要目录…

文献阅读的六个步骤

对于科研人员来说&#xff0c;文献阅读是一项重要的任务&#xff0c;当然要找对方法和步骤&#xff0c;可以按照这些步骤来哦。 1、确定研究问题和目标&#xff1a;在开始阅读外文文献之前&#xff0c;明确您的研究问题和目标。这将帮助您更好地理解作者所说的话以及他们提出的…

windows版本的grafana如何离线安装插件

本文以安装clickhouse的插件为例&#xff0c;记录下如何离线安装插件 1 下载插件 ClickHouse plugin for Grafana | Grafana Labs 2 找到grafana的配置文件 打开编辑&#xff0c;搜索plugin关键字&#xff0c;修改plugin的加载目录 目录不存在&#xff0c;手动创建&#xff0…

【Python】Vscode解决Python中制表符和空格混用导致的缩进问题

【Python】Vscode解决Python中制表符和空格混用导致的缩进问题 文章目录 【Python】Vscode解决Python中制表符和空格混用导致的缩进问题1. 问题来源2. 解决Reference 1. 问题来源 在python中使用缩进来进行代码块的分区&#xff0c;通常来说python的一个缩进包含4个空格&#…

软件测试岗位与职业发展

一、软件测试岗位有哪些&#xff1f; 在企业中&#xff0c;软件测试领域的几个典型的职位有&#xff1a;功能测试工程师&#xff08;也叫手工测试&#xff09;、自动化测试工程师、性能测试工程师、测试开发等。 1、功能测试&#xff08;手工测试&#xff09;工程师 主要工作内…

2023年“福建省工业互联网+智能制造创新大赛”开启报名

11月22日&#xff0c;由福建省总工会、福建省大数据集团有限公司共同举办的2023年“福建省工业互联网智能制造创新大赛”启动报名。 大赛积极响应《福建省总工会等八部门关于广泛深入开展劳动和技能竞赛为新发展阶段新福建建设建工立业的意见》&#xff08;闽工〔2022〕70号&am…