数据分析实例 分析MovieLens电影数据
- 导入数据
- 数据合并
- 按性别查看各个电影的平均评分
- 活跃电影排行榜
电影投票数据
grouplens.org/datasets/movielens


把文件放到这个路径下
导入数据



数据合并


按性别查看各个电影的平均评分

查看男女评分差别最大的

按照diff去排序 找出分歧最大的就好啦


活跃电影排行榜
评分个数



这些就是最热门的电影(前十大热门电影)
下面找评分最高的电影


但是现在结果是很多评分高的用户少的不知名的电影排行很高
为了解决这个问题
先看一下前十大热门电影的评分

前二十大高分电影

下面看一下前二十大高分电影的热度,我们用前二十大电影作为索引

我们用前二十大热门电影作为索引

我们为了避免上面问题的出现,我们首先要找热度比较高的电影,有足够的评分次数

然后用热度足够高的电影去找到这个评分

我们再来看一下前二十啊
