数据分析实例 分析MovieLens电影数据
- 导入数据
- 数据合并
- 按性别查看各个电影的平均评分
- 活跃电影排行榜
 
 
电影投票数据
 grouplens.org/datasets/movielens
 
 
 把文件放到这个路径下
导入数据


 
数据合并

 
按性别查看各个电影的平均评分

 查看男女评分差别最大的
 
 按照diff去排序 找出分歧最大的就好啦
 
 
活跃电影排行榜
评分个数
 
 
 
 这些就是最热门的电影(前十大热门电影)
 下面找评分最高的电影
 
 
 但是现在结果是很多评分高的用户少的不知名的电影排行很高
 为了解决这个问题
 先看一下前十大热门电影的评分
 
 前二十大高分电影
 
 下面看一下前二十大高分电影的热度,我们用前二十大电影作为索引

 我们用前二十大热门电影作为索引
 
 我们为了避免上面问题的出现,我们首先要找热度比较高的电影,有足够的评分次数
 
 然后用热度足够高的电影去找到这个评分
 
 我们再来看一下前二十啊
 