tableau破解方法_使用Tableau浏览Netflix内容的简单方法

tableau破解方法

Are you struggling to perform EDA with R and Python?? Here is an easy way to do exploratory data analysis using Tableau.

您是否正在努力使用R和Python执行EDA? 这是使用Tableau进行探索性数据分析的简单方法。

Lets Dive in to know the process and look at the analysis !

让我们深入了解该过程并查看分析!

Introduction

介绍

Netflix is the world’s leading internet entertainment service with 158 million paid memberships in over 190 countries enjoying TV series, documentaries and feature films across a wide variety of genres and languages. I was curious to analyze the content released in Netflix platform which led me to create these simple, interactive and exciting visualizations with Tableau.

Netflix是全球领先的互联网娱乐服务,在190多个国家/地区拥有1.58亿付费会员,他们可以收看各种类型和语言的电视连续剧,纪录片和故事片。 我很好奇地分析了Netflix平台上发布的内容,这促使我使用Tableau创建了这些简单,交互式和令人兴奋的可视化效果。

Data SourceThe dataset used in this EDA project is taken from Kaggle. Click here to download the data.

数据源此EDA项目中使用的数据集取自Kaggle。 点击此处下载数据。

Data Description

资料说明

Data has 12 columns which include show id, title, type, director, cast, country, release year, description, rating and genre of the movies/TV shows. Type column gives if each record is a movie or Tv show. Country column has all the countries a movie or show is released. Each movie or show belongs to one or more genres which is mentioned in the genre column separated by commas.

数据有12列,其中包括电影/电视节目的节目ID,标题,类型,导演,演员,国家/地区,发行年份,描述,等级和流派。 “类型”列给出每个记录是电影还是电视节目。 “国家/地区”列包含已发行电影或节目的所有国家/地区。 每部电影或节目都属于一种或多种类型,在类型栏中以逗号分隔。

Data Transformation

数据转换

In order to visualize top genres or country wise releases, the existing data has to be transformed. We don’t require any coding experience to do this. A simple understanding of Alteryx tool creates a pipeline to transform the data. Lets break down the transformation to 2 steps. Step 1: Convert the text in country and genre columns to multiple columns.Step 2: Transpose the columns to get a record for each genre or country.

为了可视化热门类型或国家/地区发行,必须对现有数据进行转换。 我们不需要任何编码经验。 对Alteryx工具的简单理解可创建用于转换数据的管道。 让我们将转换分解为2个步骤。 第1步:将country和genre列中的文本转换为多列。第2步:转置列以获取每种流派或国家的记录。

See below, the screenshots of the workflow and data sample before and after transformation

参见下文,转换前后的工作流程和数据示例的屏幕截图

Image for post
Data Transformation workflow in Alteryx
Alteryx中的数据转换工作流
Image for post
Data before transformation
转换前的数据
Image for post
Transformed Data
转换后的数据

探索性数据分析 (EXPLORATORY DATA ANALYSIS)

  1. Movies vs TV shows

    电影与电视节目

Netflix platform even has the content which was originally released in 1965. For a better visual I have only displayed the releases from 2000. We observe that initially the percentage of movies is higher than TV shows but from 2019 Netflix has started to focus more on TV shows.

Netflix平台甚至包含最初于1965年发布的内容。为了获得更好的视觉效果,我只显示了2000年以来的版本。我们观察到,电影的百分比最初高于电视节目,但从2019年起,Netflix就开始更多地关注电视节目。

Image for post

2. Country Wise Releases

2. 明智的国家/地区发布

United states has most total releases ( both movies and TV shows) followed by India and United Kingdom. The interactive dashboard is present here with dynamic parameters to see top N countries of highest releases.

美国的总发行量(电影和电视节目)最多,其次是印度和英国。 此处提供了带有动态参数的交互式仪表板,可以查看N个国家/地区的最高发布版本。

Image for post
Tree map showing the Top 10 countries w.r.t to no. of releases
树状图显示了排名前10位的国家/地区。 发行

3. Top Genres in Movies vs Tv shows

3.电影与电视节目中的顶尖类型

Movies and Tv shows are predominantly focused on international, dramas and comedies.

电影和电视节目主要集中于国际,戏剧和喜剧。

You can see below the top genres in each category. Click here for movies and here for Tv shows to interact with the chart and see the top N genres in each year or range of years.

您可以在每个类别的顶级类型下面看到。 点击这里为电影和这里的电视节目进行互动与图表,看看每年或几年范围的前N个流派。

Image for post
Image for post
Top Genres in Movies ( left) vs Tv shows ( right)
电影中的热门流派(左)与电视节目(右)

4. Country wise releases of each categoryBoth the categories has good presence in United states, India, and UK.

4.每个类别国家/地区的明智发行情况这两个类别在美国,印度和英国都有良好的影响力。

Image for post
Image for post
Releases per country for each category
每个国家/地区的每个类别的发布

Can access the complete dashboard from this link and Alteryx workflow is available on my GitHub

可以通过此链接访问完整的仪表板,我的GitHub上提供了Alteryx工作流

结论 (Conclusion)

Netflix has major presence in United states and India. Its focus has shifted recently towards TV shows which was previously on movies. More TV shows released than movies.

Netflix在美国和印度都有重要业务。 最近,它的重点已经转向了以前在电影上的电视节目。 发布的电视节目多于电影。

翻译自: https://medium.com/analytics-vidhya/a-simple-way-to-explore-the-netflix-content-using-tableau-5b06e17e443

tableau破解方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/391426.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

六周第三次课

2019独角兽企业重金招聘Python工程师标准>>> 六周第三次课 9.6/9.7 awk awk也是流式编辑器,针对文档中的行来操作,一行一行地执行。 awk比sed更强大的功能是它支持了分段。 -F选项的作用是指定分隔符,如果不加-F选项,…

macaca web(4)

米西米西滴,吃过中午饭来一篇,话说,上回书说道macaca 测试web(3),参数驱动来搞,那么有小伙本又来给雷子来需求, 登录模块能不能给我给重新封装一下吗, 我说干嘛封装&…

rfm模型分析与客户细分_如何使用基于RFM的细分来确定最佳客户

rfm模型分析与客户细分With some free time at hand in the midst of COVID-19 pandemic, I decided to do pro bono consulting work. I was helping a few e-commerce companies with analyzing their customer data. A common theme I encountered during this work was tha…

数据仓库项目分析_数据分析项目:仓库库存

数据仓库项目分析The code for this project can be found at my GitHub.该项目的代码可以在我的GitHub上找到 。 介绍 (Introduction) The goal of this project was to analyse historic stock/inventory data to decide how much stock of each item a retailer should hol…

web前端效率提升之浏览器与本地文件的映射-遁地龙卷风

1.chrome浏览器,机制是拦截url,      1.在浏览器Element中调节的css样式可以直接同步到本地文件,反之亦然,浏览器会重新加载css,省去刷新   2.在source面板下对js的编辑可以同步到本地文件,反之亦然…

归因分析_归因分析:如何衡量影响? (第2部分,共2部分)

归因分析By Lisa Cohen, Ryan Bouchard, Jane Huang, Daniel Yehdego and Siddharth Kumar由 丽莎科恩 , 瑞安布沙尔 , 黄美珍 , 丹尼尔Yehdego 和 亚洲时报Siddharth库马尔 介绍 (Introduction) This is our second article in a series wh…

linux与磁盘相关的内容

本节所讲内容1.认识SAS-SATA-SSD-SCSI-IDE硬盘2.使用fdisk对磁盘进行操作,分区,格式化3.开机自动挂载分区4.使用parted操作大于等于4T硬盘5.扩展服务器swap内存空间 MBR(Master Boot Record)主引导记录,也就是现有的硬盘分区模式。MBR分区的标…

页面布局

页面布局两大类&#xff1a;   主站&#xff1a; 1 <div classpg-header> 2 <div stylewidth:980px;margin:0 auto;> 3 内容自动居中 4 </div> 5 <div classpg-content></div> 6 <div classpg-footer></div&…

sonar:默认的扫描规则

https://blog.csdn.net/liumiaocn/article/details/83550309 https://note.youdao.com/ynoteshare1/index.html?id3c1e6a08a21ada4dfe0123281637e299&typenote https://blog.csdn.net/liumiaocn/article/details/83550309 文本版&#xff1a; soanr规则java版 …

多变量线性相关分析_如何测量多个变量之间的“非线性相关性”?

多变量线性相关分析现实世界中的数据科学 (Data Science in the Real World) This article aims to present two ways of calculating non linear correlation between any number of discrete variables. The objective for a data analysis project is twofold : on the one …

探索性数据分析(EDA):Python

什么是探索性数据分析(EDA)&#xff1f; (What is Exploratory Data Analysis(EDA)?) If we want to explain EDA in simple terms, it means trying to understand the given data much better, so that we can make some sense out of it.如果我们想用简单的术语来解释EDA&a…

微服务框架---搭建 go-micro环境

1.安装micro 需要使用GO1.11以上版本 #linux 下 export GO111MODULEon export GOPROXYhttps://goproxy.io # windows下设置如下环境变量 setx GO111MODULE on setx GOPROXY https://goproxy.io # 使用如下指令安装 go get -u -v github.com/micro/micro go get -u -v github.co…

写作工具_4种加快数据科学写作速度的工具

写作工具I’ve been writing about data science on Medium for just over two years. Writing, in particular, technical writing can be time-consuming. Not only do you need to come up with an idea, write well, edit your articles for accuracy and flow, and proofr…

python数据结构与算法

2019独角兽企业重金招聘Python工程师标准>>> http://python.jobbole.com/tag/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E4%B8%8E%E7%AE%97%E6%B3%95/ 转载于:https://my.oschina.net/u/3572879/blog/1611369

大数据(big data)_如何使用Big Query&Data Studio处理和可视化Google Cloud上的财务数据...

大数据(big data)介绍 (Introduction) This article will show you one of the ways you can process stock price data using Google Cloud Platform’s BigQuery, and build a simple dashboard on the processed data using Google Data Studio.本文将向您展示使用Google Cl…

ubuntu 16.04常用命令

ip配置&#xff1a; 终端输入vi /etc/network/interfaces命令编辑配置文件,增加如下内容&#xff1a;         auto enp2s0    iface enp2s0 inet static    address 192.168.1.211    netmask 255.255.255.0    gateway 192.168.1.1 重启网卡&#xf…

多元时间序列回归模型_多元时间序列分析和预测:将向量自回归(VAR)模型应用于实际的多元数据集...

多元时间序列回归模型Multivariate Time Series Analysis多元时间序列分析 A univariate time series data contains only one single time-dependent variable while a multivariate time series data consists of multiple time-dependent variables. We generally use mult…

字符串基本操作

1.已知‘星期一星期二星期三星期四星期五星期六星期日 ’&#xff0c;输入数字&#xff08;1-7&#xff09;&#xff0c;输出相应的‘星期几 s星期一星期二星期三星期四星期五星期六星期日 d int(input(输入1-7:)) print(s[3*(d-1):3*d]) 2.输入学号&#xff0c;识别年级、专业…

数据分析和大数据哪个更吃香_处理数据,大数据甚至更大数据的17种策略

数据分析和大数据哪个更吃香Dealing with big data can be tricky. No one likes out of memory errors. ☹️ No one likes waiting for code to run. ⏳ No one likes leaving Python. &#x1f40d;处理大数据可能很棘手。 没有人喜欢内存不足错误。 No️没有人喜欢等待代码…

MySQL 数据还原

1.1还原使用mysqldump命令备份的数据库的语法如下&#xff1a; mysql -u root -p [dbname] < backup.sq 示例&#xff1a; mysql -u root -p < C:\backup.sql 1.2还原直接复制目录的备份 通过这种方式还原时&#xff0c;必须保证两个MySQL数据库的版本号是相同的。MyISAM…