目录
 Part.01 关于HDP
 Part.02 核心组件原理
 Part.03 资源规划
 Part.04 基础环境配置
 Part.05 Yum源配置
 Part.06 安装OracleJDK
 Part.07 安装MySQL
 Part.08 部署Ambari集群
 Part.09 安装OpenLDAP
 Part.10 创建集群
 Part.11 安装Kerberos
 Part.12 安装HDFS
 Part.13 安装Ranger
 Part.14 安装YARN+MR
 Part.15 安装HIVE
 Part.16 安装HBase
 Part.17 安装Spark2
 Part.18 安装Flink
 Part.19 安装Kafka
 Part.20 安装Flume
一、关于HDP
1.Ambari
Ambari是一种基于Web的工具,支持Apache Hadoop集群的创建、管理和监控。
 Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、Hbase、Zookeeper、Sqoop和Hcatalog等。Apache Ambari支持HDFS、MapReduce、Hive、Pig、Hbase、Zookeepr、Sqoop和Hcatalog等的集中管理。也是5个顶级hadoop管理工具之一。
 Ambari自身也是一个分布式架构的软件,主要由两部分组成:Ambari Server和Ambari Agent。简单来说,用户通过Ambari Server通知Ambari Agent安装对应的软件;Agent会定时地发送各个机器每个软件模块的状态给Ambari Server,最终这些状态信息会呈现在Ambari的GUI,方便用户了解到集群的各种状态,并进行相应的维护。
2.HDP
不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)、Hortonworks版本(Hortonworks Data Platform,简称HDP)。
 HDP安装包主要包括如下内容:
 HDP
 HDP是hortonworks的软件栈,里面包含了hadoop生态系统的所有软件项目,比如HBase、Zookeeper、Hive、Pig等等。
 HDP-UTILS
 HDP-UTILS是工具类库。
 HDP-GPL
 新版hadoop使用了LZO数据压缩库,这个协议跟HDP栈的协议不相同,需要使用GPL。
 官方指导:
 https://docs.cloudera.com/HDPDocuments/Ambari-2.6.1.5/bk_ambari-installation/content/ch_Getting_Ready.html
 版本对应查询:
 https://supportmatrix.cloudera.com/#Hortonworks