完整教程:集群环境安装与部署 Hadoop

news/2025/11/27 18:51:46/文章来源:https://www.cnblogs.com/tlnshuju/p/19279118

完整教程:集群环境安装与部署 Hadoop

2025-11-27 18:48  tlnshuju  阅读(0)  评论(0)    收藏  举报

安装 hadoop 与部署 hadoop

本文主要讲解如何在分布式集群上部署 hadoop,具体的操作如下所示。

安装 hadoop

  1. 第一步,在 usr 目录创建一个目录 cstor,具体的操作命令如下所示。

    cd /usr
    sudo mkdir cstor
  2. 第二部,进入到目录 /usr/cstor 下解压hadoop2.7.7.tar.gz文件,具体的操作命令如下所示。

    cd cstor
    sudo tar -zxvf /media/sf_vmshare/hadoop-2.7.7.tar.gz

    执行上述操作后,检查以下文件是否成功解压了 hadoop-2.7.7.tar.gz 文件,查询到的信息如下所示。

    leolei@leifenglin:/usr/cstor$ ls -l
    total 4
    drwxr-xr-x 9 leolei staff 4096 Jul 19  2018 hadoop-2.7.7

    若文件解压成功则将解压后的文件名系应该为 hadoop,修改完成之后再次查询文件名是否修改成功,查询到的信息如下所示。

    leolei@leifenglin:/usr/cstor$ sudo mv hadoop-2.7.7 hadoop
    leolei@leifenglin:/usr/cstor$ ls -l
    total 4
    drwxr-xr-x 9 leolei staff 4096 Jul 19  2018 hadoop

    notebook tip

    • 注意,上述的命令ls -l可以缩写为ll
    • mv 命令具有两种功能,分别是重命名和移动文件的位置。若文件在同一目录下且都不带 “/”符号,即为重命名。若 mv 的参数只要有一个带有符号“/”,则是移动文件。
  3. 文件解压完成和改名成功后,更改 hadoop 文件的权限,修改为普通用户的权限。具体的操作命令如下所示。

    sudo chown -R leolei:leolei hadoop

    修改完成之后查询 hadoop 文件及其子目录的权限,具体的操作命令如下所示。

    leolei@leifenglin:/usr/cstor$ ls -l
    total 4
    drwxr-xr-x 9 leolei leolei 4096 Jul 19  2018 hadoop
    leolei@leifenglin:/usr/cstor$ cd hadoop/
    leolei@leifenglin:/usr/cstor/hadoop$ ll
    total 144
    drwxr-xr-x 9 leolei leolei  4096 Jul 19  2018 ./
    drwxr-xr-x 3 root   root    4096 Oct 27 13:23 ../
    drwxr-xr-x 2 leolei leolei  4096 Jul 19  2018 bin/
    drwxr-xr-x 3 leolei leolei  4096 Jul 19  2018 etc/
    drwxr-xr-x 2 leolei leolei  4096 Jul 19  2018 include/
    drwxr-xr-x 3 leolei leolei  4096 Jul 19  2018 lib/
    drwxr-xr-x 2 leolei leolei  4096 Jul 19  2018 libexec/
    -rw-r--r-- 1 leolei leolei 86424 Jul 19  2018 LICENSE.txt
    -rw-r--r-- 1 leolei leolei 14978 Jul 19  2018 NOTICE.txt
    -rw-r--r-- 1 leolei leolei  1366 Jul 19  2018 README.txt
    drwxr-xr-x 2 leolei leolei  4096 Jul 19  2018 sbin/
    drwxr-xr-x 4 leolei leolei  4096 Jul 19  2018 share/

    如上述的输出信息可以知道文件 hadoop 及其子目录的权限都修改为普通用户 leolei 的权限。

    注意:命令 sudo chown -R leolei:leolei hadoop的参数 R 就是将整个文件及其子目录的所有文件权限都修改为普通用户。

部署HDFS

  1. 部署 HDFS ,在其指定文件中添加 JDK 安装目录。

    首先查看 JDK 的安装目录,具体的操作命令如下所示。

    leolei@leifenglin:/$ java -version
    openjdk version "1.8.0_362"
    OpenJDK Runtime Environment (build 1.8.0_362-8u372-ga~us1-0ubuntu1~18.04-b09)
    OpenJDK 64-Bit Server VM (build 25.362-b09, mixed mode)
    leolei@leifenglin:/$ echo $JAVA_HOME
    /usr/lib/jvm/java-8-openjdk-amd64

    如上述的输出信息所示,可以知道 JDK 的版本为 1.8.0_362,JDK 的安装目录为 /usr/lib/jvm/java-8-openjdk-amd64。这里建议安装 Ubuntu 系统自带的 JDK。JDK 的安装方法可以参考网址https://blog.csdn.net/2301_77987130/article/details/153122819?spm=1011.2415.3001.5331进行安装。

  2. 编辑文件“/usr/cstor/hadoop/etc/hadoop/hadoop-env.sh”,找到如下一行:export JAVA_HOME=${JAVA_HOME},将这行内容修改为:export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64。具体信息如下所示。

    ...
    # The java implementation to use.
    # export JAVA_HOME=${JAVA_HOME}
    export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
    # The jsvc implementation to use. Jsvc is required to run secure datanodes
    # that bind to privileged ports to provide authentication of data transfer
    # protocol.  Jsvc is not required if SASL is configured for authentication of
    # data transfer protocol using non-privileged ports.
    ...

    修改完文件 hadoop-env.sh 后,保存退出。

  3. 指定HDFS主节点

    编辑文件“/usr/cstor/hadoop/etc/hadoop/core-site.xml”,将如下内容嵌入此文件里最后两行的标签之间,配置core-site.xml文件时需要在添加一个配置,让所有节点能够访问namenode,配置如下所示:

    <configuration><properties><name>hadoop.tmp.dir</name><value>/usr/cstor/hadoop/cloud</value></properties><properties><name>fs.defaultFS</name><value>hdfs://leifenglin:8020</value></properties><properties><name>dfs.namenode.rpc-bind-host</name><value>0.0.0.0</value></properties>
    </configuration>

    上述文件的配置信息配置完成之后,然后保存退出。

  4. 将hadoop 文件拷贝至其它集群服务器。具体的操作如下所示。

    在 leifenglin 主节点上执行下列命令,将配置好的 hadoop 拷贝至slaveX。

    首先创建一个当前用户下创建一个文件 machines,用于存储子节点 leifenglin1 和 leifenglin2 的节点名。先通过命令vim machines打开文件,然后添加如下所示的信息。

    leifenglin1
    leifenglin2

    然后通过以下命令将 hadoop 文件拷贝到子节点上,执行下列步骤时需要保证复制的目标目录存在才能成功复制。具体操作如下所示。

    首先在子节点 leifenglin1 和 leifenglin2 上创建文件 /usr/cstor/hadoop。具体的操作如下所示。

    cd /usr
    sudo mkdir -p cstor/hadoop
    cd cstor/
    sudo chown -R leolei:leolei hadoop

    执行过上述命令后通过命令ls -l查看文件的权限。权限修改成功之后再执行后续操作。

    然后开始执行以下命令开始拷贝 hadoop 文件到子节点。

    leolei@leifenglin:~$ for x in `cat machines` ; do echo $x ; scp -r /usr/cstor/hadoop $x:/usr/cstor/hadoop ; done

    最后,分别到子节点 leifenglin1 和 leifenglin2 上检查上述创建的目录是否有完整的文件,若有,则证明 hadoop 文件拷贝成功。具体操作命令如下所示。

    上一步骤的操作完成之后,发现多了一层目录 hadoop/,先将文外层文件改名为 hadoop-1,再将内层 hadoop 文件移动到 cstor/ 目录下,然后删除改名后的文件。具体的操作命令如下所示。

    leolei@leifenglin1:/usr/cstor$ sudo mv hadoop hadoop-1
    leolei@leifenglin1:/usr/cstor$ ls
    hadoop-1
    leolei@leifenglin1:/usr/cstor$ sudo mv /usr/cstor/hadoop-1/hadoop/ .
    leolei@leifenglin1:/usr/cstor$ ls
    hadoop  hadoop-1
    leolei@leifenglin1:/usr/cstor$ cd hadoop
    leolei@leifenglin1:/usr/cstor/hadoop$ ls
    bin  etc  include  lib  libexec  LICENSE.txt  NOTICE.txt  README.txt  sbin  share
    leolei@leifenglin1:/usr/cstor/hadoop$ cd ../hadoop-1/
    leolei@leifenglin1:/usr/cstor/hadoop-1$ ls
    leolei@leifenglin1:/usr/cstor/hadoop-1$ cd ..
    leolei@leifenglin1:/usr/cstor$ ll
    total 16
    drwxr-xr-x  4 root   root   4096 Oct 27 15:02 ./
    drwxr-xr-x 11 root   root   4096 Oct 27 14:33 ../
    drwxr-xr-x  9 leolei leolei 4096 Oct 27 14:54 hadoop/
    drwxr-xr-x  2 leolei leolei 4096 Oct 27 15:02 hadoop-1/
    leolei@leifenglin1:/usr/cstor$ sudo rm -rf hadoop-1/
    leolei@leifenglin1:/usr/cstor$ ls
    hadoop

    子节点 leifenglin2 的操作与上述操作一致。
    未完成!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/978849.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[题解]考前一些贪心技巧题

比如今年 S-T1,去年 NOIp-T1,讲真我挺害怕这种贪心的,所以记录一些偏向思维/技巧的贪心题。 受 Codeforces 的启发,尝试这样一种新的题解风格。 用这种风格,大概是为了让自己搞懂“为什么想到这样转化”,对考场思…

实用指南:Jenkins Pipeline 快速开始

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年下半年特氟龙喷涂、聚四氟乙烯喷涂、陶瓷喷涂、碳化钨喷涂、聚四氟乙烯管道设备厂家口碑推荐

摘要 2025年下半年,碳化钨喷涂行业在工业耐磨、防腐领域持续创新,技术进步推动市场需求增长。本文基于行业调研和用户反馈,整理出一份推荐榜单,旨在为采购商提供参考。榜单排名不分先后,仅作推荐用途,重点介绍各…

两款开源PLC软件推荐,ARMxy系列完美适配!

在过去,PLC(可编程逻辑控制器)几乎是工业自动化的“高墙”。要么买昂贵的品牌硬件,要么用封闭的编程环境。但在开源浪潮的推动下,这堵墙正在被慢慢推倒。 如今,一台树莓派、一块嵌入式主板、一个开源PLC软件,就…

251127

251127活在村子里的人羡慕城市的生活,原先脚能踩到真实的土地,现在住在不天不地的房子里,偶尔有阳光渗进来,没有种菜的地方,这间屋子就是都市人的坟墓,这个小区就像是没有蚁后的蚁穴,并不是真的没有蚁后,只是蚁…

2025年下半年特氟龙喷涂、聚四氟乙烯喷涂、陶瓷喷涂、碳化钨喷涂、聚四氟乙烯管道设备厂家综合评估与选购指南

摘要 随着工业耐磨防护需求的持续增长,2025年下半年碳化钨喷涂市场呈现技术升级和服务细分趋势。本文基于行业调研数据,为寻求碳化钨喷涂服务的企业提供五家值得关注的供应商参考清单(排名不分先后),其中成都市晨…

2025年下半年菜籽油/粮油批发/植物油/食用油批发厂家口碑前五推荐

2025年下半年,菜籽油行业持续发展,消费者对健康、绿色食用油的需求增长,推动批发市场扩大。本文基于综合评估,推荐五家菜籽油批发厂家,排名不分先后,旨在为您提供参考。榜单仅供参考,实际选择需结合自身需求,我…

成都动力无限:深耕十五载,以专业短视频代运营赋能企业增长

成都动力无限:深耕十五载,以专业短视频代运营赋能企业增长在数字经济浪潮席卷全球的今天,短视频已成为企业营销与品牌建设的核心阵地。据《2023年中国短视频行业研究报告》显示,短视频用户规模已突破10亿,企业通过…

2025年下半年特氟龙喷涂、聚四氟乙烯喷涂、陶瓷喷涂、碳化钨喷涂、聚四氟乙烯管道设备厂家综合推荐指南

摘要 随着工业防腐技术的快速发展,聚四氟乙烯喷涂行业在2025年下半年呈现出明显的技术升级趋势。本文基于市场调研和行业数据分析,为有需求的用户提供五家优质服务商推荐,排名不分先后,每家企业在技术实力、服务质…

android studio,java 语言。新建了任务,在哪儿设置 app 的名字和 logo。

android studio,java 语言。新建了任务,在哪儿设置 app 的名字和 logo。pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family:…

3 天从 0 入门 SQL:交易所 Market Surveillance 实战速成(Wash Trading / Spoofing / Pump Dump)

适合岗位: Market Surveillance Intern / Market Risk Analyst / Data Analyst / Quant Intern 适合人群: 没有 SQL 基础 / 有基础但不会写复杂查询 / 想在简历写“熟练 SQL”这套教程不是通用 SQL,而是 专为交易所…

保姆级教程!PaddleOCR-VL 私有化部署全流程,109 种语言 SOTA 模型直接用

Hello,大家好,最近在部署 PaddleOCR-VL 的过程中,发现了一个容易被忽视的点:PaddleOCR-VL 实际上由两个模型组成——版面检测模型(Layout Detection)和 VLM(Vision-Language Model)。目前huggingface提供的 vL…

2025年下半年拖车绳/三股绳/拖拉绳/弹力绳工厂 top 5 推荐

拖车绳作为车辆救援和运输领域的关键配件,2025年下半年的行业需求持续增长,尤其在高强度、耐用性和定制化方面表现突出。本文基于市场调研和用户反馈,整理出一份推荐前五的拖车绳工厂榜单,旨在为采购商提供参考。榜…

怎样减少库存对资金的占用?企业老板最该先解决的,其实就是这三件事

怎样减少库存对资金的占用? 在中小企业做供应链久了,你会发现一个很扎心的现象: 仓库越大,库存越多;库存越多,现金越紧。 老板每天都在问一句话: “我们到底是做生意,还是把钱堆在仓库里?” 今天我只讲三个最…

容器终端常用命令

文件和目录查看 ls 命令 - 列出文件和目录 ls # 列出当前目录文件 ls -l # 详细列表格式 ls -la # 显示所有文件(包括…

深入解析:批量替换文件内容麻烦?Windows小工具5步搞定,效率提升80%

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Raney 引理小记

内容:对于一个长度为 \(n\) 和为 \(1\) 的整数序列 \(a\), 其循环移位中有且仅有一个满足所有前缀和 \(>0\)。 证明:不会。 应用:推导卡特兰数:应用括号序列那个例子 ( 为 \(1\) ) 为 \(-1\),在开头插入一个 \…

2026年石家庄/邯郸/邢台/保定/沧州/廊坊/衡水农村自建房推荐榜,图南建房宝领衔 六家实力公司赋能乡村宜居生活

一、引言:冀中南七市自建房进入“地域精准适配与智能建造升级时代” 十年前,石家庄、邯郸等冀中南七市的农村建房还深陷“本村工匠牵头、手绘草图施工”的粗放模式。这片横跨太行山东麓、华北平原腹地与滨海冲积平原…

2025年下半年拖车绳/三股绳/拖拉绳/弹力绳厂家前五推荐

随着汽车保有量持续增长和户外活动需求上升,2025年下半年拖车绳市场呈现稳定增长态势。本文基于行业调研和用户反馈,整理出五家值得关注的拖车绳生产企业推荐清单,排名不分先后,仅供参考选择。特别说明:本推荐榜单…