Hadoop完全分布式配置 - 实践

news/2025/10/2 8:09:26/文章来源:https://www.cnblogs.com/ljbguanli/p/19123171

Hadoop完全分布式配置 - 实践

环境

  乌班图Linux系统装虚拟机——至少安装两个虚拟机

Hadoop完全分布式环境

1.安装Java、Hadoop

文章:https://blog.csdn.net/2401_86886401/article/details/151230102?spm=1001.2014.3001.5501

可以看到Java和Hadoop的安装方法

2.网络配置

1.网络适配器设置

2.使IP地址不改变(NAT模式)
1.查看网关和IP范围

(进入后,记录网关)

(进入后记录IP范围)

2.在系统中设置静态IP
ip addr
//查看网卡名称(类似ens33、ens160)记住

ls /etc/netplan
//查看配置文件名称(较新版本)
//如果上一条失败(自身版本较旧)
sudo nano /etc/network/interfaces
//文档编辑格式
auto ens33
iface ens33 inet staticaddress 192.168.6.100  # 你要设置的静态 IP 地址,需在子网内且不冲突netmask 255.255.255.0  # 子网掩码gateway 192.168.5.1    # 网关 IP,即之前看到的dns-nameservers 8.8.8.8 114.114.114.114  # DNS 服务器地址

退出文档时“Ctrl+o”-->回车-->“Ctrl+x”

sudo systemctl restart networking
//重启网络服务

3.修改主机名(设置一个主节点-Master,一个从节点-Slave1)

1.修改/etc/hostname文件(设置后要重启)

  这是储存系统主机名的核心文件

sudo vim /etc/hostname
//打开主机文件

(主节点)

(从节点)

2.修改/etc/hosts文件(地址要设置成ifconfig命令后看到的地址,设置后要重启)

  这是一个本地DNS解析文件,用于将主机名映射到IP地址

作用:

1.让系统能通过主机名找到对应的IP

2.避免一些依赖主机名解析的程序错误

sudo vim /etc/hosts
//打开DNS文件

(主机名修改要区分大小写)

tip1:在命令模式下点击“i”进入编辑模式

tip2:退出vim编辑要在命令模式(Esc)下输入“:”+“wq”

3.测试是否互通(注意地址是否设置正确,否则不通)

  需要两个虚拟机都打开

ping Slave1 -c 3
//用主节点联通从节点

(成功)

4.SSH无密码登录节点

1.安装SSH(所有机器都要装)
sudo apt-get install openssh-server
//安装SSH server

 2.第一次装可以看博主的伪分布式配置链接:https://blog.csdn.net/2401_86886401/article/details/151230102?spm=1001.2014.3001.5501

3.生成公钥,并无密码登录(有公钥则删除重新生成)
cd ~/.ssh
//如果没有该目录则执行一次“ssh localhost”
rm ./id_rsa*
//如果之前有公钥则删除
ssh-keygen -t rsa
//一直回车就行

cat ./id_rsa.pub >> ./authorized_keys
//令节点能无密码登录

4.将公钥传给其他节点(其他节点也要开机)
scp ~/.ssh/id_rsa.pub hadoop@Slave1:/home/hadoop/
//hadoop是你的从节点的用户名,如果不同,要修改

(有100%则成功)

5.在从节点上将SSH公钥加入授权
mkdir ~/.ssh
//创建文件夹,如果有则不需要创建
查看是否有没有——“ls -l ~/.ssh”

cat ~/id_rsa.pub >> ~/.ssh/authorized_keys
//加入授权

rm ~/id_rsa.pub
//用完删除就行

6.尝试登录
ssh hadoop1@Slave1
//hadoop1是我的从节点用户名,填自己的

5.配置PATH变量

使hdfs命令能在任意目录生效

在博主https://blog.csdn.net/2401_86886401/article/details/151230102?spm=1001.2014.3001.5501中可以看

start-dfs.sh
//其在任意目录都能运行

6.配置集群/分布式环境

1.修改workers文件(主、从节点的worker文件都要修改)

  需要将所有数据节点的主机名写入文件,一行一个(默认为localhost——把本机作为名称节点数据节点)。在分布式配置时可以保留localhost,让本机节点既是名称节点也是数据节点,也可以删除localhost,使本机节点只作为名称节点使用

vim /opt/hadoop-3.1.3/etc/hadoop/workers
//编辑workers文件

(Master作为名称节点使用)

2.修改core-site.xml文件

参考:https://blog.csdn.net/2401_86886401/article/details/151230102?spm=1001.2014.3001.5501

(其中的localhost改为IP地址、Master

同步从节点

scp /opt/hadoop-3.1.3/etc/hadoop/core-site.xml hadoop1@Slave1:/opt/hadoop-3.1.3/etc/hadoop
//将主节点配置的文件同步给从节点

3.修改hdfs-site.xml文件

参考:https://blog.csdn.net/2401_86886401/article/details/151230102?spm=1001.2014.3001.5501

要在文件中多增加一段

dfs.namenode.secondary.http-addressMaster:50090dfs.replication1dfs.namenode.name.dirfile:/opt/hadoop-3.1.3/hadoop/tmp/dfs/namedfs.datanode.data.dirfile:/opt/hadoop-3.1.3/hadoop/tmp/dfs/data

4.修改mapred-site.xml文件

  在自己的hadoop文件路径下文件“mapred-site.xml.template”修改为mapred-site.xml(有些自己就是修改后的文件,不用人为修改),然后修改文件配置

mv mapred-site.xml.template mapred-site.xml
//修改文件名,有些不用修改

gedit mapred-site.xml
//打开要修改的文件

mapreduce.framework.nameyarnmapreduce.jobhistory.adressMaster:10020mapreduce.jobhistory.webapp.addressMaster:19888yarn.app.mapreduce.am.envHADOOP_MAPRED_HOME=/opt/hadoop-3.1.3mapreduce.map.envHADOOP_MAPRED_HOME=/opt/hadoop-3.1.3mapreduce.reduce.envHADOOP_MAPRED_HOME=/opt/hadoop-3.1.3

//修改配置,注意用自己的路径

5.修改yarn-site.xml文件
gedit yarn-site.xml
//打开文件

yarn.resourcemanager.hostnameMasteryarn.nodemanager.aux-servicesmapreduce_shuffle

//配置文件
//第二行是注释,可以不删除

6.将Master的文件复制给从节点(要清除伪分布模式下生成的临时文件)
cd /opt/hadoop-3.1.3
//切换目录
sudo rm -r ./hadoop-3.1.3/tmp
//删除Hadoop临时文件
sudo rm -r ./logs/*
//删除日志文件
cd /opt
//切换目录
tar -zcf ~/hadoop.master.tar.gz hadoop-3.1.3
//先压缩再复制

scp ~/hadoop.master.tar.gz hadoop1@Slave1:/home/hadoop1
//复制文件到从节点

7.在从节点上解压文件
sudo rm -r /opt/hadoop-3.1.3
//删除旧的
sudo tar -zxf ~/hadoop.master.tar.gz -C /opt
//解压主节点传输文件
sudo chown -R hadoop1 /opt/hadoop-3.1.3
//修改文件和目录的拥有者

8.格式化Master名称节点(只需要进行一次)
hdfs namenode -format
//格式化名称节点

9.启动Hadoop
start-dfs.sh
start-yarn.sh
mr-jobhistory-daemon.sh start historyserver 此命令可能弃用,替换为"mapred --daemon start"
//开启Hadoop

(主节点成功)

(从节点成功)

(主节点输入红框命令——成功)

10.分布式实例
start-dfs.sh
start-yarn.sh
mapred --daemon start
//开启服务

hdfs dfs -mkdir -p /user/hadoop
//创建HDFS上的用户目录
hdfs dfs -mkdir input
//创建一个input目录
hdfs dfs -put /opt/hadoop-3.1.3/etc/hadoop/*.xml input
//将配置文件复制到input目录

hadoop jar /opt/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar grep input output 'dfs[a-z.]+'
//运行mapreduce作业

会显示进度,如果长时间进度没变化可以重启试试,也可以看硬盘内存够不够

11.关闭Hadoop集群
stop-yarn.sh
stop-dfs.sh
mr-jobhistory-daemon.sh stop historyserver
//关闭Hadoop集群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/924688.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VMware Cloud Foundation Automation 9.0.1.0 发布 - 私有云自动化平台

VMware Cloud Foundation Automation 9.0.1.0 发布 - 私有云自动化平台VMware Cloud Foundation Automation 9.0.1.0 发布 - 私有云自动化平台 VMware Cloud Infrastructure - VCF Automation 请访问原文链接:https:/…

VMware Cloud Foundation Operations 9.0.1.0 发布 - 私有云运维管理

VMware Cloud Foundation Operations 9.0.1.0 发布 - 私有云运维管理VMware Cloud Foundation Operations 9.0.1.0 发布 - 私有云运维管理 VMware Cloud Infrastructure - VCF Operations 请访问原文链接:https://sys…

VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析

VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析 VMware Cloud Infrastructure - VCF Operatio…

网站模板素材住房与城乡建设网上办事大厅

随着公司的发展和市场竞争的影响,越来越多的创业者希望注册一家好名称的公司,以提高企业知名度和竞争力。但是,注册中字头无地域公司需要满足一定的条件和流程。本文将对中字头无地域公司注册条件及流程进行详细的介绍。可以致电咨询我或者来…

2025护栏板厂家TOP企业品牌推荐排行榜,波形护栏板、乡村、公路、道路、镀锌、喷塑、城乡、路侧、两波、三波护栏板推荐这十家公司!

在交通基础设施建设持续推进的当下,护栏板作为保障道路安全的关键设施,其质量与性能直接关系到行车安全与道路使用寿命。然而当前护栏板行业却面临诸多问题,部分生产厂家为压缩成本,在原材料选用上偷工减料,导致产…

网站建设域名注册免费百度seo怎么关闭

最近遇到一些事情,觉得挺憋屈的,可是再憋屈总得往前走吧!打工人,不好办啊!事情是这样的,笔者在芯片原厂负责SDK和行业解决方案输出的,可以理解成整体SDK turnkey方案。但是有些客户多少还要改一…

在AI技术唾手可得的时代,挖掘新需求成为核心竞争力——某知名AI开发框架需求洞察

本文深入分析了一个开源AI开发框架的核心功能与用户需求。该框架提供代码优先的开发方式、丰富的工具生态系统和多代理系统架构,支持从本地到云端的灵活部署。通过分析用户反馈,发现了对简化CLI工具、增强可视化界面…

找别人做网站注意事项梅州建站

标号:标记了指令,数据,段的起始地址data segment str db ‘hello’data endscode segment start: jmp begin begin: mov ax,datacode ends end startstr标号(数据标号通常又叫变量),表示内存单元地址和长度start,begin标号表示了指令mov ax,data的地址data ,code标号…

做淘客都有什么网站科技类网站风格

在学习如何开启Ubuntu系统自动升级之前,先解释下为什么需要自动升级。默认情况下,ubuntu每天一次检查更新。但是一周只会弹出一次软件升级提醒,除非当有安全性升级时,才会立即弹出。所以,如果你已经使用Ubuntu一段时间…

做教育招生网站中小企业门户网站的建设方案

Transformer问答-2 根据我的了解,最开始Transformer的架构为encoderdecoder,是用于处理Seq2Seq任务的,后来GPT系列只采用decoder-only架构专注于next toke prediction任务,在我的认识当中,这两者都可以归为next toke …

网站后台管理员怎么做网站推广公司运营模式

若您在 iPhone/iPad 上使用 Apple ID 登录 iCloud 时,提示“验证失败:连接到服务器时出现问题”,一般是网络连接出现异常导致,请参考如下信息尝试解决。检查网络状况请确保您的 iPhone 已经连接到网络,您可以打开 Safa…

个人网站建设设计wordpress 邮箱留言

HTML&#xff08;超文本标记语言&#xff09;是构建Web页面的标准语言&#xff0c;它包含了许多标签&#xff0c;用于定义和排列页面内容。在Web开发中&#xff0c;显示图像是非常常见的需求之一&#xff0c;为此HTML提供了<img>标签来插入图像。本文将详细介绍HTML图片标…

2025 年充电桩厂家TOP企业品牌推荐排行榜,汽车、电车、智能、重卡、电动车直流、新能源车、大功率、一体式双枪、双枪直流、通用快充充电桩公司推荐!

随着新能源汽车保有量的持续增长,充电桩作为重要配套设施,其市场需求不断扩大,但行业也面临诸多问题。部分充电桩存在充电效率低的情况,无法满足车主快速补能的需求;安全防护不到位,在复杂环境下使用易出现安全隐…

河南省建设网站网店推广的方法

青少年软件编程(Python)等级考试试卷(五级) 一、单选题(共25题,共50分) 1. 阅读以下代码,程序输出结果正确的选项是?( ) def process_keywords(keywords_list): unique_keywords = list(set(keywords_list)) sorted_keywords = sorted(unique_keywords) …

商城网站开发平台公众号如何推广宣传

AI下围棋、AI写作文、AI看病……在智能时代&#xff0c;通过新技术的赋能&#xff0c;行业已经发展到了一个新的高度。那么在服务领域&#xff0c;尤其是企业服务中&#xff0c;智能技术的加入会带来哪些新的想象&#xff1f; 在阿里巴巴&#xff0c;智能服务已经成为企业发展…

许昌市做网站汉狮网络广东网站建设公

A类地址第1字节为网络地址&#xff0c;其它3个字节为主机地址。另外第1个字节的最高位固定为0。 A类地址范围&#xff1a;1.0.0.0到127.255.255.255。 A类地址中的私有地址和保留地址&#xff1a; 10.0.0.0到10.255.255.255是私有地址&#xff08;所谓的私有地址就是在互联网上…

专门看广告的网站网站建设方案平台架构

目录 前言&#xff1a; 1.标准库中的string类 1.1 auto和范围for auto 范围for 1.2 string类常用接口说明 1.string类对象的常见构造 1.3 string类对象的访问及遍历操作 1.4. string类对象的修改操作 1.5 string类非成员函数 2.string类的模拟实现 2.1 经典的string…

2025加工厂家企业品牌推荐排行榜,走心机、精密细长轴、进口津上机、精密零部件、机械零件非标定制、新能源电机传动轴、紧固件、复杂零件一次成型、内外螺纹台阶轴卡簧槽键槽加工推荐

在当今制造业蓬勃发展的大环境下,加工行业作为其中的关键一环,正面临着诸多挑战与机遇。一方面,市场对于加工产品的精度、质量以及个性化定制的需求日益增长,这就要求加工企业不断提升自身的技术水平与服务能力。另…

2025年地磅厂家TOP企业品牌推荐排行榜,电子地磅、物联网、无人值守、汽车衡、防爆、自动称重系统、100 吨地磅、专业地磅汽车衡公司推荐!

在工业生产、物流运输、港口码头等领域,地磅作为关键的称重设备,其精度、稳定性与耐用性直接影响企业的生产效率、成本控制与管理决策。当前地磅行业虽呈现蓬勃发展态势,但市场上生产厂家数量众多,产品质量参差不齐…

广州中企动力网站制作wordpress 开通json

摘要&#xff1a; 正确设计Hbase的rowkey可以让你的应用飞起来&#xff0c;前提是你需要了解一些Hbase的存储机制。 UTT是Aliexpress的营销消息运营平台&#xff0c;运营希望促销活动时APP消息推送的QPS达到34W。 UTT刚接入APP消息推送时&#xff0c;QPS只能达到5W&#xff0…