hadoop linux 安装

news/2025/11/17 21:17:32/文章来源:https://www.cnblogs.com/zx8868/p/19234440

在 Linux 系统上安装 Hadoop 需要以下几个步骤,包括系统准备、下载 Hadoop、解压安装、配置环境变量、启动集群等。以下是一个通用的安装指南,适用于大多数 Linux 发行版(如 Ubuntu、CentOS、Debian 等)。

一、系统准备

1. 系统要求

Linux 发行版:Ubuntu 18.04 LTS 或更高版本、CentOS 7/8、Debian 10+ Java 环境:JDK 8 或更高版本 磁盘空间:至少 30GB(Hadoop 需要较大的存储空间) 网络:确保所有节点之间可以通信(IP 范围、防火墙配置)

二、安装 Java

sudo apt update
sudo apt install openjdk-8-jdk -y

验证 Java 是否安装成功:

java -version
javac -version

三、下载 Hadoop

1. 从官方网站下载 Hadoop

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

2. 解压 Hadoop

tar -xzvf hadoop-3.3.6.tar.gz -C /opt/

设置环境变量(可选,但推荐):

export HADOOP_HOME=/opt/hadoop-3.3.6
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

四、配置 Hadoop

1. 配置 hadoop-env.sh

sudo nano /opt/hadoop-3.3.6/etc/hadoop/hadoop-env.sh

export JAVA_HOME= 后添加:

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

2. 配置 core-site.xml

sudo nano /opt/hadoop-3.3.6/etc/hadoop/core-site.xml

添加以下内容(注意替换为你的实际 IP 地址):

<configuration><property><name>fs.defaultFS</name><value>hdfs://namenode</value></property><property><name>hadoop.home.dir</name><value>/opt/hadoop-3.3.6</value></property>
</configuration>

3. 配置 hdfs-site.xml

sudo nano /opt/hadoop-3.3.6/etc/hadoop/hdfs-site.xml

添加以下内容:

<configuration><property><name>dfs.namenode.httpaddress</name><value>namenode:50070</value></property><property><name>dfs.datanode.httpaddress</name><value>datanode:50075</value></property><property><name>dfs.datanode.dfsnaclient.bindaddress</name><value>0.0.0.0</value></property>
</configuration>

4. 配置 mapred-site.xml

sudo nano /opt/hadoop-3.3.6/etc/hadoop/mapred-site.xml

添加以下内容:

<configuration><property><name>mapreduce.jobhistory.address</name><value>jobhistorynode:10020</value></property><property><name>mapreduce.jobhistory.httpaddress</name><value>jobhistorynode:10020</value></property>
</configuration>

5. 配置 yarn-site.xml

sudo nano /opt/hadoop-3.3.6/etc/hadoop/yarn-site.xml

添加以下内容:

<configuration><property><name>yarn.resourcemanager.hostname</name><value>resourcemanager</value></property><property><name>yarn.resourcemanager.webapp.address</name><value>resourcemanager:8088</value></property><property><name>yarn.resourcemanager.scheduler.address</name><value>resourcemanager:8030</value></property><property><name>yarn.resourcemanager.resource-tracker.address</name><value>resourcemanager:8031</value></property><property><name>yarn.resourcemanager.nodemanager.address</name><value>namenode:8042</value></property><property><name>yarn.resourcemanager.nodemanager.httpaddress</name><value>namenode:8042</value></property><property><name>yarn.resourcemanager.scheduler.class</name><value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value></property>
</configuration>

五、格式化 HDFS

hadoop namenode -format

六、启动 Hadoop 集群

1. 启动 NameNode 和 DataNode

start-dfs.sh

2. 启动 YARN

start-yarn.sh

七、验证安装

1. 检查 NameNode 是否运行

jps

你应该看到 NameNode, DataNode, NodeManager, ResourceManager 等进程。

2. 检查 Hadoop 端口是否开放

netstat -tuln | grep 50070
netstat -tuln | grep 8088
netstat -tuln | grep 8042

八、可选:配置 SSH 防火墙

如果你使用的是防火墙(如 ufwiptables),请确保开放以下端口:

sudo ufw allow 8088
sudo ufw allow 50070
sudo ufw allow 8042
sudo ufw allow 10020
sudo ufw enable

九、其他注意事项

如果你使用的是 Kubernetes 或 Docker,可以使用 hadoop 镜像进行快速部署。 如果你使用的是 Hadoop 3.x,需要确保你的 Hadoop 版本与集群中其他节点的版本一致。 如果你使用的是 Hadoop 2.x,配置文件路径可能略有不同。

十、Hadoop 常用命令

命令 作用hadoop version 查看 Hadoop 版本hadoop dfs -ls / 列出 HDFS 中的文件hadoop jar hadoop-mapreduce-examples-3.3.6.jar 运行 Hadoop 示例程序hadoop fs -put localfile /hdfs/path 将本地文件上传到 HDFShadoop fs -get /hdfs/path localfile 将 HDFS 文件下载到本地

如需进一步配置 Hadoop 集群(如高可用、负载均衡等),可以参考官方文档 Hadoop 3.3.6 官方文档。

如需安装 Hadoop 2.x 或 3.x,请告知具体版本,我可以提供更详细的安装指南。

文章转自:[命运神界梦境链接角色介绍 ] (https://www.52mwyd.com/news/9640.html)

作者:游戏攻略,转载请注明原文链接:https://www.52mwyd.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/968311.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025最新展柜设计公司推荐,展柜制作公司,展台源头厂家,烤漆展柜十大品牌推荐榜,家纺柜台供应厂家十大排行榜:梵之宇装饰推荐

2025最新展柜设计公司推荐,展柜制作公司,展台源头厂家,烤漆展柜十大品牌推荐榜,家纺柜台供应厂家十大排行榜:梵之宇装饰推荐2025最新展柜设计公司推荐,展柜制作公司,展台源头厂家,烤漆展柜十大品牌推荐榜,家纺…

团队技术资产建设:从散兵游勇到标准化作战

好的,这是一个能充分展现您技术领导力和工程化思维的问题。下面我将为您系统地阐述如何从0到1规划、设计并推动团队技术资产的建设。团队技术资产建设:从散兵游勇到标准化作战 提升100%的开发效率并非一蹴而就,它是…

2025年11月学习机榜单:打破智商税偏见,十大提分机型实证推荐

2025年11月学习机榜单:打破智商税偏见,十大提分机型实证推荐“学习机是智商税” 的偏见,本质是对 “低效工具” 的否定 —— 但 2025 年艾媒咨询数据显示,具备 “精准诊断 - 定向训练 - 效果追踪” 全链路能力的 A…

解决罗技M590右键必须用力才能使用的问题

罗技M590用了好几年了,最近频繁出现右键轻点没有反应的情况,必须用力才能弹出右键菜单,一开始还以为是微动问题,物理方法替换微动弹簧片也没有解决问题,后来发现是因为模具与微动接触的地方磨损出现空行程导致的.那就…

悼念故友

美人离思远,湘水夜来深美人离思远,湘水夜来深 我的生命中曾有一位非常非常重要的人。 我们一起观春花,爬夏树,拾秋叶,赏冬雪。 我们一起上学,一起闯祸,一起FQ翘课,一起登台演出。 我们一起上过道观,进过寺庙,…

UV python管理工具 mac电脑

python3.9为系统自带的 pip3pip 对应的是uv 3.13 系统配置了pip路径 也设置了软连接 所有是pip ls -la /Users/peter/.local/bin/ | grep pip 查看软连接 uv python包管理器 uv python list 查看安装的python uv pyth…

题解:uoj632【UR #21】挑战最大团

题意:给出一个无向图,其满足以下性质:若存在边 \((a,b),(b,c),(c,d)\),则 \((a,c),(a,d),(b,d)\) 不能同时不存在。求图中大小为 \(1,2,3\cdots n\) 的团的个数。\(n\le 8000\)。 做法: 直接做是 npc,考虑发掘性…

[CSP-S 2025] 员工招聘 / employ

P14364 [CSP-S 2025] 员工招聘 / employ 先初步分析一下录取的条件:\(s_i=0\) 此时一定不会被录取 \(s_i=1\) 记之前被淘汰的人数为 \(j\),则若 \(c_{p_i}>j\) 则会被录取,\(c_{p_i}\le j\) 不会被录取。考虑一个…

20232410 2025-2026-1 《网络与系统攻防技术》实验六实验报告

1.实验内容 掌握Metasploit的基础操作:模块搜索(search)、加载(use)、参数配置(set)、攻击执行(exploit/run)及会话管理(sessions)。 理解4类漏洞的核心原理,明确漏洞与靶机开放端口、服务的对应关系。 能…

sequence 题解

原题链接。 首先这个数据范围就很 meet in middle。 首先一个关键性质是对于任意的一个顶到界限的 \(a\) 都能保它顶到界限那一位后面的位数合法,因为它后面随便选就意味着一定能通过调整使得后面的位置异或完是零。 …

2025上海商铺办公室装修公司推荐指南:业态适配与TOP10实力榜

2025上海商铺办公室装修公司推荐指南:业态适配与TOP10实力榜一、商铺装修公司核心评估维度(基于商业空间需求定制) 据《上海市商业空间装饰服务标准(2025 版)》,优质商铺装修服务商需满足六大针对性指标,适配餐…

FastAPI Test Project

# FastAPI Test Project## 项目简介 这是一个使用 FastAPI 框架的测试项目。## 技术栈 - Python >= 3.13 - FastAPI >= 0.121.2 - Uvicorn >= 0.38.0 - uv (包管理工具)## 环境配置### 虚拟环境说明 本项目使…

React Scheduler(调度器)

非常好!React Scheduler(调度器)是React并发能力的引擎,是理解React高性能更新的关键。它独立于React本身,是一个用于在浏览器中调度任务的通用库。 让我们深入剖析React调度器的核心机制。一、调度器是什么?为什…

2025年11月学习机榜单:双线提分机型领衔,十大高性价比之选

2025年11月学习机榜单:双线提分机型领衔,十大高性价比之选孩子放学回家,居家自学缺方法、线下补漏效率低,新课标改革后知识梯度拉升,家长既难同步校内进度,又难精准帮孩子突破薄弱点 —— 这成了 2025 年秋季开学…

Hier-SLAM++ (2) MeshGPT:仅使用解码器Transformer生成三角形网格 - MKT

Hier-SLAM++ (2) MeshGPT:仅使用解码器Transformer生成三角形网格 MeshGPT: Generating Triangle Meshes with Decoder-Only Transformershttps://github.com/audi/MeshGPTMeshGPT通过对经过训练的Transformer模型进…

2025.11.10训练记录

noip模拟赛。 因为喝了咖啡没有睡觉。costa的瓶装拿铁真的特别难喝。 T1 图上加边删边,维护连通块大小的积。 一开始以为直接可撤销并查集就可以做。直接去看T2了,看了一会儿回来实现。 想了一下,感觉也许可以直接撤…

Day41(11)-F:\硕士阶段\Java\课程代码\后端\web-ai-code\web-ai-project02\tlias-web-management

Mybatis 配置文件spring:application:name: springboot-mybatis-quickstart#数据库的连接信息datasource:type: com.alibaba.druid.pool.DruidDataSourceurl: jdbc:mysql://localhost:3306/web01driver-class-name: co…

vue2和vue3声明式和命令时的区别

这是一个非常好的问题,它触及了Vue2到Vue3最核心的演进逻辑。Vue3在保留声明式本质的基础上,通过更底层的命令式API,让开发者能够编写出更具声明性、更易维护的代码。 让我们来深入剖析Vue2和Vue3在声明式与命令式上…

WPS office 2023专业增强版 无限用v12.8 永久激活下载及安装使用教程

激活序列码:TJ3GN-9NTGQ-GLF7C-YEN8X-TJWML WPS Office是由金山软件股份有限公司自主研发的一款办公软件套装,可以实现办公软件最常用的文字、表格、演示等多种功能。 具有内存占用低、运行速度快、体积小巧、强大插…

3D 文件类型,怎么在线查看编辑STL/AMF/OBJ/stp/fbx/ply转换

​ 大致上,数字文件有三种类型:用于打印的、用于建模的和用于二维绘图的。为了生产实体零件,3D打印机需要特定的文件类型。被称为“网格模型”,3D打印中最常见的文件类型称为STereoLithography,简称STL。可以免费…