hadoop3 禁用ec_Hadoop + Amazon EC2 –更新的教程

hadoop3 禁用ec

在Hadoop的Wiki页面上放置了一个旧教程: http : //wiki.apache.org/hadoop/AmazonEC2 ,但是最近我不得不遵循本教程,并且我注意到它没有涵盖某些Amazon新功能。

建议您已经熟悉Hadoop的基础来学习本教程,可以在Hadoop的主页http://hadoop.apache.org/上找到非常有用的“如何开始”教程。 另外,您必须至少熟悉Amazon EC2内部和实例定义。

当您在Amazon AWS上注册帐户时,您可以运行750小时
t1.micro实例,但不幸的是,您无法在此类计算机上成功运行Hadoop。

在以下步骤中,当命令以$开头时,意味着它应该在本地计算机中执行,而在#EC2实例中以#命令执行。

创建一个X.509证书

由于我们将使用ec2-tools,因此我们在AWS的帐户需要有效的X.509证书:

    • 创建.ec2文件夹:
$ mkdir ~/.ec2
    • 在AWS上登录
      • 选择“安全凭证”,然后在“访问凭证”上单击“ X.509证书”;
      • 您有两种选择:
        • 使用命令行创建证书:
$ cd ~/.ec2; openssl genrsa -des3 -out my-pk.pem 2048
$ openssl rsa -in my-pk.pem -out my-pk-unencrypt.pem
$ openssl req -new -x509 -key my-pk.pem -out my-cert.pem -days 1095
        • 仅在您的机器日期确定的情况下才有效。
      • 使用该站点创建证书并下载私钥(请记住将其放在〜/ .ec2中)。


设置Amazon EC2-Tools

    • 下载并解压缩ec2-tools;
    • 编辑〜/ .profile以导出ec2-tools所需的所有变量,因此您不必在每次打开提示时都这样做:
      • 以下是应附加到〜/ .profile文件的示例:
        • 导出JAVA_HOME = / usr / lib / jvm / java-6-sun
        • 出口EC2_HOME =〜/ ec2-api-tools- *
        • 导出PATH = $ PATH:$ EC2_HOME / bin
        • 出口EC2_CERT =〜/ .ec2 / my-cert.pem
      • 要访问实例,您需要进行身份验证(出于安全方面的明显原因),通过这种方式,您必须创建密钥对(公共密钥和私有密钥):
        • 在https://console.aws.amazon.com/ec2/home上,单击“密钥对”,或
        • 您可以运行以下命令:
$ ec2-add-keypair my-keypair | grep –v KEYPAIR > ~/.ec2/id_rsa-keypair
$ chmod 600 ~/.ec2/id_rsa-keypair


设置Hadoop

下载并解压缩Hadoop后,您必须编辑src / contrib / ec2 / bin / hadoop-ec2-env.sh上的EC2配置脚本。

  • AWS变量
    • 这些变量与您的AWS账户(AWS_ACCOUNT_ID,AWS_ACCESS_KEY_ID,AWS_SECRET_ACCESS_KEY)相关,可以在您的账户登录时在“安全凭证”中找到。
  • 安全变量
    • 安全变量(EC2_KEYDIR,KEY_NAME,PRIVATE_KEY_PATH)是与EC2实例的启动和访问有关的变量。
    • 选择一个AMI
      • 根据要运行的Hadoop版本(HADOOP_VERSION)和实例类型(INSTANCE_TYPE),应使用正确的映像来部署实例:
      • 您可以使用许多公共AMI图像(它们必须满足大多数用户的需求)来列出,键入
$ ec2-describe-images -x all | grep hadoop
    • 或者,您可以构建自己的映像,然后将其上传到Amazon S3存储桶;
    • 选择了将要使用的AMI之后,基本上可以在hadoop-ec2-env.sh上编辑三个变量:
      • S3_BUCKET:将要使用的图像(例如hadoop-images)放置在存储桶中,
      • ARCH:您选择的AMI映像(i386或x84_64)的体系结构,以及
      • BASE_AMI_IMAGE:映射AMI图像的唯一代码,例如ami-2b5fba42。
    • 其他可配置变量是JAVA_VERSION,您可以在其中定义将与实例一起安装的版本:
      • 您还可以提供二进制文件所在的链接(JAVA_BINARY_URL),例如,如果您具有JAVA_VERSION = 1.6.0_29,则可以使用JAVA_BINARY_URL = http://download.oracle.com/otn-pub/java/ jdk / 6u29-b11 / jdk-6u29-linux-i586.bin。


跑步!

    • 您可以将src / contrib / ec2 / bin的内容添加到PATH变量中,以便能够从打开提示的位置运行独立的命令;
    • 要启动EC2集群并启动Hadoop,请使用以下命令。 参数是集群名称(hadoop-test)和从站数(2)。 群集启动时,公共DNS名称将被打印到控制台。
$ hadoop-ec2 launch-cluster hadoop-test 2
    • 要从“集群”登录主节点,请输入:
$ hadoop-ec2 login hadoop-test
    • 登录到主节点后,便可以开始作业:
      • 例如,要测试您的集群,您可以运行hadoop * -examples.jar已提供的pi计算:
# cd /usr/local/hadoop-*
# bin/hadoop jar hadoop-*-examples.jar pi 10 10000000
    • 您可以通过http:// MASTER_HOST:50030 /查看工作进度。 其中MASTER_HOST是群集启动后返回的主机名。
    • 工作完成后,群集仍处于活动状态。 要关闭,请使用以下命令:
$ hadoop-ec2 terminate-cluster hadoop-test
    • 请记住,在Amazon EC2中,实例是按小时收费的,因此,如果您只想进行测试,则可以在集群上再玩几分钟。


参考: Hadoop + Amazon EC2 –我们的JCG合作伙伴 Rodrigo Duarte在Thinking Bigger博客上的更新教程 。

翻译自: https://www.javacodegeeks.com/2012/11/hadoop-amazon-ec2-an-updated-tutorial.html

hadoop3 禁用ec

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/351716.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

libuv 原理_Libuv初理解

整体概念libuv是一个跨平台、专门写给nodejs的库,它的设计是围绕着事件驱动的异步I/O模型。在不同的I/O轮询机制上,libuv提供的不是简单抽象对象:handle和streams为sockets和其他实例提供了一个高级抽象。此外,libuv还提供了跨平台…

Matlab排序函数sort()和sortrows()

sort() 调用形式 1.Ysort(X) 对矩阵、向量或数组进行升序排列。 例1 >> amagic(4)a 16 2 3 135 11 10 89 7 6 124 14 15 1>> brand(1,4)b 0.8147 0.9058 0.1270 0.9134>> sort(a)ans 4 2 3…

[Swift]LeetCode968.监控二叉树 | Binary Tree Cameras

★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号:山青咏芝(shanqingyongzhi)➤博客园地址:山青咏芝(https://www.cnblogs.com/strengthen/)➤GitHub地址&a…

Maven神秘化

由于我的Android开发的背景下,我比较习惯到摇篮 ,而不是Maven的 。 尽管我知道Gradle基于Maven,但我从未调查过幕后发生的事情。 在过去的一周中,我一直在尝试了解细节并找出Maven的不同组成部分。 什么是Maven Maven是主要用于J…

走进JVM【二】理解JVM内存区域

引言 对于C程序员,内存分配与回收的处理一直是令人头疼的问题。Java由于自身的自动内存管理机制,使得管理内存变得非常轻松,不容易出现内存泄漏,溢出的问题。 不容易不代表不会出现问题,一旦内存泄漏或溢出的情况发生&…

mysql一对多_mysql一对多查询合并多的一方的数据。

有时候会有这样一个需求,查询的一条记录需要包含另一个表的多条记录,并且让多条记录成为一个字段组成最终的一条记录。比较难描述,看例子吧。创建一个产品表:create table product(proId int(10),proName varchar(50))创建一个成分…

Matlab矩阵、元胞数组的合并拼接

矩阵合并拼接 1.横向拼接 [a,b] [a b]均可 例1 >> amagic(3)a 8 1 63 5 74 9 2>> brand(3)b 0.6324 0.5469 0.15760.0975 0.9575 0.97060.2785 0.9649 0.9572>> c[a,b]c 8.0000 1.0000 6.0000 0.632…

Matlab拆分矩阵/Matlab如何分割大矩阵(mat2cell函数)

dim1Dist分割后矩阵行数组成的向量,dimNDist指的是分割后矩阵列数组成的向量 例有100*200的矩阵A >> Arand(100,200); >> bmat2cell(A,[30 40 30],[100 70 30])b 33 cell 数组{30100 double} {3070 double} {3030 double}{40100 double} {40…

分布式系统部署、监控与进程管理的几重境界

陈硕 (giantchen_AT_gmail) Blog.csdn.net/Solstice t.sina.com.cn/giantchen 陈硕关于分布式系统的系列文章:http://blog.csdn.net/Solstice/category/802325.aspx 本作品采用“Creative Commons 署名-非商业性使用-禁止演绎 3.0 Unported 许可协议(cc by-nc-nd)”…

.net core mvc初级教程(六)

一、创建movie的视图 二、对cinema、movie视图添加‘添加信息’的操作 一、创建movie的视图 在views文件夹下添加Movie文件夹,在这个文件夹下添加Index.cshtml视图,为什么添加Index.cshtml这个名字的视图,可以看看我们写的MovieController控制…

apache camel_发掘Apache Camel的力量

apache camel最近几年,ESB软件越来越受欢迎。 如果大多数人通常知道什么是ESB,那么他们很少会清楚地了解这种体系结构的不同组件的确切作用。 例如,Apache ServiceMix由三个主要组件组成:Apache Karaf(OSGI容器&#…

角反射器的功能及应用

雷达反射器又名角反射器,它是通过金属板材根椐不同用途做成的不同规格的雷达波反射器。当雷达电磁波扫描到角反射后,电磁波会在金属角上产生折射放大,产生很强的回波信号,在雷达的屏幕上出现很强的回波目标。由于角反射器有极强的…

mysql卸载权限不够_Linu下启动MySQL结果显示:env: /etc/init.d/mysql:权限不够怎么解决?...

展开全部Linu下启动MySQL结果显示:env: /etc/init.d/mysql: 是脚本执行的问题解决办法:依次e69da5e887aa3231313335323631343130323136353331333365633936执行下面的命令(执行失败的话,检查路径是否正确):cp /etc/init.d/mysql /e…

GDAL/ORG之Python获取与安装

GDAL(Geospatial Data Abstraction Library)是一个的开源栅格空间数据读取/转换库。其中还有一系列命令行工具来进行数据转换和处理。而ORG项目是GDAL的一个分支,功能与GDAL类似,但其提供对矢量数据的支持。 也就是说,可以用ORG的库来读取、处…

Firewall配置

一、安装firewall #yum install -y firewalld firewall-config 二、启动并设置开机自启动# systemctl start firewalld# systemctl enable firewalld# systemctl stop firewalld# systemctl disable firewalld 三、firewall配置# firewall-config 防火墙图形配置界面# firewall…

网页cookie是什么?

Cookie 是用户访问的网站创建的文件,存储在用户电脑的硬盘中,用于保存浏览信息,例如您的网站偏好设置或个人资料信息。网站依靠Cookie辨认用户行踪,了解用户感兴趣内容,收集与用户有关的信息。用户访问查询网页上操作信…

使用基于微服务的流架构更好地进行大规模的复杂事件处理(第1部分)

基于微服务的流架构与开源规则引擎相结合,使实时业务规则变得容易 这篇文章旨在详细说明我将OSS业务规则引擎与Kafka风格的现代流消息传递系统集成在一起的项目。 该项目的目标(即众所周知的复杂事件处理(CEP))旨在实…

chown r mysql ._chown -R 用户名:组名 ./ 及 chown用法介绍

当我们在不通过yum(CentOS)、apt-get(Ubuntu)来安装MySQL的时候,通常执行以下命令来改变目录的拥有者:[rootlocalhost ~]# chown -R mysql:mysql ./这两个mysql谁是用户名谁是用户组呢?见chown详解。chown将指定文件的拥有者改为指定的用户或…

c语言abs和fabs的区别是什么?

abs是整数取绝对值,定义在stdlib.h头文件中。而fabs是指浮点数取绝对值,定义在math.h头文件中。 函数原型 int abs(int x) double fabs(double x)

Linux下编译GDAL

一、准备工作 从官网下载GDAL、PROJ.4和GEOS,将其存放在/home/liml/Work/3rdPart目录并解压,如下图所示。下载地址请自行Google。注:使用的系统是CentOS6.4 X64版本,其他的Linux系统都是一样的。 接下来检查系统中是否安装了开发…