cdh搭建hadoop集群_Hadoop宿醉:使用Apache Whirr启动hadoop集群CDH4

cdh搭建hadoop集群

这篇文章是关于如何在EC2实例上启动CDH4 MRv1或CDH4 Yarn集群的。 据说您可以在Whirr的帮助下在5分钟内启动一个集群! 当且仅当一切工作正常时,这才是正确的!

希望本文在这方面对您有所帮助。

所以,让我们划船...

  • 下载Apache Whirr的稳定版本,即。 来自以下链接的whirr-0.8.1.tar.gz:whirr-0.8.1.tar.gz
  • 从压缩包中提取并生成密钥
$ tar -xzvf whirr-0.8.1.tar.gz
$ cd whirr-0.8.1
  • 生成密钥
  • $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa_whirr
    $ cd whirr-0.8.1
  • 创建一个属性文件以使用该配置启动集群。
  • # Cluster name goes here
    whirr.cluster-name=testcluster# Change the number of machines in the cluster here
    # Using 3 DN and TT and 1JT and NN# Ganglia is configured
    whirr.instance-templates=1 hadoop-jobtracker+hadoop-namenode+ganglia-monitor+ganglia-metad,3 hadoop-datanode+hadoop-tasktracker+ganglia-monitor# Install JAVA
    whirr.java.install-function=install_openjdk
    whirr.java.install-function=install_oab_java## Install CDH4 MRV1
    whirr.hadoop.install-function=install_cdh_hadoop
    whirr.hadoop.configure-function=configure_cdh_hadoop
    whirr.env.REPO=cdh4# For EC2 set AWS_ACCESS_KEY_ID and AWS_SECRET_ACCESS_KEY environment variables.
    whirr.provider=aws-ec2
    whirr.hardware-id=c1.xlarge# Credentials should go here
    whirr.identity=XXXXXXXXXXXXXXXXX
    whirr.credential=XXXXXXXXXXXXXXXXXXXX
    whirr.cluster-user=whirr
    whirr.private-key-file=/home/ubuntu/.ssh/yourKey
    whirr.public-key-file=/home/ubuntu/.ssh/yourKey.pub
  • 现在,让我告诉您如何避免头痛!
      • 群集名称:使群集名称保持简单。 避免使用testCluster,testCluster1等。 没有大写数字。
      • 明智地确定所需的数据节点数。
      • 如果未安装java,则启动可能不会成功。 确保图像具有Java。 但是,此属性文件可以解决此问题。
      • 现在最好继续使用MRv1,等到生产稳定版本发布后再切换到MRv2。
      • 这是用于启动Hadoop集群的最小配置集。 但是,您可以对此进行很多性能调整。
      • 我是从ec2实例启动此集群的,最初我遇到关于用户的错误。 在下面设置配置即可解决问题。
    whirr.cluster-user=whirr
  • 在启动之前,为〜/ .ssh和whirr-0.8.1文件夹设置适当的权限。
    • 好了,我们已经准备好启动集群。 将属性文件命名为“ whirr_cdh.properties”。
    $ cd whirr-0.8.1
    $ bin/whirr launch-cluster --config whirr_cdh.properties

    在控制台中,您可以看到指向Namenode和JobTracker Web UI的链接。 最后,它还会显示如何ssh到实例。

    • 现在,您应该已经生成了文件。 您将能够看到以下文件:实例,hadoop-proxy.sh和hadoop-site.xml
    • 启动代理
    $ sh hadoop-proxy.sh
  • 打开另一个终端,然后键入
  • 您应该能够访问HDFS。
  • $ export HADOOP_CONF_DIR=~/.whirr/testcluster/hadoop-site.xml
    $ hadoop fs -ls /
  • 您也可以下载hadoop tarball并使用
  • $ bin/hadoop --config ~/.whirr/testcluster fs -ls /
  • 好的! 因此,我知道除非您拥有网络用户界面,否则您将不满意
  • Now, Launch Firefox (3.0v+)
    Download the FoxyProxy extension by clicking this link:https://addons.mozilla.org/en-US/firefox/addon/2464.
    Steps to configure and access the UI
    Select Tools > FoxyProxy > Options
    Click the “Add New Proxy” button.
    Select “Manual Proxy Configuration”
    Enter “localhost” for the “Host or IP Address” field.
    Enter “6666″ for the “Port” field.
    Click on the “General” tab at the top of the dialog box.
    Enter “EC2″ for the “Proxy Name” field.
    Click on the “URL Patterns” tab at the top of the dialog box.
    Click the “Add New Pattern” button.
    Enter “EC2″ for the “Pattern Name” field.
    Enter “*compute-1.amazonaws.com*, *.ec2.internal*, *.compute-1.internal*” for the “URL pattern” field (not case sensitive)
    Select the “Whitelist” and “Wildcards” radio buttons.
    Click the “OK” button to dismiss the new URL pattern dialog box.
    Click the “OK” button to dismiss the new proxy dialog box.
    Completely disable the Foxyproxy for now.
    You should be able to see 2 proxy names after closing, default and EC2.
    Click on “Use proxy EC2 for all URLs” from the pop-up menu of FoxyProxy
    Copy the URL of JobTracker (can be seen while running proxy, ec2-***-**-***-**.********.amazonaws.com) and paste it in the browser.

    所以,我们很好!

    • 如果要启动MRv2,请使用它。
    ## Cluster name goes here.
    whirr.cluster-name=yarncluster# Change the number of machines in the cluster here
    whirr.instance-templates=1 hadoop-namenode+yarn-resourcemanager+mapreduce-historyserver,2 hadoop-datanode+yarn-nodemanager# Install JAVA
    whirr.java.install-function=install_openjdk
    whirr.java.install-function=install_oab_java## Install CDH4 Yarn
    whirr.hadoop.install-function=install_cdh_hadoop
    whirr.hadoop.configure-function=configure_cdh_hadoop
    whirr.yarn.configure-function=configure_cdh_yarn
    whirr.yarn.start-function=start_cdh_yarn
    whirr.mr_jobhistory.start-function=start_cdh_mr_jobhistory
    whirr.env.REPO=cdh4
    whirr.env.MAPREDUCE_VERSION=2# For EC2 set AWS_ACCESS_KEY_ID and AWS_SECRET_ACCESS_KEY environment variables.
    whirr.provider=aws-ec2
    whirr.hardware-id=c1.xlarge# Credentials should go here
    whirr.identity=XXXXXXXXXXXXXXXXX
    whirr.credential=XXXXXXXXXXXXXXXXXXXXXXXXXXXXX
    whirr.cluster-user=whirr
    whirr.private-key-file=/home/ubuntu/.ssh/yourKey
    whirr.public-key-file=/home/ubuntu/.ssh/yourKey.pub

    和相同的过程!

    学习愉快!

    参考: Hadoop宿醉:在* Techie(S)pArK *博客上使用 JCG合作伙伴 Swathi V的Apache Whirr启动hadoop集群CDH4 。

    翻译自: https://www.javacodegeeks.com/2013/02/hadoop-hangover-launch-a-hadoop-cluster-cdh4-using-apache-whirr.html

    cdh搭建hadoop集群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/349811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机活动宣传稿,畅想科技,创造梦想 ——东华大学计算机科学与技术学院第十一届图灵科技文化节通讯稿...

2015年11月11日,东华大学计算机科学与技术学院“畅想科技,创造梦想”第十一届图灵科技文化节在松江校区图文信息中心第二报告厅拉开帷幕,出席的嘉宾有:计算机学院院长刘国华教授、计算机学院党总支副书记虞晨洁老师、东华大学校团…

在cygwin下编译c语言

1 #include <stdio.h> 2 3 int main (void) 4 { 5 printf("Hello World!\n"); 6 return 0; 7 } 1.保存到cygwin工作目录下 2.在cygwin中输入&#xff1a;gcc -o hello helloworld.c 将文件编译成exe后缀可执行文件 3.在cygwin中输入&#xff1a;ls …

Apache Camel 2.20发布–新增功能

Apache Camel 2.20已于今天发布&#xff0c;并且像往常一样&#xff0c;我受命撰写有关此新发行版及其亮点的博客。 该版本具有以下重点。 1&#xff09;Java 9技术预览支持 我们已经开始支持Java 9的工作&#xff0c;此版本称为技术预览。 源代码在Java 9上构建和运行&…

距测试软件,两步路怎么测量距离 测距工具使用方法介绍

两步路户外助手是专门为户外运动爱好者打造的一款手机户外运动助手软件&#xff0c;用户通过它可以记录自己的每一条轨迹以及出行方式&#xff0c;这样可以很好的为大家记录各种户外出行的数据&#xff0c;还能参加各种活动和比赛。此外软件自带的地图还有很多实用的小功能&…

Visual Studio的Web Performance Test提取规则详解(1)

总结 Visual Studio的Web Performance Test是基于HTTP协议层的&#xff0c;它不依赖于浏览器&#xff0c;通过直接接收&#xff0c;发送HTTP包来和Web服务器交互。Web Performance Test发送和接收的一系列请求和响应之间存在相关性&#xff0c;例如&#xff0c;用户登录后&…

我的世界f服务器自定义皮肤,我的世界服务器皮肤指令

我的世界换肤教程&#xff0c;本篇教程记录如何使用MCSkin 3D软件、皮肤使用、皮肤预览图制作等相关教程。感兴趣的小伙伴们可以来看看这篇我的世界皮肤教程。一.MCSkin 3D1.4软件介绍及教程&#xff1a;1. 视图-3D设置-屏蔽部位半透明显示在绘制其他部位时&#xff0c;可以用半…

couchbase_Couchbase 101:从Java应用程序创建视图(MapReduce)

couchbase使用Couchbase 2.0开发新应用程序时&#xff0c;有时需要从代码中动态创建视图。 例如&#xff0c;在安装应用程序&#xff0c;编写一些测试时&#xff0c;可能会需要此方法&#xff1b;或者&#xff0c;在构建框架时&#xff0c;您也可以使用此方法&#xff0c;并希望…

如何设置Linux操作系统shell命令的默认语言

Linux中语言的设置和本地化设置真是一个很繁琐的事情&#xff0c;时不时的会出现乱码的情况。 一般来说&#xff0c;linux中显示什么语言是通过环境变量来确认的。 这些环境变量包括&#xff1a; $LANG / $LANGUAGE / $LC_CTYPE .... 可以通过locale命令查看这些变量的值。 要设…

如何在虚拟机上安装wsus服务器,如何在Hyper-V虚拟机上安装WSUS服务器技巧

由于许多企业继续减少使用物理服务器&#xff0c;一个经常提及的问题随之而来&#xff1a;对Windows Server更新服务(WSUS)服务器进行虚拟化处理是个好想法吗?简单的回答&#xff1a;是的。本文介绍了如何在Hyper-V虚拟机中运行WSUS。WSUS可以在虚拟机中运行吗?一言以蔽之&am…

从Spring Data JPA访问EntityManager

Spring Data JPA允许您通过使用Repository接口来快速开发数据访问层。 有时&#xff0c;您需要从Spring Data JPA访问EntityManager。 这篇文章向您展示了如何访问EntityManager。 实体管理器 EntityManager的目的是与持久性上下文进行交互。 然后&#xff0c;持久性上下文将管…

NOIP模拟测试11「string·matrix·big」

打的big出了点小问题&#xff0c;maxx初值我设的0然后少了10分 第二题暴力打炸 第一题剪了一些没用的枝依然40分 总分70 这是一次失败的考试 string 想到和序列那个题很像&#xff0c;但我没做序列&#xff0c;考场回忆学长讲课&#xff0c;打不出来。最后我口胡了一个CDQ分治&…

监控摄像头服务器维护要多久,监控摄像机怎么维护和保养?

原标题&#xff1a;监控摄像机怎么维护和保养?在安防监控系统中&#xff0c;起决定作用的是显示器、摄像机和储存设备。那么&#xff0c;问题来了&#xff0c;监控摄像机怎么维护和保养呢?摄像机属于精密家电&#xff0c;使用上也应更加注意。1、注意防潮&#xff1a;潮湿是摄…

Promise 学习心得

当了这么久码农到今天没事才开始去深究 Promise 这个对象 什么是 Promise&#xff0c; Promise 有什么用&#xff1f;在写代码的时候多多少少都有遇见过地狱式的回调 代码看起来没问题就是有点乱&#xff0c;Promise 这个东西就是为了解决回调嵌套而生的 Promise 是异步编程的一…

小米羊城通余额不足服务器维护,再不怕羊城通余额不够了!地铁站现自助补票“神器”...

再不怕羊城通余额不够了&#xff01;地铁站现自助补票“神器”金羊网 作者&#xff1a;陈泽云 2018-04-16金羊网讯 记者陈泽云报道你有没遇到过这样情况&#xff0c;准备出地铁站时&#xff0c;却发现羊城通余额不足刷不出闸、或者闸机读取不到你的进站信息&#xff0c;只能去…

flex 组建重写

flex历经几个版本的变化&#xff0c;其封装性也越来越规范。 今日flex的学习&#xff0c;总结是组件的重写。 项目中为使组件的针对性&#xff0c;易用性更强 &#xff0c;免不了要重写组件。 要改变你的对手你的了解你的对手。 一个组件从被new到渲染出来主要经历几个重要事件…

glassfish发布应用_GlassFish 4升级的构建,Gradle和嵌入式应用服务器

glassfish发布应用最近&#xff0c;大概在去年年底&#xff0c; GlassFish开源团队发布了GlassFish 4.0 beta 72作为升级版 。 阿伦古普塔&#xff08;Arun Gupta&#xff09;在他的博客上发布了有关GlassFish 4 .0 beta 72的Maven坐标的文章。 该版本意义重大&#xff0c;因为…

Zend Framework 多模块配置 (二)

&#xfeff;续 Zend Framework 多模块配置 &#xff08;一&#xff09; 4&#xff09;启动bootstrap文件&#xff1a; 全局bootstrap文件 &#xff08;repos/application/botstrap.php&#xff09; class Bootstrap extends Zend_Application_Bootstrap_Bootstrap {/***加载一…

固定速率与固定延迟– RxJava常见问题解答

如果您使用的是纯Java&#xff0c;从版本5开始&#xff0c;我们有一个方便的调度程序类&#xff0c;该类允许以固定速率或固定延迟运行任务&#xff1a; import java.util.concurrent.Executors; import java.util.concurrent.ScheduledExecutorService;ScheduledExecutorServ…

cpta 好像有漏洞

https://kwt.cpta.com.cn/转载于:https://www.cnblogs.com/heikeboys/p/7173543.html

通过Spring Boot使用MySQL JDBC驱动程序

在本文中&#xff0c;我将向您展示如何将MySQL数据库与Spring Boot应用程序连接。 本文使用的工具包括&#xff1a; Spring Boot 1.5.6版本 MySQL 5.7.X 马文 Java 8 Spring Data JPA 1 –项目结构 项目结构是典型的Maven结构。 2 –项目依赖性 请注意&#xff0c;父母…