hadoop windows

 

1、安装JDK1.6或更高版本

  官网下载JDK,安装时注意,最好不要安装到带有空格的路径名下,例如:Programe Files,否则在配置Hadoop的配置文件时会找不到JDK(按相关说法,配置文件中的路径加引号即可解决,但我没测试成功)。

2、安装Cygwin

  Cygwin是Windows平台下模拟Unix环境的工具,需要在安装Cygwin的基础上安装Hadoop,下载地址:http://www.cygwin.com/

  根据操作系统的需要下载32位或64的安装文件。

  1)、双击下载好的安装文件,点击下一步,选择install from internet

  
  2)、选择安装路径

  3)、选择local Package Directory

  4)、选择您的Internet连接方式

  5)、选择合适的安装源,点击下一步

  

  6)、在Select Packages界面里,Category展开net,选择如下openssh和openssl两项

  

    如果要在Eclipe上编译Hadoop,需要安装Category为Base下的sed

  

    如果想在Cygwin上直接修改hadoop的配置文件,可以安装Editors下的vim

  

  7)、点击“下一步”,等待安装完成。

3、配置环境变量

  在“我的电脑”上点击右键,选择菜单中的“属性",点击属性对话框上的高级页签,点击”环境变量"按钮,在系统变量列表里双击“Path”变量,在变量值后输入安装的Cygwin的bin目录,例如:D:\hadoop\cygwin64\bin

4、安装sshd服务

  双击桌面上的Cygwin图标,启动Cygwin,执行ssh-host-config -y命令

  

  执行后,会提示输入密码,否则会退出该配置,此时输入密码和确认密码,回车。最后出现Host configuration finished.Have fun!表示安装成功。

  输入net start sshd,启动服务。或者在系统的服务里找到并启动Cygwin sshd服务。

    可能会遇到无法安装和启动sshd服务的问题,可参考此连接http://www.cnblogs.com/kinglau/p/3261886.html。

  另外如果是Win8操作系统,启动Cygwin时,需要以管理员身份运行(右键图标,选择以管理员身份运行),否则会因为权限问题,提示“发生系统错误5”。

5、配置SSH免密码登录

  执行ssh-keygen命令生成密钥文件

  如下图所示,输入:ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa,注意-t -P -f参数区分大小写。

  ssh-keygen是生成密钥命令

  -t 表示指定生成的密钥类型(dsa,rsa)

  -P表示提供的密语

  -f指定生成的密钥文件。

  注意:~代表当前用户的文件夹,/home/用户名

  

  执行此命令后,在你的Cygwin\home\用户名 路径下面会生成.ssh文件夹,可以通过命令ls -a /home/用户名  查看,ssh -version命令查看版本。

  执行完ssh-keygen命令后,再执行下面命令,就可以生成authorized_keys文件了。

  cd ~/.ssh/

  cp id_dsa.pub authorized_keys

  如下图所示:

  

  然后执行exit命令,退出Cygwin窗口

6、再次在桌面上双击Cygwin图标,打开Cygwin窗口,执行ssh localhost命令,第一次执行该命令会有提示,输入yes后,回车即可。如下图所示

  

7、安装Hadoop

   hadoop官网下载http://hadoop.apache.org/releases.html。

  把hadoop压缩包解压到/home/用户名 目录下,文件夹名称更改为hadoop,可以不修改,但后边在执行命令时稍显麻烦。

  (1)单机模式配置方式

    单机模式不需要配置,这种方式下,Hadoop被认为是一个单独的Java进程,这种方式经常用来调试。

  (2)伪分布模式

    可以把伪分布模式看作是只有一个节点的集群,在这个集群中,这个节点既是Master,也是Slave,既是NameNode,也是DataNode,既是JobTracker,也是TaskTracker。

    这种模式下修改几个配置文件即可。

    配置hadoop-env.sh,记事本打开改文件,设置JAVA_HOME的值为你的JDK安装路径,例如:

    JAVA_HOME="D:\hadoop\Java\jdk1.7.0_25"    

    配置core-site.xml

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

配置hdfs-site.xml

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

配置mapred-site.xml

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

 

8、启动Hadoop

  打开Cgywin窗口,执行cd ~/hadoop命令,进入hadoop文件夹,如下图:

  

  启动Hadoop前,需要先格式化Hadoop的文件系统HDFS,执行命令:bin/hadoop namenode -format

  注意namenode要小些,否则如果输入NameNode,会提示错误,找不到或无法加载主类NameNode。执行正确命令后如下图所示:

  

  输入命令 bin/start-all.sh,启动所有进程,如下图:  

 

接下来,验证是否安装成功

打开浏览器,分别输入下列网址,如果能够正常浏览,说明安装成功。

http://localhost:50030,回车打开MapReduce的web页面,如下图(页面部分截图):

 

http://localhost:50070,回车打开HDFS的web页面,如下图(页面部分截图):

 

第一次启动后,如果都不能浏览,或不能浏览某一个,退出Cygwin,重新打开Cygwin,执行bin/start-all.sh命令。

如果只想启动MapReduce,可执行bin/start-mapred.sh命令。

如果只想启动HDFS,可执行bin/start-dfs.sh命令。

 

参考文献:

本文参考和引用了《Hadoop实战》(作者:陆嘉恒)中的章节“2.3在Windows上安装与配置Hadoop”。

特此声明,如果涉及到版权问题,请告知。

 

 

分类: Hadoop
绿色通道: 好文要顶 关注我 收藏该文与我联系
kinglau
关注 - 16
粉丝 - 42
+加关注
5
0
(请您对文章做出评价)
« 上一篇:Windows 平台下安装Cygwin后,sshd服务无法启动
» 下一篇:Hadoop的datanode无法启动
posted @ 2013-08-20 16:15 kinglau 阅读(34107) 评论(29) 编辑 收藏
#1楼 2014-03-14 14:52 lovetimi
你好,看过你的文章后,跟着你做到
8、启动Hadoop
小写namenode还是会提示错误,找不到或无法加载主类NameNode。
不知道是怎么回事。。
支持(0)反对(0)
#2楼 2014-03-24 16:32 清清2013
http://localhost:50079,回车打开HDFS的web页面,如下图(页面部分截图)

端口應該是http://localhost:50070
支持(0)反对(0)
#3楼 2014-04-02 15:52 jianshuang
Administrator@wx ~
$ net start sshd
CYGWIN sshd ▒▒▒▒▒▒▒▒▒▒▒▒ .
CYGWIN sshd ▒▒▒▒▒Ѿ▒▒▒▒▒▒ɹ▒▒▒


Administrator@wx ~


这表示启动服务成功了吧。
支持(0)反对(0)
#4楼 2014-04-05 17:50 KiwenLau
@jianshuang
cygwin中文乱码问题解决可以参见我的博客《Cygwin中文乱码》http://www.cnblogs.com/kiwenlau/p/3645752.html
支持(0)反对(0)
http://pic.cnblogs.com/face/569245/20150603225120.png
#5楼 2014-04-05 17:51 KiwenLau
@清清2013
我也发现这个问题了。还以为自己装错了,楼主修改一下吧!
支持(0)反对(0)
http://pic.cnblogs.com/face/569245/20150603225120.png
#6楼[楼主] 2014-05-23 11:22 kinglau
@清清2013
多谢,已修改。
支持(0)反对(0)
#7楼 2014-06-25 20:59 程序猿213
你好,我按照您的步骤做,在执行format的时候./hdfs namenode -format,报错如下:
错误: 找不到或无法加载主类 org.apache.hadoop.hdfs.server.namenode.NameNode

请问是什么原因呢
支持(0)反对(0)
#8楼 2014-07-02 11:54 364718323
遇到7楼问题 找不到解决方法吖
支持(0)反对(0)
#9楼 2014-08-13 19:36 changanlaosan
administrator@2012-20121224CP /cygdrive/d/hadoop-0.20.2
$ bin/hadoop namenode format
14/08/13 19:27:45 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = 2012-20121224CP/192.168.131.182
STARTUP_MSG: args = [format]
STARTUP_MSG: version = 0.20.2
STARTUP_MSG: build = //svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707; compiled by 'chrisdo' on Fri Feb 19 08:07:34 UTC 2010
************************************************************/
Usage: java NameNode [-format] | [-upgrade] | [-rollback] | [-finalize] | [-importCheckpoint]
14/08/13 19:27:45 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at 2012-20121224CP/192.168.131.182
************************************************************/
我崩溃了,到底怎么弄各种错误,求楼主这个问题怎么办,我是新手谢谢了怎么弄都不行了
支持(0)反对(0)
#10楼 2014-08-13 19:38 changanlaosan
最后格式化的时候出现了上边的原因,楼主求解答、、
支持(0)反对(0)
#11楼 2014-08-17 10:10 懂zj你
@lovetimi
请问这个问题你解决了吗?
支持(0)反对(0)
#12楼 2014-08-17 10:10 懂zj你
@changanlaosan
请问这个问题你解决了吗?
支持(0)反对(0)
#13楼 2014-08-17 10:11 懂zj你
@程序猿213
请问这个问题你解决了吗?
支持(0)反对(0)
#14楼[楼主] 2014-08-18 11:00 kinglau
@changanlaosan
$ bin/hadoop namenode -format
支持(0)反对(0)
#15楼 2014-10-31 13:40 孙畅
你好,我遇到问题Administrator@ks-zx-pc-100 ~
$ ssh-host-config -y

*** Info: Generating missing SSH host keys
*** Query: Overwrite existing /etc/ssh_config file? (yes/no) yes
*** Info: Creating default /etc/ssh_config file
*** Query: Overwrite existing /etc/sshd_config file? (yes/no) yes
*** Info: Creating default /etc/sshd_config file

*** Info: StrictModes is set to 'yes' by default.
*** Info: This is the recommended setting, but it requires that the POSIX
*** Info: permissions of the user's home directory, the user's .ssh
*** Info: directory, and the user's ssh key files are tight so that
*** Info: only the user has write permissions.
*** Info: On the other hand, StrictModes don't work well with default
*** Info: Windows permissions of a home directory mounted with the
*** Info: 'noacl' option, and they don't work at all if the home
*** Info: directory is on a FAT or FAT32 partition.
*** Query: Should StrictModes be used? (yes/no) yes

*** Info: Privilege separation is set to 'sandbox' by default since
*** Info: OpenSSH 6.1. This is unsupported by Cygwin and has to be set
*** Info: to 'yes' or 'no'.
*** Info: However, using privilege separation requires a non-privileged account
*** Info: called 'sshd'.
*** Info: For more info on privilege separation read /usr/share/doc/openssh/README.privsep.
*** Query: Should privilege separation be used? (yes/no) yes
*** Info: Updating /etc/sshd_config file

*** Info: Sshd service is already installed.

*** Info: Host configuration finished. Have fun!

Administrator@ks-zx-pc-100 ~
$
输入命令之后,并没有提示我输入密码
支持(0)反对(0)
#16楼 2014-11-03 16:28 孙畅
@changanlaosan
这个问题我也遇到的,现在解决了,之所以出现这样的问题,是因为配置那三个文件出错了,你试下这样的配置方法
修改 core-site.xml 为如下配置

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

修改 hdfs-site.xml 为如下配置

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

修改 mapred-site.xml 为如下配置

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/388105.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

科学价值 社交关系 大数据_服务的价值:数据科学和用户体验研究美好生活

科学价值 社交关系 大数据A crucial part of building a product is understanding exactly how it provides your customers with value. Understanding this is understanding how you fit into the lives of your customers, and should be central to how you build on wha…

在Ubuntu下创建hadoop组和hadoop用户

一、在Ubuntu下创建hadoop组和hadoop用户 增加hadoop用户组&#xff0c;同时在该组里增加hadoop用户&#xff0c;后续在涉及到hadoop操作时&#xff0c;我们使用该用户。 1、创建hadoop用户组 2、创建hadoop用户 sudo adduser -ingroup hadoop hadoop 回车后会提示输入新的UNIX…

vs azure web_在Azure中迁移和自动化Chrome Web爬网程序的指南。

vs azure webWebscraping as a required skill for many data-science related jobs is becoming increasingly desirable as more companies slowly migrate their processes to the cloud.随着越来越多的公司将其流程缓慢迁移到云中&#xff0c;将Web爬网作为许多与数据科学相…

hadoop eclipse windows

首先说一下本人的环境: Windows7 64位系统 Spring Tool Suite Version: 3.4.0.RELEASE Hadoop2.6.0 一&#xff0e;简介 Hadoop2.x之后没有Eclipse插件工具&#xff0c;我们就不能在Eclipse上调试代码&#xff0c;我们要把写好的java代码的MapReduce打包成jar然后在Linux上运…

netstat 在windows下和Linux下查看网络连接和端口占用

假设忽然起个服务&#xff0c;告诉我8080端口被占用了&#xff0c;OK&#xff0c;我要去看一下是什么服务正在占用着&#xff0c;能不能杀 先假设我是在Windows下&#xff1a; 第一列&#xff1a; Proto 协议 第二列&#xff1a; 本地地址【ip端口】 第三列&#xff1a;远程地址…

selenium 解析网页_用Selenium进行网页搜刮

selenium 解析网页网页抓取系列 (WEB SCRAPING SERIES) 总览 (Overview) Selenium is a portable framework for testing web applications. It is open-source software released under the Apache License 2.0 that runs on Windows, Linux and macOS. Despite serving its m…

代理ARP协议(Proxy ARP)

代理ARP&#xff08;Proxy-arp&#xff09;的原理就是当出现跨网段的ARP请求时&#xff0c;路由器将自己的MAC返回给发送ARP广播请求发送者&#xff0c;实现MAC地址代理&#xff08;善意的欺骗&#xff09;&#xff0c;最终使得主机能够通信。 图中R1和R3处于不同的局域网&…

hive 导入hdfs数据_将数据加载或导入运行在基于HDFS的数据湖之上的Hive表中的另一种方法。

hive 导入hdfs数据Preceding pen down the article, might want to stretch out appreciation to all the wellbeing teams beginning from cleaning/sterile group to Nurses, Doctors and other who are consistently battling to spare the mankind from continuous Covid-1…

对Faster R-CNN的理解(1)

目标检测是一种基于目标几何和统计特征的图像分割&#xff0c;最新的进展一般是通过R-CNN&#xff08;基于区域的卷积神经网络&#xff09;来实现的&#xff0c;其中最重要的方法之一是Faster R-CNN。 1. 总体结构 Faster R-CNN的基本结构如下图所示&#xff0c;其基础是深度全…

大数据业务学习笔记_学习业务成为一名出色的数据科学家

大数据业务学习笔记意见 (Opinion) A lot of aspiring Data Scientists think what they need to become a Data Scientist is :许多有抱负的数据科学家认为&#xff0c;成为一名数据科学家需要具备以下条件&#xff1a; Coding 编码 Statistic 统计 Math 数学 Machine Learni…

postman 请求参数为数组及JsonObject

2019独角兽企业重金招聘Python工程师标准>>> 1. (1)数组的请求方式(post) https://blog.csdn.net/qq_21205435/article/details/81909184 (2)数组的请求方式&#xff08;get&#xff09; http://localhost:port/list?ages10,20,30 后端接收方式&#xff1a; PostMa…

python 开发api_使用FastAPI和Python快速开发高性能API

python 开发apiIf you have read some of my previous Python articles, you know I’m a Flask fan. It is my go-to for building APIs in Python. However, recently I started to hear a lot about a new API framework for Python called FastAPI. After building some AP…

基于easyui开发Web版Activiti流程定制器详解(一)——目录结构

&#xfeff;&#xfeff;题外话&#xff08;可略过&#xff09;&#xff1a; 前一段时间&#xff08;要是没记错的话应该是3个月以前&#xff09;发布了一个更新版本&#xff0c;很多人说没有文档看着比较困难&#xff0c;所以打算拿点时间出来详细给大家讲解一下&#xff0c;…

基于easyui开发Web版Activiti流程定制器详解(二)——文件列表

&#xfeff;&#xfeff;上一篇我们介绍了目录结构&#xff0c;这篇给大家整理一个文件列表以及详细说明&#xff0c;方便大家查找文件。 由于设计器文件主要保存在wf/designer和js/designer目录下&#xff0c;所以主要针对这两个目录进行详细说明。 wf/designer目录文件详解…

Power BI:M与DAX以及度量与计算列

When I embarked on my Power BI journey I was almost immediately slapped with an onslaught of foreign and perplexing terms that all seemed to do similar, but somehow different, things.当我开始Power BI之旅时&#xff0c;我几乎立刻受到了外国和困惑术语的冲击&am…

git 基本命令和操作

设置全局用户名密码 $ git config --global user.name runoob $ git config --global user.email testrunoob.comgit init:初始化仓库 创建新的 Git 仓库 git clone: 拷贝一个 Git 仓库到本地 : git clone [url]git add:将新增的文件添加到缓存 : git add test.htmlgit status …

基于easyui开发Web版Activiti流程定制器详解(三)——页面结构(上)

&#xfeff;&#xfeff;上一篇介绍了定制器相关的文件&#xff0c;这篇我们来看看整个定制器的界面部分&#xff0c;了解了页面结构有助于更好的理解定制器的实现&#xff0c;那么现在开始吧&#xff01; 首先&#xff0c;我们来看看整体的结构&#xff1a; 整体结构比较简单…

基于easyui开发Web版Activiti流程定制器详解(四)——页面结构(下)

&#xfeff;&#xfeff;题外话&#xff1a; 这两天周末在家陪老婆和儿子没上来更新请大家见谅&#xff01;上一篇介绍了调色板和画布区的页面结构&#xff0c;这篇讲解一下属性区的结构也是定制器最重要的一个页面。 属性区整体页面结构如图&#xff1a; 在这个区域可以定义工…

梯度下降法优化目标函数_如何通过3个简单的步骤区分梯度下降目标函数

梯度下降法优化目标函数Nowadays we can learn about domains that were usually reserved for academic communities. From Artificial Intelligence to Quantum Physics, we can browse an enormous amount of information available on the Internet and benefit from it.如…

FFmpeg 是如何实现多态的?

2019独角兽企业重金招聘Python工程师标准>>> 前言 众所周知&#xff0c;FFmpeg 在解码的时候&#xff0c;无论输入文件是 MP4 文件还是 FLV 文件&#xff0c;或者其它文件格式&#xff0c;都能正确解封装、解码&#xff0c;而代码不需要针对不同的格式做出任何改变&…