nagios全部的服务大致可以分为3大种:第一种是“本地系统监测服务”,就是监测主机Nagios所在主机对自己本地的一些情况的监测,比如本地磁盘占用情况,本地CPU使用情况等等。第二种是“远程系统监测服务”,就是远程主机系统的内部情况,比如被监测主机的磁盘占用情况,远程主机的CPU使用情况等等,但是要实现远程系统监测服务,还必须要再安装NRPE核心代理的C/S扩展插件程序(这个以后讲)。第三种服务是“连通检测服务”,就是Nagios主机到被监测的远程主机当中的一些连通性的监测,比如Ping操作,指定端口的TCP/UDP监控,这些服务不需要NRPE也能够实现。本文主要讲述nrpe的安装与配置。
1.下载nrpe
http://www.mirrors.wiretapped.net/security/network-monitoring/nagios/nrpe-2.8.1.tar.gz
2.在监控机上安装nrpe
tar xzf nrpe-2.8.1.tar.gz
cd nrpe-2.8.1
./configure
make all
make install-plugin
如果安装成功,就可以在/.../nagios/libexec 目录中找到 "check_nrpe"这个插件。
之后需要定义一个可以在监控平台使用的命令,这个定义一般会在/.../nagios/etc/commands.cfg中,其内容如下:
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
3.在被监控机上安装nrpe
(1)同样,在被监控机上也创建一个nagios帐号
如果不是root用户,切换为root用户
su-l
创建一个名为nagios的帐号并给定登录口令
/usr/sbin/useradd nagios
passwd nagios
(2)安装nagios-plugin插件
tar xzf nagios-plugins-1.4.9.tar.gz
cd nagios-plugins-1.4.9
./configure --prefix=/usr/local/nagios
make
make install
(3)安装nrpe插件
tar xzf nrpe-2.8.1.tar.gz
cd nrpe-2.8.1
./configure
make all
make install-plugin
make install-daemon
make install-daemon-config
安装好了,可以到/usr/local/nagios/下面检查一下,应该生成了4个目录:bin、etc、libexec、share
4.修改被监控机上的nrpe配置:/usr/local/nagios/etc/nrpe.cof
(1)找到“allowed_hosts=127.0.0.1”将其改为:allowed_hosts=127.0.0.1,监控机的IP地址或域名。这样才能让监控机访问到。
(2)定义服务
在nrpe.cof文件下方配置几个默认的服务
command[check_users]=/usr/local/nagios/libexec/check_users -w 4 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 5,4,3 -c 10,6,5
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20 -c 10 -p /dev/hda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 544 -c 744
还有可以传参数的服务定义,这些默认是被注释掉的
#command[check_users]=/usr/local/nagios/libexec/check_users -w $ARG1$ -c $ARG2$
#command[check_load]=/usr/local/nagios/libexec/check_load -w $ARG1$ -c $ARG2$
#command[check_disk]=/usr/local/nagios/libexec/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$
#command[check_procs]=/usr/local/nagios/libexec/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$
如果需要使用传参数的服务定义,先要找到dont_blame_nrpe=0修改成dont_blame_nrpe=1,然后将固定参数的服务定义注释掉
再将传参数的服务定义注释去掉。
5.启动NRPE守护进程
/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
此命令生成的日志会在系统的日志(/var/log/message)中。如果没有出错,就基本搞定了
6.测试nrpe:
/usr/local/nagios/libexec/check_nrpe -H 127.0.0.1
或者在nagios监控机上:/usr/local/nagios/libexec/check_nrpe -H $被监控机的IP地址
正常的返回值为被监控机上安装的NRPE的版本信息:
NRPE v2.8.1
注意:如果被监控机的防火墙有打开,就要添加nrpe的端口号5666
1.下载nrpe
http://www.mirrors.wiretapped.net/security/network-monitoring/nagios/nrpe-2.8.1.tar.gz
2.在监控机上安装nrpe
tar xzf nrpe-2.8.1.tar.gz
cd nrpe-2.8.1
./configure
make all
make install-plugin
如果安装成功,就可以在/.../nagios/libexec 目录中找到 "check_nrpe"这个插件。
之后需要定义一个可以在监控平台使用的命令,这个定义一般会在/.../nagios/etc/commands.cfg中,其内容如下:
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
3.在被监控机上安装nrpe
(1)同样,在被监控机上也创建一个nagios帐号
如果不是root用户,切换为root用户
su-l
创建一个名为nagios的帐号并给定登录口令
/usr/sbin/useradd nagios
passwd nagios
(2)安装nagios-plugin插件
tar xzf nagios-plugins-1.4.9.tar.gz
cd nagios-plugins-1.4.9
./configure --prefix=/usr/local/nagios
make
make install
(3)安装nrpe插件
tar xzf nrpe-2.8.1.tar.gz
cd nrpe-2.8.1
./configure
make all
make install-plugin
make install-daemon
make install-daemon-config
安装好了,可以到/usr/local/nagios/下面检查一下,应该生成了4个目录:bin、etc、libexec、share
4.修改被监控机上的nrpe配置:/usr/local/nagios/etc/nrpe.cof
(1)找到“allowed_hosts=127.0.0.1”将其改为:allowed_hosts=127.0.0.1,监控机的IP地址或域名。这样才能让监控机访问到。
(2)定义服务
在nrpe.cof文件下方配置几个默认的服务
command[check_users]=/usr/local/nagios/libexec/check_users -w 4 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 5,4,3 -c 10,6,5
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20 -c 10 -p /dev/hda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 544 -c 744
还有可以传参数的服务定义,这些默认是被注释掉的
#command[check_users]=/usr/local/nagios/libexec/check_users -w $ARG1$ -c $ARG2$
#command[check_load]=/usr/local/nagios/libexec/check_load -w $ARG1$ -c $ARG2$
#command[check_disk]=/usr/local/nagios/libexec/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$
#command[check_procs]=/usr/local/nagios/libexec/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$
如果需要使用传参数的服务定义,先要找到dont_blame_nrpe=0修改成dont_blame_nrpe=1,然后将固定参数的服务定义注释掉
再将传参数的服务定义注释去掉。
5.启动NRPE守护进程
/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
此命令生成的日志会在系统的日志(/var/log/message)中。如果没有出错,就基本搞定了
6.测试nrpe:
/usr/local/nagios/libexec/check_nrpe -H 127.0.0.1
或者在nagios监控机上:/usr/local/nagios/libexec/check_nrpe -H $被监控机的IP地址
正常的返回值为被监控机上安装的NRPE的版本信息:
NRPE v2.8.1
注意:如果被监控机的防火墙有打开,就要添加nrpe的端口号5666