运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(一)

前言

记得刚来这家公司的时候,我部门就我一个运维工程师,然后就是经理,刚开始公司平台什么监控都没有,在我与经理的努力下,先搭建nagios+cacti监控平台,后来随着公司业务的增加,平台的功能与服务也不断的扩展,nagios+cacti监控不太适合平台的需要,为了解决此问题我就使用shell来搭建了脚本监控系统,根据平台的应用服务需求与领导要求,使用shell的脚本监控系统监控整个平台的运行情况,但随着公司业务的扩大,平台数量的增加,服务器的数量也随之增加,从以前的30台变为现在的120台左右,之前的shell脚本监控系统虽然能够顺利的监控平台的运行情况,但在日常服务器巡检的时候没有什么便利,我这里管理很严格,每天9、13、17都需要对平台进行一下巡检,服务器少的时候还好说,但120台巡检就是个噩梦,为了美好的生活,我决定使用自己设计一个新的监控系统,主要是能在服务器端,使用shell脚本监控继续的监控平台运气情况,使用mysql数据库记录监控数据,使用php设计一个web平台,能在web里展示这些服务器的监控数据,经过2个月的努力,我独自一人的完成了这项任务,经过3个月的试运行与生产环境的测试,成功的完成了我之前的需求,使我的时间变的更充裕,不必把时间浪费到日常巡检里,当然也有副作用,就是每天什么事都没有,实在太闲了(主要是我在搭建shell监控的时候,如果发现有服务宕掉,就根据错误代码自动的解决这个问题并重启服务,所以每天实在很闲)。

由于本监控系统我本人独立自主开发,所以具有决定本监控系统是否开源的权利,为了发展开源精神,我决定把本分布式监控系统open source,借此向开源致敬。其中php程序与shell脚本已经放到最后一页,也就是第七页,希望本文对各位如何的搭建分布式私有监控系统能有更多的启发,也希望各位同仁能多提意见,谢谢!

闲话不说,下面是我的“运维自动化之PHP+MYSQL+SHELL监控系统”的界面展示。

为了方便大家的理解,我画了一个php+mysql+shell的流程图

 

 本监控系统的流程为(部署的顺序是从右到左):

1、需要在各省的机房里的所有服务器安装shell监控脚本,然后把监控服务与资源的数据写入到mysql数据库里;
2、mysql收到各省服务器发送的监控数据,把他们按照先前定义的数据表分别的存储起来;
3、php程序按照之前编辑好的显示方式,从mysql数据库里提前相应的数据,在web端显示,同时在部署php程序的images目录里,运行数据视图化脚本,生成各省监控的数据资源图;
4、用户可以通过web来浏览监控服务与资源的数据、资源的监控数据图。


 由于本文文章与代码描述过多,所以分成7篇文章,下面是文章网页地图。

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(一)

http://dl528888.blog.51cto.com/2382721/1034992

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(二)

http://dl528888.blog.51cto.com/2382721/1035131

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(三)

http://dl528888.blog.51cto.com/2382721/1035142

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(四)

http://dl528888.blog.51cto.com/2382721/1035145

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(五)

http://dl528888.blog.51cto.com/2382721/1035252

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(六)

http://dl528888.blog.51cto.com/2382721/1035297

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(七)

http://dl528888.blog.51cto.com/2382721/1035335

1、先查看资产管理

资产管理下面有2个功能,一个是新增的设备,一个是浏览设备
新增设备

可以增加以上的内容
浏览设备

可以展示之前添加的内容,是从数据库的device表里获得数据
2、监控详情
此页面里展示了所以的监控省份

比如我监控的省份就有甘肃、天津、广西、贵州、海南、河北、湖南、青海、新疆、河南、西藏、包头、湖北、江西、宁夏、陕西工16个省份,每个省份5台服务器,共计80个服务器,目前还在继续添加服务器,预计半个月后,监控的服务器会增加到105个。
下面我们以天津为例
A、应用服务监控详情

 

以上监控,显示的是应用服务的监控主要显示的内容是通过shell脚本监控的,通过shell写入到mysql,然后php通过设置好的表单来进行展示来自mysql的数据。
B、硬盘使用率监控详情

C、cpu使用率监控详情

D、硬件信息错误监控详情

E、I/O使用率监控详情

F、15分钟内的负载

G、内存使用率监控详情

H、日志错误信息监控详情

I、用户登录数监控详情

3、当日报警
以天津为例

可以看到天津今天只有内存报警
4、监控视图

可以看到监控视图有3种,分别有日、月、年的,下面我们分别的查看一下
A、当日报警,以新疆数据库为例
(1)新疆数据库的硬盘使用率

(2)新疆数据库的cpu使用率

(3)新疆数据库的io使用率

(4)新疆数据库的load使用率
(5)新疆数据库的内存使用率

(6)新疆数据库的用户登录数

以上为什么在hour为13,是因为我设置的hour为当前时间的,比如当前为2012年10月23日13:49分,那么当前的hour为13.而右上角的2行文字内容是:

2012年10月23日,database数据库的用户登录不正常的使用红色线表示

2012年10月23日,database数据库的用户登录正常的使用绿色线表示
 
B、当月报警,以湖南引擎为例
(1)湖南引擎的硬盘使用率

(2)湖南引擎的cpu使用率

 
(3)湖南引擎的io使用率

(4)湖南引擎的load使用率

(5)湖南引擎的内存使用率

(6)湖南引擎的用户登录数

注意,month(31)是本月有多少天,通过shell脚本进行计算的。
C、当年报警,以贵州引擎为例
(1)贵州引擎的cpu使用率
(2)贵州引擎的cpu使用率

(3)贵州引擎的io使用率

(4)贵州引擎的load使用率

(5)贵州引擎的内存使用率

(6)贵州引擎的用户登录数

5、邮件接收的shell报警截图

挑选几个真实的服务器报警给大家展示一下shell脚本监控服务器的报警系统。

A、服务宕掉的报警

 

B、hardware硬件错误信息报警

Cload负载报警

D、内存报警

Eswap报警

由于本文文字与脚本内容过多,超过每篇8万字的限制,所以不得不分成多篇博文,尽请见谅。

下一篇文章地址:

运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(二)

http://dl528888.blog.51cto.com/2382721/1035131

BTW:如果大家认为我写的不错,希望能给我的博客投个票,谢谢!

http://blog.51cto.com/contest2012/2382721






 本文转自 reinxu 51CTO博客,原文链接:http://blog.51cto.com/dl528888/1034992,如需转载请自行联系原作者


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/454583.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试风云录(01) - 怎样回答这两个问题?

由于工作经历的缘故,使我有一些面试别人的机会,所以应该还有一些经验可以跟大家聊聊。 当我们提到“面试” 这个词,总是让人有种阶级感,好像面试官就是高高在上,而面试者则是屈居于下,其实并非如此&#xf…

Redis Python

Python操作Redis 安装Python使用Redis的库 sudo pip install redis or sudo easy_install redis or 源码安装 详见:https://github.com/WoLpH/redis-py 1.1 操作模式 redis-py提供两个类Redis和StrictRedis用于实现Redis的命令,StrictRedis用于实现大…

android 代码写命令,monkey基本命令及脚本编写(示例代码)

Monkey 是Android自带的黑盒测试工具,一般通过随机触发界面事件,来确定应用是否会发生异常,多用于android应用的稳定性、压力测试基本命令:adb shell monkey [options] usage: monkey [-p ALLOWED_PACKAGE [-p ALLOWED_PACKAGE] .…

js更新数组对象_7 种Vue 数据已更新而页面没有更新的情况及深化总结(收藏)

作者:前端1943链接:https://segmentfault.com/a/1190000022772025如果你发现你自己需要在 Vue 中做一次强制更新,99.9% 的情况,是你在某个地方做错了事。1. Vue 无法检测实例被创建时不存在于 data 中的 property原因:…

从P560小型机B181201B故障代码识别手把手详解

背景:生产小型机发生宕机事件,现场发现液晶面板存在B181201B代码,可是查看网络,未见有权威的参考文章,通过管理口登录HMC管理界面,发现错误代码B181201B,同时提示可能是电源故障,后登…

Java反射中method.isBridge() 桥接方法

桥接方法是 JDK 1.5 引入泛型后&#xff0c;为了使Java的泛型方法生成的字节码和 1.5 版本前的字节码相兼容&#xff0c;由编译器自动生成的方法。我们可以通过Method.isBridge()方法来判断一个方法是否是桥接方法。 假定接口 public interface SuperClass<T> {void met…

python 利用pexpect进行多机远程命令执行

在安装之前&#xff0c;确认你的机器安装了python,和easy_install.通常python是自动安装的&#xff0c;如果没有安装easy_install&#xff0c;那么wget -q http://peak.telecommunity.com/dist/ez_setup.py 获取一下python ez_setup.pypexpect是python一个模块&#xff0c;可以…

Python 之 线程

进程 之前我们已经了解了操作系统中进程的概念&#xff0c;程序并不能单独运行&#xff0c;只有将程序装载到内存中&#xff0c;系统为它分配资源才能运行&#xff0c;而这种执行的程序就称之为进程。程序和进程的区别就在于&#xff1a;程序是指令的集合&#xff0c;它是进程…

flymcu无法打开串口_西门子1200与其他PLC/组态软件无线串口通讯(自由口)

一、控制系统原理图1:控制系统原理二、硬件需求S7-1200 PLC目前有3种类型的CPU&#xff1a;1)S7-1211C CPU2)S7-1212C CPU3)S7-1214C CPU这三种类型的CPU都可以连接三个串口通信模版本例中使用的PLC硬件为&#xff1a;1)PM1207电源(6EP1 332-1SH71)2)S7-1214C(6ES7 214-1BE30-0…

android按钮固定尺寸,如何在android中保持按钮的固定宽高比

我正在改进你的XML.我没有测试它,但它应该工作.建议的更改是,而不是将图像设置为背景,将其设置为ImageButtons的src.此外,如果您坚持使用Button,则可以使用其他布局包装每个按钮,并将其重力属性设置为“center”.看一下下面的XML.android:layout_width"fill_parent"a…

横空出世,席卷互联网--评微软等公司数据结构和算法面试100题

横空出世&#xff0c;席卷互联网 ---评微软数据结构算法面试100题 作者&#xff1a;July。 时间&#xff1a;2010年10月-11月。版权所有&#xff0c;侵权必究。 出处&#xff1a;http://blog.csdn.net/v_JULY_v。 说明&#xff1a;本文原题为&#xff1a;“横空出世&#xff0c…

收银管理系统怎样帮助商家很好地经营服装门店

收银管理系统对于服装门店的经营可以提供多方面的帮助&#xff0c;以下是一些具体的优势和功能&#xff1a; 1. 快速准确的收银&#xff1a;收银管理系统可以实现快速、准确的收银操作&#xff0c;通过条码扫描或手动输入商品信息&#xff0c;自动计算价格并生成收据。这样可以…

BZOJ 1567: [JSOI2008]Blue Mary的战役地图

二次联通门 : BZOJ 1567: [JSOI2008]Blue Mary的战役地图 /*BZOJ 1567: [JSOI2008]Blue Mary的战役地图社会我栋哥人怂P话多暴力能A题正解能WA0*/ #include <cstdio> #include <iostream>#define rg register inline void read (int &n) {rg char c getchar (…

python模拟输入回车键_用Python模拟键盘输入

import win32apiimport win32conwin32api.keybd_event(17,0,0,0) #ctrl键位码是17win32api.keybd_event(86,0,0,0) #v键位码是86win32api.keybd_event(86,0,win32con.KEYEVENTF_KEYUP,0) #释放按键win32api.keybd_event(17,0,win32con.KEYEVENTF_KEYUP,0)附个键位码表&#xff…

Python 之 进程

目录 理论知识 操作系统背景知识 进程 什么是进程 进程调度 进程的并行与并发 同步异步阻塞非阻塞 同步和异步 阻塞与非阻塞 同步/异步与阻塞/非阻塞 组合 进程的创建与结束 进程的创建 进程的结束 在python程序中的进程操作 multiprocess&#xff08;multiproc…

从全息投影到全息平台,必须克服7个障碍

“每个科幻爱好者和痴迷技术的人儿都希望能拥有一个全息成像台。不幸的是&#xff0c;制造全息平台的技术还尚未被人类掌握。据说我们离这项技术可用之时还有大约10到15年的时间——这是 AMD 的专业人士 Phil Rogers 说的&#xff0c;他专攻 3D 技术工作已超过20年。在《今日宇…

android fragment fragmenttransaction,Android FragmentTransaction 常用方法总结

FragmentManage&#xff1a;FragmentManager能够实现管理activity中fragment. 通过调用activity的getFragmentManager()取得它的实例.FragmentManager可以做如下一些事情:1、使用findFragmentById() (用于在activity ...public class Toolkit { /** * * Role:Telec…

IBM总架构师寇卫东:话说程序员的职业生涯-IT程序人生-职业生涯规划

初级程序员和高级程序员时期&#xff0c;都属于职业生涯发展的第一阶段&#xff0c;我们可以称之为黄金时期。这阶段程序员的年龄在20~35岁之间&#xff0c;因为年轻&#xff0c;所以更善于学习&#xff0c;而且体力充沛&#xff0c;很多走过这个阶段的程序员有过通宵工作的经历…

metric learning -- 马氏距离与欧氏距离

一 基本概念 方差&#xff1a;&#xff08;variance&#xff09;是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望&#xff08;即均值&#xff09;之间的偏离程度。统计中的方差&#xff08;样本方差&#xff09;是每个…

深入理解 C# 协变和逆变

msdn 解释如下&#xff1a; “协变”是指能够使用与原始指定的派生类型相比&#xff0c;派生程度更大的类型。 “逆变”则是指能够使用派生程度更小的类型。 解释的很正确&#xff0c;大致就是这样&#xff0c;不过不够直白。 直白的理解&#xff1a; “协变”->”和谐的变”…