在线看视频网站怎么做做网站如何上传apk
在线看视频网站怎么做,做网站如何上传apk,wordpress 翻译函数,网页设计模板图片素材下载1 介绍
1.1 摘要
本文深入浅出#xff0c;切近实际运维应用#xff0c;由 zabbix 3.4 版本入手#xff0c;学习 zabbix 监控告警实现方式#xff0c;由 zabbix 5.0 浅出实现快速部署、快速应用。本人从业多年#xff0c;关注 zabbix 开源社区#xff0c;以及 zabbix 官…1 介绍
1.1 摘要
本文深入浅出切近实际运维应用由 zabbix 3.4 版本入手学习 zabbix 监控告警实现方式由 zabbix 5.0 浅出实现快速部署、快速应用。本人从业多年关注 zabbix 开源社区以及 zabbix 官方组织的各种峰会了解到的前沿技术因随着运维监控软件的不断发展未来软件将是开箱即用的模式运维人员在使用监控软件不必再去花精力编写运维监控程序而是完善监控项这样的方式对于初学者越来越不容易学习。因此学习 zabbix 3.4 版本是非常必要的 zabbix 官方那时候还没有集成更多的模板以直接使用那里有大量的监控项需要自己编写实现不仅全面了解了 zabbix 也是对 linux 命令、 shell 脚本、 Python 语言等的很好学习也有助于二次开发自定义监控项的配置。
1.2 背景
以下是部署实施基于 zabbix 监控系统的建设背景以解决诸多运维实际问题
目前公司系统运维主要采用人工检查的方式问题发现的时效性较低容易出现问题不被立刻发现人工也容易疏忽漏查导致问题处理不及时影响信息化系统服务效果就需要更好保障系统稳定运行。
公司信息化系统、操作系统、设备种类多各类信息化系统如OA 、 U9 PLM 、企业邮箱等又有 Linux 、 Windows 、 VMware 、 EMC 等系统设备有服务器、交换机、存储等机房环境有动环系统进行监测。如此众多的信息化系统平台当然需要统一运维界面实时监测各系统运行状况为运维工作提供便利。
为适应时代的发展未来是个智能化的时代运维工作要实现自动化运维工作者要向开发去转变开发即运维或许有一天人工智能将代替运维人员而今的运维人员希望是人工智能创造者的一份子了解自动化运维与时俱进是非常必要的。
综上为了提高运维效率节约人力资源对设备、机房环境实时监控能有效、实时发出告警信息从而及时发现问题快速响应。急需一套能满足以上需求的监控系统经考量 zabbix 监控系统应用广泛可实现上述功能。
1.3 系统简介
Zabbix 是一个企业级解决方案支持实时监控数千台服务器虚拟机和网络设备采集百万级监控指标。Zabbix 完全开源免费。
Zabbix 的主要特点有
指标收集从任何设备、系统、应用程序上进行指标采集问题监测定义智能阈值可视化单一界面管理平台告警和修复确保及时、有效的告警安全和认证保护您所有层级的数据轻松搭建部署大批模板开箱即用节省您宝贵的时间自动发现自动监控大型动态环境分布式监控无限制扩展ZABBIX API 将 Zabbix 集成到您 IT 环境的其他任何部分
1.4 名词术语
Zabbix 系统有一些自己定义的专业术语为更好的熟悉系统名词下面主要介绍本文以及 zabbix 常用的术语。
主机 host
一台你想监控的服务器、工作站、交换机等网络设备用 IP 或者域名表示。
主机组 host group
多台具有某种相同角色、属性的集合。例如所有 windows 服务器放在一个叫 “windows server” 的主机组中。
监控项 item
你想要监控、获取主机或主机组的哪些数据。例如我想监控所有机器的 CPU 使用情况则需要建一个监控项用于获取所有服务器的 CPU 使用率。
触发器 trigger
由逻辑表达式组成的按照预先设置好的阀值来评估由监控项采集到的数据。触发器有两种状态分别为 “ 问题 ” 和 “ 已解决 ” 。例如在上述通过监控项获取了 CPU 的使用率假如我想超过 CPU 使用超过 80% 的就预警则可以创建一个触发器当监控项获取的值超过 80% 时就按照预设的情况报警状态为 “ 问题 ” 低于 80% 时认为报警解除状态恢复为 “ 已解决 ” 。
事件 event
单次发生的需要注意的事情例如上述触发器状态由问题变成了正常或者由正常变成了问题均可以称为一个事件。事件包括触发器事件、自动发现事件、自动注册事件和内部事件 4 个部分。
动作 action
一个对事件做出反应的预定义的操作例如 CPU 使用超过 80% 时触发器状态变成了问题即产生了一个事件我们可以针对此事件预设一个动作比如执行命令 reboot 则系统会自动针对此事件的预设动作执行命令 reboot 。
媒介 media
发送告警通知的手段或途径。例如当 CPU 超过 80% 报警后通过媒介邮件、短信、自定义脚本、微信等形式告知。
模板 template
一组可以被应用到一个或多个主机上的实体监控项触发器图形聚合图形应用 web 场景等的集合。简单的说即多个监控项的集合。
应用集 application
一组监控项组成的逻辑分组。例如 CPU 的监控项归集至 cpu 在想查看有关 cpu 方面的信息时可以直接在界面上提供的搜索框内查询所有有关 cpu 的信息。
zabbix server
zabbix 系统实现监控的核心程序主要功能是与被监控主机、代理机等进行交互、触发器计算、发送告警通知、收集数据并存储等。
zabbix agent
一个部署在监控对象上的能够主动监控本地资源和应用的程序一般来讲我们需要在所有被监控服务器上安装此程序。
zabbix proxy
一个帮助 zabbix server 收集数据分担 zabbix server 的负载压力的程序另外还可以用在 server 与 agent 机器网络不通使用 proxy 作为网络代理实现两者的通信功能。
1.5 系统架构
系统结构说明由 web 、 linux 、 php 、 mysql 等组件部署安装实现 zabbix server 服务端由被监控对象例如Windows 系统 linux 系统、 Vmware 虚拟化平台、交换机存储等组成了 agent 端。Zabbix server 可采用主动模式获取 agent 上数据也可采用被动模式接收 agent 定时发送的数据。 2 指标
2.1 软件版本
版本选择说明目前 zabbix 3 版本成熟稳定各大企业公司运维监控系统运行于该平台上提供的监控项比 zabbix 第 1 和 2 版本丰富完全能满足监控对象的需要至今 zabbix 第 3 版已持续发布 4 年多时间开源系统积累了大量的资料与研究人员可供交流学习能很好服务于 zabbix 定制化zabbix 4.0 版本 2018 年 10 月正式发布 4.2 版本于 2019 年 4 月正式发布目前最新的是 zabbix 5.2 版本版本持续更新满足未来升级发展的需要新版本增加了 ELK 、时序数据库以及前端 web 优化但监控本质并未发生大的变化。
2.1 硬件指标
Zabbix 可以运行于虚拟环境也可以部署在服务器上因 zabbix 采集数据主要是文本对网络带宽要求不高千兆速率足矣只要满足性能上的要求即可主要为 CPU 、内存和硬盘三项。结合 zabbix 官网给出的指标、实际监控项数量、历史记录保存时间长度。根据上表的参考标准测试环境建议小型化部署。
名称CPU/内存数据库可监控主机数量小型4核心/16GMySQL 500GB普通硬盘500台以内中型4核心/32GMySQL 500GB普通硬盘500-1000台大型8核心/64GMySQL 1TB RAID存储盘1000-3000台超大型16核心/128GMySQL 2TB RAID存储盘3000台以上 3 安装部署
Zabbix 安装方式主要是两种1 、 yum 源安装 2 、 zabbix 源码安装安装方法互联网上搜索非常多这里就不再阐述。主要安装组件PHP 、 Apache 或 Nginx 、 Mysql 、 Zabbix 软件包。 4 windows 系统状态监控
本节介绍实现对 windows 系统状态监控。使用zabbix 3.4版本一起了解学习zabbix监控数据采集过程这样对我们自定义监控项非常有帮助提供方法扩展思路 。诚然zabbix 5.0 版本等高版本许多监控项已经被zabbix agent集成但那并不利于初学者学习与实践。
通过在被监控主机上部署安装 zabbix_agent 实现事件查看器监控、 CPU 监控、内存监控、磁盘读写监控、磁盘容量监控、网卡流量监控、系统时间监控、系统进程和服务监控。
考虑到公司使用的服务器目前多数为 windows server 对于个别服务器安装了PC 操作系统不深入研究经测试 Windows 版本支持情况如下表
版本是否支持备注Windows server 2003是需要运行32位程序Windows server 2008是Windows server 2012是Windows 7是Windows 10否测试zabbix-agent程序有报错
4.1 windows 部署 zabbix_agent
为了监控 window 系统首先需要在该系统下部署 zabbix_agent 代理用于收集该系统信息。
自研程序包列表
角色安装包说明适用版本基于zabbix-agent-3.4.6Zabbix目录bin conf scriptWindows server 2003、2008、2012
4.1.1 解压安装
Zabbix agent 的原始文件为 zabbix_agents_3.4.6.win.zip 一般部署是解压在 window 服务器 C 盘根目录下再改写 conf 下的配置文件。为了部署方便快捷现提供已经配置成熟的 zabbix 目录直接复制 zabbix 目录到 window 服务器的 C 盘根目录下最后进行程序安装和启动。因此涉及 C:zabbixscriptconfzabbix_agentd.win.conf 文件的均可以忽略供学习与交流。
cmd 或 powershell 下安装和启停命令如下 cd C:zabbixbinwin64 .zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -i 安装 .zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -s 启动 .zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -x 停止
4.1.2 添加端口
Windows 防火墙需要添加端口的出站和入站规则将 TCP 协议 10050 、 10051 端口开放。不然 zabbix 主动或被动模式就获取不到该设备的数据。10050 10051 是 zabbix 程序使用端口。
4.1.3 配置自启动
Zabbix agent 安装过程中会自动将 zabbix agent 服务、开机自启动配置好只需要检查下 agent 是否正常运行即可。
4.2 windows 事件查看器监控
对 windows 系统下 事件查看器中系统日志进行监控和信息获取将事件查看器中的错误 Error 、关键 Critical 等系统、程序重要信息打印在 zabbix 界面中也可以添加监控项触发器来针对某个信息实现告警。例如当事件查看器中有磁盘坏块告警信息时 zabbix 界面会进行告警提示。或是配合研发部门程序日志程序可将告警信息写入到事件查看器中zabbix 对其进行监控告警。
4.2.1 zabbix 官网指导说明
https://www.zabbix.com/documentation/3.4/manual/config/items/itemtypes/zabbix_agent/win_keys
截图如下 4.2.2 创建监控项 类型必须是 zabbix 客户端主动式 键值参考 zabbix 官方文档例子
eventlog[System,,Critical|Error] 将事件查看器中 “ 系统 ” 栏中 “Critical|Error” 类型的信息过滤出来
eventlog[System,,Error,.Disk.] 事件查看器中 “ 系统 ” 栏中 “Critical|Error” 类型的信息过滤并使用正则表达式匹配详细信息中的来源Disk 的关键字
eventlog[Security,,Success Audit,,^4624$,,skip].nodata(60)}0 and
eventlog[Security,,Success Audit,,^4624$,,skip].regexp(administrator,1)}0
如果在 60 秒内有监控到数据并且监控内容不包含字符串 administrator 则触发告警如果 60 秒内没有新的数据了则触发器恢复 OK 。简单点说就是用户登录后触发器触发至少会持续 60 秒如果用户不断的登录成功间隔小于 60 秒则触发器一直是 problem 状态。
应用集Event 事件日志
4.2.3 创建触发器 名称{HOST.NAME} 代表主机名
表达式添加 “ 最新一条日志级别不等于 N” N 取值是 0 、 1 或其他 0 表示正常 1 和其他值表示不正常。所以 N 取值不等于 0 触发告警。
4.2.4 事件查看器注意事项 系统System 安全Security
级别错误 Error 、关键 Critical 、信息 Information 等参考 zabbix 官网指导说明
来源一定要看详细信息中的 Provider Name 次截图上详细信息与常规来源不一致一个是 Microsoft-Windows-TerminalServices-Printers 一个是 TerminalServices-Printers 。容易导致正则匹配出错建议使用含有匹配的方式。
4.2.5 监控结果 4.3 windows 系统 CPU 监控
4.3.1 监控 CPU 使用率
因为 zabbix 未提供能查看 cpu 使用率的监控项只提供了 cpu 负载的监控项就需新增建监控项监控 CPU 用户使用率与其类似不再说明。zabbix 3.4版本
4.3.2 创建监控项
名称CPU 使用率
键值为了规范命名 cpu_time
信息类型浮点数
更新时间1m
单位%
应用集CPU 状态
4.3.3 创建触发器 名称CPU 使用率过高{HOST.NAME}
表达式{Windows Server Model:cpu_time.avg(5m)}90 5 分钟均值大于 90% 告警
4.3.4 配置图形 注根据需要调整绘图风格
4.3.5 配置 zabbix_agentd.win.conf
最后行添加
# CPU 使用率 PerfCountercpu_time,Processor(_Total)% Processor Time,60 # CPU 用户使用率 PerfCountercpu_usertime,Processor(_Total)% User Time,60
注cpu_time 为 zabbix 界面上监控项配置的键值虽然可以自定义但要规范命名。 60 为数据更新时间单位秒要小于等于 zabbix 界面上监控项配置 “ 更新时间 ” 这样才有更新的意义。
配置完成后重启 zabbix_agentd 生效
cd C:zabbixbinwin64 .zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -x .zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -s
4.3.6 监控结果 4.4 windows 系统内存监控
应用集Memory 内存状态
Memory 内存状态主要监控项有Memory 内存使用率、 Memory 内存使用量、 Memory 内存总量带上 Memory 方便了排序归类。Swap 交换分区使用率、 Swap 交换分区使用量、 Swap 交换分区总量。
zabbix 自带内存监控项可以直接创建使用。
监控项配置 说明windows 系统下没有支持 system.swap.size[pused] swap 使用率监控项一般 swap 分区被使用了就可以说明物理内存不足可以使用 pfree 替代。
4.4.1 创建监控项
以监控内存使用率为例 名称内存使用率
键值vm.memory.size[pused]
其他键值vm.memory.size[used] vm.memory.size[total]
信息类型浮点数
更新时间1m
单位%
应用集Memory 内存状态
4.4.2 创建触发器 名称内存使用率过高{HOST.NAME}
表达式{Windows Server Model:vm.memory.size[pused].avg(5m)}90 5 分钟均值大于 90% 告警
4.4.3 配置图形 4.4.5 监控结果 4.5 windows 磁盘读写监控
Windows 下磁盘监控可以细分到监控各个磁盘数据如 C 、 D 、 E 等目前未想到到自发现规则配置就对所有磁盘进行监控取总体值以总体值为例进行监控配置。
细分
LogicalDisk(E:)Disk Write Bytes/sec
LogicalDisk(C:)Disk Write Bytes/sec
LogicalDisk(D:)Disk Write Bytes/sec
LogicalDisk(_Total)Disk Write Bytes/sec
总体
PhysicalDisk(_Total)Disk Read Bytes/sec
4.5.1 创建监控项
磁盘读写监控项较多配置监控项如下图 键值
disk_read_speed 、 disk_write_speed 、 disk_free_percent 、 disk_rw_percent 、 disk_rw_percent 等。
C:zabbixscriptconfzabbix_agentd.win.conf 文件配置为
# Disk 磁盘读速率 Bytes/s PerfCounterdisk_read_speed,PhysicalDisk(_Total)Disk Read Bytes/sec,60
# Disk 磁盘写速率 Bytes/s PerfCounterdisk_write_speed,PhysicalDisk(_Total)Disk Write Bytes/sec,60
# Disk 磁盘空闲状态百分比 PerfCounterdisk_free_percent,PhysicalDisk(_Total)% Idle Time,60
# Disk 磁盘读和写总共用时百分比 PerfCounterdisk_rw_percent,PhysicalDisk(_Total)% Disk Time,60
# Disk 磁盘读用时百分比 PerfCounterdisk_read_percent,PhysicalDisk(_Total)% Disk Read Time,60
# Disk 磁盘写用时百分比 PerfCounterdisk_write_percent,PhysicalDisk(_Total)% Disk Write Time,60
# Disk 磁盘平均读写队列长度 PerfCounterdisk_queue_length,PhysicalDisk(_Total)Avg. Disk Queue Length,60
# Disk 磁盘平均读队列长度 PerfCounterdisk_read_queue_length,PhysicalDisk(_Total)Avg. Disk Read Queue Length,60
# Disk 磁盘平均读队列长度 PerfCounterdisk_write_queue_length,PhysicalDisk(_Total)Avg. Disk Write Queue Length,60
4.5.2 配置图形 Disk 磁盘读写用时百分比选择
Windows 系统监控 模板 : Disk 磁盘读用时百分比
Windows 系统监控 模板 : Disk 磁盘写用时百分比
Windows 系统监控 模板 : Disk 磁盘读和写总共用时百分比
调整线条以及颜色
4.5.3 监控结果 4.6 windows 磁盘容量监控
Zabbix 自带监控模板在自动发现规则 Mounted filesystem discovery 已经配置。可用来来监控 CDEF 等分区容量。可以改成中文易读。如下图 4.7 windows 网卡流量监控
Zabbix 自带监控模板在自动发现规则 Network interface discovery 已经配置。
需要过滤掉不需要监控的端口只显示真实的网卡流量在 zabbix 界面管理 - 一般 - 正则表达式中找到 Network interfaces for discovery 项添加过滤规则。例如 4.8 windows 系统时间监控
需要创建两个监控项一个是绝对时间用于触发器告警另一个是易读时间显示。通过获取到被监控系统时间与 zabbix server 做时差比较超过 10 分钟告警。
4.8.1 创建监控项 键值system.localtime[local] 易读时间
键值system.localtime[] 绝对时间
4.8.2 创建触发器 名称与 zabbix 主机时差超过 10 分钟{HOST.NAME}
表达式{Windows Server Model:system.localtime[].fuzzytime(600)}0
4.9 windows 系统进程监控
Windows 的进程或程序监控是通过监控进程数量以此为状态标志位来判断进程是否已停止运行。
当最新进程数为 0 时判断进程已停止运行当 5 分钟内平均值大于等于 1 时恢复触发器判断进程已恢复运行当最新进程数不为 0 时判断进程正在运行。
下面以监控 Xshell.exe 程序运行进程为例来创建实施监控。
4.9.1 创建监控项 键值proc.num[Xshell.exe]
Zabbix 官网样例 proc.num[,,,,]
信息类型数字无正负 方便看图形标志位
更新间隔1m 1 分钟同一规定
注windows 下 只支持进程名和用户名称
4.9.2 创建触发器 名称Xshell 程序已停止运行{HOST.NAME}
问题表现形式{Windows Server Model:proc.num[Xshell.exe].last()}0
恢复表达式{Windows Server Model:proc.num[Xshell.exe].avg(5m)}1 or {Windows Server Model:proc.num[Xshell.exe].avg(5m)}1
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/89809.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!