【prometheus+Grafana篇】基于Prometheus+Grafana实现windows操作系统的监控与可视化

💫《博主主页》:

           🔎 CSDN主页

           🔎 IF Club社区主页

🔥《擅长领域》:擅长阿里云AnalyticDB for MySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控;并对SQLserver、NoSQL(MongoDB)有了解

💖如果觉得文章对你有所帮助,欢迎点赞收藏加关注💖

    今天这篇文章继续给大家分享一下通过 Prometheus 来抓取 windows 系统的监控数据,并利用 Grafana 可视化平台进行展示。同时,还将配置一些常见的 windows 系统告警项 ,进行实时监控和及时预警,帮助大家第一时间发现Linux潜在问题。

          

特别说明💥:

📌 开源仪表盘引用

  • 本文采用的windows监控仪表盘直接使用了Grafana官网开源项目(Dashboard ID: 20763),非常感谢原作者的无私分享。关于Grafana的所有配置步骤均基于该开源仪表盘并验证通过,各位可一键导入快速搭建专业级的可视化监控。

                  

⚡ 原创告警规则实现

  • 关于告警部分为博主独立开发完成,针对windows系统实现了如下告警:

    •  目录使用过高警报

    •  CPU使用率过高告警

    •  服务器内存使用过高警报

    •  服务器下载带宽使用过高警报

    • ✅ 服务器上传带宽使用过高警报

                            

                        

prometheus+Grafana全系列文章(实时更新 🔥 ):

【prometheus+Grafana篇】Prometheus与Grafana:深入了解监控架构与数据可视化分析平台-CSDN博客

【prometheus+Grafana篇】从零开始:Linux 7.6 上二进制安装 Prometheus、Grafana 和 Node Exporter_grafana二进制部署-CSDN博客

【prometheus+Grafana篇】Prometheus告警规则参数全解析 + Alertmanager实现多平台告警(含电子邮件/企业微信群/飞书群/钉钉群接受方式)_告警消息对接企业微信、飞书、钉钉 步骤-CSDN博客

【prometheus+Grafana篇】基于Prometheus+Grafana实现Linux操作系统的监控与可视化-CSDN博客

【prometheus+Grafana篇】基于Prometheus+Grafana实现windows操作系统的监控与可视化-CSDN博客


                 

目录

一、安装windows_exporter(windows_exporter:用于收集操作系统和硬件信息的metrics。windows_exporter插件是GitHub开源组织提供的,通过GitHub官网下载windows_exporter)

1)下载windows_exporter安装包,选择download,然后点击“Exporters and integrations”,选择windows exporter

2)跳转到了gitHub,点击windows_exporter的版本集,选择最新的windows_exporter下载

3)选择v0.30.0版本下载

4)直接运行.msi文件windows_exporter包

5)查看Windows启动服务项

6)登录windows_exporter界面管理,默认端口为9182

二、将当前主机加入到prometheus监控,并通过Grafana展示

1)将windows_exporter的信息加入到prometheus监控的配置文件prometheus.yml中

2)配置告警规则文件

3)检查配置文件

4)prometheus.yml文件添加了信息,所以重启prometheus进程或者重新加载配置文件(二选一)

5)在prometheus查看是否可以看到监控信息

6)登录Grafana界面管理,将当前主机的监控信息做展示

一、下载一个仪表盘:Grafana官网“http://www.grafana.com”—Dashboard templates,然后选择一个下载量高的自己喜欢的windows_exporter(windows主机监控)

二、将仪表盘添加到Grafana上:Dashboards—New—Import—点击“Upload dashboard JSON file”

三、仪表盘展示:Dashboards—查看到已经定义好的仪表盘,并且数据源是prometheus监控,点击进去


                       

监控windows信息如下:

主机名

IP地址

配置

系统

描述

Windows

110.120.100.50

4C 8G

Windows server 2012

安装windows_exporter对这台服务器进行监控

windows_exporter:默认端口9182。用于收集操作系统和硬件信息的metrics

        

一、安装windows_exporter(windows_exporter:用于收集操作系统和硬件信息的metrics。windows_exporter插件是GitHub开源组织提供的,通过GitHub官网下载windows_exporter)

1)下载windows_exporter安装包,选择download,然后点击“Exporters and integrations”,选择windows exporter

           

2)跳转到了gitHub,点击windows_exporter的版本集,选择最新的windows_exporter下载

PS:也可以直接在gitHub官网下载

一、通过gitHub(官网地址:https://github.com/)下载windows_exporter安装包,在gitHub搜索“windows_exporter”。

     

二、点击windows_exporter的版本集,选择最新的windows_exporter下载

         

3)选择v0.30.0版本下载

架构:

amd64:也称为 x86-64 或 x64,这是一种64位的处理器架构,由 AMD 公司推出。它是基于 x86 架构的64位扩展,现在广泛用于桌面和服务器系统。

arm64:这是 ARMv8-A 的64位处理器架构,主要应用于 ARM 架构的64位处理器,包括用于服务器、移动设备和嵌入式系统的处理器。

           

文件格式:

.exe:可执行文件。

.msi:Microsoft Installer Package。

          

4)直接运行.msi文件windows_exporter包

windows_exporter-0.30.0-amd64.msi

   

        

5)查看Windows启动服务项

    安装好windows_exporter包后会自动在服务列表中添加一个windows_exporter,那么就可以通过在服务列表里面对windows_exporter进行启动或者关闭

                   

6)登录windows_exporter界面管理,默认端口为9182

http://110.120.100.50:9182/metrics

              

二、将当前主机加入到prometheus监控,并通过Grafana展示

注意:如下操作是在安装了prometheus和Grafana的主机上进行操作,安装直通车👉【prometheus+Grafana篇】从零开始:Linux 7.6 上二进制安装 Prometheus、Grafana 和 Node Exporter_grafana二进制部署-CSDN博客👈

             

1)将windows_exporter的信息加入到prometheus监控的配置文件prometheus.yml中

[root@prometheus ~]# vi /opt/prometheus/prometheus.yml  
在scrape_configs下面新增如下内容:# windows_exporter配置            ###job_name 用来唯一标识一个监控任务。在同一个 prometheus.yml 文件中,不同的 scrape_config可以有不同的job_name,以便 Prometheus 能够区分和管理不同的监控目标和配置,用来将不同的监控目标分组。单位为监控Windows设置一个独立的job_name- job_name: "windows_exporter"scrape_interval: 15s            ###指定这个job_name每隔多久从每个目标(如 Exporter、应用端点)拉取一次指标数据。优先级:会覆盖全局的 global:scrape_interval(如果存在)。file_sd_configs:- files:- /opt/prometheus/conf.d/windows_targets.json     #### Windows需要监控的机器都单独写在了windows_targets.json文件中,是为了避免prometheus.yml内容过多,看起来更简洁[root@prometheus ~]# vi /data/prometheus/conf.d/windows_targets.json     ###写成linux或者MySQL通用的targets、labels的话,Prometheus可以获取到数据,但grafna获取不到数据。如下是deepseek推荐的写法,因为使用的20763 json模版没有告诉怎么定义格式
[{"targets": [ "110.120.100.50:9182" ],"labels": { "instance": "110.120.100.50:9182","hostname": "Windows服务器(IP:110.120.100.50)","ip": "110.120.100.50"}}
]

               

2)配置告警规则文件

    除了如下告警规则之外,还需要单独配置一个Targets目标不可达(up)的相关规则,因为up 是一个布尔值指标,表示 Prometheus 是否能够成功地 scrape(抓取)到指定的目标(targets)数据,用于判断目标node-exporter相关进程是否在目标主机存活。关于up的规则文件参考:【prometheus+Grafana篇】从零开始:Linux 7.6 上二进制安装 Prometheus、Grafana 和 Node Exporter_grafana二进制部署-CSDN博客

[root@prometheus ~]# cd /opt/prometheus/rules/    ###在prometheus.yml文件中定义了告警规则文件rule_files参数
[root@prometheus rules]# vi windows_alerts.ymlgroups:- name: windows_alertsrules:# 磁盘相关告警- alert: HighDiskUsageexpr: 100 - (windows_logical_disk_free_bytes / windows_logical_disk_size_bytes) * 100 > 90for: 3slabels:severity: criticalannotations:summary: "目录使用过高警报"description: "当前实例 {{ $labels.hostname }} 的 {{ $labels.volume }} 盘使用率已达到 {{ $value | printf \"%.2f\" }}%,超过90%。请检查磁盘目录使用情况!"# CPU相关告警- alert: HighCPUUsageexpr: 100 - (avg by (hostname) (irate(windows_cpu_time_total{mode="idle"}[3m])) * 100) > 90for: 3mlabels:severity: criticalannotations:summary: "CPU使用率过高告警"description: "实例 {{ $labels.hostname }} 的CPU使用率(基于3分钟内最后两个数据点计算的瞬时增长率)已持续3分钟超过90%,当前值为 {{ $value | printf \"%.2f\" }}%。请检查服务器CPU使用情况!"# 内存相关告警- alert: HighMemoryUsageexpr: 100 - ((windows_os_physical_memory_free_bytes / windows_cs_physical_memory_bytes) * 100) > 90for: 3slabels:severity: criticalannotations:summary: "服务器内存使用过高警报"description: "当前实例 {{ $labels.hostname }} 的服务器内存使用率已达到 {{ $value | printf \"%.2f\" }}%,超过90%。请检查服务器内存使用情况!"- alert: HighNetworkReceiveUsageexpr: rate(windows_net_bytes_received_total[10m]) * 8 / 1000000 > 500   # 500 Mbpsfor: 10mlabels:severity: criticalannotations:summary: "服务器下载带宽使用过高警报"description: "当前实例 {{ $labels.hostname }} 的 {{ $labels.nic }} 网卡(基于10分钟内所有数据点计算的平均增长率)每秒平均下载带宽已持续10分钟超过500 Mbps(62.5 MB/s),当前每秒平均下载带宽为 {{ $value | printf \"%.2f\" }} Mbps。请检查网络流量和带宽使用情况!"- alert: HighNetworkTransmitUsageexpr: rate(windows_net_bytes_sent_total[10m]) * 8 / 1000000 > 500   # 500 Mbpsfor: 10mlabels:severity: criticalannotations:summary: "服务器上传带宽使用过高警报"description: "当前实例 {{ $labels.hostname }} 的 {{ $labels.nic }} 网卡(基于10分钟内所有数据点计算的平均增长率)每秒平均上传带宽已持续10分钟超过500 Mbps(62.5 MB/s),当前每秒平均上传带宽 {{ $value | printf \"%.2f\" }} Mbps。请检查网络流量和带宽使用情况!"

        

3)检查配置文件

[root@prometheus ~]# cd /opt/prometheus/
[root@prometheus ~]# ./promtool check config prometheus.yml      ###用于检查 Prometheus 配置文件(prometheus.yml)的语法和格式是否正确。

执行这条命令会执行以下操作:

  1. 验证配置文件的语法:检查 prometheus.yml 文件是否符合 Prometheus 配置格式规范。
  2. 检测潜在的错误或警告:如果配置文件中存在拼写错误、格式问题、无效的配置项等问题,它会提供相关的错误信息或警告。比如告警规则写的不对,就会有提示
  3. 输出有用的诊断信息:如果配置文件存在问题,promtool 会输出详细的错误信息。

        

4)prometheus.yml文件添加了信息,所以重启prometheus进程或者重新加载配置文件(二选一)

#重载:前提是在prometheus.service启动服务项中加了--web.enable-lifecycle参数:--web.enable-lifecycle:###启用Prometheus的生命周期接口,允许通过HTTP请求来动态重新加载配置等操作。这对于在运行时更新配置或执行其他管理操作非常有用,当修改了prometheus的配置后,可以通过curl命令来重新加载配置文件,而不需要重启prometheus(推荐方式)

[root@prometheus ~]# curl -X POST http://localhost:9090/-/reload

          

#重启

[root@prometheus ~]# systemctl restart prometheus.service

              

5)在prometheus查看是否可以看到监控信息

网址:http://110.120.100.21:9090

菜单栏:Status—Targets

            

6)登录Grafana界面管理,将当前主机的监控信息做展示

地址:http://110.120.100.21:3000

默认用户:admin

默认密码:admin

           

一、下载一个仪表盘:Grafana官网“http://www.grafana.com”—Dashboard templates,然后选择一个下载量高的自己喜欢的windows_exporter(windows主机监控)

注意:不需要再增加数据源了。因为在第一次搭建prometheus+Grafana的时候就已经加好了,在添加数据源时,有个配置项是Connection,这里添加的是prometheus的地址,指的是prometheus监控服务器的地址,而不是windows_exporter的地址

      

以20763为例(Windows Exporter Dashboard 2024),新增了多个指标,比较全面

               

二、将仪表盘添加到Grafana上:Dashboards—New—Import—点击“Upload dashboard JSON file”

Name:定义名称,最好定义为主机ip加用途

Prometheus:选择prometheus源,Prometheus监控源(ip:110.120.100.21:9090)

....

然后import

        

三、仪表盘展示:Dashboards—查看到已经定义好的仪表盘,并且数据源是prometheus监控,点击进去

仪表盘Name:linux服务器监控

数据源Name:prometheus监控,Prometheus监控源(ip:110.120.100.21:9090)

Datasource:选择在添加数据源时,已经定义好的“Prometheus监控源(ip:110.120.100.21:9090)”

Job:这里其实就是当时已经在配置prometheus.yml时,定义的job_name,也就是说Grafana会自动识别到

Host:这里其实就是当时已经在配置prometheus.yml时,定义的instance,也就是说Grafana会自动识别到


    关于基于Prometheus+Grafana的windows系统监控与可视化的内容到这里就结束了,完结,撒花

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/905278.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

推荐一个感觉非常好的文章,是知识图谱的

为了省浏览的事儿,以后打算写文章都短一些,这样不用被强制登录、关注了 正文 链接是 https://blog.csdn.net/Appleyk/article/details/80422055 放个截图 推荐理由 两个,第一内容确实硬核。第二算是缘分吧,我之前公司好像&am…

《企业级前端部署方案:Jenkins+MinIO+SSH+Gitee+Jenkinsfile自动化实践》

文章目录 前言前端项目CICD时序图一、环境准备1、服务器相关2、Jenkins凭据3、注意事项 二、设计思想1. 模块化设计2.多环境支持3. 制品管理4. 安全部署机制5. 回滚机制 三、CI阶段1、构建节点选择2、代码拉取3、代码编译4、打包并上传至minio 四、CD阶段五、回滚阶段六、构建通…

Go语言超时控制方案全解析:基于goroutine的优雅实现

一、引言 在构建高可靠的后端服务时,超时控制就像是守护系统稳定性的"安全阀",它确保当某些操作无法在预期时间内完成时,系统能够及时止损并释放资源。想象一下,如果没有超时控制,一个简单的数据库查询卡住…

WTK6900C-48L:离线语音芯片重构玩具DNA,从“按键操控”到“声控陪伴”的交互跃迁

一:开发背景 随着消费升级和AI技术进步,传统玩具的机械式互动已难以满足市场需求。语音控制芯片的引入使玩具实现了从被动玩耍到智能交互的跨越式发展。通过集成高性价比的语音识别芯片,现代智能玩具不仅能精准响应儿童指令,还能实…

WebSocket的原理及QT示例

一.WebSocket 介绍 1.概述 WebSocket 是一种在单个 TCP 连接上进行全双工通讯的协议,它在 2011 年被 IETF 定为标准 RFC 6455,并由 RFC7936 补充规范。与传统的 HTTP 协议不同,WebSocket 允许服务器和客户端之间进行实时、双向的数据传输&a…

设置GO程序在离线情况下读取本地缓存的模块

在 Go 中,GOPROXY 环境变量用于指定模块代理服务器的地址。如果你想让 GOPROXY 读取本地的模块,可以通过以下几种方式实现: 1. 使用本地代理服务器 你可以搭建一个本地的 Go 模块代理服务器,将需要的模块代码推送到代理服务器中…

live555开发笔记(三):live555创建RTSP服务器源码剖析,创建h264文件rtsp服务器源码深度剖析

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/147879917 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…

STM32-模电

目录 一、MOS管 二、二极管 三、IGBT 四、运算放大器 五、推挽、开漏、上拉电阻 一、MOS管 1. MOS简介 这里以nmos管为例,注意箭头方向。G门极/栅极,D漏极,S源极。 当给G通高电平时,灯泡点亮,给G通低电平时&a…

基于定制开发开源AI智能名片S2B2C商城小程序的公私域流量融合运营策略研究

摘要:本文以定制开发开源AI智能名片S2B2C商城小程序为技术载体,系统探讨公域流量向私域流量沉淀的数字化路径。研究通过分析平台流量(公域流量)与私域流量的共生关系,提出"公域引流-私域沉淀-数据反哺"的闭环…

mysql中索引的使用

前言 最近一直在学习mysql以及忙学校课程的事情。已经好久没写过博客了,今天跟大家分享一下在mysql中关于索引的知识,希望可以帮助到大家。 索引的定义 mysql中的索引是一种数据结构,它可以帮助数据库高效地查询,更新数据表中的…

深度拆解!MES如何重构生产计划与排产调度全流程?

☂引言 在制造业数字化转型浪潮中,生产计划与排产调度的精准性直接决定企业竞争力。深蓝易网MES系统通过智能化调度与全流程管控,帮助企业破解排产难题,实现资源高效协同与生产透明化管理,为制造企业打造柔性化、敏捷化的生产体系…

【深度学习】计算机视觉(18)——从应用到设计

文章目录 1 不同的注意力机制1.1 自注意力1.2 多头注意力1.3 交叉注意力1.3.1 基础1.3.2 进阶 1 不同的注意力机制 在学习的过程中,发现有很多计算注意力的方法,例如行/列注意力、交叉注意力等,如果对注意力机制本身不是特别实现&#xff0c…

洛谷 P1955 [NOI2015] 程序自动分析

【题目链接】 洛谷 P1955 [NOI2015] 程序自动分析 【题目考点】 1. 并查集 2. 离散化 【解题思路】 多组数据问题,对于每组数据,有多个 x i x j x_ix_j xi​xj​或 x i ≠ x j x_i \neq x_j xi​xj​的约束条件。 所有相等的变量构成一个集合&…

[Java] 输入输出方法+猜数字游戏

目录 1. 输入输出方法 1.1 输入方法 1.2 输出方法 2. 猜数字游戏 1. 输入输出方法 Java中输入和输出是属于Scanner类里面的方法,如果要使用这两种方法需要引用Scanner类。 import java.util.Scanner; java.util 是Java里面的一个包,里面包含一些工…

zst-2001 上午题-历年真题 UML(13个内容)

UML基础 UML - 第1题 ad UML - 第2题 依赖是暂时使用对象,关联是长期连接 依赖:依夜情 关联:天长地久 组合:组一辈子乐队 聚合:好聚好散 bd UML - 第3题 adc UML - 第4题 bad UML - 第5题 d UML…

WebFlux vs WebMVC vs Servlet 对比

WebFlux vs WebMVC vs Servlet 技术对比 WebFlux、WebMVC 和 Servlet 是 Java Web 开发中三种不同的技术架构,它们在编程模型、并发模型和适用场景上有显著区别。以下是它们的核心对比: 核心区别总览 特性ServletSpring WebMVCSpring WebFlux编程模型…

htmlUnit和Selenium的区别以及使用BrowserMobProxy捕获网络请求

1. Selenium:浏览器自动化之王 核心定位: 跨平台、跨语言的浏览器操控框架,通过驱动真实浏览器实现像素级用户行为模拟。 技术架构: 核心特性: 支持所有主流浏览器(含移动端模拟) 精…

SSRF相关

SSRF(Server Side Request Forgery,服务器端请求伪造),攻击者以服务器的身份发送一条构造好的请求给服务器所在地内网进行探测或攻击。 产生原理: 服务器端提供了能从其他服务器应用获取数据的功能,如从指定url获取网页内容、加载指定地址的图…

SaaS备份的必要性:厂商之外的数据保护策略

在当今数字化时代,企业对SaaS(软件即服务)应用的依赖程度不断攀升。SaaS应用为企业提供了便捷的生产力工具,然而,这也使得数据安全面临诸多挑战,如意外删除、勒索软件攻击以及供应商故障等。因此&#xff0…

【Python 基础语法】

Python 基础语法是编程的基石,以下从核心要素到实用技巧进行系统梳理: 一、代码结构规范 缩进规则 使用4个空格缩进(PEP 8标准)缩进定义代码块(如函数、循环、条件语句) def greet(name):if name: # 正确缩…