【prometheus+Grafana篇】基于Prometheus+Grafana实现windows操作系统的监控与可视化

💫《博主主页》：

🔎 CSDN主页

🔎 IF Club社区主页

🔥《擅长领域》：擅长阿里云AnalyticDB for MySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控；并对SQLserver、NoSQL(MongoDB)有了解

💖如果觉得文章对你有所帮助，欢迎点赞收藏加关注💖

今天这篇文章继续给大家分享一下通过 Prometheus 来抓取 windows 系统的监控数据，并利用 Grafana 可视化平台进行展示。同时，还将配置一些常见的 windows 系统告警项，进行实时监控和及时预警，帮助大家第一时间发现Linux潜在问题。

特别说明💥：

📌 开源仪表盘引用

本文采用的windows监控仪表盘直接使用了Grafana官网开源项目（Dashboard ID: 20763），非常感谢原作者的无私分享。关于Grafana的所有配置步骤均基于该开源仪表盘并验证通过，各位可一键导入快速搭建专业级的可视化监控。



⚡ 原创告警规则实现

关于告警部分为博主独立开发完成，针对windows系统实现了如下告警：

✅ 目录使用过高警报

✅ CPU使用率过高告警

✅ 服务器内存使用过高警报

✅ 服务器下载带宽使用过高警报

✅ 服务器上传带宽使用过高警报





prometheus+Grafana全系列文章（实时更新 🔥 ）：

【prometheus+Grafana篇】Prometheus与Grafana：深入了解监控架构与数据可视化分析平台-CSDN博客

【prometheus+Grafana篇】从零开始：Linux 7.6 上二进制安装 Prometheus、Grafana 和 Node Exporter_grafana二进制部署-CSDN博客

【prometheus+Grafana篇】Prometheus告警规则参数全解析 + Alertmanager实现多平台告警(含电子邮件/企业微信群/飞书群/钉钉群接受方式)_告警消息对接企业微信、飞书、钉钉步骤-CSDN博客

【prometheus+Grafana篇】基于Prometheus+Grafana实现Linux操作系统的监控与可视化-CSDN博客

【prometheus+Grafana篇】基于Prometheus+Grafana实现windows操作系统的监控与可视化-CSDN博客

一、安装windows_exporter（windows_exporter：用于收集操作系统和硬件信息的metrics。windows_exporter插件是GitHub开源组织提供的，通过GitHub官网下载windows_exporter）

1）下载windows_exporter安装包，选择download，然后点击“Exporters and integrations”，选择windows exporter

2）跳转到了gitHub，点击windows_exporter的版本集，选择最新的windows_exporter下载

3）选择v0.30.0版本下载

4）直接运行.msi文件windows_exporter包

5）查看Windows启动服务项

6）登录windows_exporter界面管理，默认端口为9182

二、将当前主机加入到prometheus监控，并通过Grafana展示

1）将windows_exporter的信息加入到prometheus监控的配置文件prometheus.yml中

2）配置告警规则文件

3）检查配置文件

4）prometheus.yml文件添加了信息，所以重启prometheus进程或者重新加载配置文件（二选一）

5）在prometheus查看是否可以看到监控信息

6）登录Grafana界面管理，将当前主机的监控信息做展示

一、下载一个仪表盘：Grafana官网“http://www.grafana.com”—Dashboard templates，然后选择一个下载量高的自己喜欢的windows_exporter（windows主机监控）

二、将仪表盘添加到Grafana上：Dashboards—New—Import—点击“Upload dashboard JSON file”

三、仪表盘展示：Dashboards—查看到已经定义好的仪表盘，并且数据源是prometheus监控，点击进去

监控windows信息如下：

主机名	IP地址	配置	系统	描述
Windows	110.120.100.50	4C 8G	Windows server 2012	安装windows_exporter对这台服务器进行监控

windows_exporter：默认端口9182。用于收集操作系统和硬件信息的metrics

一、安装windows_exporter（windows_exporter：用于收集操作系统和硬件信息的metrics。windows_exporter插件是GitHub开源组织提供的，通过GitHub官网下载windows_exporter）

1）下载windows_exporter安装包，选择download，然后点击“Exporters and integrations”，选择windows exporter

2）跳转到了gitHub，点击windows_exporter的版本集，选择最新的windows_exporter下载

PS：也可以直接在gitHub官网下载

一、通过gitHub（官网地址：https://github.com/）下载windows_exporter安装包，在gitHub搜索“windows_exporter”。

二、点击windows_exporter的版本集，选择最新的windows_exporter下载

3）选择v0.30.0版本下载

架构：

amd64：也称为 x86-64 或 x64，这是一种64位的处理器架构，由 AMD 公司推出。它是基于 x86 架构的64位扩展，现在广泛用于桌面和服务器系统。

arm64：这是 ARMv8-A 的64位处理器架构，主要应用于 ARM 架构的64位处理器，包括用于服务器、移动设备和嵌入式系统的处理器。



文件格式：

.exe：可执行文件。

.msi：Microsoft Installer Package。



4）直接运行.msi文件windows_exporter包

windows_exporter-0.30.0-amd64.msi



5）查看Windows启动服务项

安装好windows_exporter包后会自动在服务列表中添加一个windows_exporter，那么就可以通过在服务列表里面对windows_exporter进行启动或者关闭

6）登录windows_exporter界面管理，默认端口为9182

http://110.120.100.50:9182/metrics

二、将当前主机加入到prometheus监控，并通过Grafana展示

注意：如下操作是在安装了prometheus和Grafana的主机上进行操作，安装直通车👉【prometheus+Grafana篇】从零开始：Linux 7.6 上二进制安装 Prometheus、Grafana 和 Node Exporter_grafana二进制部署-CSDN博客👈

1）将windows_exporter的信息加入到prometheus监控的配置文件prometheus.yml中
[root@prometheus ~]# vi /opt/prometheus/prometheus.yml  
在scrape_configs下面新增如下内容：# windows_exporter配置            ###job_name 用来唯一标识一个监控任务。在同一个 prometheus.yml 文件中，不同的 scrape_config可以有不同的job_name，以便 Prometheus 能够区分和管理不同的监控目标和配置，用来将不同的监控目标分组。单位为监控Windows设置一个独立的job_name- job_name: "windows_exporter"scrape_interval: 15s            ###指定这个job_name每隔多久从每个目标（如 Exporter、应用端点）拉取一次指标数据。优先级：会覆盖全局的 global:scrape_interval（如果存在）。file_sd_configs:- files:- /opt/prometheus/conf.d/windows_targets.json     #### Windows需要监控的机器都单独写在了windows_targets.json文件中，是为了避免prometheus.yml内容过多，看起来更简洁[root@prometheus ~]# vi /data/prometheus/conf.d/windows_targets.json     ###写成linux或者MySQL通用的targets、labels的话，Prometheus可以获取到数据，但grafna获取不到数据。如下是deepseek推荐的写法，因为使用的20763 json模版没有告诉怎么定义格式
[{"targets": [ "110.120.100.50:9182" ],"labels": { "instance": "110.120.100.50:9182","hostname": "Windows服务器(IP:110.120.100.50)","ip": "110.120.100.50"}}
]
2）配置告警规则文件

除了如下告警规则之外，还需要单独配置一个Targets目标不可达（up）的相关规则，因为up 是一个布尔值指标，表示 Prometheus 是否能够成功地 scrape（抓取）到指定的目标（targets）数据，用于判断目标node-exporter相关进程是否在目标主机存活。关于up的规则文件参考：【prometheus+Grafana篇】从零开始：Linux 7.6 上二进制安装 Prometheus、Grafana 和 Node Exporter_grafana二进制部署-CSDN博客
[root@prometheus ~]# cd /opt/prometheus/rules/    ###在prometheus.yml文件中定义了告警规则文件rule_files参数
[root@prometheus rules]# vi windows_alerts.ymlgroups:- name: windows_alertsrules:# 磁盘相关告警- alert: HighDiskUsageexpr: 100 - (windows_logical_disk_free_bytes / windows_logical_disk_size_bytes) * 100 > 90for: 3slabels:severity: criticalannotations:summary: "目录使用过高警报"description: "当前实例 {{ $labels.hostname }} 的 {{ $labels.volume }} 盘使用率已达到 {{ $value | printf \"%.2f\" }}%，超过90%。请检查磁盘目录使用情况！"# CPU相关告警- alert: HighCPUUsageexpr: 100 - (avg by (hostname) (irate(windows_cpu_time_total{mode="idle"}[3m])) * 100) > 90for: 3mlabels:severity: criticalannotations:summary: "CPU使用率过高告警"description: "实例 {{ $labels.hostname }} 的CPU使用率（基于3分钟内最后两个数据点计算的瞬时增长率）已持续3分钟超过90%，当前值为 {{ $value | printf \"%.2f\" }}%。请检查服务器CPU使用情况！"# 内存相关告警- alert: HighMemoryUsageexpr: 100 - ((windows_os_physical_memory_free_bytes / windows_cs_physical_memory_bytes) * 100) > 90for: 3slabels:severity: criticalannotations:summary: "服务器内存使用过高警报"description: "当前实例 {{ $labels.hostname }} 的服务器内存使用率已达到 {{ $value | printf \"%.2f\" }}%，超过90%。请检查服务器内存使用情况！"- alert: HighNetworkReceiveUsageexpr: rate(windows_net_bytes_received_total[10m]) * 8 / 1000000 > 500   # 500 Mbpsfor: 10mlabels:severity: criticalannotations:summary: "服务器下载带宽使用过高警报"description: "当前实例 {{ $labels.hostname }} 的 {{ $labels.nic }} 网卡（基于10分钟内所有数据点计算的平均增长率）每秒平均下载带宽已持续10分钟超过500 Mbps（62.5 MB/s），当前每秒平均下载带宽为 {{ $value | printf \"%.2f\" }} Mbps。请检查网络流量和带宽使用情况！"- alert: HighNetworkTransmitUsageexpr: rate(windows_net_bytes_sent_total[10m]) * 8 / 1000000 > 500   # 500 Mbpsfor: 10mlabels:severity: criticalannotations:summary: "服务器上传带宽使用过高警报"description: "当前实例 {{ $labels.hostname }} 的 {{ $labels.nic }} 网卡（基于10分钟内所有数据点计算的平均增长率）每秒平均上传带宽已持续10分钟超过500 Mbps（62.5 MB/s），当前每秒平均上传带宽 {{ $value | printf \"%.2f\" }} Mbps。请检查网络流量和带宽使用情况！"
3）检查配置文件
[root@prometheus ~]# cd /opt/prometheus/
[root@prometheus ~]# ./promtool check config prometheus.yml      ###用于检查 Prometheus 配置文件（prometheus.yml）的语法和格式是否正确。
执行这条命令会执行以下操作：

验证配置文件的语法：检查 prometheus.yml 文件是否符合 Prometheus 配置格式规范。
检测潜在的错误或警告：如果配置文件中存在拼写错误、格式问题、无效的配置项等问题，它会提供相关的错误信息或警告。比如告警规则写的不对，就会有提示
输出有用的诊断信息：如果配置文件存在问题，promtool 会输出详细的错误信息。

4）prometheus.yml文件添加了信息，所以重启prometheus进程或者重新加载配置文件（二选一）

#重载：前提是在prometheus.service启动服务项中加了--web.enable-lifecycle参数：--web.enable-lifecycle：###启用Prometheus的生命周期接口，允许通过HTTP请求来动态重新加载配置等操作。这对于在运行时更新配置或执行其他管理操作非常有用，当修改了prometheus的配置后，可以通过curl命令来重新加载配置文件，而不需要重启prometheus（推荐方式）
[root@prometheus ~]# curl -X POST http://localhost:9090/-/reload
#重启
[root@prometheus ~]# systemctl restart prometheus.service
5）在prometheus查看是否可以看到监控信息

网址：http://110.120.100.21:9090

菜单栏：Status—Targets



6）登录Grafana界面管理，将当前主机的监控信息做展示

地址：http://110.120.100.21:3000

默认用户：admin

默认密码：admin

一、下载一个仪表盘：Grafana官网“http://www.grafana.com”—Dashboard templates，然后选择一个下载量高的自己喜欢的windows_exporter（windows主机监控）

注意：不需要再增加数据源了。因为在第一次搭建prometheus+Grafana的时候就已经加好了，在添加数据源时，有个配置项是Connection，这里添加的是prometheus的地址，指的是prometheus监控服务器的地址，而不是windows_exporter的地址



以20763为例（Windows Exporter Dashboard 2024），新增了多个指标，比较全面

二、将仪表盘添加到Grafana上：Dashboards—New—Import—点击“Upload dashboard JSON file”

Name：定义名称，最好定义为主机ip加用途

Prometheus：选择prometheus源，Prometheus监控源(ip:110.120.100.21:9090)

....

然后import



三、仪表盘展示：Dashboards—查看到已经定义好的仪表盘，并且数据源是prometheus监控，点击进去

仪表盘Name：linux服务器监控

数据源Name：prometheus监控，Prometheus监控源(ip:110.120.100.21:9090)

Datasource：选择在添加数据源时，已经定义好的“Prometheus监控源(ip:110.120.100.21:9090)”

Job：这里其实就是当时已经在配置prometheus.yml时，定义的job_name，也就是说Grafana会自动识别到

Host：这里其实就是当时已经在配置prometheus.yml时，定义的instance，也就是说Grafana会自动识别到