马尔科夫不等式和切比雪夫不等式

前言

本文隶属于专栏《机器学习数学通关指南》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见《机器学习数学通关指南》


正文

统计概率的利剑:掌握这两大不等式,让机器学习模型风险评估更有保障!

在这里插入图片描述

1️⃣ 马尔科夫不等式:概率上界的基石 🏗️

🔍 核心思想

对于非负随机变量 X ≥ 0 X \geq 0 X0,其取值超过某阈值 a ( a > 0 ) a\ (a > 0) a (a>0) 的概率上界可通过数学期望估计。马尔科夫不等式提供了一种分布无关的概率上界估计方法。

📝 数学形式

P ( X ≥ a ) ≤ E ( X ) a P(X \geq a) \leq \frac{E(X)}{a} P(Xa)aE(X)

🧩 直观理解

想象一个班级的学生成绩(非负),平均分80分。有多少学生可能得到160分以上?马尔科夫告诉我们:最多50%,因为 80 160 = 0.5 \frac{80}{160} = 0.5 16080=0.5

🔄 推导过程

由于 X ≥ 0 X \geq 0 X0,期望 E ( X ) = ∫ 0 ∞ x f ( x ) d x E(X) = \int_0^\infty x f(x) dx E(X)=0xf(x)dx。将积分拆分:

E ( X ) = ∫ 0 a x f ( x ) d x + ∫ a ∞ x f ( x ) d x ≥ ∫ a ∞ x f ( x ) d x ≥ a ∫ a ∞ f ( x ) d x = a ⋅ P ( X ≥ a ) E(X) = \int_0^a x f(x) dx + \int_a^\infty x f(x) dx \geq \int_a^\infty x f(x) dx \geq a \int_a^\infty f(x) dx = a \cdot P(X \geq a) E(X)=0axf(x)dx+axf(x)dxaxf(x)dxaaf(x)dx=aP(Xa)

两边同除 a a a 即得不等式。

💡 机器学习应用

  1. 异常检测:估计特征值超过阈值的异常概率上界
  2. 过拟合风险评估:当损失函数视为随机变量时,评估超过某阈值的概率
  3. 资源分配预测:如预估GPU内存使用峰值概率
  4. 梯度下降收敛性:评估随机梯度下降中梯度爆炸的概率上界

📈 实例:模型训练资源规划

假设深度学习训练任务的内存需求 X X X 平均为8GB,估计内存需求超过16GB的概率上界:

P ( X ≥ 16 G B ) ≤ 8 G B 16 G B = 0.5 P(X \geq 16GB) \leq \frac{8GB}{16GB} = 0.5 P(X16GB)16GB8GB=0.5

因此,如果我们为服务器配置16GB内存,理论上至少50%的训练任务可以顺利完成。

2️⃣ 切比雪夫不等式:方差的力量 💪

🔍 核心思想

切比雪夫不等式利用方差量化随机变量偏离均值的程度,提供比马尔科夫更精确的概率界限,是机器学习中量化不确定性的强大工具。

📝 数学形式

P ( ∣ X − E ( X ) ∣ ≥ ϵ ) ≤ D ( X ) ϵ 2 P\left(|X - E(X)| \geq \epsilon\right) \leq \frac{D(X)}{\epsilon^2} P(XE(X)ϵ)ϵ2D(X)

等价形式:

P ( ∣ X − E ( X ) ∣ < ϵ ) ≥ 1 − D ( X ) ϵ 2 P\left(|X - E(X)| < \epsilon\right) \geq 1 - \frac{D(X)}{\epsilon^2} P(XE(X)<ϵ)1ϵ2D(X)

🧩 直观理解

如果模型预测误差的方差为4,那么预测偏离真实值超过10个单位的概率不会超过 4 1 0 2 = 0.04 \frac{4}{10^2} = 0.04 1024=0.04,即4%。

🔄 推导过程

对随机变量 Y = ( X − μ ) 2 Y = (X - \mu)^2 Y=(Xμ)2 应用马尔科夫不等式。已知 E ( Y ) = D ( X ) E(Y) = D(X) E(Y)=D(X),则:

P ( Y ≥ ϵ 2 ) ≤ E ( Y ) ϵ 2 = D ( X ) ϵ 2 P(Y \geq \epsilon^2) \leq \frac{E(Y)}{\epsilon^2} = \frac{D(X)}{\epsilon^2} P(Yϵ2)ϵ2E(Y)=ϵ2D(X)

注意到 ( X − μ ) 2 ≥ ϵ 2 ⇔ ∣ X − μ ∣ ≥ ϵ (X - \mu)^2 \geq \epsilon^2 \Leftrightarrow |X - \mu| \geq \epsilon (Xμ)2ϵ2Xμϵ,即得原式。

💡 机器学习应用

  1. 模型预测置信区间:根据验证误差方差估计预测偏离的概率范围
  2. 特征重要性评估:评估特征值偏离均值的稳定性
  3. 模型鲁棒性分析:量化模型对输入扰动的敏感度
  4. 早停策略设计:基于验证损失偏离平均值的概率设计早停阈值

💻 实现示例

import numpy as np
import matplotlib.pyplot as plt# 生成随机数据
np.random.seed(42)
data = np.random.normal(100, 15, 1000)  # 均值100,标准差15的正态分布# 计算实际值
mean = np.mean(data)
var = np.var(data)
epsilon = 30# 切比雪夫不等式计算
chebyshev_bound = var / (epsilon**2)
actual_prob = np.mean(np.abs(data - mean) >= epsilon)print(f"数据均值: {mean:.2f}")
print(f"数据方差: {var:.2f}")
print(f"切比雪夫界限: P(|X - μ| ≥ {epsilon}) ≤ {chebyshev_bound:.4f}")
print(f"实际概率: P(|X - μ| ≥ {epsilon}) = {actual_prob:.4f}")# 对比图
plt.figure(figsize=(10, 6))
plt.hist(data, bins=50, alpha=0.7, density=True, label='数据分布')
plt.axvline(mean, color='r', linestyle='--', label=f'均值: {mean:.2f}')
plt.axvline(mean + epsilon, color='g', linestyle='--', label=f'均值 + {epsilon}')
plt.axvline(mean - epsilon, color='g', linestyle='--', label=f'均值 - {epsilon}')
plt.title('切比雪夫不等式实例演示')
plt.legend()
plt.show()

📊 实例:推荐系统的准确性评估

某推荐系统的点击率预测模型在验证集上的预测误差方差为0.04。使用切比雪夫不等式,可估计预测偏离真实值超过0.3的概率上界:

P ( ∣ X − μ ∣ ≥ 0.3 ) ≤ 0.04 0. 3 2 ≈ 0.44 P(|X - \mu| \geq 0.3) \leq \frac{0.04}{0.3^2} \approx 0.44 P(Xμ0.3)0.320.040.44

这提示我们模型的准确性还有提升空间,44%的预测可能有较大偏差。

3️⃣ 马尔科夫与切比雪夫不等式对比 🔍

对比项马尔科夫不等式切比雪夫不等式
适用条件 X ≥ 0 X \geq 0 X0,仅需均值已知需已知均值和方差
数学基础通过期望拆分积分基于变量 ( X − μ ) 2 (X - \mu)^2 (Xμ)2的马尔科夫扩展
估计特点单边界( X ≥ a X \geq a Xa)双侧界( ∣ X − μ ∣ ≥ ϵ \vert X - \mu \vert \geq \epsilon Xμϵ)
界限精度较松散更严格(利用方差信息)
ML中典型应用梯度爆炸检测
资源使用预测
预测置信区间
模型收敛性分析

4️⃣ 机器学习中的实际应用 🤖

🔬 批量归一化(Batch Normalization)原理解释

切比雪夫不等式帮助解释为什么批量归一化能提高模型训练稳定性。通过标准化每层输出,使方差保持恒定,根据切比雪夫不等式,可以更好地控制激活值偏离均值的概率,减少梯度消失/爆炸问题。

🎯 SGD优化器学习率调节

随机梯度下降中,每批次梯度可视为随机变量。应用马尔科夫不等式,可以估计梯度超过阈值的概率上界,帮助动态调整学习率。

🛡️ 异常检测阈值设定

在无监督异常检测中,若特征 X X X的均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2,根据切比雪夫不等式,设置阈值 T = μ + k σ T = \mu + k\sigma T=μ+,则异常比例不超过 1 k 2 \frac{1}{k^2} k21,提供了阈值选择的理论依据。

5️⃣ 与其他概率界的关系与扩展 🌐

🔗 霍夫丁不等式(Hoeffding’s Inequality)

切比雪夫的一个重要扩展,提供了有界随机变量和的更紧概率界限,是PAC学习理论和VC维分析的基础。

形式:若 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn是独立随机变量且 a i ≤ X i ≤ b i a_i \leq X_i \leq b_i aiXibi,则:

P ( ∣ 1 n ∑ i = 1 n X i − E [ 1 n ∑ i = 1 n X i ] ∣ ≥ ϵ ) ≤ 2 e − 2 n 2 ϵ 2 ∑ i = 1 n ( b i − a i ) 2 P\left(|\frac{1}{n}\sum_{i=1}^n X_i - E[\frac{1}{n}\sum_{i=1}^n X_i]| \geq \epsilon\right) \leq 2e^{-\frac{2n^2\epsilon^2}{\sum_{i=1}^n (b_i-a_i)^2}} P(n1i=1nXiE[n1i=1nXi]ϵ)2ei=1n(biai)22n2ϵ2

🔄 集中不等式(Concentration Inequalities)

马尔科夫和切比雪夫不等式是最基础的集中不等式,在高维统计和机器学习中,更广泛应用的有:

  • 次高斯分布的概率界
  • 矩阵浓缩不等式,用于随机矩阵分析
  • 经验风险最小化的泛化误差界

6️⃣ 代码实践:模型鲁棒性评估工具 🛠️

def estimate_robustness(model, test_data, test_labels, epsilon=0.1):"""使用切比雪夫不等式估计模型对输入扰动的鲁棒性Args:model: 训练好的模型test_data: 测试数据test_labels: 测试标签epsilon: 输入扰动幅度Returns:robustness_score: 模型鲁棒性分数 (0-1,越高越好)"""# 计算原始预测original_preds = model.predict(test_data)original_acc = np.mean(np.argmax(original_preds, axis=1) == test_labels)# 生成扰动数据perturbed_data = test_data + np.random.normal(0, epsilon, test_data.shape)perturbed_preds = model.predict(perturbed_data)# 计算预测变化的方差pred_diff = np.abs(original_preds - perturbed_preds)pred_var = np.var(pred_diff)# 使用切比雪夫不等式估计稳定性delta = 0.1  # 允许的预测变化阈值stability_prob_lower = 1 - (pred_var / (delta**2))stability_prob_lower = max(0, min(1, stability_prob_lower))  # 限制范围[0,1]print(f"模型原始准确率: {original_acc:.4f}")print(f"预测变化方差: {pred_var:.6f}")print(f"稳定性下界(切比雪夫): {stability_prob_lower:.4f}")return stability_prob_lower

7️⃣ 总结与进阶方向 📚

📌 要点总结

  • 马尔科夫不等式:通过均值提供单侧概率上界,适用于非负随机变量
  • 切比雪夫不等式:通过方差提供双侧概率界,更精确但要求更多信息
  • 机器学习应用:从模型训练、评估到部署,这些不等式提供了理论基础
  • 实践价值:即使在不知道确切分布的情况下也能得到有用的概率界限

🚀 进阶方向

  1. 探索更精确的界限:学习柴丁-霍夫丁不等式(Chernoff-Hoeffding bounds),它在大多数情况下提供比切比雪夫更紧的概率界

  2. 指数型马尔科夫不等式:研究基于矩生成函数的指数马尔科夫不等式,形式为 P ( X ≥ a ) ≤ E [ e t X ] e t a P(X \geq a) \leq \frac{E[e^{tX}]}{e^{ta}} P(Xa)etaE[etX],它是许多更强不等式的基础

  3. 次高斯(Sub-Gaussian)与次指数(Sub-Exponential)随机变量:这些特殊类型的随机变量具有更好的尾部概率界限,在高维统计和机器学习理论中广泛应用

  4. 经验风险最小化(ERM)理论:了解如何使用集中不等式推导学习算法的泛化误差界

8️⃣ 机器学习算法中的应用实例 🧠

🤖 梯度下降的收敛性分析

随机梯度下降(SGD)中,单次梯度可视为随机变量。若其方差有界,通过切比雪夫不等式可估计:

P ( ∣ ∣ ∇ f ( x t ) − E [ ∇ f ( x t ) ] ∣ ∣ ≥ ϵ ) ≤ σ 2 ϵ 2 P\left(||\nabla f(x_t) - \mathbb{E}[\nabla f(x_t)]|| \geq \epsilon\right) \leq \frac{\sigma^2}{\epsilon^2} P(∣∣∇f(xt)E[f(xt)]∣∣ϵ)ϵ2σ2

这解释了为什么:

  • 小批量(mini-batch)SGD比单样本SGD更稳定
  • 梯度裁剪(gradient clipping)能提高训练稳定性
  • 学习率衰减策略有助于收敛

📋 特征选择与降维

在特征选择中,可使用切比雪夫不等式评估特征缺失对模型性能的影响。若特征 X i X_i Xi 的信息增益方差为 σ i 2 \sigma_i^2 σi2,则可以估计删除该特征后模型性能下降超过阈值 δ \delta δ 的概率。

def feature_stability_score(feature_importances, n_bootstrap=100):"""使用切比雪夫不等式评估特征重要性的稳定性"""importances = []for _ in range(n_bootstrap):# 假设有bootstrap重采样的特征重要性数据bootstrap_idx = np.random.choice(len(feature_importances), len(feature_importances), replace=True)importances.append(feature_importances[bootstrap_idx])# 计算每个特征重要性的方差variances = np.var(importances, axis=0)# 使用切比雪夫不等式估计稳定性epsilon = 0.05  # 允许的波动stability_scores = 1 - (variances / (epsilon**2))stability_scores = np.clip(stability_scores, 0, 1)  # 限制在[0,1]范围return stability_scores

🎯 异常检测与离群点识别

在基于密度的异常检测中,马尔科夫不等式提供了一个重要思路:如果数据点 x x x 的密度估计值 p ( x ) p(x) p(x) 满足 p ( x ) < τ E [ p ( X ) ] p(x) < \frac{\tau}{E[p(X)]} p(x)<E[p(X)]τ,则 x x x 可能是异常值。这是局部异常因子(LOF)等算法的理论基础之一。

9️⃣ 常见问题与解答 ❓

Q1: 这些不等式在深度学习中有什么应用?

A: 在深度学习中,这些不等式帮助:

  • 分析网络权重初始化策略的合理性
  • 证明Dropout等正则化技术的有效性
  • 设计自适应学习率优化器(如AdaGrad)
  • 分析批量归一化(Batch Normalization)等技术的收敛性质
  • 评估模型对对抗样本的鲁棒性

Q2: 为什么切比雪夫不等式在实际中常被认为界限过松?

A: 切比雪夫不等式适用于任何具有有限方差的分布,这种通用性导致界限较为保守。对于特定分布(如高斯分布),可以得到更紧的界限。例如,对于高斯分布,3-sigma规则表明偏离均值超过3个标准差的概率约为0.003,而切比雪夫仅给出 1 / 9 ≈ 0.111 1/9 \approx 0.111 1/90.111 的上界。

Q3: 如何使用这些不等式设计早停策略?

A: 设模型在验证集上的损失为随机变量 L L L,其移动平均为 μ t \mu_t μt,移动方差为 σ t 2 \sigma_t^2 σt2。使用切比雪夫不等式,可估计损失低于当前最佳值的概率上界。若该概率小于阈值(如0.05),则可能已接近最优,可以考虑早停。

🔟 经典应用:PAC学习理论 🎓

PAC(Probably Approximately Correct)学习理论是机器学习的理论基础,而集中不等式(特别是霍夫丁不等式,切比雪夫不等式的一个扩展)在其中扮演核心角色。

对于样本量为 m m m 的训练集,经验风险为 R ^ ( h ) \hat{R}(h) R^(h),真实风险为 R ( h ) R(h) R(h),霍夫丁不等式给出:

P ( ∣ R ( h ) − R ^ ( h ) ∣ ≥ ϵ ) ≤ 2 e − 2 m ϵ 2 P(|R(h) - \hat{R}(h)| \geq \epsilon) \leq 2e^{-2m\epsilon^2} P(R(h)R^(h)ϵ)2e2mϵ2

这意味着当样本量 m ≥ 1 2 ϵ 2 ln ⁡ 2 δ m \geq \frac{1}{2\epsilon^2}\ln\frac{2}{\delta} m2ϵ21lnδ2 时,我们有 1 − δ 1-\delta 1δ 的置信度认为经验风险与真实风险的差不超过 ϵ \epsilon ϵ。这直接导出了PAC学习的样本复杂度界限。

def calculate_pac_sample_size(epsilon, delta):"""计算PAC学习理论下需要的最小样本量Args:epsilon: 允许的经验风险与真实风险之间的误差delta: 允许的失败概率Returns:m: 所需最小样本数"""m = np.ceil((1 / (2 * (epsilon**2))) * np.log(2 / delta))return int(m)# 示例:如果想要95%的置信度,误差不超过0.1
sample_size = calculate_pac_sample_size(0.1, 0.05)
print(f"为获得95%置信度,误差不超过0.1,需要至少{sample_size}个样本")

💭 结语

马尔科夫和切比雪夫不等式是机器学习数学基础中的璀璨明珠。它们不仅提供了理论保证,更在实际算法设计和模型评估中发挥着不可替代的作用。掌握这些工具,我们能够:

  • 对模型性能做出可靠估计,即便不知道准确的数据分布
  • 设计具有理论保证的算法
  • 更好地理解现有算法的优缺点
  • 建立对模型可靠性的信心

在机器学习日益成为关键技术的今天,深入理解这些基础概念不仅是理论探索,更是实践应用的坚实基石。希望这篇文章能帮助你在机器学习的数学迷宫中找到前进的方向!

💡 思考练习: 试着用马尔科夫不等式估计你的模型在极端情况下可能达到的最差性能,然后思考如何通过降低相应指标的方差来提高这个下限。记住,真正的工程师不仅追求平均性能,更要保证最坏情况下的可靠性!


如果你对这个系列感兴趣,可以关注我的「机器学习数学通关指南」专栏,我们将继续探索概率论、线性代数、优化理论等领域在机器学习中的精彩应用!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/897053.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于 STC89C52 的 8x8 点阵显示汉字

一、引言 在电子信息显示领域,汉字的直观呈现为信息传递带来极大便利。8x8 点阵虽显示空间有限,但通过合理设计,能够清晰展示一些常用、简单的汉字,丰富电子设备的交互界面。STC89C52 单片机作为一款经典且应用广泛的微控制器,以其成本低廉、易于开发的特性,成为驱动 8x…

二进制、八进制、十进制和十六进制间的转换(原理及工程实现)

在计算机科学和编程中&#xff0c;进制转换是一个非常重要的基础知识。无论是二进制、八进制、十进制还是十六进制&#xff0c;它们在不同的场景中都有广泛的应用。本文将详细介绍常用进制之间的转换方法&#xff0c;并附上C语言示例代码&#xff0c;帮助大家更好地理解和掌握这…

从零开始的 Kafka 学习(二)| 集群启动

1. 相关概念 1.1 代理&#xff1a;Broker 使用Kafka前&#xff0c;我们都会启动Kafka服务进程&#xff0c;这里的Kafka服务进程我们一般会称之为Kafka Broker 或 Kafka Server。因为Kafka是分布式消息系统所以再实际的生产环境中&#xff0c;是需要多个服务进程形成集群提供消…

python如何随机产生一堆数字并输出

python随机产生一堆数字并输出的方法&#xff1a; 通过for循环语句多次执行for循环里面的“random.randint()”函数产生随机数。将产生的随机数赋值给变量&#xff0c;输出这个变量就可以了 执行结果如下&#xff1a;

vue3与react、 react hooks

一、Vue3新特性&#xff1a;setup、ref、reactive、computed、watch、watchEffect函数、生命周期钩子、自定义hooks函数、toRef和toRefs、shallowReactive 与 shallowRef、readonly 与 shallowReadonly、toRaw 与 markRaw、customRef、provide 与 inject、Fragment、Teleport、…

《基于WebGPU的下一代科学可视化——告别WebGL性能桎梏》

引言&#xff1a;科学可视化的算力革命 当WebGL在2011年首次亮相时&#xff0c;它开启了浏览器端3D渲染的新纪元。然而面对当今十亿级粒子模拟、实时物理仿真和深度学习可视化需求&#xff0c;WebGL的架构瓶颈日益凸显。WebGPU作为下一代Web图形标准&#xff0c;通过显存直存、…

宠物医疗对接DeepSeek详细方案

基于DeepSeek本地化部署技术与医疗场景优化实践 一、核心架构设计 1. 本地化部署与数据安全 私有化服务器部署:将DeepSeek模型部署在宠物医院本地服务器,所有诊疗数据(如宠物病历、影像报告)均存储于院内,避免云端传输风险数据加密机制:采用AES-256加密算法对医疗数据加…

K8s 1.27.1 实战系列(一)准备工作

一、主机规划与硬件要求 1、节点数量 至少需要 3 台服务器(1 台 Master 节点,2 台 Worker 节点)。本地测试可缩容:若仅用于测试,可缩减为 1 个 Master 和 1 个 Worker,但需注意稳定性风险。2、硬件配置 ​Master 节点:建议 2 核 CPU、8GB 内存、80GB 硬盘。​Worker 节…

2.PSCAD是什么软件?

PSCAD&#xff08;Power Systems Computer Aided Design&#xff09;是一款功能强大的电力系统仿真软件&#xff0c;广泛应用于电力系统的建模、仿真和分析。它结合了电磁暂态仿真引擎EMTDC&#xff08;Electromagnetic Transients including DC&#xff09;&#xff0c;能够精…

Stable Diffusion模型Pony系列模型深度解析

Stable Diffusion模型Pony系列模型深度解析 一、技术架构与核心特性 基于SDXL的深度优化 Pony系列模型以SDXL为基础框架&#xff0c;通过针对二次元/动漫风格的微调&#xff0c;强化了在该领域的生成能力&#xff0c;同时保留了对写实场景的兼容性‌。其训练数据特别侧重于人…

FastGPT 引申:混合检索完整实例

文章目录 FastGPT 引申&#xff1a;混合检索完整实例1. 各检索方式的初始结果2. RRF合并过程3. 合并后的结果4. Rerank重排序后5. 最终RRF合并6. 内容总结 FastGPT 引申&#xff1a;混合检索完整实例 下边通过一个简单的例子说明不同检索方式的分值变化过程&#xff0c;假设我…

在MATLAB环境中,对矩阵拼接(Matrix Concatenation)的测试

在MATLAB环境中&#xff0c;对矩阵拼接&#xff08;Matrix Concatenation&#xff09;的正确性与鲁棒性开展测试时&#xff0c;需要依据不同的拼接场景精心设计测试用例&#xff0c;全面验证矩阵维度、数据顺序、边界条件以及异常处理等关键方面。以下是详尽的测试方法与具体示…

OpenFeign 学习笔记

OpenFeign 学习笔记 一、基础入门 1.1 简介 OpenFeign 是基于声明式的 REST 客户端&#xff0c;用于简化服务间远程调用。&#xff08;编程式 REST 客户端&#xff08;RestTemplate&#xff09;&#xff09; 通过接口注解方式定义 HTTP 请求&#xff0c;自动实现服务调用。 …

“沂路畅通”便利服务平台:赋能同城物流,构建高效畅通的货运生态

“沂路畅通”便利服务平台&#xff1a;赋能同城物流&#xff0c;构建高效畅通的货运生态 随着城市化进程的加速&#xff0c;同城物流需求迅速增长&#xff0c;然而货运过程中仍然存在信息不对称、资源浪费、司机服务体验差等痛点。临沂呆马区块链网络科技有限公司&#xff08;…

去除HTML有序列表(ol)编号的多种解决方案

以下是去除HTML有序列表(ol)编号的多种解决方案&#xff1a; <!DOCTYPE html> <html> <head> <style> /* 基础方案&#xff1a;完全移除编号 */ ol.no-number {list-style-type: none; /* 移除默认编号 */padding-left: 0; /* 移除默认缩进 */…

es如何进行refresh?

在 Elasticsearch 中,refresh 操作的作用是让最近写入的数据可以被搜索到。以下为你介绍几种常见的执行 refresh 操作的方式: 1. 使用 RESTful API 手动刷新 你可以通过向 Elasticsearch 发送 HTTP 请求来手动触发 refresh 操作。可以针对单个索引、多个索引或者所有索引进…

Leetcode 57: 插入区间

Leetcode 57: 插入区间 问题描述&#xff1a; 给定一个非重叠的区间集合 intervals&#xff08;按开始时间升序排列&#xff09;和一个新的区间 newInterval&#xff0c;将新的区间插入到区间集合中并合并重叠的部分&#xff0c;最后返回结果区间集合。 适合面试的解法&#x…

爬虫面试:关于爬虫破解验证码的13个经典面试题

更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 1. ​什么是验证码(CAPTCHA)?它的作用是什么?2. ​常见的验证码类型有哪些?3. ​在爬虫开发中,遇到验证码时通常有哪些解决方案?4. ​如何使用第三方验证码识别服务?请举例说明。5. ​训练自己的验证码识别模型…

Kylin麒麟操作系统服务部署 | NFS服务部署

以下所使用的环境为&#xff1a; 虚拟化软件&#xff1a;VMware Workstation 17 Pro 麒麟系统版本&#xff1a;Kylin-Server-V10-SP3-2403-Release-20240426-x86_64 一、 NFS服务概述 NFS&#xff08;Network File System&#xff09;&#xff0c;即网络文件系统。是一种使用于…

三参数水质在线分析仪:从源头保障饮用水安全

【TH-ZS03】饮用水安全是人类健康的重要保障&#xff0c;其质量直接关系到人们的生命健康。随着工业化、城市化的快速发展&#xff0c;水体污染问题日益严峻&#xff0c;饮用水安全面临着前所未有的挑战。为了从源头保障饮用水安全&#xff0c;科学、高效的水质监测手段必不可少…