集成学习(一):从理论到实战(附代码)

一、引言

在机器学习领域,打造一个独立、强大的算法是解决问题的关键。然而,集成学习提供了一种不同的视角:通过组合多个“弱”学习器来创建一个更强大的模型。本文探讨集成学习的思想、方法及其应用。

二、机器学习 vs 集成学习思想

传统机器学习思想

  • 打造一个独立、强大的算法:传统的机器学习倾向于开发一种能够解决特定问题的高效算法。
  • 单个算法打天下:强调单一算法的能力,试图找到适用于广泛问题的最佳解决方案。
  • 个人英雄主义:注重单个算法的性能和能力。

集成学习思想

  • 群狼打败猛虎的策略:集成学习采用集体智慧战胜单个强者的策略。
  • 管理理念:招募一批二流货色,组合成一个强大的团队,以干掉一流货色。
  • 三个臭皮匠顶个诸葛亮:通过结合多个简单的模型(弱评估器),可以构建出比任何单独模型都更强的预测模型。

三、集成学习要素

  1. 一批弱分类器:这些分类器或回归器各自的表现并不突出,但当它们组合在一起时,能显著提高整体性能。
  2. 组合策略:如何有效地将这些弱学习器的结果结合起来形成最终预测。

四、集成学习策略

4.1 Voting

思想:数据相同,算法不同,对不同算法的结果,采用多数原则

VotingClassifierVotingRegressor 是集成学习中用于分类和回归任务的两种元估计器(meta-estimators)。它们的基本思想是结合多个不同的模型(通常称为“弱学习器”或基础估计器)的预测结果,以期通过集体决策来提高整体模型的性能。这种策略基于的是“群体智慧”的理念,即多个模型的组合可以比单个模型更准确。


4.1.1 VotingClassifier

VotingClassifier 主要用于分类问题,它可以通过两种主要的方式来进行投票:硬投票(hard voting)和软投票(soft voting)。

  1. 硬投票(Hard Voting)

    • 在硬投票中,每个分类器对输入数据进行分类,并将得票最多的类别作为最终的预测结果。
    • 例如,如果有三个分类器分别预测 [0, 1, 1],那么最终的预测结果将是 1,因为两个分类器都投了 1
  2. 软投票(Soft Voting)

    • 软投票需要所有基础分类器都能够输出概率估计(即支持度),然后根据这些概率计算加权平均值,选择具有最高平均概率的类别作为预测结果。
    • 这种方法考虑了每个类别的置信度,因此在理论上可能比硬投票更精确。

示例代码

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.ensemble import VotingClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split# 创建示例数据集
# 这是Scikit-learn中的一个函数,用于生成一个合成的分类数据集。
# n_samples=1000:生成的数据集中包含1000个样本。
# n_features=20:每个样本有20个特征。
# random_state=42:设置随机种子以确保每次运行代码时生成的数据集相同。这对于实验的可重复性非常重要。
# X:形状为 (1000, 20) 的二维数组,表示1000个样本的20个特征。
# y:长度为1000的一维数组,表示每个样本对应的标签(类别)。
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
# 数据集分割
# test_size=0.3:指定测试集占总数据集的比例为30%。因此,70%的数据将被分配给训练集。
# random_state=42:再次设置随机种子,确保每次运行代码时数据集的划分方式相同。
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义基础分类器
# LogisticRegression逻辑回归分类器
# multi_class='multinomial':指定使用多项式逻辑回归来处理多分类问题。
# random_state=1:设置随机种子,使得结果具有可重复性。
clf1 = LogisticRegression(multi_class='multinomial', random_state=1)
# RandomForestClassifier:随机森林算法,通过构建多个决策树并汇总它们的预测结果来进行分类。
# n_estimators=50:指定随机森林中决策树的数量为50。
# random_state=1:设置随机种子,使得结果具有可重复性。
clf2 = RandomForestClassifier(n_estimators=50, random_state=1)
# GaussianNB:高斯朴素贝叶斯分类器
clf3 = GaussianNB()# 创建VotingClassifier实例
voting_clf = VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('gnb', clf3)], voting='hard') # 或者使用 'soft'# 训练模型
voting_clf.fit(X_train, y_train)# 预测
predictions = voting_clf.predict(X_test)

举一个软投票的例子,并说明投票的过程,使用软投票策略进行预测,并为每个分类器指定不同的权重。

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier, VotingClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 生成合成数据集
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义基础分类器
clf1 = LogisticRegression(multi_class='multinomial', random_state=1)
clf2 = RandomForestClassifier(n_estimators=50, random_state=1)
clf3 = GaussianNB()# 创建VotingClassifier实例,设置voting='soft'表示使用软投票,并指定各分类器的权重
voting_clf_soft_weighted = VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('gnb', clf3)
], voting='soft', weights=[2, 1, 1])# 训练模型
voting_clf_soft_weighted.fit(X_train, y_train)# 使用训练好的模型进行预测
y_pred_soft_weighted = voting_clf_soft_weighted.predict(X_test)# 计算并打印准确率
accuracy_soft_weighted = accuracy_score(y_test, y_pred_soft_weighted)
print(f"Soft Voting Classifier with Weights Accuracy: {accuracy_soft_weighted:.4f}")

带权重的软投票的工作原理

在这个例子中,我们为每个分类器指定了不同的权重:

  • 逻辑回归 (LogisticRegression):权重为2。
  • 随机森林 (RandomForestClassifier):权重为1。
  • 高斯朴素贝叶斯 (GaussianNB):权重为1。

这意味着逻辑回归的预测概率将被赋予两倍于其他两个分类器的重要性。

具体步骤如下:

  1. 预测概率:对于每个测试样本,每个分类器都会输出一个概率向量。

    假设我们有一个测试样本 x,三个分类器对其类别 [0, 1, 2] 的预测概率分别为:

    • 逻辑回归[0.2, 0.5, 0.3]
    • 随机森林[0.3, 0.4, 0.3]
    • 高斯朴素贝叶斯[0.1, 0.6, 0.3]
  2. 加权平均:根据指定的权重,对每个类别的概率进行加权平均。例如,假设权重为 [2, 1, 1],则计算方法如下:

    • 类别0的加权平均概率:(2 * 0.2 + 1 * 0.3 + 1 * 0.1) / (2 + 1 + 1) = (0.4 + 0.3 + 0.1) / 4 = 0.2
    • 类别1的加权平均概率:(2 * 0.5 + 1 * 0.4 + 1 * 0.6) / 4 = (1.0 + 0.4 + 0.6) / 4 = 0.5
    • 类别2的加权平均概率:(2 * 0.3 + 1 * 0.3 + 1 * 0.3) / 4 = (0.6 + 0.3 + 0.3) / 4 = 0.3
  3. 选择最高概率的类别:根据加权平均后的概率向量,选择具有最高概率的类别作为最终预测结果。在这个例子中,类别1的概率最高(0.5),因此最终预测结果为类别1。

带权重的软投票通过结合多个分类器的概率预测结果并考虑不同分类器的重要性来提高整体模型的准确性。

4.1.2 VotingRegressor

VotingRegressor 则适用于回归任务。它的工作原理与 VotingClassifier 类似,但不是通过投票来决定类别,而是通过对各个基础回归器的预测结果取平均值(或其他聚合方式)来得到最终的预测值。

  • 平均法:最简单直接的方法是对所有基础回归器的预测结果求均值作为最终的预测值。
  • 加权平均法:可以为每个回归器分配一个权重,然后根据这些权重计算加权平均值。

示例代码:

from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR
from sklearn.ensemble import VotingRegressor
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split# 创建示例数据集
X, y = make_regression(n_samples=1000, n_features=20, noise=0.1, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义基础回归器
reg1 = LinearRegression()
reg2 = RandomForestRegressor(n_estimators=50, random_state=1)
reg3 = SVR()# 创建VotingRegressor实例
voting_reg = VotingRegressor(estimators=[('lr', reg1), ('rf', reg2), ('svr', reg3)])# 训练模型
voting_reg.fit(X_train, y_train)# 预测
predictions = voting_reg.predict(X_test)
4.1.3 总结
  • VotingClassifierVotingRegressor 提供了一种简单而有效的方法来集成多个模型,以提高预测性能。
  • 对于分类任务,可以选择硬投票或软投票;对于回归任务,默认采用的是平均预测值的方法。
  • 使用这些集成方法时,重要的是确保所选的基础模型具有一定的多样性,这样可以最大化集成的效果。如果所有模型都非常相似,那么集成可能不会带来显著的性能提升。

4.2 Bagging

  1. Bootstrap Sampling:从原始数据集中随机抽取样本(有放回抽样),创建多个不同的子集。
  2. 独立训练模型:在每个子集上使用相同的算法训练一个模型。
  3. 聚合结果
    • 对于分类问题,通常采用多数投票的方式决定最终类别(适用于BaggingClassifier)。
    • 对于回归问题,通常采用平均值的方式来决定最终预测值(适用于BaggingRegressor)。

BaggingClassifierBaggingRegressor 是集成学习方法中的一种,它们基于Bootstrap aggregating(简称Bagging)技术。

4.2.1 BaggingClassifier

BaggingClassifier 用于分类任务。它通过构建多个基础分类器,并对这些分类器的预测结果进行投票来确定最终的预测结果。

示例代码

from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 生成合成数据集
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义基础分类器
base_classifier = DecisionTreeClassifier()# 创建BaggingClassifier实例
bagging_clf = BaggingClassifier(base_estimator=base_classifier, n_estimators=100, max_samples=0.5, max_features=0.5,random_state=42)# 训练模型
bagging_clf.fit(X_train, y_train)# 使用训练好的模型进行预测
y_pred = bagging_clf.predict(X_test)# 计算并打印准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"Bagging Classifier Accuracy: {accuracy:.4f}")
  • base_estimator:指定作为基础模型的分类器,默认为决策树。
  • n_estimators:指定要训练的基础模型的数量。
  • max_samples:每个基础模型使用的样本数比例(可以小于1表示使用部分样本)。
  • max_features:每个基础模型使用的特征数比例(可以小于1表示使用部分特征)。
4.2.2 BaggingRegressor

BaggingRegressor 用于回归任务。它通过构建多个基础回归器,并对这些回归器的预测结果取平均值来确定最终的预测结果。

示例代码

from sklearn.ensemble import BaggingRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error# 生成合成数据集
X, y = make_regression(n_samples=1000, n_features=20, noise=0.1, random_state=42)# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义基础回归器
base_regressor = DecisionTreeRegressor()# 创建BaggingRegressor实例
bagging_reg = BaggingRegressor(base_estimator=base_regressor, n_estimators=100, max_samples=0.5, max_features=0.5,random_state=42)# 训练模型
bagging_reg.fit(X_train, y_train)# 使用训练好的模型进行预测
y_pred = bagging_reg.predict(X_test)# 计算并打印均方误差
mse = mean_squared_error(y_test, y_pred)
print(f"Bagging Regressor MSE: {mse:.4f}")
  • 参数解释BaggingClassifier类似,只是基础模型换成了回归器,评估指标也相应地变为了回归任务常用的均方误差(MSE)。
4.2.3 总结
  • BaggingClassifierBaggingRegressor 通过在不同的数据子集上训练多个相同类型的模型,并结合它们的预测结果来提高模型的性能。
  • 在分类问题中,Bagging通过多数投票来决定最终类别;在回归问题中,则通过计算预测值的平均值来得到最终结果。

4.3 Stacking

  1. 基础模型:在第一阶段,使用不同的算法训练多个基础模型。这些模型可以是任何类型的分类器或回归器。
  2. 元模型:在第二阶段,使用一个新的模型(元模型)来学习如何最好地结合基础模型的预测结果。元模型接收的是基础模型对训练数据的预测作为输入特征,并试图学习一个最佳的组合策略。
  3. 交叉验证:为了避免过拟合,通常使用交叉验证的方法来生成用于训练元模型的数据集。也就是说,基础模型的预测不是直接基于整个训练集,而是基于每个基础模型在其未见过的数据上的预测结果。

StackingClassifierStackingRegressor 是集成学习方法中的另一种技术,称为堆叠(Stacking)。堆叠的核心思想是通过训练多个基础模型(也称作第一层模型或弱学习器),然后使用另一个模型(称为元模型或第二层模型)来结合这些基础模型的预测结果,从而生成最终的预测。这种方法允许模型之间进行更复杂的交互,并且能够利用不同模型的优点。

4.3.1 StackingClassifier

StackingClassifier 适用于分类任务,它通过将多个基础分类器的结果传递给一个元分类器来进行最终的分类决策。

示例代码

from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import StackingClassifier
from sklearn.metrics import accuracy_score# 生成合成数据集
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义基础分类器
base_classifiers = [('rf', RandomForestClassifier(n_estimators=100, random_state=42)),('gb', GradientBoostingClassifier(n_estimators=100, random_state=42))
]# 定义元分类器
meta_classifier = LogisticRegression()# 创建StackingClassifier实例
stacking_clf = StackingClassifier(estimators=base_classifiers, final_estimator=meta_classifier, cv=5)# 训练模型
stacking_clf.fit(X_train, y_train)# 使用训练好的模型进行预测
y_pred = stacking_clf.predict(X_test)# 计算并打印准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"Stacking Classifier Accuracy: {accuracy:.4f}")
  • estimators:指定一组基础分类器。
  • final_estimator:指定元分类器,用于学习如何结合基础分类器的输出。
  • cv:指定交叉验证的折数,默认为5折交叉验证。这确保了元模型不会直接看到基础模型的训练数据,从而减少过拟合的风险。
4.3.2 StackingRegressor

StackingRegressor 类似于 StackingClassifier,但适用于回归任务。它通过将多个基础回归器的结果传递给一个元回归器来进行最终的预测。

示例代码

from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import StackingRegressor
from sklearn.metrics import mean_squared_error# 生成合成数据集
X, y = make_regression(n_samples=1000, n_features=20, noise=0.1, random_state=42)# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义基础回归器
base_regressors = [('rf', RandomForestRegressor(n_estimators=100, random_state=42)),('gb', GradientBoostingRegressor(n_estimators=100, random_state=42))
]# 定义元回归器
meta_regressor = LinearRegression()# 创建StackingRegressor实例
stacking_reg = StackingRegressor(estimators=base_regressors, final_estimator=meta_regressor, cv=5)# 训练模型
stacking_reg.fit(X_train, y_train)# 使用训练好的模型进行预测
y_pred = stacking_reg.predict(X_test)# 计算并打印均方误差
mse = mean_squared_error(y_test, y_pred)
print(f"Stacking Regressor MSE: {mse:.4f}")
  • 参数设置与 StackingClassifier 类似,只是这里的基础模型和元模型都是针对回归任务设计的。

如何理解将多个基础分类器的结果传递给一个元分类器来进行最终的分类决策?

关键点解析:

  • 基础模型(Base Models):可以是任何类型的机器学习模型,例如决策树、支持向量机、神经网络等。在分类任务中,它们被称为基础分类器;在回归任务中,它们被称为基础回归器。

  • 元模型(Meta Model):这是一个单独的模型,它接收基础模型对训练数据的预测结果作为输入,并基于这些预测进行最终的预测。对于分类问题,元模型输出的是类别标签;对于回归问题,元模型输出的是连续值。

详细解释

  1. 基础分类器的预测:首先,你有一组不同的基础分类器(比如逻辑回归、随机森林和K近邻)。每个分类器都会对相同的训练集或验证集做出预测。这些预测结果通常是一个概率分布(对于每个样本属于各个类别的概率)或者直接是类别标签。

  2. 生成新的特征集:接下来,利用这些基础分类器对训练集的预测结果来创建一个新的特征集。具体来说,如果有一个包含N个样本的数据集,且有M个基础分类器,则每个样本现在会对应M个预测值(如果是概率形式,则可能是M*K个值,其中K是类别的数量)。这实际上为原始数据集添加了一层新的特征表示。

  3. 元分类器的训练:然后,使用上述步骤生成的新特征集作为输入来训练元分类器。也就是说,元分类器不是直接基于原始特征进行训练,而是基于基础分类器的预测结果进行训练。这样做的目的是让元分类器学会如何最好地整合来自不同基础分类器的信息,从而做出更准确的最终预测。

  4. 最终的分类决策:一旦元分类器训练完成,在测试阶段,首先用所有基础分类器对测试集进行预测,然后将这些预测结果作为输入传递给元分类器,由元分类器根据这些信息做出最终的分类决定。

示例流程

假设我们有三个基础分类器:clf1, clf2, 和 clf3,以及一个元分类器 meta_clf

  1. 对于训练集中的每个样本,分别得到 clf1, clf2, 和 clf3 的预测结果。
  2. 使用这些预测结果作为新特征来训练 meta_clf
  3. 在测试阶段,同样获取这三个分类器对测试集的预测结果。
  4. 将这三个分类器的预测结果输入到 meta_clf 中,meta_clf 根据这些输入给出最终的分类结果。

这种机制使得堆叠能够有效地利用多个模型的优势,克服单个模型可能存在的局限性,进而提升整个系统的预测能力。

4.3.3 总结
  • StackingClassifierStackingRegressor 通过构建多个基础模型并将它们的预测结果传递给一个元模型来实现最终的预测。
  • 这种方法允许模型之间进行更复杂的交互,并能够利用不同模型的优点,提高整体模型的性能。
  • 使用交叉验证来生成元模型的训练数据,有助于防止过拟合,使得模型更加稳定和可靠。
  • 在实践中,调整超参数和考虑模型之间的多样性也是优化堆叠模型性能的重要方面。

4.4 Boosting

  • 错题本思想:通过调整错误分类实例的权重,使得后续分类器更加关注这些困难案例。

AdaBoost 和 Gradient Boosting 是两种基于提升(Boosting)策略的集成学习方法,它们通过构建一系列弱学习器并将这些弱学习器组合成一个强学习器来提高预测性能。

4.4.1 AdaBoost

AdaBoost(Adaptive Boosting)是一种迭代算法,它通过对先前分类错误的数据点赋予更高的权重来逐步改进模型。

4.4.1.1 AdaBoostClassifier
from sklearn.ensemble import AdaBoostClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split# 创建合成数据集
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义AdaBoost分类器
adaboost_clf = AdaBoostClassifier(n_estimators=50, random_state=42)# 训练模型
adaboost_clf.fit(X_train, y_train)# 预测
predictions = adaboost_clf.predict(X_test)
4.4.1.2 AdaBoostRegressor
  • 工作原理:类似于 AdaBoostClassifier,但用于回归任务。它通过最小化损失函数来更新样本权重,并结合多个弱回归器的结果以生成最终预测值。

    • 不同之处:主要在于如何计算每个弱学习器的贡献以及如何更新样本权重,具体细节依赖于所使用的损失函数(如线性、平方等)。
from sklearn.ensemble import AdaBoostRegressor
from sklearn.datasets import make_regression# 创建合成数据集
X, y = make_regression(n_samples=1000, n_features=20, noise=0.1, random_state=42)# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 定义AdaBoost回归器
adaboost_reg = AdaBoostRegressor(n_estimators=50, random_state=42)# 训练模型
adaboost_reg.fit(X_train, y_train)# 预测
predictions = adaboost_reg.predict(X_test)
4.4.2 Gradient Boosting

Gradient Boosting 是一种前向分步算法,它通过添加新的模型来纠正现有模型的误差,从而逐步降低损失函数的值。

4.4.2.1 GradientBoostingClassifier
  • 工作原理:从一个简单的初始模型(通常是常数预测)开始,然后依次添加新的弱学习器(通常是决策树),每个新添加的模型都试图减少整体模型的损失函数。具体来说,每个新的弱学习器都是基于前一轮模型的残差(即预测值与真实值之间的差异)进行训练的。
from sklearn.ensemble import GradientBoostingClassifier# 定义Gradient Boosting分类器
gb_clf = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42)# 训练模型
gb_clf.fit(X_train, y_train)# 预测
predictions = gb_clf.predict(X_test)
4.4.2.2 GradientBoostingRegressor
  • 工作原理:与 GradientBoostingClassifier 类似,但用于回归任务。它的目标是最小化回归任务中的损失函数(如均方误差)。

    • 过程:从初始估计开始,随后每一步都添加一个新的弱学习器,该学习器专注于拟合上一步中模型预测值与实际值之间的残差,以此来逐步改善模型的整体性能。
from sklearn.ensemble import GradientBoostingRegressor# 定义Gradient Boosting回归器
gb_reg = GradientBoostingRegressor(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42)# 训练模型
gb_reg.fit(X_train, y_train)# 预测
predictions = gb_reg.predict(X_test)
4.4.3 总结
  • AdaBoost:通过增加难以分类样本的权重来迭代地改进模型,适用于分类和回归任务。
  • Gradient Boosting:通过梯度下降的方式逐步优化模型,专注于减少残差,同样适用于分类和回归任务。
  • 这两种方法都属于提升技术,旨在通过组合弱学习器来构建强大的模型。选择哪种方法取决于具体应用场景及数据特性。

篇幅有点长了,接下一篇《集成学习(二):从理论到实战(附代码)》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/70871.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Auto-go 环境配置

go环境配置 1.下载 Go 安装包 从 Go 官方网站(https://golang.org/dl/)下载适合你操作系统的 Go 安装包。不过由于网络原因,可能访问官方网站不太方便可以用我这里的链接Go安装包下载地址点击自动下载 2.下载ide这里使用GoLand 官方网站 …

如何在 Elasticsearch 中设置向量搜索 - 第二部分

作者:来自 Elastic Valentin Crettaz 了解如何在 Elasticsearch 中设置向量搜索并执行 k-NN 搜索。 本文是三篇系列文章中的第二篇,深入探讨了向量搜索(也称为语义搜索)的复杂性以及它在 Elasticsearch 中的实现方式。 第一部分重…

Leetcode - 周赛435

目录 一、3442. 奇偶频次间的最大差值 I二、3443. K 次修改后的最大曼哈顿距离三、3444. 使数组包含目标值倍数的最少增量四、3445. 奇偶频次间的最大差值 II 一、3442. 奇偶频次间的最大差值 I 题目链接 本题使用数组统计字符串 s s s 中每个字符的出现次数,然后…

SQLMesh系列教程-2:SQLMesh入门项目实战(上篇)

假设你已经了解SQLMesh是什么,以及其他应用场景。如果没有,我建议你先阅读《SQLMesh系列教程-1:数据工程师的高效利器-SQLMesh》。 在本文中,我们将完成一个小项目或教程,以帮助你开始使用SQLMesh。你可以选择一步一步…

【xdoj-离散线上练习H】T234(C++)

解题心得: 写递归函数的时候,首先写终止条件,这有助于对整个递归函数的把握。 题目:输入集合A和B,输出A到B上的所有函数。 问题描述 给定非空数字集合A和B,求出集合A到集合B上的所有函数。 输入格式 第一行…

基础连接已经关闭: 服务器关闭了本应保持活动状态的连接

您在进行 HTTP 请求时遇到“基础连接已经关闭: 服务器关闭了本应保持活动状态的连接”的错误,这通常与连接的保持活动(Keep-Alive)设置有关。以下是可能的原因和解决方法: 可能的原因: Keep-Alive 设置: 默…

MybatisPlus常用增删改查

记录下MybatisPlus的简单的增删改查 接口概述 Service和Mapper区别 Mapper简化了单表的sql操作步骤(CRUD),而Serivce则是对Mapper的功能增强。 Service虽然加入了数据库的操作,但还是以业务功能为主,而更加复杂的SQL…

17 MOS管

参考资料 全面认识MOS管,一篇文章就够了-云社区-华为云基础知识中 MOS 部分迟迟未整理,实际分享的电路中大部分常用电路都用到了MOS管,今天势必要来一篇文章,彻底掌握mos管!https://bbs.huaweicloud.com/blogs/375339…

pnpm的使用

pnpm的使用 1.安装和使用2.统一包管理工具下载依赖 1.安装和使用 pnpm:performant npm ,意味“高性能的npm”。 pnpm由npm/yarn衍生而来,解决了npm/yarn内部潜在的bug,极大的优化了性能,扩展了使用场景。被誉为“最先进的包管理工具”。 pnpm安装指令: npm i -g p…

World of Warcraft [CLASSIC][Grandel] FOR THE HORDE

《World of Warcraft [CLASSIC][80猎人][Grandel]维克尼拉斯大型纪录片2025年元宵节击杀联盟主城4BOSS[为了部落!]》 World of Warcraft [CLASSIC][80猎人][Grandel]维克尼拉斯大型纪录片2025年元宵节击杀联盟主城4BOSS[为了部落!]_魔兽

Docker 网络的几种常见类型

目录 Docker 网络类型 桥接网络(Bridge) 通俗解释 特点 使用场景 示例 主机网络(Host) 通俗解释 特点 使用场景 示例 None 网络 通俗解释 特点 使用场景 示例 Overlay 网络 通俗解释 特点 使用场景 示例 Ma…

SSH隧道+Nginx:绿色通道详解(SSH Tunnel+nginx: Green Channel Detailed Explanation)

SSH隧道Nginx:内网资源访问的绿色通道 问题背景 模拟生产环境,使用两层Nginx做反向代理,请求公网IP来访问内网服务器的网站。通过ssh隧道反向代理来实现,重点分析一下nginx反代的基础配置。 实验环境 1、启动内网服务器的tomca…

人生的转折点反而迷失了方向

就像我老婆说的,我是抽空结了一个婚。今天是上班的第三天,不知道是出于何种原因,自己反而陷入了深深的困境,没有了斗志,原因也找不出来,白天在公司没有很大量的产出,晚上回去是想学一学&#xf…

SQLite 数据库:优点、语法与快速入门指南

文章目录 一、引言二、SQLite 的优点 💯三、SQLite 的基本语法3.1 创建数据库3.2 创建表3.3 插入数据3.4 查询数据3.5 更新数据3.6 删除数据3.7 删除表 四、快速入门指南4.1 安装 SQLite4.2 创建数据库4.3 创建表4.4 插入数据4.5 查询数据4.6 更新数据4.7 删除数据4…

uniapp 编译生成鸿蒙正式app步骤

1,在最新版本DevEco-Studio工具新建一个空项目并生成p12和csr文件(构建-生成私钥和证书请求文件) 2,华为开发者平台 根据上面生成的csr文件新增cer和p7b文件,分发布和测试 3,在最新版本DevEco-Studio工具 文…

ADB详细教程

目录 一、ADB简介 二、配置 配置环境变量 验证是否安装成功 三、简单使用 基本命令 设备连接管理 USB连接 WIFI连接(需要USB线) 开启手机USB调试模式 开启USB调试 四、其他 更换ADB默认启动端口 一、ADB简介 ADB(Android Debug…

CNN-BiLSTM卷积神经网络双向长短期记忆神经网络多变量多步预测,光伏功率预测

代码地址:CNN-BiLSTM卷积神经网络双向长短期记忆神经网络多变量多步预测,光伏功率预测 CNN-BiLSTM卷积神经网络双向长短期记忆神经网络多变量多步预测 一、引言 1.1、研究背景和意义 光伏功率预测在现代电力系统中占有至关重要的地位。随着可再生能源…

三、OSG学习笔记-应用基础

前一章节:二、OSG学习笔记-入门开发-CSDN博客https://blog.csdn.net/weixin_36323170/article/details/145513874 一、 OsgGA: 界面事件处理空间,处理操作各种操作器的最大名字空间; GUIEventHandler: ui 事件操作类 注意:在启…

Django开发入门 – 0.Django基本介绍

Django开发入门 – 0.Django基本介绍 A Brief Introduction to django By JacksonML 1. Django简介 1) 什么是Django? 依据其官网的一段解释: Django is a high-level Python web framework that encourages rapid development and clean, pragmatic design. …

计算机毕业设计PySpark+Hadoop+Hive机票预测 飞机票航班数据分析可视化大屏 航班预测系统 机票爬虫 飞机票推荐系统 大数据毕业设计

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…