算法人生(11):从“梯度提升树(GBDT)”看“2/8时间管理法”

梯度提升树(Gradient Boosting Decision Trees, GBDT)是一种高效的机器学习算法,它通过迭代构建多个决策树并综合它们的预测结果来提高预测的准确率。GBDT的核心思想在于,每一棵树都尝试对前一棵树留下的预测残差进行修正,在构建过程中,每个特征通过分裂节点的方式对模型性能的提升做出贡献,由此可以评估每个特征的重要性,步骤如下:

  1. 训练模型:使用训练数据集训练一个梯度提升树模型,模型构建过程中会生成多棵决策树。使用GBM或其他支持特征重要性评估的模型进行训练,得到模型对训练数据集的拟合结果。

  2. 计算特征重要性:从训练好的模型中提取各个特征的重要性得分。特征的重要性通过计算其在所有树中作为分裂节点时对损失函数减少的贡献来衡量。每个特征每次被选作分裂节点时,都会导致模型对训练数据拟合程度的提高,即损失函数的减小。损失函数减小的程度越大,表明该特征对模型性能的提升作用越大。

  3. 排序特征:经过多棵树的构建后,汇总每个特征在整个模型中的重要性得分,即每个特征作为作为分裂节点时对损失函数减少的总和,累加起来得到该特征在整个GBDT模型中的总重要性得分。根据特征重要性得分对特征进行降序排序。

  4. 特征选择:通过可视化图表展示特征的重要性,比如直方图、条形图等,以便直观地看到哪些特征对模型预测性能的贡献最大。按帕累托法则的思路,即少量特征贡献了大部分模型性能,那么就可以依据这些重要性得分,优先选择排名靠前的特征进行模型训练(根据具体情况调整比例)。

  5. 验证和优化:使用选择后的特征子集重新训练模型,并通过交叉验证或其他评估方法验证模型性能,还可以通过逐步增加或减少特征的方式来微调特征选择的数量,以达到最优模型性能。

此外,其他特征选择方法如基于L1正则化的线性模型(如Lasso)在压缩稀疏解的过程中也会体现类似帕累托法则的现象,即大量的特征被裁剪掉,而留下对模型预测至关重要的少数特征。

由以上的介绍,我们可以看出,GBDT(梯度提升树)中一个很重要的思想是“提取重要特征”,把模型训练的精力放在了“对结果产出有重大影响的特征上”,而不是“全面照顾所有特征”,这样不仅可以节省了训练模型的精力,也可以有效地减少了模型的复杂度,提高了模型的可解释性。这个思路就是遵循了一个商业法则:2/8法则。

2/8法则,也被称为帕累托法则、80/20法则或关键少数法则,是指在许多情况下,80%的结果源于20%的原因,或者说,20%的努力会产生80%的产出。这个法则普遍存在于社会、经济、管理等多个领域。然而,不止是在商业思维上可以应用2/8法则的思路,在个人思维上也同样适用,比如“2/8时间管理法”。

在时间管理中应用2/8法则,可以遵循以下步骤:

  1. 列出任务清单:首先,需要将个人目前的所有任务列出来,要确保全面、没有遗漏。此外,还要列出当前个人最需要完成的关键目标是什么。

  2. 评估任务的重要性:对每个任务进行评估,按照其对完成关键目标的重要性进行排序。这一步非常关键,因为它决定了哪些任务是真正重要的,是需要优先处理的。

  3. 识别关键任务:识别出任务清单中关键的20%的任务,这些任务往往是对关键目标影响最大的任务。此时要学会一定的“断舍离”,也就是不能凭直觉地想“哪些任务对目标影响最大”,最好有可量化的数据来辅助自己识别。

    比如当前的关键目标是“短期迅速提升英语口语能力”,那可以分类的任务有:背单词,上网课,跟读英语新闻等,那这时候你就要根据自己当前的状态,单词的词汇量基础,网课的具体内容等来具体分析,要在短期内提升英语口语水平最好的方式是什么。自己可以每一样都尝试并记录下对“口语提升”的影响度,然后再根据自身当前的状态和目标来定“要全力主攻哪一项来才能最快提升自己的英语口语”。笔者建议每次只定一个主要任务,等到这个任务完成再选次重要的任务(根据事情的性质,可自行调整,主要是尽可能“聚焦”,有助于提效!)

  4. 分配时间块:将每天的工作时间分成若干个时间块,将这20%的关键任务放在首位(比例随情况可调),优先分配时间和精力去处理,确保这些任务得以高质量完成(尽量用一个大块的时间段来做重要的任务,长时间才更有利于进入“心流”,“进入心流”更有利完成效率的提升)。如果有多个关键任务需要处理,可以根据紧急性和重要性进行优先级的设置。对于剩余的80%的任务(比例可调),合理分配时间,尽量避免在琐碎的事情上浪费过多时间,要优先确保关键任务得到优先处理。

  5. 消除干扰:在处理关键任务时,应尽量避免干扰。可以通过将手机静音、关闭社交媒体等方式,创造一个专注的工作环境。

    下面我们用程序员的角色为例子来举例如何应用“2/8时间管理法”:

  • 关键任务分析和识别:面对众多的编程任务、bug修复、代码审查、技术文档撰写等工作时,应用2/8法则意味着要找出那些对当前项目整体进度和产品质量影响最大的20%的工作内容。

    例如当前的主要目标是新产品尽快上线,让用户来使用验证产品的设想,那这时就可以一起讨论“让用户能尽快用起来的关键步骤是什么”,“完成这一关键步骤,必须有什么”,也就是这时候要一起讨论“省精力”,本着“抠”的原则,仔细讨论业务场景,尽量“抠着用精力”,让团队的“精力”花在最关键的步骤上。

    当然这个关键任务的识别可能主要靠产品经理,但是在具体的技术实现方面,如果也能多“抠一抠”,多了解些具体的业务场景和背后的原因,有助于在需求讨论阶段或代码实现阶段,发现哪里可以更“省精力”。

    产品设想需要市场、用户的验证,需要快速试错,每一个当下不必要的任务都会耗费研发团队的精力,尽可能地降低试错成本,识别关键任务以及关键任务的实现方式,才是让研发团队从疲劳开发中解脱出来的关键。这需要整个研发团队的一起努力,从各自专业的角度多思考才能避免。

  • 时间分配:将一天中精力最为旺盛的80%时间(比例可调,此处只是想说明主要的时间精力)投入到最重要的20%的任务上,确保这些关键任务能够高效、准确地完成。同时,也要关注工作中频繁出问题的环节,针对性地优化和改进,可以极大提高整体的工作效率。

  • 资源利用:识别出工作中最常用的工具、资源和技能,对其加以精炼和提升,因为它们可能带来了大部分的工作成果。现在AIGC类的产品很多,每家都各有优势,可以根据自己当前任务所需,多尝试每家的产品,看如何搭配使用,让自己从繁琐的工作琐事或自己不擅长但AI擅长的事情中解脱出来,从而让自己有更多精力集中在关键任务的处理上。

    讲到2/8法则,最近有一部杨紫的剧《承欢记》正在播出,其中有一个桥段是杨紫管理的公寓中,有一户很难伺候的住客经常让杨紫去做些琐事,杨紫之所以愿意去做,也是因为只有服务好了这个住客,才可以让住客对公寓的服务质量改观,进而把物业费交了。这时,男主就提醒杨紫“要关注在这个住户最在意的事情上,不要让自己整天被遛狗、买奶茶之类的事情给折腾没有了精力”。生活中所有的道理都是相通的,算法也好,工作也好,人与人的相处等,都可以运用“2/8法则”来思考。

    《楞严经》中有详细介绍佛陀众弟子如何修"六根"来破“六尘”,“眼、耳、鼻、舌、身、意 ”根根难修,根根缠绕,互为影响,千丝万缕让人难以下手。佛陀的众弟子则是根据自己的“实践”,各自选了“一根”适合自己的来修,然后“一根通,六根皆通了”。笔者想来,也是这点跟“2/8法则”很类似,人的生命和精力都有限,凡事“抓大放小”,时间才能“多”一些,精力更聚焦,才能更好的解决问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/827665.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenWRT磁盘扩容(PVE虚拟机方案)

官方扩容指导文档 PVE给虚拟机磁盘扩容 给虚拟机磁盘扩容,选中OpenWRT的硬盘,随后选择调整大小 输入增量大小,即增加多少磁盘空间给硬盘。这里我选择增加4G 进入OpenWRT控制台界面安装一些linux常用查看磁盘的工具(也可以通过网…

EasyPoi实现简单的Excel导出、导入

EasyPoi实现Excel导出、导入 下面这种方式不需要模板&#xff0c;更加方便但是不能进行复杂的导出 一、引入依赖 <dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-base</artifactId><version>4.4.0</version><…

2024商业地产五一劳动节健康大会朋克养生市集活动策划方案

2024商业地产五一劳动节健康大会朋克养生市集&#xff08;带薪健康 快乐打工主题&#xff09;活动策划方案 活动策划信息&#xff1a; 方案页码&#xff1a;53页 文件格式&#xff1a;PPT 方案简介&#xff1a; 打工不养生 赚钱养医生 期待已久的五一假期&#xff0c; …

mysql download 2024

好久没在官网下载 mysql server 安装包。今天想下载发现&#xff1a; 我访问mysql官网的速度好慢啊。mysql server 的下载页面在哪里啊&#xff0c;一下两下找不到。 最后&#xff0c;慢慢悠悠终于找到了下载页面&#xff0c;如下&#xff1a; https://dev.mysql.com/downlo…

什么是全局特征,什么又是局部特征

全局特征和局部特征是用来描述数据中信息的两种不同方式&#xff0c;特别是在图像处理、模式识别和机器学习领域中经常被提到。它们有助于理解和分析数据的不同层面&#xff1a; 全局特征&#xff08;Global Features&#xff09; 全局特征描述了整个数据集的整体属性。在图像…

windows和linux服务器等保测评加固方法

服务器加固是通过各种方法增强服务器安全性的过程。保护操作系统免受黑客、破解者和攻击者的侵害。网络安全防护的目标是保密性、完整性、可用性、可控制性、不可否认性。 一、window服务器等保加固 以win2012和win2008 为例&#xff1a; &#xff08;win2008&#xff09; …

【UML建模】用例图

1 参与者 参与者的概念&#xff1a; 指系统以外的、需要使用系统或与系统交互的外部实体 可以分为&#xff1a;人、外部设备、外部系统 参与者的图形符号&#xff1a; 例 3.1 在一个银行业务系统中&#xff0c;可能会有以下参与者 客户 &#xff1a;在银行业务系统中办理…

React【Day2】

React表单控制 受控绑定 概念&#xff1a;使用React组件的状态&#xff08;useState&#xff09;控制表单的状态 双向绑定 MVVM 报错记录&#xff1a; 错误代码&#xff1a; import { useState } from "react";const App () > {const [value, setValue] useS…

TLV61048非同步升压BOOST转换器输入电压2.6-5.5V输出电流4A输出电压最高15V

推荐原因&#xff1a; 输入电压较低&#xff0c;输出电流可达3.5A SOT23-6封装 批量价格约0.70元 TLV61048引脚 TLV61048引脚功能 7 详细说明 7.1 概述 TLV61048是一款非同步升压转换器&#xff0c;支持高达 15 V 的输出电压和输入范围从 2.61 V 到 5.5 V。该TLV61048集成了…

LlamaIndex 加 Ollama 实现 Agent

AI Agent 是 AIGC 落地实现的场景之一&#xff0c;与 RAG 不同&#xff0c;RAG 是对数据的扩充&#xff0c;是模型可以学习到新数据或者本地私有数据。AI Agent 是自己推理&#xff0c;自己做&#xff0c;例如你对 AI Agent 说我要知道今天上海的天气怎么样&#xff0c;由于 AI…

serverLess

第一步 安装依赖 npm install serverless-devs/s g 第二步 配置秘钥&#xff1a; 第三步 执行终端 执行命令 s config add 选择 alibaba cloud &#xff08;alibaba&#xff09; 把对应的ID secret填写&#xff0c;第三个别名可以随便写&#xff1a; serverLess 查看是…

Kettle的安装及简单使用

Kettle的安装及简单使用 文章目录 Kettle的安装及简单使用一、kettle概述二、kettle安装部署和使用Windows下安装&#xff08; 1 &#xff09;概述 案例 1 &#xff1a;MySQL to MySQL主界面&#xff1a;**在kettle中新建转换--->输入--->表输入-->表输入双击**建立连…

js进行数据移除性能比较(splice,map)

当使用 splice() 方法处理大量数据时&#xff0c;确实会遇到性能问题&#xff0c;因为它涉及到移动数组中的元素&#xff0c;导致操作的时间复杂度为 O(n)。对于大量数据&#xff0c;频繁的插入和删除可能会导致性能下降。 1、设置数组数据为10000&#xff0c;使用splice移除数…

软件项目经理需要具备这 11 个能力

当前软件开发技术更新换代越来越快&#xff0c;各种项目实施管理思想也日新月异&#xff0c;作为一个软件项目经理&#xff0c;需要具备这 11 种能力&#xff1a; 1. 项目管理能力 了解项目管理的基本原则和方法&#xff0c;包括制定项目计划、资源分配、风险管理、问题解决和…

Python练习03

题目 解题思路 Demo58 通过字符串切片来进行反转操作 def _reverse():"""这是一个反转整数的函数"""num input("请输入想要反转的整数")print(num[::-1]) 运行结果 Demo61 首先制作一个判断边长的函数&#xff0c;通过三角形两边…

4.23学习总结

一.NIO(一) (一).简介: NIO 是 Java SE 1.4 引入的一组新的 I/O 相关的 API&#xff0c;它提供了非阻塞式 I/O、选择器、通道、缓冲区等新的概念和机制。相比与传统的 I/O 多出的 N 不是单纯的 New&#xff0c;更多的是代表了 Non-blocking 非阻塞&#xff0c;NIO具有更高的并…

【Linux高性能服务器编程】两种高性能并发模式剖析——半同步/半异步模式

hello &#xff01;大家好呀&#xff01; 欢迎大家来到我的Linux高性能服务器编程系列之两种高性能并发模式介绍&#xff0c;在这篇文章中&#xff0c;你将会学习到高效的创建自己的高性能服务器&#xff0c;并且我会给出源码进行剖析&#xff0c;以及手绘UML图来帮助大家来理解…

《HCIP-openEuler实验指导手册》1.4 Apache MPM工作模式调整

MPM介绍 二、配置步骤 查看MPM当前工作模式 方法一&#xff1a; httpd -M | grep mpm方法二&#xff1a; 浏览器访问&#xff1a;http://IP:端口/server-status 方法三&#xff1a; cat /etc/httpd/conf.modules.d/00-mpm.conf查看 LoadModule mpm_event_module modules/mo…

Iterator 迭代器

意图 提供一个方法顺序访问一个聚合对象中的各个元素&#xff0c;且不需要暴漏该对象的内部表示。 结构 Iterator&#xff08;迭代器&#xff09;定义访问和遍历元素的接口。ConcreteIterator&#xff08;具体迭代器&#xff09;实现迭代器接口&#xff1b;对该聚合遍历是跟踪…

DSSM 模型技术介绍

转自&#xff1a;git 本文属于新闻推荐实战-召回阶段-DSSM召回模型。区别于策略召回&#xff0c;基于向量召回也是目前工业界常用的一种召回方法。这里我们将介绍一个比较经典的召回模型DSSM&#xff0c;希望读者可以快速掌握模型原理以及细节&#xff0c;同时可以了解具体的实…