我读Population Based Training of Neural Networks

原文点此

1.intro

PBT是一种简单的异步优化算法,它能够有效利用固定的计算预算,通过联合优化一组模型和其超参数以最大化性能。

2.methodology

目标是优化模型f ff的参数θ \thetaθ以最大化目标函数Q ^ \hat {\mathcal{Q}}Q^, 实际性能指标Q \mathcal{Q}Q通常有别于Q ^ \hat{\mathcal{Q}}Q^。PBT的目的是在Q \mathcal{Q}Q上联合优化参数θ \thetaθ和超参数h hh, 寻找最优参数集的过程可以表述为:θ ∗ = argmax θ ∈ Θ eval ( θ ) \theta^*=\text{argmax}_{\theta\in\Theta}\text{eval}(\theta)θ=argmaxθΘeval(θ)

具体来说,θ ← step ( θ ∣ h ) \theta\leftarrow \text{step}(\theta|h)θstep(θh),θ ∗ = optimize ( θ ∣ h ) = optimize ( θ ∣ ( h t ) t = 1 T ) = step ( step ( … step ( θ ∣ h 1 ) … ∣ h T − 1 ) ∣ h T ) \theta^*=\text{optimize}(\theta|h)=\text{optimize}(\theta|(h_t)^T_{t=1})=\text{step}(\text{step}(\dots\text{step}(\theta|h_1)\dots|h_{T-1})|h_T)θ=optimize(θh)=optimize(θ(ht)t=1T)=step(step(step(θh1)hT1)hT), 这样的迭代过程计算成本很高且算得慢;受超参数h hh的影响也很大, 需要有关h hh的先验知识。

一个省事而且快的算式是θ ∗ = optimize ( θ ∣ h ∗ ) \theta^*=\text{optimize}(\theta|h^*)θ=optimize(θh),h ∗ = argmax h ∈ H T eval ( optimize ( θ ∣ H ) ) h^*=\text{argmax}_{h\in\mathcal{H}^T}\text{eval}(\text{optimize}(\theta|H))h=argmaxhHTeval(optimize(θH))

用这个算式训练N NN个模型{ θ i } i = 1 N \{\theta^i\}^N_{i=1}{θi}i=1N组成种群P \mathcal{P}P, 每个个体用不同的超参数{ h i } i = 1 N \{h^i\}^N_{i=1}{hi}i=1N优化, 目标是找到整个种群中的最优模型。

instead of采用并行搜索(每个个体各自独立地找最优解), PBT使用部分已有的解进行额外的meta-optimization, 即根据整个种群的表现调整超参数h hh和权重θ \thetaθ。实现方式:

(1) exploit, 根据种群的表现决定worker是否放弃当前解并专注于更promising的

(2) explore, 在给定当前解和超参数的条件下提出新解以更好地搜索解空间

种群中的每个个体并行训练, 当其被认为准备就绪(如优化步数达标或达到特定性能阈值)时, 其权重和超参数由exploit和explore更新(比如exploit把当前权重替换成种群中表现最优者的权重, explore用噪声随机扰动超参数)。在exploit和explore之后, 继续迭代更新。重复这样的过程直到模型收敛。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1179180.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

完整教程:腾讯云渠道商:腾讯云轻量服务器和CVM有什么差异?

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

机器学习周报三十一

文章目录摘要Abstract1 TripleFDS2 Flux-Text总结摘要 本周看了两篇关于场景文本编辑的论文,达到了最新的SoTA的论文,学习到了数据集构建和损失函数构造对模型性能提升至关重要。 Abstract This week, I read two papers on scene text editing, both…

分布式理论的认知重构:CAP 与 BASE 的真相、边界与实践逻辑 - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Python中的JSON处理(标准库)

一、什么是JSON? JSON(JavaScript Object Notation)是一种基于文本的开放标准,用于表示结构化数据。它采用键值对的形式组织数据,支持以下基本数据类型: 字符串(string)数字&#…

Multi-Content GAN for Few-Shot Font Style Transfer(用于少样本字体风格迁移的多内容GAN)

预训练和正式训练,预选练是正式训练的第一阶段但二者损失不同注意:本论文是对字母的风格迁移在未来对汉字进行风格迁移时预训练的笔画划分(或常用字形)可能存在挑战预训练:通过对抗网络对26个字母的平均字形进行学习。…

主流 AI IDE 之一的 Claude Code 介绍

Claude Code 是 Anthropic(Claude AI 的开发公司)于 2025 年推出的代理式(agentic)编码工具,目前被公认为终端里最强的 AI 编程助手之一。它直接运行在你的终端(Terminal / PowerShell / cmd)&a…

两两交换链表中的节点-day04

两两交换链表中的节点 题目链接:https://leetcode.cn/problems/swap-nodes-in-pairs/solutions/444474/liang-liang-jiao-huan-lian-biao-zhong-de-jie-di-91/ 思路:新建头结点,保存第1结点,第2个结点,第3个结点的…

Mars-Admin 基于Spring Boot 3 + Vue 3 + UniApp的企业级管理系统

Mars-Admin 企业级管理系统 🔥 开箱即用的企业级全栈管理系统 🔥 一套基于 Spring Boot 3 Vue 3 UniApp 的现代化企业管理平台,采用前后端分离架构,提供完整的权限管理、用户管理、移动端支持等功能,是中小企业快速…

2026必备!继续教育TOP9AI论文写作软件测评与推荐

2026必备!继续教育TOP9AI论文写作软件测评与推荐 2026年继续教育AI论文写作工具测评:精准筛选,高效助力学术创作 随着人工智能技术的不断进步,AI论文写作工具在继续教育领域的应用愈发广泛。对于需要撰写论文、发表研究成果的学员…

贵金属回收攻略:本地高价回收不踩坑,今日金价实时更新 - 非研科技

贵金属回收避坑指南:这 3 个套路一定要避开 1. 警惕“高价吸引,低价结算” 部分非正规商家会在网上标注“黄金回收 450 元/克”的超高价,吸引客户到店后,再以“纯度不足”“有磨损”“要扣手续费”等理由压低价格,…

MFC 对话框Alt+F4退出程序实例

MFC 对话框应用程序按AltF4退出程序实现方法 重写OnSysCommand函数 1.添加消息处理函数 在对话框类的头文件(.h)中添加: protected:virtual void OnSysCommand(UINT nID, LPARAM lParam);DECLARE_MESSAGE_MAP()2.在实现文件(.cpp&…

SonarQube-开源的持续代码质量检测平台

一、SonarQube 核心定义 SonarQube 是一款开源的持续代码质量检测平台,由 SonarSource 公司开发维护。它通过自动化扫描,从代码质量、安全漏洞、可维护性、合规性四大维度对代码进行全方位审查,帮助团队在软件开发生…

AI 模型输出学术内容准确率飙升97%!我只用了这个简单提示词技巧

经常用AI工具辅助学术科研与写作的同仁,可能已经对提示词工程掌握的程度比较深了。为了让模型输出的内容更准确一点,提示词工程师也会研究各种复杂的提示词技巧,比如设定角色、思维链、多样本学习等等。 但最近七哥发现还有一种能提升模型输出内容准确率的方法,该方法出自…

读《大明王朝1566》有感

《大明王朝1566》从一件改稻为桑的事说起,牵扯出大明各个阶层之间的利益斗争。嘉靖年间,一年一度的国家财政会议召开,六部主管向皇上汇报去年的财政支出情况,并上报本年度的财政支出计划。去年财政收支情况依然不容…

亲测好用!10款一键生成论文工具测评,本科生毕业论文必备

亲测好用!10款一键生成论文工具测评,本科生毕业论文必备 学术写作工具测评:为何需要这份2026年榜单? 随着人工智能技术的不断进步,越来越多的学术写作工具被推向市场,帮助学生和研究人员提升论文撰写效率。…

收藏这篇就够了!AI大模型学习路线全解析:从数学基础到实战应用

文章提供了AI大模型从零基础到进阶的完整学习路线,包括数学与编程基础、机器学习入门、深度学习深入、大模型探索、进阶应用及社区资源。详细列出了各阶段的理论学习资源(书籍、课程)和实践项目,并提供了大量学习资源包、视频教程…

2026本科必备9个降AI率工具测评榜单

2026本科必备9个降AI率工具测评榜单 降AI率工具测评:为何你需要一份专业榜单? 在2026年的学术环境中,论文的AI率检测已经成为毕业和科研的关键门槛。许多学生在提交前才发现自己的论文AI率超标,甚至被直接打回修改,严重…

读人本智能产品设计6原则05表达(下)

读人本智能产品设计6原则05表达(下)1. 物体的表达方式 1.1. 随着产品变得更具有互动性和内容驱动性,例如亚马逊的Alexa或苹果的Siri,语音交互成为多模态系统的必要组成部分 1.2. 语音要素必须与灯光、非语音提示、动…

亲测好用10个一键生成论文工具,研究生高效写作必备!

亲测好用10个一键生成论文工具,研究生高效写作必备! AI 工具如何助力论文写作?这些功能你不可不知 随着人工智能技术的不断发展,越来越多的研究生开始借助 AI 工具来提升论文写作效率。在当前学术研究中,AI 降重工具不…

AI产品经理必修课:拆解大模型落地的关键能力与实战技巧

文章从四大维度系统阐述了AI产品经理的必备能力:两大定律(AI能力定律和AI提效定律)强调判断力的重要性;五要素(业务人员参与、AI能力认知、编程能力、小处着手、老板支持)确保大模型成功落地;技…