图片类网站 怎么做优化无锡网站维护

news/2025/9/23 6:20:18/文章来源:
图片类网站 怎么做优化,无锡网站维护,搬家公司电话,性能优化大师文献阅读#xff1a;Large Language Models as Optimizers 1. 文章简介2. 方法介绍 1. OPRO框架说明2. Demo验证 1. 线性回归问题2. 旅行推销员问题#xff08;TSP问题#xff09; 3. Prompt Optimizer 3. 实验考察 结论 1. 实验设置2. 基础实验结果 1. GSM8K2. BBH3.…文献阅读Large Language Models as Optimizers 1. 文章简介2. 方法介绍 1. OPRO框架说明2. Demo验证 1. 线性回归问题2. 旅行推销员问题TSP问题 3. Prompt Optimizer 3. 实验考察 结论 1. 实验设置2. 基础实验结果 1. GSM8K2. BBH3. 泛化性 3. 消融实验 1. meta-prompt2. 生成prompt的数目3. 起始点4. diversity 4. 过拟合分析5. 与EvoPrompt的对比 4. 总结 思考 文献链接https://arxiv.org/abs/2309.03409 1. 文章简介 这篇文章是Google在23年9月发表的一个工作在这篇文章当中他们提出了一个OPRO的框架在这个框架当中他们使用LLM来模拟模型训练当中的optimizer然后通过迭代的方式不断地预设的NLP问题进行持续迭代从而获得最优的问题回答。 基于这个框架文中首先在两个简单的问题上做了可行性验证 线性回归问题旅行推销员问题TSP问题 这个框架天然地适用于prompt的优化问题因为这同样是一个有明确定义的文本优化问题因此文中使用这个框架同样进行了LLM的prompt优化然后在GSM8K和BBH两个NLP数据集当中获得了SOTA的结果。 以下就是OPRO获得的GSM8K上面的prompt与其他当前使用的主流的prompt的一些对比示例 下面我们来看一下OPRO的具体设计以及文中给出的实验及其效果。 2. 方法介绍 1. OPRO框架说明 OPRO的全称为Optimization by PROmpting具体来说就是使用LLM来作为optimizer来通过另外一个prompt来持续迭代优化输入的文本。 我们首先回想一下模型训练当中的Optimizer是怎么工作的对于一般的training过程就是通过输入的训练数据计算出来一个loss然后计算出梯度之后通过optimizer来反向更新模型当中的参数值。 文中的OPRO框架也基本就是这么个思路给出一段文本然后计算出这段文本的score然后通过一个meta prompt交给LLM来迭代优化这段文本直到计算出来的score达到一个最大值。 我们给出文中的OPRO框架的整体示意图如下 2. Demo验证 下面我们来通过两个具体的case来说明一下OPRO框架的具体运行方式。 1. 线性回归问题 首先文中在线性回归问题当中进行了一下考察具体来说就是用下述公式生成50个点 y k x b ϵ y kx b \epsilon ykxbϵ 然后让OPRO进行 ( k , b ) (k, b) (k,b)的学习。 给出这个问题的meta prompt如下 得到结果如下 可以看到 OPRO框架确实可以来拟合学习 ( k , b ) (k, b) (k,b)的值且GPT4的效果优于其他模型。 2. 旅行推销员问题TSP问题 然后文中还考察TSP问题具体来说就是给定一些点和边求遍历所有点所需经过的边的权重总和最小值。 同样的给出文中对于这个问题的meta prompt如下 对应的实验结果如下 可以看到 OPRO同样可以一定程度上解决掉TSP问题且GPT4模型效果优于其他模型。 3. Prompt Optimizer 有了上面的基础我们来看一下如何使用OPRO框架来优化prompt同样的我们就是给出一个prompt然后通过几个case考察以下这个prompt的效果然后给出一个score然后让LLM重新基于之前的一系列prompt以及其对应的打分score去尝试迭代优化下一个版本的prompt。 给出文中在GSM8K下的prompt迭代优化的meta prompt的示例如下 可以看到整体上这个meta prompt就是包含了几个部分 prompt examples scores 过去给出prompt以及对应的打分结果 problem examples 一些具体的case以及给出prompt然后给出的答案 instruction instruction to optimize prompt 然后就是整体上不断地加入case进行迭代优化直至获得最优的prompt内容即可。 下面我们来看一下文中关于OPRO对prompt优化的实验结果。 3. 实验考察 结论 1. 实验设置 首先我们来看一下文中给出的OPRO优化的prompt的实验设置。 在模型方面文中使用的prompt优化模型和打分模型分别如下 Optimizer Pre-trained PaLM 2-Linstruction-tuned PaLM 2-Ltext-bisongpt-3.5-turbogpt-4 Scorer Pre-trained PaLM 2-Ltext-bison 而实验使用的测试数据方面则主要为 GSM8KBBH 2. 基础实验结果 1. GSM8K 下面我们首先来看一下文中给出的GSM8K上的实验结果如下 可以看到 随着迭代的深入prompt的效果确实可以得到持续地优化。 文中还给出了OPRO优化得到的GSM8K上的prompt示例如下 2. BBH 下面我们来看一下文中在BBH数据集上的实验结果。 可以看到以Let’s think step by step作为baselineOPRO获得的prompt在BBH数据集的各个子任务下基本都有明显的accuracy的提升。 另外文中同样给出了accuracy与迭代的关系示意图 可以看到随着迭代的增加prompt的效果确实是越来越好的。 最后文中同样给出了一些BBH数据集下的OPRO的prompt例子如下 3. 泛化性 除了上述两个数据集下的基础实验之外文中还考察了一下OPRO生成的prompt的泛化能力具体来说就是使用在BBH上优化得到的prompt在其他数据集上测试效果得到结果如下 可以看到 在GSM8K上迭代得到的prompt在Multi-Arith以及AQuA数据集上同样有着优秀的效果。 3. 消融实验 下面我们来看一下文中给出的消融实验的实验结果。 文中主要考察了以下几个部分的消融实验 meta-prompt的设计每一步生成的prompt的数目起始点Diversity per step 下面我们具体来看一下各个部分对结果的影响。 1. meta-prompt 关于具体的meta prompt的设计方面文中又细化到了以下三个部分的影响 输入之前prompt的顺序scoresexampler的作用 得到实验结果如下 可以看到 迭代中prompt历史的给出顺序最好是按照递增顺序给入可以使模型得到最好的学习优化评估时使用buckets越多模型训练的效果往往越好一定的examplar有利于模型的学习但是过多的examplar会导致模型效果下滑可能是由于prompt的混淆。 2. 生成prompt的数目 其次我们考察一下文中对于单次迭代中生成的prompt数目的考察类比到ML当中可以视作learning rate的选择。 给出文中的实验结果如下 可以看到 同样的一定程度上增加生成数目有利于模型的学习但也不是越大越好文中给出的建议值是一轮生成8个prompt。 3. 起始点 然后文中还考察了一下起始点对OPRO效果的影响即最开始的prompt设置对效果的影响。 给出文中的实验结果如下 可以看到 不同的起始点对于OPRO最终的收敛效果并不会有太大的影响。 4. diversity 最后文中还考察一下迭代中diversity对迭代效果的影响。 具体来说就是在生成中temperature参数对实验效果的影响即调整生成过程中的随机性看生成效果的影响得到结果如下 可以看到这里也存在一个trade-off当temperature取1.0时可以获得一个最优的效果。 4. 过拟合分析 此外由于文中将LLM视为一个optimizer进行prompt的优化那么自然也可能会出现过拟合的现象因此文中也对过拟合进行了一下考察得到结果如下 可以看到在文中的两个case当中过拟合现象并不明显但是文中提到确实存在一些case可能会有过拟合现象的发生因此可以的话最好还是设置一下early stop机制比较好。 5. 与EvoPrompt的对比 最后文中还和当前其他的一些类似工作进行了比较EvoPrompt得到结果如下 可以发现 OPRO的效果是明显优于EvoPrompt的。 4. 总结 思考 综上文中给出了一个新的Prompt的调优方式即将LLM视为一个optimizer来通过反向传播迭代的方式来自行优化prompt的方法。 坦率地说还是比较巧妙的感觉后面可以试试或许真能获得一些惊喜也说不定就是迭代成本文中没提可能不太好搞但是即便不好搞直接使用文中给出的这个Take a Deep Breath或许也能获得一些意外的惊喜毕竟按文中的意思他们调出来的prompt是具有一定的泛化能力的。 不过还是得说我是真的不喜欢prompt tuning啊唉不知道是不是只有我一个人这么想……

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/911575.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何用ps做网站平面图嘉兴网站推广

PrimiHub一款由密码学专家团队打造的开源隐私计算平台,专注于分享数据安全、密码学、联邦学习、同态加密等隐私计算领域的技术和内容。 在当前时代,每一次点击、触摸或按键都留下了数字痕迹。但是我们对自己的个人数据几乎没有控制的权限,这让…

网站的建议网投网站怎样建

近期将某些网站换服务器,由于网站数量巨大,加上附件和静态页,文件数量异常多,考虑先打包然后直接传过去。起初尝试用winrar打包,但是发现即使选择”仅储存”速度仍然慢到无法接受,后来想到了tar&#xff0c…

全运网站的建设仿制网站侵权行为

在深圳租房市场,有着许多的“二房东”,房主委托他们将房子租出去,而租客想要租房的话,也是和“二房东”沟通,租房期间有任何问题,找二房东解决。对于房主来说,委托给“二房东”可太省事了&#…

石景山网站开发做图表网站

先说说什么是branch。按照Subversion的说法,一个branch是某个development line(通常是主线也即trunk)的一个拷贝,见下图: branch存在的意义在于,在不干扰trunk的情况下,和trunk并行开发&#xf…

网站的费用多少合适手机个人网站制作教程

Nginx (“engine x”) 是一个高性能的 HTTP 和 反向代理 服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发…

怎么提升搜狗网站排名有免费网站推荐吗

目录 摘要 引言 CPU内存监控 磁盘监控 网络监控 GPU监控 帧率监控 总结 摘要 本文介绍了网络性能监测的重要性,并详细介绍了一款名为克魔助手的应用开发工具,该工具提供了丰富的性能监控功能,包括CPU、内存、磁盘、网络等指标的实时…

杭州网站建设服务wordpress 启用主题

概述 【例】通过按钮来控制一个电梯的状态,一个电梯有开门状态,关门状态,停止状态,运行状态。每一种状态改变,都有可能要根据其他状态来更新处理。例如,如果电梯门现在处于运行时状态,就不能进…

中国做网站的公司广州北京网站建设公司

NetBeans IDE是开发各种应用程序的绝佳选择。 具体来说,我每天都使用它来开发和维护Java EE应用程序。 在过去的几个发行版中,不仅Java EE的生产力提高了,而且NetBeans IDE还减少了开发应用程序的时间……使Java EE和NetBeans成为绝配&#x…

统一门户网站建设规范app制作教程视频全

📢📢📢📣📣📣 哈喽!大家好,我是「奇点」,江湖人称 singularity。刚工作几年,想和大家一同进步🤝🤝 一位上进心十足的【Java ToB端大厂…

建设工程项目报建网站给网站做优化刷活跃要收费吗

一.背景 由于最近客户定制需要将文件挂载类型修改为sdcardfs,由于修改了文件挂载类型,导致了骁龙相机录像后不显示左下角缩略图,也不能点击进入相册中,相册里面也没有录制的视频,故对骁龙相机从点击事件开始进行问题的排查 二.流程介绍 录像的流程大概分为几个阶段:进行…

阿里云购买网站登录服务器租用价格

给定一个字符串 s ,请你找出其中不含有重复字符的 最长子串的长度 示例 1: 输入: s "abcabcbb"输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。 示例 2: 输入: s "bbbbb"输出: 1解释: 因为无重复字…

二手书网站建设报告做设计学什么英语比较好的网站

工地安全帽工作服检测Y8S,采用YOLOV8S训练模型,然后使用OPENCV的DNN调用,彻底拜托PYTORCH依赖,可以在C,PYTHON,ANDROID上跑。附件是C生成的效果测试(只需解压将图片或者视频放入VIDEOS文件夹,文件夹没图片或…

毕业设计代做网站都可信么学校文化建设聚奇网站

号外:教链内参12.27《美元快速下行,黄金再创新高》 日前,微策略(Microstrategy)创始人Michael Saylor发推称,微策略再次出手,以均价约42110刀再次加仓14620枚BTC。截至2023.12.26,微…

时代设计网 新网站惠阳住房与规划建设局网站

一,单片机的概念 单片机(Single-Chip Microcomputer),也被称为单片微控制器,是一种集成电路芯片。它采用超大规模集成电路技术,将具有数据处理能力的中央处理器CPU、随机存储器RAM、只读存储器ROM、多种I/O口和中断系统、定时器/计数器等功能(可能还包括显示驱动电路、…

做电脑网站用什么软件好用吗三台网站seo

1、 多头注意力层 下图展示了Transformer模型中的编码器和解码器。我们可以看到,每个解码器中的多头注意力层都有两个输入:一个来自带掩码的多头注意力层,另一个是编码器输出的特征值。 让我们用R来表示编码器输出的特征值,用M来…

怎样设置网站开发商和承建商的区别

软件架构(业务流程) 基于前端系统提供的硬件通信平台,后端系统以控制执行单元为核心,协同控制通信管理、驱动适配、存储单元等职能单元完成与前端系统的通信数据交互业务,在经历以下业务流程后,完成设备自适应通信业务功能。 1.外部设备通信前端系统 前端系统连接新的…

网站开发挣不挣钱wordpress像微博

作者 | Addo Zhang来源 | 云原生指北GitHub Actions 是一个功能强大、“免费” 的 CI(持续集成)工具。与之前介绍的 Tekton 类似,GitHub Actions 的核心也是 Pipeline as Code 也就是所谓的流水线即代码。二者不同的是,GitHub Act…

用什么建设网站自己怎么做入网站回收书报

要实现的内容&#xff1a;手写签名&#xff0c;协议内容。点击提交后&#xff1a;生成1张图片&#xff0c;有协议内容和签署日期和签署人。 实现的效果图如下&#xff1a; 1、签名页面 <template><view class"index"><u-navbar title"电子协议…

根据链接获取网站名称wordpress后台慢js

书接上回&#xff0c;经过连续两期使用人工神经网络对福彩3D进行预测&#xff0c;经过不断的调参优化&#xff0c;并及时总结规律&#xff0c;感觉还是有一定的信心提高七码的命中概率。 今天&#xff0c;咱们继续来验证&#xff0c;直接上今天的统计结果&#xff0c;首先&…

网站开发语言字典99作文网官网

好久没有上来了。也没有什么好说的。最近在做基于SVG开发的一个实时监测系统&#xff0c;感觉目前SVG性能还不是太好&#xff0c;客户端CPU不经意间就达到80%以上了。向老板提出辞职&#xff0c;不过老板没有同意&#xff0c;最终协商结果再做三个月&#xff0c;直到新人完全接…