生产环境下部署微调的10条戒律

关于大模型微调部署,openPile,Kyle Corbitt的《Ten Commandments to Deploy Fine-Tuned Models inProd》:https://docs.google.com/presentation/d/1lRrTEDOw7160sU_-PL5bONLOPq_7E8alewvcJ01BCE/edit#slide=id.g2721fb6713e_0_44

1、第一戒律:不可微调,直接使用提示语(prompting),选择性地使用少量示例或检索增强生成(RAG):

2、第二戒律:应当编写提示语,并创建一个基准,证明任务是可行的。如果提示语有效,微调有90%的可能性会改善模型表现:如果无效,微调只有25%的可能性有效

3、第三戒律:应当审查你的数据,仔细检查和清洗数据,以确保数据的准确性和一致性

4、第四戒律:应当使用真实数据,使用真实的业务数据进行模型训练和测试,并确保数据集在平均水平上是正确的,即使有些错误数据也是可以接受的

5、第五戒律:应当保留一个测试集,并保留一部分数据作为测试集,用于评估模型的实际性能。

6、第六戒律:应当选择合适的模型,根据具体任务选择最适合的模型,以实现最佳性能和资源效率

7、第七戒律:应当编写快速评估,编写快速评估工具,用于在短时间内评估模型性能

8、第八戒律:亦应当编写慢速评估,编写详细的评估工具,以全面测试模型的各方面性能

9、第九戒律:不可“发射后不管”,部署模型后,持续监控和改进模型,避免一次性部署后不再维护

10、第十戒律:不可过于严肃对待这些戒律。保持灵活性,根据实际情况调整和优化模型开发和部署流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/854803.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CDN内容加速原理?

1.用户向浏览器提供要访问的域名 2.浏览器从本地host文件中解析域名,如何host文件没有做任何配置,则浏览器调用域名解析库对域名进行解析,析函数库一般得到的是该域名对应的CNAME记录,从中获取真正的IP地址,此过程中,根据地理位置信息解析对应的IP地址,…

微射流均质机可用于纳米制剂和材料制备 我国市场需求空间广阔

微射流均质机可用于纳米制剂和材料制备 我国市场需求空间广阔 微射流均质机是一种纳米级乳化及分散的处理设备,工作原理是在加压状态下,高压流体经过微细孔径喷嘴后,形成高速微射流,从而产生强大的涡流和切应力,将颗粒…

ESP8266-01S烧录MQTT固件ERROR问题

今天在烧录ESP8266固件时遇到了这个问题,技术客服给了个有效的解决方案。 选择固件的时候可以先确认自己的模块是ESP8266或者EPS8285主控,这在选择DOWNLOADTOOL时还不一样。 然后波特率是115200,我在这个地方选错成1152000。 当然上面都不…

PHP 日期处理完全指南

PHP 日期处理完全指南 引言 在PHP开发中,日期和时间处理是一个常见且重要的任务。PHP提供了丰富的内置函数来处理日期和时间,包括日期的格式化、计算、解析等。本文将详细介绍PHP中日期处理的相关知识,帮助读者全面理解和掌握这一技能。 1. PHP日期函数基础 1.1 date()函…

【ARM Cache 及 MMU 系列文章 1.4 -- 如何判断 L3 Cache 是否实现?】

请阅读【ARM Cache 及 MMU/MPU 系列文章专栏导读】 及【嵌入式开发学习必备专栏】 文章目录 Cluster Configuration Register代码实现什么是Single-Threaded Core?什么是PE(Processor Execution units)?Single-Threaded Core与PE的关系对比多线程(Multithreading)Cluster…

LeetCode-day15-522. 最长特殊序列 II

LeetCode-day15-522. 最长特殊序列 II 题目描述示例示例1:示例2: 思路代码 题目描述 给定字符串列表 strs ,返回其中 最长的特殊序列 的长度。如果最长特殊序列不存在,返回 -1 。 特殊序列 定义如下:该序列为某字符串…

用java 做一个模拟的菜单及对话框测试

首先我们要创建一个Menu 的java类 然后接着给上代码 代码如下: package test01;import javax.swing.*;public class Menu extends JFrame{JMenuBar jmb;JMenu jmfile,jmedit,jmhelp;JMenuItem jminew,jmiopen,jmisave,jmisaveas,jmiexit,jmicut,jmicopy,jmipast…

gridview自带编辑功能如何判断用户修改的值的合法性

在使用GridView的编辑功能更新值时,确保输入的值合法性是十分重要的。为了实现这一点,你可以在GridView的RowUpdating事件中加入代码来检查用户输入的值。如果发现输入的值不合法,你可以取消更新操作并向用户显示错误消息。下面是如何实现的步…

小区噪音监测管理系统设计

一、引言 随着城市化进程的加快,小区居民对于居住环境的要求日益提高。其中,噪音污染已成为影响居民生活质量的重要因素。因此,设计一套小区噪音监测管理系统,对于提升居民的生活品质和小区管理效率具有重要意义。本文将详细阐述…

一五二、go缓存GCache和Go-Redis

GCache 和 Go-Redis 都是 Go 语言中常用的缓存解决方案,但它们适用于不同的场景。以下是它们各自的特点和适用场景。 GCache GCache 是一个内存缓存库,主要用于在单个应用程序实例中缓存数据。它具有以下特点: 本地缓存:缓存数…

React useReducer 使用及 useImmerReducer

useReducer 实际上是以数组上的 reduce() 方法命名的。 传递给 reduce 的函数被称为 “reducer”。它接受 目前的结果 和 当前的值,然后返回 下一个结果。 React 中的 reducer 和这个是一样的:它们都接受 目前的状态 和 action ,然后返回 下一…

数据资产驱动的智能化决策:深度剖析数据资产在提升企业决策效率与准确性中的关键作用

在数字化、信息化日益普及的今天,数据已经成为企业发展的重要资产。数据资产不仅能够帮助企业更好地了解市场需求、优化业务流程,还能在决策过程中提供科学、精准的支持。本文将深入剖析数据资产在提升企业决策效率与准确性中的关键作用,探讨…

【镜像制作】docker命令的参数解释及用法

文章目录 简介一.docker参数详解1.1 用法:docker[OPTIONS]COMMAND1.2 管理命令:1.3 Swarm命令:1.4 命令:1.5全局选项: 二.容器操作相关2.1.查看容器列表2.2.启动容器2.3.停止容器2.4.强制停止容器2.5.重启容器2.6.查看…

电脑文件防泄密软件——天锐绿盾 - 中科数安—— 哪个好

在选择电脑文件防泄密软件时,天锐绿盾和中科数安都是值得考虑的选项。以下是对这两款软件的详细比较: www.drhchina.com PC地址: https://isite.baidu.com/site/wjz012xr/2eae091d-1b97-4276-90bc-6757c5dfedee 功能全面性: 天锐…

Java内存模型(JMM)详解

文章目录 1、Java内存模型2、JMM的核心概念1)主内存与工作内存2)内存可见性3)JMM的三大特性:原子性、可见性、有序性。 3、JMM中的八种操作4、Happens-before 规则5、样例: 1、Java内存模型 Java内存模型(…

模型裁切中的kml导入失败,不提示导入失败的话看不见kml范围线是怎么回事?

答:kml需要面格式,可以在dasview面标注绘制导出 DasViewer是由大势智慧自主研发的免费的实景三维模型浏览器,采用多细节层次模型逐步自适应加载技术,让用户在极低的电脑配置下,也能流畅的加载较大规模实景三维模型,提供方便快捷的数据浏览操作。 DasVi…

tRNAscan-SE-2.0:安装尝试

2020.11.12丨tRNAscan-SE-2.0最新安装流程_trnascan se v2.0.7-CSDN博客 参照大佬的尝试一下 在下面网站看最新的安装包 tRNAscan-SE Search Server tRNAscan-SE-2.0.12.tar.gz 开始安装 tar -xvzf trnascan-se-2.0.12.tar.gz cd tRNAscan-SE-2.0 ./configure make sudo …

系统安全(补充)

基于行的自主访问控制的方法有能力表、前缀表、口令基于列的自主访问控制的方法有访问控制表、保护位口令是当前大多数网络实施访问控制进行身份鉴别的重要依据,因此,口令管理尤为重要,一般遵守一般遵守以下原则:1口令选择应至少在…

开源的数据资产管理平台

开源的数据资产管理平台通过提供集中化的存储、管理和分析功能,帮助企业更好地利用其数据资源。以下是几个广泛使用的开源数据资产管理平台: 1. Apache Atlas 优点: 全面的数据治理: 提供数据分类、协作、治理和探索的框架,可以…

一种可以识别局部单调的系数

记录一种可以识别局部单调的系数 pearson和kendall等系数再识别单调的时候,更多是关注整体情况,很多时候,变量和因变量之间非简单的单调关系,局部单调ξ识别 假设我们正在测量变量X和Y之间的关系。传统的相关性测量方法通常假定…