李宏毅机器学习（十）GPT-3

news/2025/11/10 8:19:00/文章来源:https://blog.csdn.net/qq_35222729/article/details/119751138

前情提要

论文名称： Language Models are Few-shot learners

但是GPT-3的缺点在于，太过巨大！它有多大呢？原来最大的时候是Turing NLG，有17B，而GPT-3是它的10倍！

对GPT-3的评价：

GPT-3要干什么事呢？它是为了ZERO-shot的learning！所以你现在要训练你的BERT还是需要训练一些资料的！而GPT-3的目的就是说不再需要fine-tune，直接一个模型就解决所有！！！

GPT系列的野望

就是给出你问题，你在读了问题后就知道怎么解答这个试题！

具体一点，该模型主要做了三个事！ GPT-3的目的直接zero-shot，而不需要例子，只需要给出描述就可以了！在论文中就叫做“In-context” learning！！

后面这个是GPT系列的准确率！准确率是提高了，但是这种复杂度的提高值不值得就另当别论了！

应用

CLosed Book QA

就是说不需要读特定的文章就可以回答问题！ GPT-3的效果可以超过经过Fine-tuned的最好性能！

SuperGLUE上

效果也是还行的

Generated new articles

只给出标题来生成文章！横轴是参数的量，纵轴是准确率，就是能够骗过模型的准确率！准确率越低，说明人分辨生成的新闻能力越差！

造句

数学问题

后面都是表现差的例子：

NLI（就是输入两个句子，看这两个句子是不是有矛盾）

Turing Advice Challenge

这是一个比赛，让看模型理解人的语言到什么程度！内容一般是一个人提出自己的生活中的问题，然后让机器人回答怎么解决！

可以看到生成可用建议的准确度还不是很高！只有9%，就算最好40%

图像上的应用： gpt： raster order

就是让图像自己有创造力，自己创造故事！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/476231.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

ipython是免费的吗_IPython技巧

ipython是免费的吗_IPython技巧

IPython是一个python的交互式shell，比python自带的shell好用得多，支持变量自动补全、自动缩进、直接运行shell命令、内置了许多很有用的功能和函数，让我们可以用更高的效率来使用python，同时也是利用Python进行科学计算和交互可视…

阅读更多...

LeetCode 985. 查询后的偶数和

LeetCode 985. 查询后的偶数和

1. 题目给出一个整数数组 A 和一个查询数组 queries。对于第 i 次查询，有 val queries[i][0], index queries[i][1]，我们会把 val 加到 A[index] 上。然后，第 i 次查询的答案是 A 中偶数值的和。 （此处给定的 index quer…

阅读更多...

C#正则表达式判断输入日期格式是否正确

C#正则表达式判断输入日期格式是否正确

/// <summary> /// 是否为日期型字符串 /// </summary> /// <param name"StrSource">日期字符串(2008-05-08)</param> /// <returns></returns> public static bool IsDate(string StrSourc…

阅读更多...

知识图谱论文阅读（八）【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

知识图谱论文阅读（八）【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

学习的博客： 推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现知识图谱特征学习的模型分类汇总知识图谱嵌入(KGE)：方法和应用的综述论文： Knowledge Graph Embedding: A Survey of Approaches and Application…

阅读更多...

thinkphp用来做什么项目_thinkphp第1课：使用thinkphp创建一个项目

thinkphp用来做什么项目_thinkphp第1课：使用thinkphp创建一个项目

一、thinkphp第一课：1、在网站根目录下，建立一个项目名称orange；2、在orange目录下，创建一个入口文件index.php：define(APP_DEBUG,true); //开启调试模式require(../TP/ThinkPHP.php);?>3、下载thinkphp核心包并解…

阅读更多...

LeetCode 1005. K 次取反后最大化的数组和

LeetCode 1005. K 次取反后最大化的数组和

1. 题目给定一个整数数组 A，我们只能用以下方法修改该数组： 我们选择某个个索引 i 并将 A[i] 替换为 -A[i]，然后总共重复这个过程 K 次。（我们可以多次选择同一个索引 i。） 以这种方式修改数组后，返回数…

阅读更多...

Server操作Mxd文件详细讲解

Server操作Mxd文件详细讲解

Server操作Mxd文件详细讲解Server发布地图都是基于Mxd去发布的，这点与IMS使用axl文件差不多。一般来说，发布后mxd尽可能不要修改，或者在通过使用arcMap进行编辑后在重新发布。修改mxd会导致地图服务发生变化，因此，相对…

阅读更多...

知识图谱入门知识（五）【转】秒懂词向量Word2Vec的本质

知识图谱入门知识（五）【转】秒懂词向量Word2Vec的本质

博文： 秒懂词向量Word2Vec的本质什么是Word2Vec？ 词性标注：是动词还是名词，样本（x，y）中，x是词语，y是它们的词性 f（x）->y 中的f（…

阅读更多...

af_netlink_2、netlink简介

af_netlink_2、netlink简介

Netlink 是一种特殊的 socket，它是 Linux 所特有的，类似于 BSD 中的AF_ROUTE 但又远比它的功能强大，目前在最新的 Linux 内核(2.6.14)中使用netlink 进行应用与内核通信的应用很多，包括：路由 daemon(NETLINK_ROUTE)&am…

阅读更多...

LeetCode 819. 最常见的单词

LeetCode 819. 最常见的单词

1. 题目给定一个段落 (paragraph) 和一个禁用单词列表 (banned)。返回出现次数最多，同时不在禁用列表中的单词。题目保证至少有一个词不在禁用列表中，而且答案唯一。禁用列表中的单词用小写字母表示，不含标点符号。段落中的单词不区分…

阅读更多...

Java代码优化方案 J2ME内存优化

Java代码优化方案 J2ME内存优化

从几本书上，N个网站上整理的一些JAVA代码优化方案，最近的项目只有1M内存可用，必须很抠门了~J2ME项目更要注意的避免内存溢出 l 不用的对象释放(置空) 如 ： a不为空时 anew object()//这句代码执行时将有两个对象存在于内存中较…

阅读更多...

was 程序jvm_【保家护行航】WAS知识学习分享

was 程序jvm_【保家护行航】WAS知识学习分享

文/王文平保家护行航：航是护航，是保障人真抓实干，持之以恒，切实做好运维保障本职工作，守护农行生产安全的务本崇实；航是领航，是保障人敬业敏学，精益求精，努力提高运维管理…

阅读更多...

LeetCode 824. 山羊拉丁文

LeetCode 824. 山羊拉丁文

1. 题目给定一个由空格分割单词的句子 S。每个单词只包含大写或小写字母。我们要将句子转换为 “Goat Latin”（一种类似于猪拉丁文 - Pig Latin 的虚构语言）。山羊拉丁文的规则如下： 如果单词以元音开头（a, e, i, o, u&am…

阅读更多...

jQuery学习笔记：事件

jQuery学习笔记：事件

一、页面载入1、ready(fn)当DOM载入就绪可以查询及操纵时绑定一个要执行的函数。这是事件模块中最重要的一个函数，因为它可以极大地提高web应用程序的响应速度。简单地说，这个方法纯粹是对向window.load事件注册事件的替代方法。通过使用这个方法&#…

阅读更多...

torch.nn.Module()

torch.nn.Module()

torch.nn.Module() 如果自己想研究，官方文档它是所有的神经网络的根父类！ 你的神经网络必然要继承！ 模块也可以包含其他模块，允许将它们嵌套在树结构中。所以呢，你可以将子模块指定为常规属性。常规定义子模块的方法…

阅读更多...

dlib 怎么安装vs2017_win10中的dlib库安装过程

dlib 怎么安装vs2017_win10中的dlib库安装过程

之前试过很多方法结果都失败，最后终于发现一个成功的方法，先记一下以防忘记。参考：记一次Win10环境python3.7安装dlib模块趟过的坑由于我是通过Anaconda安装的Python，所以环境与这位博主的有所不同，所以具体情况需要根…

阅读更多...

LeetCode 779. 第K个语法符号（找规律）

LeetCode 779. 第K个语法符号（找规律）

1. 题目在第一行我们写上一个 0。接下来的每一行，将前一行中的0替换为01，1替换为10。给定行数 N 和序数 K，返回第 N 行中第 K个字符。（K从1开始） 例子: 输入: N 1, K 1 输出: 0输入: N 2, K 1 输出: 0输入: …

阅读更多...

ADO.NET、ODP.NET、Linq to SQL、ADO.NET Entity 、NHibernate在Oracle下的性能比较

ADO.NET、ODP.NET、Linq to SQL、ADO.NET Entity 、NHibernate在Oracle下的性能比较

下面我对Oracle数据库在.NET平台下的主要几种数据访问方式进行测试。下面是测试表： CREATE TABLE CUSTOMERS ( "CUSTOMER_ID" NUMBER NOT NULL , "FIRST_NAME" VARCHAR2(255 CHAR) NOT NULL , "LAST_NAME" VARCHAR2(255 CHAR) …

阅读更多...

LeetCode 第 186 场周赛（1060/3107，前34.1%）

LeetCode 第 186 场周赛（1060/3107，前34.1%）

文章目录1. 比赛结果2. 题目1. LeetCode 5392. 分割字符串的最大得分 easy2. LeetCode 5393. 可获得的最大点数 medium3. LeetCode 5394. 对角线遍历 II medium4. LeetCode 5180. 带限制的子序列和 hard1. 比赛结果做出来了 1、2 题，第3题模拟法，超时&…

阅读更多...

torch.nn.embedding()

torch.nn.embedding()

作者：top_小酱油链接：https://www.jianshu.com/p/63e7acc5e890 来源：简书内容：上述是以RNN为基础解析的 torch.nn.Embedding(num_embeddings, embedding_dim, padding_idxNone, max_normNone, norm_type2.0, scale_grad_by_fre…

阅读更多...

最新文章