解析:什么是生成式AI?与其他类型的AI有何不同?

原创 | 文 BFT机器人 

图片

快速浏览一下头条新闻,你会发现生成式AI似乎无处不在。事实上,一些新闻标题甚至可能是通过生成式AI编写的,例如OpenAI旗下的ChatGPT,这个聊天机器人已经展现出了生成看起来像人类所写文本的惊人能力。

当人们提到“生成式人工智能”时,他们指的到底是什么?

在生成式AI热潮兴起之前,当人们谈论人工智能时,通常是指那些可以基于数据进行预测的机器学习模型。例如,通过数百万个示例对此类模型进行训练,以预测某种X射线是否显示出肿瘤的迹象,或者某个借款人是否可能拖欠贷款。

图片

生成式 AI 可以被认为是一种另类的机器学习模型,经过训练后可以创建新数据,而不是对特定数据集进行预测。生成式AI系统指的是用来生成类似于其训练数据的更多对象的系统。“当涉及到生成式AI和其他类型的AI背后的技术时,它们之间的界限可能有点模糊。通常相同的算法可以用于两者,“麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola表示。

尽管 ChatGPT 及其同类产品的发布引起了广泛的关注和讨论,但该技术本身并不是全新的。这些强大的机器学习模型是基于超过50年的研究和计算技术进步。

01

复杂性的提升

生成式AI的一个早期实例被称为马尔可夫链。该技术以俄罗斯数学家安德烈·马尔科夫(Andrey Markov)的名字命名,他在1906年引入了这种统计方法来模拟随机过程的行为。在机器学习中,马尔可夫模型长期被用于如电子邮件程序中预测下一个单词的自动填充任务。

图片

在文本预测中,马尔可夫模型能够通过分析前一个或几个单词来生成句子中的下一个单词。但这些模型由于只能回顾有限的信息,因此生成的文本往往不够合理,MIT电气工程与计算机科学Thomas Siebel教授、CSAIL和数据、系统与社会研究所(IDSS)成员Tommi Jaakkola表示。“我们在过去十年之前就开始进行生成式操作,但主要区别在于我们现在能生成的对象的复杂性以及训练这些模型的规模。”他补充道。

在几年前,研究人员倾向于寻找一种能够充分利用特定数据集的机器学习算法。但现在这种焦点已经略有转移,许多研究人员开始利用更大规模的数据集,可能包括数亿甚至数十亿数据点,来训练能够取得卓越成果的模型。

ChatGPT及其类似系统的基础模型在工作方式上与马尔可夫模型大致相同。区别在于,ChatGPT规模更大、更复杂,有数十亿个参数,并且它已经接受了互联网上可公开获取的大量数据的训练。在这个庞大的文本资料库中,单词和句子以具有某些依赖关系的顺序出现,这种重复性有助于模型了解如何将文本切割为具有一定可预测性的统计块。模型通过学习这些文本块的模式,并利用此知识来预测接下来可能出现的内容。

图片

02

更强大的架构

庞大的数据集是推动生成式AI热潮的催化剂之一,重要的研究进展也促成了更为复杂的深度学习架构的发展。

2014年,蒙特利尔大学的研究人员提出了一种名为生成对抗网络(GAN)的机器学习架构。GAN使用两个协同工作的模型:一个学习生成目标输出(如图像),另一个学习从生成器的输出中区分真实数据。生成器试图欺骗鉴别器,并在此过程中学习制作更逼真的输出。图像生成器StyleGAN就是基于此类模型的实例。

此后一年,斯坦福大学和加州大学伯克利分校的研究人员引入了扩散模型,通过迭代优化其输出,这些模型可以学习生成类似于训练数据集中样本的新数据样本,并用于创建逼真的图像。

图片

2017年,谷歌的研究人员推出了transformer架构,该架构已被用于开发大型语言模型,比如驱动ChatGPT的模型。在自然语言处理中,Transformer将文本语料库中的每个词编码为一个令牌,然后生成一个注意力图,该图捕捉每个令牌与所有其他令牌的关系。这个注意力图帮助Transformer在生成新文本时理解上下文。

这些仅仅是可用于生成式AI的众多方法中的一小部分。

03

应用范围广泛

这些方法的共同特点是将输入转换为一组令牌,这些令牌是数据块的数值表示形式。只要数据可以转换为这种标准的令牌格式,理论上可以应用这些方法来生成类似的新数据。“效果会因数据复杂度和信号提取难度而异,但它实际上越来越接近于通用CPU处理任意类型数据的方式,”Isola表示。

这为生成式AI开辟了大量的应用场景:

例如,Isola的团队正在使用生成式AI来创建合成图像数据,这些数据可用于训练另一个智能系统,例如教计算机视觉模型如何识别物体。

Jaakkola的团队正在使用生成式AI来设计新的蛋白质结构或有效的晶体结构以指定新材料。就像生成模型学习语言的依赖性一样,如果展示晶体结构,它也可以学习使结构稳定和可实现的关系。

图片

尽管生成模型可以取得惊人的成果,但它们并非适用于所有类型的数据,对于那些涉及在结构化数据(如电子表格中的表格数据)上进行预测的任务,生成式AI模型往往不如传统的机器学习方法。

04

生成式AI的机遇与风险

生成式AI聊天机器人目前在呼叫中心被用来解答客户的问题,但这一应用凸显了实施这些模型可能带来的一个潜在问题——人类的工作岗位被替代。此外,生成式AI可能会继承和扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。同时这些模型具有抄袭的能力,并且可以生成看起来像是由特定人创作的内容,从而引发潜在的版权纠纷。

但另一方面,麻省理工学院的研究人员提出,生成式AI可能赋能艺术家,他们可以利用生成工具帮助创作他们可能无法用其他方式制作的创意内容。而在其他领域——如制造业,研究人员认为,在未来生成式AI不仅是让模型生成椅子的图像,它也许能生成可实际制造的椅子设计方案,这类应用或将彻底改变许多领域的经济格局。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/146685.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

maptalks三维地图网址

三维 地址: http://examples.maptalks.com/examples/cn/gltf/gltf-marker/shader

Redis实现延时队列-工具类

Redis实现延时队列-工具类 RedisDelayQueueUtil第一种方式:优点:缺点:第二种方式:优点:缺点:总结:RedisDelayQueueUtil 依赖: <dependency><groupId>org.springframework.boot

简朴博客系统测试报告

文章目录 一. 项目简介二. 测试概要三. 测试环境四. 测试执行概况及功能测试1. 手工测试1.1 手动测试用例编写1.2 执行的部分测试用例 2. 自动化测试Selenium2.1 编写测试用例2.2 自动化测试代码 3. 测试结果 五. 发现的问题 一. 项目简介 简朴博客系统是采用前后端分离的方式…

《Effective C++》条款17

以独立语句将newed对象置入智能指针 class A {...}; int g() {...} int f(shared_ptr<A> a,g()) {...} int main() {f(shared_ptr<A> (new A), g()); } 假如你想通过主函数里的语句进行调用f函数。虽然看上去没有什么问题&#xff0c;但是实际上可能会造成内存泄漏…

【QML】警告Name is declared more than once

1. 问题&#xff1a; qml函数中的不同块中定义同名变量&#xff0c;报警&#xff1a;Name is declared more than once 举例&#xff1a; function test(a){if(a "1"){var re 1;console.log(re);}else{var re 2; //这里会报警&#xff1a;Name is declared mor…

asp.net core mvc 之 依赖注入

一、视图中使用依赖注入 1、core目录下添加 LogHelperService.cs 类 public class LogHelperService{public void Add(){}public string Read(){return "日志读取";}} 2、Startup.cs 文件中 注入依赖注入 3、Views目录中 _ViewImports.cshtml 添加引用 4、视图使用…

Scala---样例类+隐式转换

样例类(case classes) 1、概念理解 使用了case关键字的类定义就是样例类(case classes)&#xff0c;样例类是种特殊的类。实现了类构造参数的getter方法&#xff08;构造参数默认被声明为val&#xff09;&#xff0c;当构造参数是声明为var类型的&#xff0c;它将帮你实现set…

Python每日一练@前言

Python每日一练前言 导读 人生苦短&#xff0c;我用Python 大家好&#xff0c;我是鹅不糊涂 欢迎大家来到Python每日一练 好处 加强编程能力: 每日一练可以帮助提升编程技能&#xff0c;通过解决各种编程问题和挑战&#xff0c;你能够不断锻炼自己的逻辑思维和解决问题的能力…

顺序表(数据结构与算法)

✅✅✅✅✅✅✅✅✅✅✅✅✅✅✅✅ ✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨ &#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1f33f;&#x1…

2023.11.17 hadoop之HDFS进阶

目录 HDFS的机制 元数据简介 元数据存储流程:namenode 生成了多个edits文件和一个fsimage文件 edits和fsimage文件 SecondaryNameNode辅助NameNode的方式: HDFS的存储原理 写入数据原理: 发送写入请求,获取主节点同意,开始写入,写入完成 读取数据原理:发送读取请求,获取…

vim——“Linux”

各位CSDN的uu们好呀&#xff0c;今天&#xff0c;小雅兰的内容是Linux的开发工具——vim。下面&#xff0c;我们一起进入Linux的世界吧&#xff01;&#xff01;&#xff01; Linux编辑器-vim使用 vim的基本概念 vim的基本操作 vim正常模式命令集 vim末行模式命令集 vim操…

【Linux网络】从原理到实操,感受PXE无人值守自动化高效批量网络安装系统

一、PXE网络批量装机的介绍 1、常见的三种系统安装方式 2、回顾系统安装的过程&#xff0c;了解系统安装的必要条件 3、什么是pxe 4、搭建pxe的原理 5、Linux的光盘镜像中的isolinux中的相关文件学习 二、关于实现PXE无人值守装机的四大文件与五个软件的对应关系详解 5个…

强缓存和弱缓存

强缓存和弱缓存是Web开发中常用的两种缓存机制。 强缓存&#xff08;Strong Cache&#xff09; 强缓存是指在浏览器发送请求前&#xff0c;先检查本地缓存中是否存在可用的资源副本。如果存在&#xff0c;并且该资源没有过期&#xff0c;服务器将返回一个特定的响应头&#xff…

使用 Redis BitMap 实现签到与查询历史签到以及签到统计功能(SpringBoot环境)

目录 一、前言二、Redis BitMap 位图原理2.1、BitMap 能解决什么2.2、BitMap 存储空间计算2.3、BitMap 存在问题 三、Redis BitMap 操作基本语法和原生实现签到3.1、基本语法3.2、Redis BitMap 实现签到操作指令 四、SpringBoot 使用 Redis BitMap 实现签到与统计功能4.1、代码…

python之 flask 框架(2)项目拆分的 执行逻辑

项目的结构图 app.py # 导入__init__.py 比较特殊 from APP import create_appapp create_app() if __name__ __main__:app.run(debugTrue)init.py # __inti__.py # 初始化文件&#xff0c;创建Flask应用 from flask import Flask from .views import bluedef create_ap…

PyTorch 实战之水果分类

当我们试图提高神经网络的准确性时&#xff0c;经常会遇到过拟合训练数据的情况。当我们运行测试数据的模型时&#xff0c;这会导致一个糟糕的预测。因此&#xff0c;我采取了一个数据集&#xff0c;并应用这些技术&#xff0c;不仅提高准确性&#xff0c;而且还处理过拟合的问…

【SA8295P 源码分析】127 - 摄像头 GMSL1、GMSL2 加串-解串器 常用寄存器配置整理(正在更新中......)

【SA8295P 源码分析】127 - 摄像头 GMSL1、GMSL2 加串-解串器 常用寄存器配置整理 一、MAX96712 解串器基础配置1.1 配置链路 GMSL 协议 及 传输速率1.1.1 配置GMSL1、GMSL2协议 及 配置使能 Link A/B/C/D [0x6]:GMSL2_A、LINK_EN_A1.1.2 配置GMSL2 传输速率 3 Gbps / 6 Gbps …

基于IDEA 进行Maven依赖管理

1. 依赖管理概念 Maven 依赖管理是 Maven 软件中最重要的功能之一。Maven 的依赖管理能够帮助开发人员自动解决软件包依赖问题&#xff0c;使得开发人员能够轻松地将其他开发人员开发的模块或第三方框架集成到自己的应用程序或模块中&#xff0c;避免出现版本冲突和依赖缺失等…

一个用于操作Excel文件的.NET开源库

推荐一个高性能、跨平台的操作Excel文件的.NET开源库。 01 项目简介 ClosedXML是一个.NET第三方开源库&#xff0c;支持读取、操作和写入Excel 2007 (.xlsx&#xff0c; .xlsm)文件&#xff0c;是基于OpenXML封装的&#xff0c;让开发人员无需了解OpenXML API底层API&#xf…

go语言 | 图解字节青训营抖音(一)

前言 本文大致介绍了本人及本人所在小组为第五届字节跳动青训营后端专场大项目需求 —— 「实现一个极简版抖音」的部分实现细节。 需求 本届后端青训营大项目要求实现一个极简版抖音的后端服务&#xff0c;该后端服务通过 HTTP 协议向已被设计好的前端 App 传递数据&#xf…