AI大模型:(一)1.大模型的发展与局限

       说起AI大模型不得不说下机器学习的发展史,机器学习包括传统机器学习、深度学习,而大模型(Large Models)属于机器学习中的深度学习(Deep Learning)领域,具体来说,它们通常基于神经网络架构。

1.机器学习的发展史

       机器学习技术的发展历程可以追溯到20世纪50年代,当时提出了感知机、神经网络等概念。80年代末期,反向传播算法的发明,给机器学习带来了希望,掀起了基于统计模型的机器学习热潮。21世纪以来,随着数据量的增加、计算能力的提升和算法的改进,机器学习技术进入了深度学习时代,取得了令人瞩目的成就。机器学习技术在很多领域都有应用,例如图像识别、自然语言处理、推荐系统等,为人类社会带来了巨大的价值和意义。

机器学习技术的发展可以分为以下几个阶段:

1. 早期阶段:上世纪50年代到70年代初期,机器学习被视为人工智能的一个子领域。这个阶段的主要方法是基于符号逻辑的推理和规则表达,例如专家系统、决策树等。1943年Warren McCulloch和Walter Pitts就提出首个神经网络模型,模拟神经元的工作方式。1949年Donald Hebb提出Hebbian学习理论,为神经网络学习奠定了基础。但1969年由于Marvin Minsky和Seymour Papert指出感知机的局限性,加之当时计算能力不足和数据稀缺限制了机器学习的发展,导致神经网络研究陷入低谷。

2. 统计学习阶段:20世纪80年代到90年代初期,机器学习开始采用统计学习方法,如最小二乘法、最大似然估计等。这个阶段的代表性算法包括神经网络、支持向量机、朴素贝叶斯等。但这个阶段是已统计学习为主的阶段,因为1990年开始神经网络因计算复杂性和理论限制再次遇冷,研究转向统计学习。

3.深度学习阶段:2006年以来,随着计算能力的提升和数据量的增加,深度学习开始崛起。深度学习是一种基于神经网络的机器学习方法,可以处理大规模、高维度的数据。深度学习的代表性算法包括卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等。

4.现代发展阶段:自2017年Transformer架构的提出,一统深度学习领域的江湖之后,彻底改变了自然语言处理领域,BERT、GPT等模型相继问世。大规模预训练模型(如GPT-3、GPT-4)在多个任务上表现出色,推动了通用人工智能(AGI)的研究。强化学习、自监督学习、联邦学习等新兴方向快速发展。

5.未来趋势:研究如何让机器具备更广泛的智能,如AI与生物医学、量子计算的融合。确保AI技术的公平性、透明性和安全性。目前大模型还有更大的挑战这也是我们后边要说的局限性。

2.GPT大模型发展历程

       大模型的发展,必然离不开GPT,为什么要说他,不仅他是现在最优秀的模型之一。还因为他验证了随着模型尺寸变大、学习的知识更多,模型的性能会大幅提升。这就是OpenAI 在 2020 年发表的论文《Scaling Laws for Neural Language Models》中提出了 Scaling Laws。虽然这篇论文在2020年提出,但当时却影响甚微。因为从GPT2开始部分闭源了,GPT3已经完全闭源,虽然在GPT3 中生成1750亿相比GPT2 1.7亿的参数有了100倍的能力提升,由于闭源,加之GPT只基于 Transformer 的解码器(Decoder-only)架构,没有编码器部分,行业内也并未有太大的影响。直到2022 年 11 月,OpenAI 发布了基于 GPT 模型的人工智能对话应用服务ChatGPT。ChatGPT沿用了InstructGPT的训练技术,并针对对话能力进行了优化。它结合了人类生成的对话数据进行训练,展现出丰富的世界知识、复杂问题求解能力、多轮对话上下文追踪与建模能力以及与人类价值观对齐的能力。ChatGPT还支持插件机制,扩展了功能,超越了以往所有人机对话系统的能力水平,引发了社会的高度关注。虽然GPT没有在技术上突破,但他用实践证明了scaling laws。从ChatGPT发布后,行业内多家巨头争相大知识量训练自家模型,也就短短几个月让模型学习全网人类几百年的知识。灌注了大量的知识后,再进行微调,人类对齐就产生现在的通用大模型。现在百模齐放,离不开GPT的贡献。OpenAI始终把创建安全、通用的大模型为自己的使命,他的成功有一定的偶然,但也是必然的。

3.大模型的发展局限性

      大模型分为推理学习、数据学习,举个相似的例子,推理学习和数据学习就像数据与物理的关系,正在输出.....待完善!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/73838.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

rust学习笔记17-异常处理

今天聊聊rust中异常错误处理 1. 基础类型&#xff1a;Result 和 Option&#xff0c;之前判断空指针就用到过 Option<T> 用途&#xff1a;表示值可能存在&#xff08;Some(T)&#xff09;或不存在&#xff08;None&#xff09;&#xff0c;适用于无需错误信息的场景。 f…

Python:单继承方法的重写

继承&#xff1a;让类和类之间转变为父子关系&#xff0c;子类默认继承父类的属性和方法 单继承&#xff1a; class Person:def eat(self):print("eat")def sing(self):print("sing") class Girl(Person):pass#占位符&#xff0c;代码里面类下面不写任何东…

记录一下aes加密与解密

该文章只做拓展后续会更新&#xff1b;如有出错请指出 首先需要先引入相关依赖 crypto-js 然后直接开始存储 export function aesEncrypt(message: string, key: string) {return aes.encrypt(message, key).toString(); } 之后是解密方式 function decrypt(content: any, key…

[免费]直接整篇翻译pdf工具-支持多种语言

<闲来没事写篇博客填补中文知识库漏洞> 如题&#xff0c;[免费][本地]工具基于开源仓库&#xff1a; 工具 是python&#xff01;太好了&#xff0c;所以各个平台都可以&#xff0c;我这里基于windows. 1. 先把github代码下载下来&#xff1a; git clone https://githu…

UI设计中的用户反馈机制:提升交互体验的关键

hello宝子们...我们是艾斯视觉擅长ui设计和前端数字孪生、大数据、三维建模、三维动画10年经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 在数字化产品泛滥的今天&#xff0c;用户与界面的每一次交互都在无形中塑造着他们对产品的认知。一个…

Hessian 矩阵是什么

Hessian 矩阵是什么 目录 Hessian 矩阵是什么Hessian 矩阵的性质及举例说明**1. 对称性****2. 正定性决定极值类型****特征值为 2(正),因此原点 ( 0 , 0 ) (0, 0) (0,0) 是极小值点。****3. 牛顿法中的应用****4. 特征值与曲率方向****5. 机器学习中的实际意义**一、定义与…

Nginx 代理访问一个 Web 界面时缺少内容

1. 资源路径问题 Web 页面中的静态资源&#xff08;如图片、CSS、JavaScript 文件&#xff09;可能使用了相对路径或绝对路径&#xff0c;而这些路径在代理后无法正确加载。 解决方法&#xff1a; 检查资源路径&#xff1a;打开浏览器的开发者工具&#xff08;按 F12&#xf…

GPU视频编解码:Jetson VPI+multimedia_api视频编解码入门(一)

目录 一.Pipline与工具栈 二.硬件设备概况 三.GPU视频编解码框架 四.VPI编译使用实例 五. jetson_multimedia_api编译使用实例 一.Pipline与工具栈 二.硬件设备概况 三.GPU视频编解码框架 jetson设备目前不支持VPF框架&#xff0c;关于VPF的使用我在下节PC段使用X86进行安…

《深入理解AOP编程:从基础概念到Spring实现》

AOP编程 AOP(Aspect Oriented Programing) 面向切面编程 Spring动态代理开发 以切面为基本单位的程序开发&#xff0c;通过切脉你间的彼此协同&#xff0c;相互调用&#xff0c;完成程序构建 切面切入点额外功能 OOP(Object Oriented Programing)面向对象编程 java 以对象为基本…

C# 零基础入门篇(19.DateTime 使用指南)

## 一、概述 DateTime 是 C# 中用于表示日期和时间的结构&#xff0c;位于 System 命名空间中。它提供了丰富的属性和方法&#xff0c;用于处理日期和时间的创建、格式化、比较和计算。 ## 二、创建 DateTime 对象 ### &#xff08;一&#xff09;使用默认构造函数 DateTime…

Docker 实践与应用举例

一、引言 在当今快速发展的信息技术领域&#xff0c;容器化技术已成为推动软件开发、部署和运维变革的关键力量。Docker 作为容器化技术的领军者&#xff0c;以其高效、便捷、可移植等特性&#xff0c;被广泛应用于各种场景。它能够将应用程序及其依赖项打包成一个独立的容器&…

C++初阶——类和对象(一)

C初阶——类和对象&#xff08;一&#xff09; 一、面向过程和面向对象 1.面向过程 面向过程的程序设计&#xff08;Procedure-Oriented Programming&#xff09;&#xff0c;简称POP&#xff0c;是一种是以程序执行流程为核心的编程范式。它是先分析出解决问题所需要的的步…

Skyeye 云智能制造办公系统 VUE 版本 v3.15.13 发布

Skyeye 云智能制造&#xff0c;采用 Springboot winUI 的低代码平台、移动端采用 UNI-APP。包含 30 多个应用模块、50 多种电子流程&#xff0c;CRM、PM、ERP、MES、ADM、EHR、笔记、知识库、项目、门店、商城、财务、多班次考勤、薪资、招聘、云售后、论坛、公告、问卷、报表…

Obsidian Copilot:打造你的专属 AI 笔记助手

Obsidian Copilot作为一款非常受欢迎的Obsidian插件&#xff0c;不仅极大地提升了用户的笔记管理和信息检索效率&#xff0c;还通过其多样化的AI功能为用户带来了前所未有的便捷体验。本文将详细介绍Obsidian Copilot的核心特点、使用方法及个人体验分享。 核心特点 Obsidian…

每日一题--计算机网络

一、基础概念类问题 1. TCP 和 UDP 的区别是什么&#xff1f; 回答示例&#xff1a; TCP&#xff1a;面向连接、可靠传输&#xff08;通过三次握手建立连接&#xff0c;丢包重传&#xff09;、保证数据顺序&#xff08;如文件传输、网页访问&#xff09;。 UDP&#xff1a;无…

使用 Spring 的 FactoryBean 创建和获取 Bean 对象

在Spring框架中&#xff0c;FactoryBean接口提供了一种强大的机制来创建复杂的bean实例。本文将基于提供的代码示例&#xff0c;详细介绍如何通过FactoryBean创建bean对象&#xff0c;并展示如何获取这些bean实例以及它们所属的FactoryBean实例。 示例代码类 定义 MyBean 接口…

制造业数字化转型,汽车装备制造企业数字化转型案例,智能制造数字化传统制造业数字化制造业数字化转型案例

《某制造业企业信息化整体解决方案》PPT展示了一个汽车装备企业的整体信息化解决方案&#xff0c;阐述了该企业的业务特点和现状&#xff0c;主要包括按订单生产、多级计划和产品跟踪等&#xff0c;分析了信息化建设的主要困难&#xff0c;如信息管理手工化、过程数据追溯困难、…

软链接 使用笔记 linux命令 if判断

目录 1>0判断怎么写&#xff1a; 1. 使用 [ ] 进行数值比较&#xff1a; 2. 使用 (( )) 进行数学运算&#xff1a; 3. 使用 [[ ]]&#xff08;主要用于字符串比较&#xff0c;不推荐用于数学运算&#xff09;&#xff1a; 软链接 使用笔记 1>0判断怎么写&#xff1a…

pycharm-python國際象棋遊戲代碼

嗯&#xff0c;用户的问题是“pycharm寫關於python國際象棋遊戲代碼”&#xff0c;也就是要用PyCharm来写一个Python的国际象棋游戏代码。我需要先整理一下用户提供的搜索结果&#xff0c;看看有什么相关的信息可以利用。 首先看搜索结果中的各个网页内容。网页1主要讲的是象棋…

【Film】MovieAgent:自动化电影生成通过多智能体CoT规划

论文概览 自动化电影生成根据剧本概要和角色库创建具有一 致角色、同步字幕和音频的长篇视频。它涉及自动化叙 事规划、场景结构化, 和镜头构图,复制现实世界电影制作的层次推理。 核心贡献 提出MovieAgent,通过多智能体链式思维(CoT)规划实现自动化电影生成。首次探索并…