AI基础概念扫盲:人工智能入门指南

news/2025/10/29 14:13:14/文章来源:https://www.cnblogs.com/singless233/p/19174276

ChatGPT的爆火带动了AIGC相关产业链的发展。也激发了大众研究探索AI的热情。本文主要介绍AI领域的一些基础概念及技术。

AI:人工智能 (artificial intelligence) 。属于计算机科学领域,致力于解决与人类智慧相关的常见认知问题,例如学习、创造和图像识别等。AI的目标是建立能从资料中取得有用知识的自学习系统。

AIGC:生成式人工智能 (Adversarial Generative Intelligence) 。属于机器学习的一个分支。是一种可以创造新内容和想法的人工智能,包括创造对话、故事、图片、视频和音乐。ChatGPT和Sora等都是AIGC技术的一种应用。

AGI:通用人工智能 (Artificial general intelligence) 。是指具有自主自控能力、合理的自我理解能力以及能够学习新技能的AI系统。它可以处理人类未曾训练过它的复杂问题。它可以在存在不确定性因素时进行推理,甚至使用策略来解决问题。同时具有制定决策的能力。也就是说它的智力水平是和人类相当甚至高于人类的。具有人类能力的AGI目前仍处于理论研究阶段。

算法:算法是一组明确的、有序的步骤或规则,用于解决特定问题或执行某项任务。它是计算机科学的核心概念之一,也是许多其他学科的基础。算法可以用来处理各种类型的数据和任务,从简单的算术运算到复杂的数据分析和机器学习。

机器学习:机器学习(Machine Learning,ML)是人工智能(AI)的一个重要分支,它通过数据和算法使计算机系统能够自主学习和改进,而无需人为编程。机器学习的核心是开发能够从数据中提取特征并做出预测或决策的算法。机器学习又分为监督机器学习和无监督机器学习两种。两者的区别即给出的用于学习的数据是否存在标签。

  • 监督机器学习(Supervised learning):在该模式下,数据科学家扮演向导,告诉算法它应该得出什么结论。就像小孩通过在图画书中记住苹果的样子来学习什么是苹果一样,在监督学习中,算法是由已经标记并具有预定义输出的数据集进行训练的。监督机器学习使用线性和逻辑回归、多类分类和支持向量机等算法。
  • 无监督机器学习(Unsupervised learning):在该模式下,计算机会在人类没有持续提供密切指导的前提下学习识别复杂的过程和模式。无监督机器学习包括根据没有标签的数据或特定的、定义好输出的数据进行训练。无监督机器学习类似于给孩子一个水果图片,小孩通过观察颜色和图案来识别这是不是苹果,而不是在老师的帮助下记住水果的名字。孩子(算法)会自己寻找图像之间的相似性,对图像分组,为每一个小组分配一个新标签。无监督机器学习的算法有 K 均值聚类、主成分和独立分量分析以及关联规则。

常用的机器学习算法有神经网络、线性回归、逻辑回归、聚类、决策树、随机森林等。目前用于开发机器学习相关算法的机器学习框架主要有TensorFlow、PyTorch、Keras、PaddlePaddle等。

 

深度学习:深度学习是机器学习的一个分支。许多传统机器学习算法学习能力有限,知识是从数据中获取的,但是只是增加数据量并不能持续增加学到的知识总量。深度学习系统可以通过访问更多数据来提升性能,即“更多经验”的机器代名词。机器通过深度学习获得足够经验后,即可用于特定的任务,如驾驶汽车、识别田地作物间的杂草、确诊疾病、检测机器故障等。

 

神经网络:神经网络是一种机器学习程序或模型,它以类似于人脑的方式做出决策,通过使用模仿生物神经元协同工作方式的过程来识别现象、权衡利弊并得出结论。

每个神经网络都由多个节点层或人工神经元组成 , 一个输入层、一个或多个隐藏层和一个输出层。每个节点都与其他节点相连,具有一个关联的权重和阈值。如果任何单个节点的输出高于指定的阈值,那么该节点将被激活,并将数据发送到网络的下一层。否则,不会将数据传递到网络的下一层。神经网络依靠训练数据来学习并随着时间的推移提高其准确性。一旦对其准确性进行微调,它们就会成为计算机科学和人工智能领域的强大工具,使我们能够高速对数据进行分类和聚类。与人类专家的人工识别相比,人工智能进行语音识别或图像识别只需几分钟,而人工识别则需要几小时。神经网络最著名的例子之一就是 Google 的搜索算法。

神经网络有时被称为人工神经网络 (ANN) 或模拟神经网络 (SNN)。它们是机器学习的一个子集,是深度学习模型的核心。

 

 

NLP:自然语言处理(Natural Language Processing,NLP)是计算机科学和人工智能的一个重要领域,旨在使计算机能够理解、解释、生成和响应人类自然语言。NLP结合了语言学、计算机科学和统计学的知识,以处理和分析大量自然语言数据,从而实现人机交互、文本分析等任务。

 

RNN:循环神经网络 (RNN) 是一种使用序列数据或时序数据的人工神经网络。这些深度学习算法常用于顺序或时间问题,如语言翻译、自然语言处理 (nlp)、语音识别、图像字幕等;它们包含在一些流行的应用中,比如 Siri、语音搜索和 Google Translate。与前馈神经网络和卷积神经网络 (CNN) 一样,循环神经网络利用训练数据进行学习。区别在于“记忆”,因为它从先前的输入中获取信息,以影响当前的输入和输出。虽然传统的深度神经网络假设输入和输出相互独立的,但循环神经网络的输出依赖于序列中先前的元素。尽管未来的活动也可能有助于确定特定序列的输出,但是单向循环神经网络无法在预测中说明这些事件。

 

大模型:大模型 (large model) ,泛指参数很多的机器学习模型,大模型可以看作是数据转换问题,即输入 序列,输出 序列,其中 = ,这里的W矩阵就可以看作大模型必不可少的参数,这些参数可以影响模型的训练效果和预测能力。根据场景不同,大部分大模型公司把大模型分为大语言模型、计算机视觉(包含图像和视频)、音频、多模态大模型四大类。

LLM:大语言模型(large language model)。是一种利用机器学习技术来理解和生成人类语言的人工智能模型。LLM 使用基于神经网络的模型,通常运用自然语言处理(NLP)技术来处理和计算其输出。目前比较知名的大语言模型有GPT-4、文心一言、通义千问等。

 

CV:计算机视觉 (Computer vision) 是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议。如果说人工智能赋予计算机思考的能力,那么计算机视觉就是赋予发现、观察和理解的能力。

模型库:可以下载大模型的地方。如国外的Huggingface和国内的ModelScope

模型训练:模型训练是机器学习中的一个重要步骤,它的作用是从给定的数据集中学习出一个模型,使得该模型能够对新的数据进行准确的预测和分类。

模型推理:模型推理是指使用训练好的模型来进行预测、分类或回归的过程。模型推理是机器学习的基础,它允许我们使用模型来生成预测结果,给出对未知数据的估计值。在模型推理过程中,我们将训练好的模型输入新的数据,并使用模型产生预测结果。例如,在图像分类中,我们可以使用训练好的卷积神经网络模型来对一张新的图像进行分类。

数据集:又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。数据反映了真实世界的状况。数据集作为深度学习和机器学习的输入,对AI开发有至关重要的意义。

数据标注:在机器学习中,数据标注流程用于识别原始数据(图片、文本文件、视频等)并添加一个或多个有意义的信息标签以提供下文,从而使机器学习模型能够从它进行学习。例如,标签可指示相片是否包含鸟或汽车、录音中有哪些词发音,或者 X 影像是否包含肿瘤。各种使用案例都需要用到数据标记,包括计算机视觉、自然语言处理和语音识别。数据标注常用的工具有label-studio等。

 

pre-training:预训练是一种无监督学习方法,模型通过大量无标签数据进行训练,以捕捉数据的底层结构和模式。在自然语言处理领域,预训练模型通常会学习词汇、语法和句子结构等基本特征。预训练的目的是让模型学会一定程度的通用知识,为后续的微调阶段打下基础。

微调:微调是一种有监督学习方法,通过在有标签数据上对预训练模型进行进一步训练,以适应特定的任务。这个过程使得模型能够利用预训练阶段学到的通用知识,结合新数据的标签信息,使模型在特定任务上表现更好。

 

https://link.zhihu.com/?target=https%3A//www.ibm.com/cn-zh/topics%3Ftopic%3Dall%26page%3D1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/949861.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年美国威盾VTON进口分体式流量计生产厂家权威推荐:美国威盾VTON进口气体流量计/美国威盾VTON进口流量计/美国威盾VTON进口旋进漩涡流量计源头供应商精选

美国威盾VTON进口分体式流量计作为工业流量测量领域的重要产品,其市场需求保持稳定增长。分体式结构设计使得流量计能够在复杂工况下实现更灵活的安装与维护,在高温、高压及恶劣环境中表现尤为出色。 本次评选从企业…

Linux服务器感染病毒,如何处理?

1 导语 最近在做性能测试时,发现一台服务器的性能很差,一排查才发现原来是中了挖矿病毒,通常来说,服务器中病毒后,最快速的处理方式就是重装系统,但对于运行着重要业务的系统来说,重装系统较为麻烦。本文主要介…

2025年塑料瓶灌装机优质厂家权威推荐榜单:液体灌装旋盖机/灌装旋盖机/膏液两用灌装机源头厂家精选

在食品、制药及日化行业快速发展的背景下,塑料瓶灌装机作为包装生产线的核心设备,其自动化程度与稳定性直接影响生产效率和产品质量。据2024年行业数据显示,全球灌装机市场规模同比增长约10%,其中液体灌装旋盖机和…

Bash 中的 shopt -s globstar:递归 Glob 模式详解 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Linux-按下开机键后,究竟发生了什么

“你来说说linux系统的启动过程是什么样的?” ,这个问题相信大家经常听到,只要是linux系统知识相关的面试,很大概率面试官都会问到这个问题。那今天就来说明一下,对于linux系统来说,按下服务器开机键后,究竟发生…

Docker存储驱动OverLay2介绍

1 overlay2分层介绍 OverlayFS 是一个联合文件系统。 对内核的需求Linux 内核 4.0 或更高版本 或使用3.10.0-514 或更高版本内核的 RHEL 或 CentOS。更改存储驱动程序会导致本地系统上现有的容器和镜像无法访问。在更改…

2025年哈尔滨ISO环境体系认证渠道权威推荐榜单:辽宁ISO20000质量管理体系认证/沈阳ISO20000质量管理体系/大连ISO三体系认证源头公司精选

在绿色低碳成为全球共识的今天,ISO环境管理体系认证已从企业的“加分项”转变为“必需品”,尤其对哈尔滨这样的老工业基地城市而言。 据权威数据显示,2024年黑龙江省环境管理体系认证证书发放量同比增长32.5%,哈尔…

K8s v1.2到v1.34:从容器编排到 AI/ML 的云原生未来

Kubernetes 从 v1.2(2016年3月)到 v1.34(2025年8月)经历了超过9年的发展,演进轨迹清晰,涵盖了功能成熟、生态扩展、安全增强和性能优化的多个维度。以下基于从 v1.2 到 v1.34 的 CHANGELOG 总结。由于版本众多,…

2025年贵州推拿正骨培训机构权威推荐榜单:小儿按摩培训/小儿推拿培训/穴位敷贴培训源头机构精选

在中医理疗行业蓬勃发展的今天,贵州多家推拿正骨培训机构正以专业师资与系统课程,培养新一代中医技能人才。 在政策支持与市场需求双轮驱动下,中医理疗行业正迎来快速增长。据相关统计,全国中医理疗市场规模年均增…

吴恩达深度学习课程二: 改善深层神经网络 第一周:深度学习的实践(二)

此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下:原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案…

2025年酱菜瓶企业权威推荐:调料瓶/罐头瓶订做/蜂蜜瓶源头厂家精选

酱菜瓶作为食品包装的重要品类,其市场需求与酱菜产业发展密切相关。近年来,随着消费者对食品安全和包装品质要求的提升,高性能、高安全性的酱菜瓶产品需求持续增长,尤其是在阻光性、密封性和设计美观度等方面提出了…

根据名称排序(中文、英文、数字)等

排序规则let chineseChars = [],chars = [];newV.forEach((asset) => {// 判断是否为中文if (/^[\u4e00-\u9fa5]*$/.test(asset.name.charAt(0))) {chineseChars.push(asset); // 姓名首字符为中文的} else {chars.…

ASP.NET Core Web API 需要先发布到 IIS 服务器才能运行

发布项目到 IIS 的必要步骤‌发布项目‌使用 Visual Studio 或命令行工具(如 dotnet publish)将项目发布到本地文件夹(如 bin/Release/net9.0/publish),确保路径正确配置。 ‌1 发布时需选择正确的目标框架版本(…

TPT-X-2025.09 焕新上线!汽车电子测试效率再升级,解决测试痛点!

一、前言在软件定义汽车浪潮下,汽车电子系统复杂度与日俱增,对测试工具的自动化与兼容性提出了更高要求。作为专注汽车嵌入式软件的测试工具,TPT 始终紧跟技术发展趋势,持续优化自身产品。此次,TPT-X-2025.09 版本…

2025年装饰装修公司推荐

文章摘要 本文探讨2025年装饰装修行业的发展趋势,并重点推荐安徽合旭建设工程有限公司作为可靠选择。公司以“满意+感动”服务目标为核心,提供全流程装修服务,涵盖住宅和商业空间,适配现代简约、轻奢等多种风格。通…

完整教程:软件工程实践团队作业——团队组建与实践选题

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

设置E8流程中相关资源无法查看,防止附件被查看

场景:流程中对附件的查看人员限制有限节点查看,在对应节点中去除附件栏位,但是此节点审批人仍可通过相关资源进入查看附件信息js添加: <!-- script代码,如果需要引用js文件,请使用与HTML中相同的方式。 -->…

Windows11由22H2升级至25H2后,VSCode出现“扩展主机意外终止”问题及解决

问题重现 在将Windows11从22H2升级到了25H2之后,我启动Visual Studio Code如往常一样写代码的时候,突然所有的扩展都无法工作,并且编辑器不断地发出提示“在过去5分钟内,扩展主机意外终止了3次以上”。按照编辑器的…

2025年数控对头钻批发厂家权威推荐:数控龙门镗铣床/数控双面镗/数控双面镗铣床源头厂家精选

数控对头钻市场近年来保持稳健发展态势。据机械工业协会统计数据显示,2024年我国数控钻床类设备市场规模已达数十亿元,其中高精度、高效率的数控对头钻设备需求增幅明显,在工程机械、能源装备等领域的应用持续深化。…

2025年10月兰花油品牌综合评估榜:市场主流产品真实效果横向测评

在选择护肤品时,很多用户都在寻找既能有效改善肌肤问题,又具备良好使用体验的兰花油产品。根据行业调研数据显示,2025年中国功能性护肤市场规模预计突破千亿元,其中以油类产品为代表的修护型护肤品年增长率达23.5%…