标量/向量/矩阵/张量/范数详解及其在机器学习中的应用

标量(Scalar)、向量(Vector)、矩阵(Matrix)、张量(Tensor)与范数(Norm)详解及其在机器学习中的应用

1. 标量(Scalar)
  • 定义:标量是单个数字,仅具有大小(Magnitude),没有方向。

    • 数学表示:如 a = 5 a = 5 a=5, b = − 3.2 b = -3.2 b=3.2
    • 特点:零维数据(0D Tensor)。
  • 机器学习中的应用

    • 模型参数:如线性回归中的偏置项(Bias)。
    • 损失函数输出:如均方误差(MSE)的结果是一个标量。
    • 超参数:学习率(Learning Rate)、正则化系数(Regularization Coefficient)等。
2. 向量(Vector)
  • 定义:向量是一维数组,既有大小又有方向,表示空间中的点或变化量。

    • 数学表示:如 v = [ v 1 , v 2 , … , v n ] T \mathbf{v} = [v_1, v_2, \dots, v_n]^T v=[v1,v2,,vn]T
    • 特点:一维数据(1D Tensor),可看作标量的有序集合。
  • 机器学习中的应用

    • 特征向量(Feature Vector):数据样本的数值化表示(如图像的像素值、文本的词频统计)。
    • 嵌入(Embedding):将离散数据(如单词、类别)映射为低维向量(如Word2Vec、GloVe)。
    • 梯度(Gradient):优化算法中参数更新的方向(如随机梯度下降SGD)。
    • 输出结果:分类任务中概率分布的输出(如Softmax后的向量)。
3. 矩阵(Matrix)
  • 定义:矩阵是二维数组,由行和列组成,可表示线性变换或数据关系。

    • 数学表示:如 A = [ a 11 a 12 a 21 a 22 ] \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} A=[a11a21a12a22]
    • 特点:二维数据(2D Tensor),矩阵运算(乘法、逆、特征分解)是核心工具。
  • 机器学习中的应用

    • 数据集表示:每行代表样本,每列代表特征(如表格型数据)。
    • 权重矩阵(Weight Matrix):神经网络中层与层之间的连接参数。
    • 核方法(Kernel Methods):支持向量机(SVM)中通过核矩阵计算高维相似性。
    • 矩阵分解:推荐系统(协同过滤)中将用户-物品评分矩阵分解为低秩矩阵。
4. 张量(Tensor)
  • 定义:张量是向量和矩阵的高维推广,表示多维数组。

    • 数学表示:三维张量 T ∈ R n × m × k \mathcal{T} \in \mathbb{R}^{n \times m \times k} TRn×m×k
    • 特点:N维数据(ND Tensor),如图像(3D:高×宽×通道)、视频(4D:帧×高×宽×通道)。
  • 机器学习中的应用

    • 图像处理:RGB图像表示为三维张量(如 224 × 224 × 3 224 \times 224 \times 3 224×224×3
    • 深度学习输入/输出:卷积神经网络(CNN)中张量在层间流动(如特征图Feature Maps)。
    • 自然语言处理(NLP):词嵌入矩阵(如 句子长度 × 词向量维度 \text{句子长度} \times \text{词向量维度} 句子长度×词向量维度
    • 高阶关系建模:张量分解用于知识图谱(如TransE模型)。
5. 范数(Norm)
  • 定义:范数是向量或矩阵的“长度”度量,用于量化大小、距离或复杂度。

    • 常见类型
      • L0范数:非零元素个数(常用于稀疏性约束)。
      • L1范数:绝对值之和( ∣ ∣ x ∣ ∣ 1 = ∑ ∣ x i ∣ ||\mathbf{x}||_1 = \sum |x_i| ∣∣x1=xi,稀疏性正则化。
      • L2范数:欧几里得范数( ∣ ∣ x ∣ ∣ 2 = ∑ x i 2 ||\mathbf{x}||_2 = \sqrt{\sum x_i^2} ∣∣x2=xi2 ,防止过拟合。
      • L∞范数:最大绝对值( ∣ ∣ x ∣ ∣ ∞ = max ⁡ ∣ x i ∣ ||\mathbf{x}||_\infty = \max |x_i| ∣∣x=maxxi
      • Frobenius范数:矩阵版本的L2范数( ∣ ∣ A ∣ ∣ F = ∑ a i j 2 ||\mathbf{A}||_F = \sqrt{\sum a_{ij}^2} ∣∣AF=aij2
  • 机器学习中的应用

    • 正则化(Regularization)
      • L1正则化(Lasso):使模型参数稀疏化,选择重要特征。
      • L2正则化(Ridge):限制参数大小,防止过拟合。
    • 优化算法
      • 梯度裁剪(Gradient Clipping):用L2范数限制梯度爆炸。
      • 距离计算:K近邻(KNN)中的欧氏距离(L2)或曼哈顿距离(L1)。
    • 模型评估
      • 均方误差(MSE)等价于预测值与真实值差向量的L2范数平方。
    • 嵌入学习:对比学习(Contrastive Learning)中用余弦相似度(基于L2归一化)。
总结:机器学习中的核心角色
概念核心作用典型应用
标量参数、超参数、损失值学习率、损失函数输出
向量特征表示、梯度更新特征向量、嵌入向量
矩阵数据存储、线性变换权重矩阵、协方差矩阵
张量高维数据建模图像、视频、特征图
范数正则化、距离度量L1/L2正则化、KNN
扩展思考
  • 张量与深度学习框架:PyTorch/TensorFlow中所有数据均以张量形式处理,支持GPU加速。
  • 范数选择的影响:L1稀疏性适合特征选择,L2稳定性适合参数约束。
  • 高阶应用:张量网络(Tensor Networks)用于压缩模型或建模复杂关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/80548.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【2025年】基于电脑的jdk1.8通过idea创建springboot2.x版本(非常简洁快速)

【2025年】基于电脑的jdk1.8通过idea创建springboot2.x版本 提示:帮帮志会陆续更新非常多的IT技术知识,希望分享的内容对您有用。本章分享的是springboot的使用。前后每一小节的内容是存在的有:学习and理解的关联性。【帮帮志系列文章】&…

SierraNet协议分析使用指导[RDMA]| 如何设置 NVMe QP 端口以进行正确解码

在解码RoCEv2数据包(包括TCP RDMA和RoCE RDMA)时,若捕获的跟踪数据无法正确解码,通常需要执行特定的解码步骤。对于RoCE RDMA跟踪数据的处理,分析器主要采用两种方式获取必要信息以实现数据包解码: 首先&am…

JavaScript基础-局部作用域

在JavaScript中,理解不同种类的作用域是掌握这门语言的关键之一。作用域决定了变量和函数的可访问性(即可见性和生命周期)。与全局作用域相对应的是局部作用域,它限制了变量和函数只能在其定义的特定范围内被访问。本文将深入探讨…

李沐动手深度学习(pycharm中运行笔记)——09.softmax回归+图像分类数据集+从零实现+简洁实现

09.softmax回归图像分类数据集从零实现简洁实现(与课程对应) 目录 一、softmax回归 1、回归 vs 分类 2、经典分类数据集: 3、从回归到分类——均方损失 4、从回归到多类分类——无校验比例 5、从回归到多类分类——校验比例 6、softmax和…

C++八股——内存分配

文章目录 1. 虚拟内存空间2. malloc和free3. new和delete4. 内存池 1. 虚拟内存空间 程序进程的虚拟内存空间是操作系统为每个进程提供的独立、连续的逻辑地址空间,与物理内存解耦。其核心目的是隔离进程、简化内存管理,并提供灵活的内存访问控制。 &am…

【Linux基础】网络相关命令

目录 netstat命令 1.1 命令介绍 1.2 命令格式 1.3 常用选项 1.4 常用命令实例 1.4.1 显示所有TCP连接 1.4.2 查看路由表 1.4.3 实时监控网络接口流量 1.4.4 查看监听中的端口以及关联进程 ping命令 2.1 命令介绍 2.2 命令格式 2.3 常用选项 2.4 常用示例 ifconfi…

adb 实用命令汇总

版权归作者所有&#xff0c;如有转发&#xff0c;请注明文章出处&#xff1a;https://cyrus-studio.github.io/blog/ 基础adb命令 # 重启adb adb kill-server# 查看已连接的设备 adb devices# 进入命令行 adb shell# 使用 -s 参数来指定设备 adb -s <设备序列号> shell…

C#管道通讯及传输信息丢失的原因

以下是C#管道通讯客户端/服务端共用类 namespace PipeCommunication { /// <summary> /// 管道信息回调通知 /// </summary> /// <param name"msg"></param> public delegate void PipeMessageEventHandler(string msg…

MixTeX - 支持CPU推理的多模态LaTeX OCR

文章目录 一、项目概览相关资源核心特性技术特点 二、安装三、使用说明环境要求 四、版本更新五、当前限制 一、项目概览 MixTeX是一款创新的多模态LaTeX识别小程序&#xff0c;支持本地离线环境下的高效CPU推理。 无论是LaTeX公式、表格还是混合文本&#xff0c;MixTeX都能轻…

简单 Linux 字符设备驱动程序

注&#xff1a;本文为 “Linux 字符设备驱动” 相关文章合辑。 英文引文&#xff0c;机翻未校。 中文引文&#xff0c;略作重排。 未整理去重&#xff0c;如有内容异常&#xff0c;请看原文。 Simple Linux character device driver 简单 Linux 字符设备驱动程序 Oleg Kutko…

NX949NX952美光科技闪存NX961NX964

NX949NX952美光科技闪存NX961NX964 在半导体存储领域&#xff0c;美光科技始终扮演着技术引领者的角色。其NX系列闪存产品线凭借卓越的性能与创新设计&#xff0c;成为数据中心、人工智能、高端消费电子等场景的核心组件。本文将围绕NX949、NX952、NX961及NX964四款代表性产品…

协议路由与路由协议

协议路由”和“路由协议”听起来相似&#xff0c;但其实是两个完全不同的网络概念。下面我来分别解释&#xff1a; 一、协议路由&#xff08;Policy-Based Routing&#xff0c;PBR&#xff09; ✅ 定义&#xff1a; 协议路由是指 根据预设策略&#xff08;策略路由&#xff0…

Linux510 ssh服务 ssh连接

arning: Permanently added ‘11.1.1.100’ (ECDSA) to the list of known hosts. rooot11.1.1.100’s password: Permission denied, please try again. rooot11.1.1.100’s password: Permission denied, please try again 还没生效 登不上了 失效了 sshcaozx26成功登录 …

金融学知识笔记

金融学知识笔记 一、引言 金融学它结合了数学、概率论、统计学、经济学和计算机科学等多学科的知识&#xff0c;用于解决金融领域中的各种问题&#xff0c;如金融衍生品定价、投资组合优化、风险管理和固定收益证券分析等。通过对金融学的学习&#xff0c;我们可以更好地理解…

AB测试面试题

AB测试面试题 常考AB测试问答题(1)AB测试的优缺点是什么?(2)AB测试的一般流程/介绍一下日常工作中你是如何做A/B实验的?(3)第一类错误 vs 第二类错误 vs 你怎么理解AB测试中的第一、二类错误?(4)统计显著=实际显著?(5)AB测试效果统计上不显著?(6)实验组优于对…

USR-M100采集数据并提交MQTT服务器

本文为记录备忘&#xff0c;不做过多解释。 模块自身带有2路数字量输入&#xff0c;2路模拟量输入&#xff0c;2路485接口 数字量接报警输入&#xff0c;模拟量接压力传感器&#xff0c;液位传感器&#xff0c;485接口分别接流量计&#xff0c;温湿度传感器。 正确接线&…

Octave 绘图快速入门指南

目录 1. 基本的 2D 绘图 2. 自定义图形样式 3. 绘制散点图 4. 绘制柱状图 5. 绘制直方图 6. 3D 绘图 6.6.1 3D 曲面图 6.6.2 3D 散点图 7. 绘制极坐标 8. 多子图绘制 总结 Octave 是一个类似于 MATLAB 的开源数学软件&#xff0c;广泛用于数值计算和数据分析。它提供…

RabbitMQ--基础篇

RabbitMQ 简介&#xff1a;RabbitMQ 是一种开源的消息队列中间件&#xff0c;你可以把它想象成一个高效的“邮局”。它专门负责在不同应用程序之间传递消息&#xff0c;让系统各部分能松耦合地协作 优势&#xff1a; 异步处理&#xff1a;比如用户注册后&#xff0c;主程序将发…

【MySQL】事务(重点)

目录 一、什么是事务&#xff1a; 二、事务的前置知识了解 引擎是否支持事务 事务的提交方式 事务操作的前置准备&#xff1a; 三、事务回滚&#xff1a; 四、事务崩溃&#xff1a; 原子性&#xff1a; 持久性&#xff1a; 五、自动提交和手动提交&#xff1a; 六、…

C++STL——stack,queue

stack与queue 前言容器适配器deque 前言 本篇主要讲解stack与queue的底层&#xff0c;但并不会进行实现&#xff0c;stack的接口 queue的接口 &#xff0c;关于stack与queue的接口在这里不做讲解&#xff0c;因为通过前面的对STL的学习&#xff0c;这些接口都是大同小异的。 …