基于PyTorch的深度学习2——逐元素操作,归并,比较,矩阵

以下为部分逐元素操作代码实例。

import torcht = torch.randn(1, 3)
t1 = torch.randn(3, 1)
t2 = torch.randn(1, 3)#t+0.1*(t1/t2)
torch.addcdiv(t, 0.1, t1, t2)#计算sigmoid
torch.sigmoid(t)#将t限制在[0,1]之间
torch.clamp(t,0,1)#t+2进行就地运算
t.add_(2)

归并操作一般涉及一个dim参数,指定沿哪个维进行归并。另一个参数是keepdim,说明输出结果中是否保留维度1,缺省情况是False,即不保留。以下为归并操作的部分代码

import torch#生成一个含6个数的向量
a=torch.linspace(0,10,6)#使用view方法,把a变为2x3矩阵
a=a.view((2,3))#沿y轴方向累加,即dim=0
b=a.sum(dim=0)   #b的形状为[3]#沿y轴方向累加,即dim=0,并保留含1的维度
b=a.sum(dim=0,keepdim=True) #b的形状为[1,3]

机器学习和深度学习中存在大量的矩阵运算,常用的算法有两种:一种是逐元素乘法,另外一种是点积乘法

1)Torch的dot与Numpy的dot有点不同,Torch中的dot是对两个为1D张量进行点积运算,Numpy中的dot无此限制。

2)mm是对2D的矩阵进行点积,bmm对含batch的3D进行点积运算。

3)转置运算会导致存储空间不连续,需要调用contiguous方法转为连续。

torch.dottorch.mmtorch.bmm

1. 使用 torch.dot

torch.dot 计算两个一维张量(向量)的点积。

import torcha = torch.tensor([2, 3])
b = torch.tensor([3, 4])result_dot = torch.dot(a, b)  # 运行结果为 2*3 + 3*4 = 6 + 12 = 18
print("Dot product result:", result_dot)

解释: 点积是对应元素相乘后的和,即 2×3+3×4=6+12=182×3+3×4=6+12=18。

2. 使用 torch.mm

torch.mm 执行两个二维张量(矩阵)之间的矩阵乘法。

x = torch.randint(10, (2, 3))  # 创建一个形状为 (2, 3) 的随机整数张量
y = torch.randint(6, (3, 4))   # 创建一个形状为 (3, 4) 的随机整数张量result_mm = torch.mm(x, y)  # 形状为 (2, 4) 的结果张量
print("Matrix multiplication result:\n", result_mm)

解释: torch.mm 对两个二维张量执行标准的矩阵乘法。给定 XX 是 2×32×3 的矩阵,YY 是 3×43×4 的矩阵,则结果是一个 2×42×4 的矩阵。

示例输出

x = tensor([[7, 8, 9],[5, 6, 7]])
y = tensor([[4, 3, 2, 1],[0, 1, 2, 3],[4, 3, 2, 1]])
tensor([[64, 54, 44, 34],[48, 40, 32, 24]])

3. 使用 torch.bmm

torch.bmm 执行批量矩阵乘法,适用于三维张量,其中每个二维子张量(切片)都进行矩阵乘法。

x = torch.randint(10, (2, 2, 3))  # 创建一个形状为 (2, 2, 3) 的随机整数张量
y = torch.randint(6, (2, 3, 4))   # 创建一个形状为 (2, 3, 4) 的随机整数张量result_bmm = torch.bmm(x, y)  # 形状为 (2, 2, 4) 的结果张量
print("Batch matrix multiplication result:\n", result_bmm)

解释: torch.bmm 针对三维张量中的每一对二维子张量执行矩阵乘法。对于形状为 (batch_size, m, n)(batch_size, n, p) 的输入张量,输出将是形状为 (batch_size, m, p) 的张量。

示例输出

假设 xy 分别是:

x = tensor([[[7, 8, 9],[5, 6, 7]],[[1, 2, 3],[4, 5, 6]]])y = tensor([[[4, 3, 2, 1],[0, 1, 2, 3],[4, 3, 2, 1]],[[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12]]])

result_bmm 可能是:

tensor([[[64, 54, 44, 34],[48, 40, 32, 24]],[[38, 44, 50, 56],[86, 98, 110, 122]]])

总结

  • torch.dot:用于计算两个一维张量的点积。
  • torch.mm:用于计算两个二维张量的标准矩阵乘法。
  • torch.bmm:用于计算两个三维张量中对应的二维子张量之间的批量矩阵乘法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/71205.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

线程池的工作流程

线程池的工作流程主要包括任务提交、线程分配、任务执行和线程回收等环节,以下是对其详细的描述: 任务提交 当有任务需要执行时,用户通过线程池提供的提交方法,如execute()或submit()方法,将任务(通常是实现…

C++20 标准化有符号整数:迈向更可预测的整数运算

文章目录 一、背景:为什么需要标准化?二、2 的补码:原理与优势(一)2 的补码原理(二)2 的补码的优势 三、C20 的变化:明确 2 的补码四、如何利用这一特性优化代码(一&…

Libgdx游戏开发系列教程(1)——环境配置及demo运行

目录 环境 JDK环境 项目创建 1.下载gdx-setup.jar文件 2.填写信息,创建项目 demo运行步骤 1.修改gradle.properties 2.安装Build-Tool 3.运行 Libgdx游戏是基于Java的一款游戏引擎,可以发布Android,桌面端,Html,IOS等游戏,出名的《杀戮尖塔》也是用了此引擎制作的 本…

【jenkins配置记录】

全局工具配置: D:\Program Files\Java\jdk1.8.0_281 D:\Program Files\Git\bin\git.exe E:\allure-2.13.2 2. GIT 3. 定时任务 H 8 * * 1-5 4. 构建触发器 5. 构建后操作 Allure Report 吐血记录:报告路径可以为 workspace 相对路径 6. 系统配置 em…

C++:内联函数

内联函数可以用来降低运行时间,当内联函数收到编译器的指示时,即可发生内联:编译器会使用函数的定义体来替代函数调用语句,此行为发生在编译阶段。 定义内联函数涉及的关键字为inline,例如: inline void …

Linux网络相关概念和重要知识(1)(网络协议、网络通信)

目录 1.网络协议 (1)网络的起源 (2)为什么需要协议 (3)协议分层及其设计的解耦 (4)OSI定义的七层网络模型 ①分层及其功能 ②TCP/IP协议 ③传输层协议(TCP和UDP&a…

【入门Web安全之前端学习的侧重点和针对性的建议】

入门Web安全之前端学习的侧重点和针对性的建议 一、HTML:理解攻击载荷的载体二、CSS:次要但需警惕点击劫持三、JavaScript:渗透测试的核心重点四、浏览器工具:渗透测试的实战武器五、学习建议与资源六、总结:渗透测试者…

QILSTE H6-C210TCG高亮翠绿光LED灯珠 发光二极管LED

# H6-C210TCG:高亮翠绿光LED的复杂特性解析 在现代电子设备的复杂设计中,H6-C210TCG型号的高亮翠绿光LED以其独特的光学和电气特性脱颖而出。这款LED不仅具备紧凑的尺寸,还融合了复杂的参数设计,使其在众多应用场景中表现出色。然…

Linux操作系统5-进程信号2(信号的4种产生方式,signal系统调用)

上篇文章:Linux操作系统5-进程信号1(信号基础)-CSDN博客 本篇Gitee仓库:myLerningCode/l25 橘子真甜/Linux操作系统与网络编程学习 - 码云 - 开源中国 (gitee.com) 本篇重点:信号的4种产生 目录 一. signal系统调用 …

如何在docker中的mysql容器内执行命令与执行SQL文件

通过 docker ps -a 查询当前运行的容器,找到想执行命令的容器名称。 docker ps -a若想执行sql文件,则将sql文件放入当前文件夹下后将项目内的 SQL 文件拷贝到 mysql 容器内部的 root下。 sudo docker cp /root/enterprise.sql mysql:/root/然后进入 my…

STM32 RTC实时时钟详解与HAL库实战教程

摘要:本文深入讲解STM32的RTC(Real-Time Clock)模块,涵盖原理分析、CubeMX配置、HAL库编程实现,并提供完整的闹钟设置与时间校准例程代码。通过本文,您将掌握RTC在低功耗场景下的核心应用技巧。 1. RTC模块…

Spring Boot拦截器(Interceptor)与过滤器(Filter)详细教程

Spring Boot拦截器(Interceptor)与过滤器(Filter)详细教程 目录 概述 什么是拦截器(Interceptor)?什么是过滤器(Filter)?两者的核心区别 使用场景 拦截器的典…

Tauri跨平台开发问题及解决方案深度解析(React版)

Tauri跨平台开发问题及解决方案深度解析(React版) 一、环境配置与项目初始化难题(React适配) 1.1 React项目初始化 推荐模板: # 使用ReactTypeScript模板 npm create tauri-applatest -- --template react-ts# 项目…

AIGC和搜索引擎的异同

AIGC(生成式人工智能)与搜索引擎的核心差异体现在信息处理方式和输出形态上,我们可以从以下维度对比: 一、工作原理的本质差异 信息检索机制 搜索引擎:基于关键词匹配(如"中暑怎么办"→返回相关…

SFT与RLHF的关系

在大模型训练中,SFT(监督微调)和RLHF(基于人类反馈的强化学习)是相互关联但目标不同的两个阶段,通常需要结合使用以优化模型性能,而非互相替代。以下是关键要点: 1. 核心关系 SFT&…

C# 类型转换

C# 类型转换 引言 在C#编程语言中,类型转换是一种将一个数据类型的变量转换成另一个数据类型的操作。类型转换是编程中常见的操作,特别是在处理不同数据类型的变量时。本文将详细探讨C#中的类型转换,包括隐式转换和显式转换,以及…

提升系统效能:从流量控制到并发处理的全面解析

在当今快速发展的数字时代,无论是构建高效的网络服务、管理海量数据,还是优化系统的并发处理能力,都是技术开发者和架构师们面临的重大挑战。本文集旨在深入探讨几个关键技术领域,包括用于网络通信中的漏桶算法与令牌桶算法的原理…

Git GitHub基础

git是什么? Git是一个分布式版本控制系统,用于管理源代码的变更。它允许多个开发者在同一个项目上协作,同时跟踪每个修改的历史记录。 关键词: 分布式版本控制软件 软件 安装到我们电脑上的一个工具 版本控制 例如论文&…

派可数据BI接入DeepSeek,开启智能数据分析新纪元

派可数据BI产品完成接入DeepSeek,此次接入标志着派可数据BI在智能数据分析领域迈出了重要一步,将为用户带来更智能、更高效、更便捷的数据分析体验。 派可数据BI作为国内领先的商业智能解决方案提供商,一直致力于为用户提供高效、稳定易扩展…

Linux-ftrace-双nop机制的实现

Linux 内核调试工具ftrace 之(NOP动态插桩的实现原理) ftrace 是 Linux 内核中的一种跟踪工具,主要用于性能分析、调试和内核代码的执行跟踪。它通过在内核代码的关键点插入探针(probe)来记录函数调用和执行信息。这对…