numpy学习笔记10:arr *= 2向量化操作性能优化

numpy学习笔记10:arr *= 2向量化操作性能优化

在 NumPy 中,直接对整个数组进行向量化操作(如 arr *= 2)的效率远高于显式循环(如 for i in range(len(arr)): arr[i] *= 2)。以下是详细的解释:


1. 性能差异的原理

(1) 底层实现不同
  • 显式循环(错误示范)

    • Python 的 for 循环是解释执行的,每次迭代需要动态解析变量类型、执行函数调用等操作。

    • 对每个元素的操作会触发多次 Python 层面的类型检查和计算,产生额外开销。

  • 向量化操作(正确示范)

    • NumPy 的 arr *= 2 是编译后的低级代码(C/Fortran 实现),直接操作连续的内存块

    • 所有元素的乘法操作一次性完成,无需逐元素处理,且支持 SIMD 指令并行加速。

(2) 内存访问效率
  • 显式循环

    • 逐个元素操作会导致频繁的内存访问,缓存命中率低。

  • 向量化操作

    • 连续的内存块一次性加载到 CPU 缓存,充分利用缓存局部性。

(3) 并行化能力
  • 显式循环

    • Python 的全局解释器锁(GIL)限制多线程并行。

  • 向量化操作

    • 底层库(如 Intel MKL、OpenBLAS)可能使用多线程或 SIMD 指令并行处理多个元素


2. 性能对比实验

使用 timeit 模块测试两种方法的执行时间(以 100 万个元素的数组为例):

import numpy as np
import timeitarr = np.random.rand(1_000_000)
print("数组的形状:", arr.shape)
print("数组的前 10 个元素:", arr[:10])# 错误示范:显式循环
def slow_method():global arrfor i in range(len(arr)):arr[i] *= 2# 正确示范:向量化操作
def fast_method():global arrarr *= 2# 测量执行时间
t_slow = timeit.timeit(slow_method, number=100)
t_fast = timeit.timeit(fast_method, number=100)print(f"显式循环耗时: {t_slow:.4f} 秒")
print(f"向量化操作耗时: {t_fast:.4f} 秒")

输出结果示例

显式循环耗时: 5.3127 秒
向量化操作耗时: 0.0052 秒
  • 向量化操作比显式循环快约 1000 倍


3. 关键优势

(1) 避免 Python 循环开销
  • Python 的 for 循环每次迭代需要:

    • 检查循环变量类型。

    • 调用 __getitem__ 和 __setitem__ 方法。

    • 管理循环计数器。

  • 这些操作在大量迭代时会累积成显著的时间损耗。

(2) 编译优化
  • NumPy 的向量化操作通过预编译的低级代码直接操作内存,避免 Python 解释器的动态类型检查。

  • 例如,arr *= 2 在底层等效于以下 C 代码:

    for (int i = 0; i < n; i++) {arr[i] *= 2;
    }

    但编译后的代码无需每次循环解析类型。

(3) 内存连续性
  • NumPy 数组在内存中是连续存储的,向量化操作可以一次性加载大块数据到 CPU 缓存,减少内存访问延迟。


4. 其他向量化操作示例

所有 NumPy 的数学运算均支持向量化,无需显式循环:

# 加法
arr += 5# 乘法
arr *= 3# 数学函数
arr = np.sin(arr)# 布尔运算
mask = arr > 0.5

5. 何时使用显式循环?

  • 无法向量化的复杂逻辑

    # 例如,元素间依赖关系(前一个元素影响后一个)
    for i in range(1, len(arr)):arr[i] = arr[i-1] * 2
  • 需要逐个处理的特殊情况

    for i in range(len(arr)):if arr[i] < 0:arr[i] = 0

总结

  • 优先使用向量化操作:对数组的整体运算(如 arr *= 2)应直接使用 NumPy 的内置函数或运算符。

  • 避免显式循环:Python 的 for 循环在处理大型数组时效率极低。

  • 性能敏感场景:向量化操作是科学计算的黄金标准,可充分利用硬件加速。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/74255.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cursor+Claude-3.5生成Android app

一、Android Studio下载 https://developer.android.com/studio?hlzh-tw#get-android-studio 等待安装完成 二、新建工程 点击new project 选择Empty Activity 起一个工程名 当弹出这个框时 可以在settings里面选择No proxy 新建好后如下 点击右边模拟器&#xff0c…

WPF Reactive 数据绑定

文章目录 Combox 绑定List-通过枚举绑定方法一:方法二:Button 绑定TextBlock绑定NumericUpDown绑定Expander绑定checkbox绑定NumericUpDownCombox 绑定List-通过枚举绑定 方法一: ViewControl using Avalonia; using Avalonia.Controls; using Avalonia.Markup.Xaml; usin…

算法及数据结构系列 - 滑动窗口

系列文章目录 算法及数据结构系列 - 二分查找 算法及数据结构系列 - BFS算法 算法及数据结构系列 - 动态规划 算法及数据结构系列 - 双指针 算法及数据结构系列 - 回溯算法 算法及数据结构系列 - 树 文章目录 滑动窗口框架思路经典题型76. 最小覆盖子串567. 字符串的排列438. …

Android adb调试应用程序

启动app 有的时候app不是预先安装的&#xff0c;也不能从界面start一个app&#xff0c;这时需要后台拉起app。 $adb shell am start package.name/Activity.name 例如&#xff0c;android原生camera app&#xff0c; 包名为com.android.camera2&#xff0c; mainActivity名为…

Java EE(15)——网络原理——TCP协议解析一

一.确认应答/(确认)序列号 接收方接收到数据后&#xff0c;向发送方返回一个确认信号(ack)&#xff0c;告诉发送方数据被成功接收。ACK报文段只是作为确认使用的&#xff0c;一般来说不携带应用层数据&#xff08;载荷&#xff09;&#xff0c;也就是说只有报头部分。但有可能…

node-ddk,electron 组件, 打开新窗口

node-ddk 打开新窗口 https://blog.csdn.net/eli960/article/details/146207062 也可以下载demo直接演示 http://linuxmail.cn/go#node-ddk 本文讲解如何在渲染进程发起创建新窗口, 包括 window.open 在主进程定义窗口类型 import main, { NODEDDK } from "node-ddk…

git管理时keil项目忽略文件列表

在使用 Git 管理 Keil MDK&#xff08;μVision 5&#xff09;工程时&#xff0c;需要忽略编译生成的临时文件、调试文件、用户配置等非必要内容。以下是忽略文件的详细列表及说明&#xff0c;可直接保存为 .gitignore 文件&#xff1a; Keil MDK 工程的 .gitignore 文件 giti…

C#单例模式

单例模式 (Singleton),保证一个类仅有一个实例&#xff0c;并提供一个访问它的全局访问点。通常我们可以让一个全局变量使得一个对象被访问&#xff0c;但它不能防止你实例化对个对象&#xff0c;一个最好的办法就是&#xff0c;让类自身负责保护它的唯一实例。这个类可以保证没…

ZYNQ的cache原理与一致性操作

在Xilinx Zynq SoC中&#xff0c;Cache管理是确保处理器与外部设备&#xff08;如FPGA逻辑、DMA控制器&#xff09;之间数据一致性的关键。Zynq的ARM Cortex-A9处理器包含L1 Cache&#xff08;指令/数据&#xff09;和L2 Cache&#xff0c;其刷新&#xff08;Flush/Invalidate&…

Linux NFS、自动挂载与系统启动管理指南

1. NFS客户端挂载导出的目录的方式 NFS&#xff08;网络文件系统&#xff09; 允许将远程服务器的目录挂载到本地&#xff0c;像访问本地文件一样操作远程文件。挂载方式主要有两种&#xff1a; 手动挂载&#xff1a;使用 mount 命令&#xff08;临时生效&#xff0c;重启后丢…

NO.55十六届蓝桥杯备战|排序|插入|选择|冒泡|堆|快速|归并(C++)

插⼊排序 插⼊排序(Insertion Sort)类似于玩扑克牌插牌过程&#xff0c;每次将⼀个待排序的元素按照其关键字⼤⼩插⼊到前⾯已排好序的序列中&#xff0c;按照该种⽅式将所有元素全部插⼊完成即可 #include <iostream> using namespace std; const int N 1e5 10; …

【Oracle资源损坏类故障】:详细了解坏块

目录 1、物理坏块与逻辑坏块 1.1、物理坏块 1.2、逻辑坏块 2、两个坏块相关的参数 2.1、db_block_checksum 2.2、db_block_checking 3、检测坏块 3.1、告警日志 3.2、RMAN 3.3、ANALYZE 3.4、数据字典 3.5、DBVERIFY 4、修复坏块 4.1、RMAN修复 4.2、DBMS_REPA…

计算机网络高频(二)TCP/IP基础

计算机网络高频(二)TCP/IP基础 1.什么是TCP/IP⭐⭐ TCP/IP是一种网络通信协议,它是互联网中最常用的协议之一。TCP/IP有两个基本的协议:TCP(传输控制协议)和IP(互联网协议)。 TCP(Transmission Control Protocol,传输控制协议)是一种可靠的、面向连接的协议。它负…

【大模型算法工程】大模型应用工具化、忠诚度以及知识库场景下PDF双栏解析问题的讨论

1. 大模型时代应用工具化以及无忠诚度现象讨论 接触大模型久了&#xff0c;也慢慢探到一些大模型能力表现非常自然和突出的场景&#xff0c;比如AI搜索&#xff08;依赖大模型的理解总结能力&#xff09;、AI对话&#xff08;即chat&#xff0c;依赖大模型的生成能力&#xff0…

Java EE(13)——网络编程——UDP/TCP回显服务器

前言 本文主要介绍UDP和TCP相关的API&#xff0c;并且基于这两套API实现回显服务器 UDP和TCP UDP和TCP属于网络五层模型中传输层的协议 特点&#xff1a; UDP&#xff1a;无连接&#xff0c;不可靠&#xff0c;面向数据包&#xff0c;全双工 TCP&#xff1a;有连接&#xff…

【蓝桥杯】12111暖气冰场(多源BFS 或者 二分)

思路 这题可以用BFS做&#xff0c;也可以用二分来做。 用二分这里只提供一个思路&#xff1a;对时间来二分查找&#xff0c;check函数就是检查在特定的时间 t 0 t_0 t0​内每一个暖气炉的传播距离能否覆盖所有格子。 用BFS做&#xff1a; 由几个点开始向外扩散&#xff0c;知道…

使用bat批量获取WORD中包含对应字符的段落,段落使用回车换行

get_word_paragraphs.vbs 获取命令行参数 If WScript.Arguments.Count 0 ThenWScript.Quit 1 End If 获取 Word 文档路径 docPath WScript.Arguments(0) 创建 Word 应用程序对象 Set objWord CreateObject("Word.Application") objWord.Visible False 打开 Word …

DeepSeek自学手册:《从理论(模型训练)到实践(模型应用)》|73页|附PPT下载方法

导 读INTRODUCTION 今天分享是由ai呀蔡蔡团队带来的DeepSeek自学手册&#xff1a;《从理论&#xff08;模型训练&#xff09;到实践&#xff08;模型应用&#xff09;》&#xff0c;这是一篇关于DeepSeek模型训练、应用场景及替代方案的综合指南文章&#xff0c;主要介绍了Deep…

WEB API 设计规范

REST API 简介 REST 是 Representational State Transfer 的缩写&#xff0c;它将资源作为核心概念&#xff0c;通过 HTTP 方法对资源进行操作。其本身是一套围绕资源进行操作的架构规范。在实际应用中&#xff0c;更多的是体现在 API 的设计上。 企业在进行产品设计开发时&a…

QT软件匠心开发,塑造卓越设计服务

在当今这个数字化飞速发展的时代&#xff0c;软件已经成为我们生活中不可或缺的一部分。而QT&#xff0c;作为一款跨平台的C图形用户界面应用程序开发框架&#xff0c;凭借其强大的功能和灵活性&#xff0c;在众多软件开发工具中脱颖而出。我们深知&#xff0c;在软件开发领域&…