杭州公司网站制作驻马店网站建设公司

news/2025/9/22 23:46:28/文章来源:
杭州公司网站制作,驻马店网站建设公司,媒体网站模版,太原做网站费用选自TowardsDataScience作者#xff1a;George Seif本文转自机器之心(nearhuman2014)本文可以教你仅使用 3 行代码#xff0c;大大加快数据预处理的速度。Python 是机器学习领域内的首选编程语言#xff0c;它易于使用#xff0c;也有很多出色的库来帮助你更快处理数据。但…选自TowardsDataScience作者George Seif本文转自机器之心(nearhuman2014)本文可以教你仅使用 3 行代码大大加快数据预处理的速度。Python 是机器学习领域内的首选编程语言它易于使用也有很多出色的库来帮助你更快处理数据。但当我们面临大量数据时一些问题就会显现……在默认情况下Python 程序是单个进程使用单 CPU 核心执行。而大多数当代机器学习硬件都至少搭载了双核处理器。这意味着如果没有进行优化在数据预处理的时候会出现「一核有难九核围观」的情况——超过 50% 的算力都会被浪费。在当前四核处理器(英特尔酷睿 i5)和 6 核处理器(英特尔酷睿 i7)大行其道的时候这种情况会变得更加明显。幸运的是Python 库中内建了一些隐藏的特性可以让我们充分利用所有 CPU 核心的能力。通过使用 Python 的 concurrent.futures 模块我们只需要 3 行代码就可以让一个普通的程序转换成适用于多核处理器并行处理的程序。标准方法让我们举一个简单的例子在单个文件夹中有一个图片数据集其中有数万张图片。在这里我们决定使用 1000 张。我们希望在所有图片被传递到深度神经网络之前将其调整为 600×600 像素分辨率的形式。以下是你经常会在 GitHub 上看到的标准 Python 代码import globimport osimport cv2### Loop through all jpg files in the current folder ### Resize each one to size 600x600for image_filename in glob.glob(*.jpg): ### Read in the image data img  cv2.imread(image_filename) ### Resize the image img  cv2.resize(img, (600, 600)) 上面的程序遵循你在处理数据脚本时经常看到的简单模式1. 首先从需要处理内容的文件(或其他数据)列表开始。2. 使用 for 循环逐个处理每个数据然后在每个循环迭代上运行预处理。让我们在一个包含 1000 个 jpeg 文件的文件夹上测试这个程序看看运行它需要多久time python standard_res_conversion.py在我的酷睿 i7-8700k 6 核 CPU 上运行时间为 7.9864 秒在这样的高端 CPU 上这种速度看起来是难以让人接受的看看我们能做点什么。更快的方法为了便于理解并行化的提升假设我们需要执行相同的任务比如将 1000 个钉子钉入木头假如钉入一个需要一秒一个人就需要 1000 秒来完成任务。四个人组队就只需要 250 秒。在我们这个包含 1000 个图像的例子中可以让 Python 做类似的工作将 jpeg 文件列表分成 4 个小组运行 Python 解释器中的 4 个独立实例让 Python 的每个实例处理 4 个数据小组中的一个结合四个处理过程得到的结果得出最终结果列表。这一方法的重点在于Python 帮我们处理了所有棘手的工作。我们只需告诉它我们想要运行哪个函数要用多少 Python 实例剩下的就交给它了只需改变三行代码。实例import globimport osimport cv2import concurrent.futuresdef load_and_resize(image_filename): ### Read in the image data img  cv2.imread(image_filename) ### Resize the image img  cv2.resize(img, (600, 600)) ### Create a pool of processes. By default, one is created for each CPU in your machine.with concurrent.futures.ProcessPoolExecutor() as executor: ### Get a list of files to process image_files  glob.glob(*.jpg) ### Process the list of files, but split the work across the process pool to use all CPUs ### Loop through all jpg files in the current folder  ### Resize each one to size 600x600 executor.map(load_and_resize, image_files)从以上代码中摘出一行with concurrent.futures.ProcessPoolExecutor() as executor:你的 CPU 核越多启动的 Python 进程越多我的 CPU 有 6 个核。实际处理代码如下executor.map(load_and_resize, image_files)「executor.map()」将你想要运行的函数和列表作为输入列表中的每个元素都是我们函数的单个输入。由于我们有 6 个核我们将同时处理该列表中的 6 个项目如果再次用以下代码运行我们的程序time python fast_res_conversion.py我们可以将运行时间降到 1.14265 秒速度提升了近 6 倍注意在生成更多 Python 进程及在它们之间整理数据时会有一些开销所以速度提升并不总是这么明显。但是总的来说速度提升还是非常可观的。它总是那么快吗 如果你有一个数据列表要处理而且在每个数据点上执行相似的运算那么使用 Python 并行池是一个很好的选择。但有时这不是最佳解决方案。并行池处理的数据不会在任何可预测的顺序中进行处理。如果你对处理后的结果有特殊顺序要求那么这个方法可能不适合你。你处理的数据也必须是 Python 可以「炮制」的类型。所幸这些指定类别都很常见。以下来自 Python 官方文件None, True, 及 False整数、浮点数、复数字符串、字节、字节数组只包含可挑选对象的元组、列表、集合和字典在模块顶层定义的函数(使用 def 而不是 lambda )在模块顶层定义的内置函数在模块顶层定义的类这种类的实例其 __dict__ 或调用__getstate__() 的结果是可选择的(参见「Pickling Class Instances」一节)。原文链接https://towardsdatascience.com/heres-how-you-can-get-a-2-6x-speed-up-on-your-data-pre-processing-with-python-847887e63be5

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/910780.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

龙泉驿网站建设北京网站建设公司 蓝纤科技

文章目录 文章目录 pinia组成部分 pinia使用流程 注意Store获取到后不能解构,否则失去响应式 一、pinia原理? 功能:管理全局共享数据,pinia与vuex功能一样优势:pinia相对于vuex增加了对ts的支持,对响应式的…

国家工程建设标准化网站南京网站定制公司

目 录 2引脚说明 2.1引脚排列 2.2引脚定义 2.3内部引脚使用说明 2.4引脚上下拉、串联说明 2.5功能引脚信号走线长度与阻抗说明 本文档为创龙科技SOM-TLT507工业

一元夺宝网站怎么做wordpress上传权限设置密码

进行本示例的演示,需要先配置好Maven和Spring哦、见:【Spring】基于IntelliJ IDEA搭建Maven分析通过profile,我们可以获得不同的profile,我们可以获得不同的Bean。Spring4提供了一个更通用的基于条件的Bean的创建,即使用Condition…

网站备案在哪里审批我做的网站关键词到首页了没单子

第一部分:PyTorch 核心 欢迎来到本书的第一部分。在这里,我们将与 PyTorch 迈出第一步,获得理解其结构和解决 PyTorch 项目机制所需的基本技能。 在第一章中,我们将首次接触 PyTorch,了解它是什么,解决了…

网站界面(ui)设计形考任务1黄志达设计公司官网

发布时间:2015-09-10在游戏中新手玩家要注意些什么呢?今天就为大家带来新手必看技巧汇总,一起来看看吧. 新手必看技巧大全: 1.开局遇到人别急着标记,尽量先找到目标位置 2.如果开局 ...标签:发布时间:2016-04-29彩虹六号:围攻 地图攻略 总统…

自适应平台网站模板天元建设集团有限公司青岛分公司

2023.12.16 题目来源我的题解方法一 线段树(借鉴官方题解评论区 知白守黑) 题目来源 力扣每日一题;题序:2276 我的题解 方法一 线段树(借鉴官方题解评论区 知白守黑) 用一棵平衡二叉搜索树维护插入的区间…

门户网站网站制作帝国cms+wordpress

https://github.com/nihui/ruapu是nihui大佬开发的用单文件检测CPU特性的项目 ruapu.h的使用 "ruapu.h"主要提供了两个函数 ruapu_init 和 ruapu_supports,分别用于初始化和检测指令集支持。 // 使用示例见:https://github1s.com/nihui/rua…

郑州注册公司网上核名网站产品设计网站制作

SSL(Secure Sockets Layer,安全套接层)和 Kerberos(一种网络认证协议)都是用于提供身份验证和加密通信的技术。它们有以下主要区别: 目的: SSL 主要用于保护基于Web的应用的通信安全。而 Kerb…

营销企业网站制作wordpress登陆页面更改

排序类型小结 💦 插入排序直接插入排序希尔排序 💦 选择排序直接选择排序堆排序 💦 交换排序冒泡排序快速排序🐾霍尔版本补坑位版本前后指针版本非递归版本 💦 归并排序递归版本非递归版本 💦 性能测试 &am…

一些正在制作的“格林达姆”测试项目,以及“假无损”

就是这样。这里我得补充一点,第一张图的原曲是音乐平台自己升频做的假无损,后两张图的Adobe Audition 2022工程内的原声和伴奏都是44K比特率的声音导入Au处理了一下人声之后导出的“无损音乐”,能比原曲多出来7000多…

装潢公司网站建设wap手机网站

随着互联网的发展项目中的业务功能越来越复杂,有一些基础服务我们不可避免的会去调用一些第三方的接口或者公司内其他项目中提供的服务,但是远程服务的健壮性和网络稳定性都是不可控因素。 在测试阶段可能没有什么异常情况,但上线后可能会出…

个人怎么做网站排名优化鲜花网站素材

对象库接口:ObjectLib 迷你世界 更新时间: 2023-04-26 20:21:09 具体函数名及描述如下: 序号 函数名 函数描述 1 getAreaData(...) 获取区域数据 2 getPositionData(...) 获取位置数据 3 getLivingData(...) 获取生物数据 4 getItemDat…

淘宝网站是谁做的好建设单位网站需求报告

专业英语 部分专业名词 短语 在这里插入图片描述

母版页做网站例子wordpress 介绍插件

(一)单选 下列属于链路状态协议的是? Direct static FTP OSPF 解析: FTP:文件传输协议 OSPF:链路状态路由协议 如下图所示的网络主机A通过Telnet登录到路由器A然后在远程的界面通过FTP获取路由器的配置文件&…

建筑学网站推荐福田公司在哪里

nba数据库统计The idea is not to block every shot. The idea is to make your opponent believe that you might block every shot. — Bill Russel这个想法不是要阻止每一个镜头。 这个想法是让你的对手相信你可能会阻挡每一个投篮。 —比尔罗素 The block in basketball ha…

网站建设 百度云盘云设计平台

今天带你了解期权开户零门槛怎么操作?期权不满50w的开户方式。在股票期权市场上,期权交易是一种非常受欢迎的投资方式。它不仅可以增加投资组合的多样性,还可以为投资者提供一定的保护和利润机会,比如通过买入认股期权做空对冲大盘…

北京大兴专业网站建设公司wordpress无法加载图片

大模型技术的不断升级及应用落地,正在推动人工智能技术发展进入新的阶段,而智能化快速增长和发展的市场对芯片提出了更高的要求:高算力、高性能、灵活性、安全性。可重构计算区别于传统CPU、GPU,以指令驱动的串行执行方式&#xf…

网站建设与维护asp沈阳网站制作推广

C#(读作“C-sharp”)是一种由微软公司开发的通用高级编程语言,自2000年发布以来,它迅速成为开发人员构建各种类型应用程序的首选语言之一。C#的设计目标是成为一种简单、现代、面向对象的语言,它结合了C的强大功能和Ja…

做宣传册网站网站开发工作怎样

【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax概述 【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax快速入门 【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax类图 【大数据进阶第三阶段之Datax学习笔记】使用…

网站首页site不到 a5android 开发wordpress

【K3s】在 AWS EC2 上运行生产 K3s 集群 本文将介绍如何在 AWS EC2 上运行 K3s。您将创建一个 EC2 实例并在 AWS 上运行单节点 K3s 集群。 自托管的 K3s 允许您在裸金属上运行 Kubernetes,并应用较小、低资源工作负载的原则。哦,你还可以控制你的控制平面。这有点像逃离托管…