【CANN训练营】体验基于Caffe ResNet-50网络实现图片分类实践操作

实例功能

很简单的一个实例,功能就是一个实现图片分类的功能,然后拓展实现以下

  • 将一张YUV420SP格式的图片编码为*.jpg格式的图片。
  • 将两张*.jpg格式的解码成两张YUV420SP NV12格式的图片,缩放,再进行模型推理,分别得到两张图片的推理结果后,处理推理结果,输出最大置信度的类别标识以及top5置信度的总和。
  • 将两张*.jpg格式的解码成两张YUV420SP NV12格式的图片,抠图,再进行模型推理,分别得到两张图片的推理结果后,处理推理结果,输出最大置信度的类别标识以及top5置信度的总和。
  • 将两张*.jpg格式的解码成两张YUV420SP NV12格式的图片,抠图贴图,再进行模型推理,分别得到两张图片的推理结果后,处理推理结果,输出最大置信度的类别标识以及top5置信度的总和。
  • 将YUV420SP NV12格式的图片(分辨率8192*8192)缩放,得到4000*4000。

环境及环境版本介绍

NPU:Ascend910(32GB)

CANN版本:CANN-8.0.RC3.alpha001

开始实践

创建conda环境

conda create -n cann_demopython=3.8-y conda activate cann_demo

安装CANN

wgethttps://ascend-repo.obs.cn-east-2.myhuaweicloud.com/Milan-ASL/Milan-ASL%20V100R001C20SPC703/Ascend-cann-toolkit_8.0.0.alpha003_linux-aarch64.runbashAscend-cann-toolkit_8.0.0.alpha003_linux-aarch64.run --full

激活环境变量

source/home/ma-user/Ascend/ascend-toolkit/set_env.sh

下载体验代码仓

gitclone -b v0.3-8.0.0.alpha003 https://gitee.com/Ascend/samples

进入示例文件夹

cdsamples/cplusplus/level2_simple_inference/1_classification/vpc_jpeg_resnet50_imagenet_classification

获取ResNet-50原始模型

下载模型CAFFE文件

cdcaffe_modelwgethttps://obs-9be7.obs.cn-east-2.myhuaweicloud.com/003_Atc_Models/AE/ATC%20Model/resnet50/resnet50.caffemodelwgethttps://obs-9be7.obs.cn-east-2.myhuaweicloud.com/003_Atc_Models/AE/ATC%20Model/resnet50/resnet50.prototxtcd..

安装依赖

pipinstalldecorator attrs psutil sympy scipy

转换模型

atc --model=caffe_model/resnet50.prototxt --weight=caffe_model/resnet50.caffemodel --framework=0--soc_version=Ascend910 --insert_op_conf=caffe_model/aipp.cfg --output=model/resnet50_aipp

准备测试图片

cddatawgethttps://obs-9be7.obs.cn-east-2.myhuaweicloud.com/models/aclsample/dvpp_vpc_8192x8192_nv12.yuvwgethttps://obs-9be7.obs.cn-east-2.myhuaweicloud.com/models/aclsample/persian_cat_1024_1536_283.jpgwgethttps://obs-9be7.obs.cn-east-2.myhuaweicloud.com/models/aclsample/wood_rabbit_1024_1061_330.jpgwgethttps://obs-9be7.obs.cn-east-2.myhuaweicloud.com/models/aclsample/wood_rabbit_1024_1068_nv12.yuvcd..

编译运行

安装依赖

condainstall-c conda-forge cmake condainstall-c conda-forge binutils

创建目录

mkdir-p build/intermediates/host

设置环境变量

source/home/ma-user/Ascend/ascend-toolkit/set_env.shexportDDK_PATH=$HOME/Ascend/ascend-toolkit/latestexportNPU_HOST_LIB=$DDK_PATH/runtime/lib64/stub

生成编译文件

cdbuild/intermediates/host cmake../../../src -DCMAKE_CXX_COMPILER=g++ -DCMAKE_SKIP_RPATH=TRUEmake

运行

设置main文件权限为可运行

cd ../../../out chmod +x main

将两张*.jpg格式的解码成两张YUV420SP NV12格式的图片,缩放,再进行模型推理,分别得到两张图片的推理结果

./main0

运行结果

[INFO] ./main param, param represents a vpc feature and must be set [INFO] start check result fold:./result [INFO] make directory successfully. [INFO] check result success, fold exist [INFO] acl init success [INFO] set device 0 success [INFO] create context success [INFO] create stream success [INFO] get run mode success [INFO] dvpp init resource success [INFO] load model ../model/resnet50_aipp.om success [INFO] create model description success [INFO] create model output success [INFO] model input width 224, input height 224 [INFO] ------------------------------------------- [INFO] start to process picture:../data/persian_cat_1024_1536_283.jpg [INFO] call JpegD [INFO] call vpcResize [INFO] Process dvpp success [INFO] create model input success [INFO] model execute success [INFO] destroy model input success [INFO] result : classType[283], top1[0.969727], top5[0.979855] [INFO] ------------------------------------------- [INFO] start to process picture:../data/wood_rabbit_1024_1061_330.jpg [INFO] call JpegD [INFO] call vpcResize [INFO] Process dvpp success [INFO] create model input success [INFO] model execute success [INFO] destroy model input success [INFO] result : classType[331], top1[0.895508], top5[1.000134] [INFO] ------------------------------------------- [INFO] unload model success, modelId is 1 [INFO] destroy model description success [INFO] destroy model output success [INFO] execute sample success [INFO] end to destroy stream [INFO] end to destroy context [INFO] end to reset device 0 [INFO] end to finalize acl

将两张*.jpg格式的解码成两张YUV420SP NV12格式的图片,抠图,再进行模型推理,分别得到两张图片的推理结果。

./main1

运行结果

[INFO] ./main param, param represents a vpc feature and must be set [INFO] start check result fold:./result [INFO] check result success, fold exist [INFO] acl init success [INFO] set device 0 success [INFO] create context success [INFO] create stream success [INFO] get run mode success [INFO] dvpp init resource success [INFO] load model ../model/resnet50_aipp.om success [INFO] create model description success [INFO] create model output success [INFO] model input width 224, input height 224 [INFO] ------------------------------------------- [INFO] start to process picture:../data/persian_cat_1024_1536_283.jpg [INFO] call JpegD [INFO] call vpcCrop [INFO] Process dvpp success [INFO] create model input success [INFO] model execute success [INFO] destroy model input success [INFO] result : classType[283], top1[0.996094], top5[0.999629] [INFO] ------------------------------------------- [INFO] start to process picture:../data/wood_rabbit_1024_1061_330.jpg [INFO] call JpegD [INFO] call vpcCrop [INFO] Process dvpp success [INFO] create model input success [INFO] model execute success [INFO] destroy model input success [INFO] result : classType[330], top1[0.859863], top5[1.000106] [INFO] ------------------------------------------- [INFO] unload model success, modelId is 1 [INFO] destroy model description success [INFO] destroy model output success [INFO] execute sample success [INFO] end to destroy stream [INFO] end to destroy context [INFO] end to reset device 0 [INFO] end to finalize acl

将两张*.jpg格式的解码成两张YUV420SP NV12格式的图片,抠图贴图,再进行模型推理,分别得到两张图片的推理结果。

./main2

运行结果

[INFO] ./main param, param represents a vpc feature and must be set [INFO] start check result fold:./result [INFO] check result success, fold exist [INFO] acl init success [INFO] set device 0 success [INFO] create context success [INFO] create stream success [INFO] get run mode success [INFO] dvpp init resource success [INFO] load model ../model/resnet50_aipp.om success [INFO] create model description success [INFO] create model output success [INFO] model input width 224, input height 224 [INFO] ------------------------------------------- [INFO] start to process picture:../data/persian_cat_1024_1536_283.jpg [INFO] call JpegD [INFO] call vpcCropAndPaste [INFO] Process dvpp success [INFO] create model input success [INFO] model execute success [INFO] destroy model input success [INFO] result : classType[283], top1[0.431885], top5[0.751892] [INFO] ------------------------------------------- [INFO] start to process picture:../data/wood_rabbit_1024_1061_330.jpg [INFO] call JpegD [INFO] call vpcCropAndPaste [INFO] Process dvpp success [INFO] create model input success [INFO] model execute success [INFO] destroy model input success [INFO] result : classType[330], top1[0.685059], top5[0.969410] [INFO] ------------------------------------------- [INFO] unload model success, modelId is 1 [INFO] destroy model description success [INFO] destroy model output success [INFO] execute sample success [INFO] end to destroy stream [INFO] end to destroy context [INFO] end to reset device 0 [INFO] end to finalize acl

将一张YUV420SP格式的图片编码为*.jpg格式的图片。

./main3

运行结果

[INFO] ./main param, param represents a vpc feature and must be set [INFO] start check result fold:./result [INFO] check result success, fold exist [INFO] acl init success [INFO] set device 0 success [INFO] create context success [INFO] create stream success [INFO] get run mode success [INFO] dvpp init resource success [INFO] start to jpege picture ../data/wood_rabbit_1024_1068_nv12.yuv [INFO] end to destroy stream [INFO] end to destroy context [INFO] end to reset device 0 [INFO] end to finalize acl

将一张分辨率为8192*8192的YUV420SP格式的图片缩放至4000*4000。

./main4

运行结果

[INFO] ./main param, param represents a vpc feature and must be set [INFO] start check result fold:./result [INFO] check result success, fold exist [INFO] acl init success [INFO] set device 0 success [INFO] create context success [INFO] create stream success [INFO] get run mode success [INFO] dvpp process 8k resize begin [INFO] dvpp init resource success [INFO] dvpp process 8k resize success [INFO] end to destroy stream [INFO] end to destroy context [INFO] end to reset device 0 [INFO] end to finalize acl

整体运行结果

执行可执行文件成功后,同时会在main文件同级的result目录下生成结果文件,便于后期查看。结果文件如下:

  • dvpp_output_0:persian_cat_1024_1536_283.jpg:图片经过缩放或抠图或抠图贴图之后的结果图片。
  • dvpp_output_1:wood_rabbit_1024_1061_330.jpg:图片经过缩放或抠图或抠图贴图之后的结果图片。
  • model_output_0:persian_cat_1024_1536_283.jpg:图片的模型推理结果,二进制文件。
  • model_output_0.txt:persian_cat_1024_1536_283.jpg:图片的模型推理结果,txt文件。
  • model_output_1:wood_rabbit_1024_1061_330.jpg:图片的模型推理结果,二进制文件。
  • model_output_1.txt:wood_rabbit_1024_1061_330.jpg:图片的模型推理结果,txt文件。
  • jpege_output_0.jpg:wood_rabbit_1024_1068_nv12.yuv:图片结果编码后的结果图片。
  • dvpp_vpc_4000x4000_nv12.yuv:dvpp_vpc_8192x8192_nv12.yuv:图片缩放后的结果图片。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1123885.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智能教学助手:快速搭建教具识别课堂应用

智能教学助手:快速搭建教具识别课堂应用 作为一名小学科学老师,你是否遇到过这样的困扰:课堂上学生面对各种实验器材时充满好奇,却因为不熟悉使用方法而手足无措?传统的教学方式需要老师反复讲解器材用途,效…

计算机视觉运维监控:模型服务健康度指标体系建设

计算机视觉运维监控:模型服务健康度指标体系建设 随着计算机视觉技术在工业、安防、零售等领域的广泛应用,模型从研发到上线的生命周期管理正面临前所未有的挑战。尤其是在多场景、高并发、持续迭代的生产环境中,如何有效监控模型服务的运行状…

企业级PPK系统登录页面开发实战

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个企业级PPK系统登录页面,需要实现:1.基于JWT的身份认证 2.图形验证码功能 3.登录失败次数限制 4.密码强度检测 5.登录日志记录。使用Spring Boot后端…

万物识别模型推理速度优化技巧:提升响应效率的方法

万物识别模型推理速度优化技巧:提升响应效率的方法 基于阿里开源中文通用领域图像识别模型的工程化提速实践 在当前AI应用快速落地的背景下,万物识别(Any-Object Recognition) 技术作为计算机视觉的核心能力之一,正被广…

宠物成长记录:按时间轴整理毛孩各阶段影像

宠物成长记录:按时间轴整理毛孩各阶段影像 引言:从“拍了就忘”到智能归档的进化之路 在养宠家庭中,手机相册里往往积累了成百上千张宠物照片——从刚接回家时怯生生的小奶猫,到满屋撒欢的调皮少年,再到慵懒晒太阳的成…

垃圾分类指导APP:拍照识别垃圾类型并提示投放方式

垃圾分类指导APP:拍照识别垃圾类型并提示投放方式 引言:从环保需求到智能识别的技术落地 随着城市化进程加快,垃圾分类已成为现代城市管理的重要环节。然而,面对“可回收物”“有害垃圾”“湿垃圾”“干垃圾”等复杂分类标准&…

AI艺术创作:结合万物识别技术的创意图像生成方案

AI艺术创作:结合万物识别技术的创意图像生成方案 作为一名数字艺术家,你是否曾想过将AI识别技术与艺术创作相结合,但又苦于复杂的模型部署和技术细节?本文将介绍一种现成的解决方案——"AI艺术创作:结合万物识别技…

码市VS传统开发:效率提升10倍的秘密

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个对比工具,展示码市平台与传统开发方式在时间、代码量和错误率上的差异。要求生成一个可视化图表,展示不同开发阶段的效率对比,并提供具…

虚拟试衣间技术:人体轮廓识别与服装贴合渲染

虚拟试衣间技术:人体轮廓识别与服装贴合渲染 引言:从“万物识别”到虚拟试衣的技术跃迁 在计算机视觉的广阔领域中,通用图像识别技术正以前所未有的速度演进。阿里开源的「万物识别-中文-通用领域」模型,作为面向中文语境下多场景…

中文优先设计!Hunyuan-MT-7B对中文语义理解更深刻

中文优先设计!Hunyuan-MT-7B对中文语义理解更深刻 在全球化日益深入的今天,跨语言沟通早已不再是简单的“字面对译”。尤其是在中文这一语法灵活、语义丰富、文化负载极重的语言场景下,传统机器翻译常常陷入“翻得出来但读着别扭”的尴尬境地…

盲文转换辅助:图像转语音描述系统构建

盲文转换辅助:图像转语音描述系统构建 引言:为视障群体打造智能视觉桥梁 在数字时代,视觉信息占据了信息交互的主导地位。然而,对于全球超过3000万的视障人士而言,图像内容始终是一道难以逾越的信息鸿沟。传统的盲文系…

PyTorch与AI:如何用智能工具加速深度学习开发

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个基于PyTorch的深度学习项目,使用快马平台的AI辅助功能自动生成一个图像分类模型的代码框架。要求包括数据加载、模型定义、训练循环和评估模块。模型需要支持R…

XSS跨站脚本攻击防范:Hunyuan-MT-7B前端过滤机制

XSS跨站脚本攻击防范:Hunyuan-MT-7B前端过滤机制 在AI模型加速Web化的今天,大语言模型不再只是实验室里的“黑箱”,而是以直观的网页界面走进开发者、企业用户甚至普通用户的日常使用场景。腾讯混元推出的 Hunyuan-MT-7B-WEBUI 正是这一趋势…

DDoS攻击防御策略在Hunyuan-MT-7B服务中的实施

DDoS攻击防御策略在Hunyuan-MT-7B服务中的实施 在当今AI模型加速走向公共服务的背景下,越来越多的大语言模型(LLM)通过Web界面对外提供推理能力。以 Hunyuan-MT-7B-WEBUI 为例,它将高性能机器翻译能力封装成浏览器可直接访问的服务…

智能制造场景:MGeo统一全球工厂地址便于供应链协同

智能制造场景:MGeo统一全球工厂地址便于供应链协同 在智能制造与全球化供应链深度融合的今天,企业往往在全球范围内拥有数十甚至上百个生产基地、合作工厂和物流节点。这些实体的地址信息通常以多语言、多格式、非结构化的方式分散在ERP、WMS、SRM等系统…

乡村教师借助Hunyuan-MT-7B为学生提供双语教学资源

乡村教师借助Hunyuan-MT-7B为学生提供双语教学资源 在西藏林芝的一所小学里,藏族语文老师卓玛正准备第二天的《草原上的小木屋》课文讲解。班上一半学生母语是藏语,对汉语长句理解吃力。她打开教室角落那台旧笔记本电脑,启动一个名为“Hunyua…

低成本实验方案:用云端GPU按需运行中文物体识别模型

低成本实验方案:用云端GPU按需运行中文物体识别模型 作为一名初创公司的CTO,我最近需要测试多个开源物体识别模型的效果,但购买昂贵的GPU服务器显然不划算。经过实践,我发现利用云端GPU按需计费的方式,可以灵活高效地完…

游戏开发辅助:NPC行为模式识别算法参考实现

游戏开发辅助:NPC行为模式识别算法参考实现 在现代游戏开发中,非玩家角色(NPC)的行为智能化程度直接影响玩家的沉浸感与交互体验。传统基于状态机或脚本的行为逻辑已难以满足开放世界、高自由度游戏对动态响应和环境感知的需求。近…

Hunyuan-MT-7B-WEBUI和Typora官网一样好用?用户体验深度评测

Hunyuan-MT-7B-WEBUI:当大模型遇上极简交互 在AI技术飞速发展的今天,我们早已不再惊讶于某个新模型又刷新了SOTA记录。真正让人眼前一亮的,是那些能让普通人“无感使用”的工程化设计——就像你打开Typora写文档时,根本不会意识到…

模型解释性研究:中文物体识别系统的可视化分析

模型解释性研究:中文物体识别系统的可视化分析 作为一名AI可解释性研究者,我经常需要分析物体识别模型的决策过程,但搭建一个包含可视化工具的开发环境总是让我头疼。最近我发现了一个预置好的镜像环境,可以快速启动中文物体识别系…