解析如何使用官方的YOLOv11代码pt权重转换出适配瑞芯微ONNX➡RKNN的权重文件

前言

在ultralytics中,导出的yolo11.onnx权重只有一个输出,这无法适配瑞芯微中的解析。其需要九个输出。通用的步骤是在训练完的pt文件后,利用[ultralytics_yolo11],可参考:【YOLOv8部署至RV1126】PT转ONNX、ONNX转RKNN、RKNN预编译

官方导出的onnx权重的输出个数:


利用ultralytics_yolo11导出的onnx权重的输出个数:

为了进一步理解其是如何在官方代码的基础上将其原本一个输出改成九个输出,本文主要使用官方的ultralytics代码(8.3.13版本),将yolo11n.pt文件转成onnx➡rknn➡预编译,比较一下两种转换后的权重是否一致。

文章目录

  • 前言
  • 一、修改ultralytics
  • 二、导出ONNX
  • 三、导出RKNN
  • 四、预编译

一、修改ultralytics

在ultralytics/nn/modules/head.py中的Detect类的forward函数中添加如下代码:

# 导出适配瑞芯微的ONNX模型ifself.export:y=[]foriinrange(self.nl):

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1186158.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Multisim在电子教学中的应用:新手教程入门必看

从零开始玩转Multisim:电子教学中的“虚拟实验室”实战指南你有没有过这样的经历?课堂上老师讲放大电路时画了一堆波形图,你说听懂了,可一到实验课接线就冒烟;想调个静态工作点,结果三极管直接烧了&#xf…

从照片到电影:用Image-to-Video讲述视觉故事

从照片到电影:用Image-to-Video讲述视觉故事 1. 简介:静态图像的动态叙事革命 在数字内容创作领域,从静态图像到动态视频的跨越一直是创作者追求的核心目标之一。传统的视频制作依赖复杂的拍摄、剪辑与后期流程,而随着生成式AI技…

Z-Image-Turbo启动报错?supervisorctl start命令执行失败排查教程

Z-Image-Turbo启动报错?supervisorctl start命令执行失败排查教程 1. 引言 1.1 业务场景描述 Z-Image-Turbo 是阿里巴巴通义实验室开源的高效AI图像生成模型,作为 Z-Image 的知识蒸馏版本,它在保持高质量图像输出的同时大幅提升了推理速度…

Whisper Large v3企业部署:高可用语音识别系统架构

Whisper Large v3企业部署:高可用语音识别系统架构 1. 引言 随着全球化业务的不断扩展,企业对多语言语音识别的需求日益增长。传统语音识别系统往往局限于少数主流语言,难以满足跨国会议、客服中心、教育平台等场景下的多样化需求。为此&am…

完整示例展示UDS 19服务在诊断开发中的通信时序

深入解析UDS 19服务:从通信时序到实战调试的完整闭环在汽车电子系统日益复杂的今天,一辆高端车型可能集成了上百个ECU(电子控制单元),每个模块都可能产生故障码。如何高效、准确地读取这些DTC(Diagnostic T…

DeepSeek-R1模型蒸馏实战:云端GPU快速尝试,低成本实验

DeepSeek-R1模型蒸馏实战:云端GPU快速尝试,低成本实验 你是不是也遇到过这样的情况?研究生论文要做模型压缩方向的研究,想试试知识蒸馏、轻量化部署这些热门技术,但实验室的GPU资源紧张,排队等卡一等就是好…

CV-UNet实战:社交媒体内容创作快速抠图

CV-UNet实战:社交媒体内容创作快速抠图 1. 引言 在社交媒体内容创作中,图像处理是提升视觉表现力的关键环节。其中,快速、精准的抠图技术成为设计师和内容创作者的核心需求之一。传统手动抠图效率低、成本高,而基于深度学习的自…

为什么Qwen3-VL-2B部署总失败?保姆级教程入门必看

为什么Qwen3-VL-2B部署总失败?保姆级教程入门必看 1. 引言:从痛点出发,理解Qwen3-VL-2B的部署挑战 在多模态大模型快速发展的今天,Qwen3-VL-2B-Instruct 凭借其强大的视觉-语言融合能力,成为开发者和研究者关注的焦点…

ES客户端与Kafka集成项目应用全面讲解

如何用好 ES 客户端与 Kafka 集成?一文讲透实时数据管道的实战要点你有没有遇到过这样的场景:线上服务日志疯狂增长,ELK 栈却频频告警“写入延迟飙升”?或者某次发布后发现部分日志没进 Kibana,排查半天才发现是消费者…

NotaGen支持112种风格组合音乐生成

NotaGen支持112种风格组合音乐生成 1. 引言:AI驱动的古典音乐创作新范式 1.1 技术背景与行业痛点 传统音乐创作,尤其是古典音乐领域,长期依赖作曲家深厚的理论功底和艺术直觉。对于非专业创作者而言,构建符合特定时期、作曲家风…

长音频秒转文字:Paraformer-large离线版真实体验分享

长音频秒转文字:Paraformer-large离线版真实体验分享 在语音识别(ASR)领域,长音频的高效、高精度转写一直是实际应用中的核心需求。无论是会议记录、课程录音还是访谈整理,用户都希望获得一个准确、快速、无需联网、操…

开源AI训练环境新选择:PyTorch-2.x镜像部署实战分析

开源AI训练环境新选择:PyTorch-2.x镜像部署实战分析 1. 引言 随着深度学习模型复杂度的不断提升,构建一个稳定、高效且开箱即用的训练环境成为研发团队的核心诉求。尽管官方提供了基础的 PyTorch 镜像,但在实际项目中仍需耗费大量时间进行依…

GLM-TTS部署教程:批量推理自动化处理实战手册

GLM-TTS部署教程:批量推理自动化处理实战手册 1. 引言 1.1 技术背景与学习目标 随着人工智能在语音合成领域的快速发展,高质量、个性化的文本转语音(TTS)技术正逐步成为智能客服、有声读物、虚拟主播等应用场景的核心组件。GLM…

零基础玩转通义千问2.5-7B-Instruct:手把手教你搭建AI助手

零基础玩转通义千问2.5-7B-Instruct:手把手教你搭建AI助手 1. 引言 1.1 为什么选择 Qwen2.5-7B-Instruct? 在当前大模型快速发展的背景下,如何快速部署一个功能强大、响应灵敏的本地化AI助手成为开发者和研究者关注的核心问题。Qwen2.5-7B…

Rembg性能优化终极指南:云端GPU参数调优实战

Rembg性能优化终极指南:云端GPU参数调优实战 你是不是也遇到过这种情况:用Rembg处理一张高清人像图,结果等了快一分钟才出结果?或者批量抠图时GPU利用率忽高忽低,资源浪费严重?作为一名AI工程师&#xff0…

Glyph使用心得:网页端点一点,图片推理结果秒出来

Glyph使用心得:网页端点一点,图片推理结果秒出来 1. 背景与初体验 在当前多模态大模型快速发展的背景下,视觉推理能力正成为AI应用的重要方向。Glyph作为智谱开源的视觉推理大模型,其核心价值在于将复杂的图文理解任务转化为直观…

Super Resolution部署教程:系统盘持久化版详细配置

Super Resolution部署教程:系统盘持久化版详细配置 1. 引言 1.1 学习目标 本文将详细介绍如何在生产环境中部署基于 OpenCV DNN 模块的 Super Resolution(超分辨率)服务,重点实现 系统盘持久化存储模型文件 的稳定架构。通过本…

BGE-Reranker-v2-m3多语言支持:中英混合检索实战案例

BGE-Reranker-v2-m3多语言支持:中英混合检索实战案例 1. 引言 1.1 技术背景与业务挑战 在当前的检索增强生成(RAG)系统中,向量检索作为核心组件广泛应用于知识库问答、文档搜索等场景。然而,传统的基于双编码器&…

Speech Seaco快速入门:3步实现录音转文字,小白必看

Speech Seaco快速入门:3步实现录音转文字,小白必看 你是不是也遇到过这样的问题?辛辛苦苦剪辑好的视频,上传到不同平台时却发现——没有字幕,播放量直接打折扣。尤其是抖音、快手、B站这些短视频平台,用户…

Wan2.2部署优化:小显存GPU运行50亿参数模型的实战经验分享

Wan2.2部署优化:小显存GPU运行50亿参数模型的实战经验分享 近年来,文本到视频(Text-to-Video)生成技术迅速发展,成为AIGC领域的重要方向。然而,大多数高质量视频生成模型对计算资源要求极高,尤…