OpenCV CUDA模块中矩阵操作------降维操作

操作系统：ubuntu22.04
OpenCV版本：OpenCV4.9
IDE:Visual Studio Code
编程语言：C++11

算法描述

cv::cuda::reduce 函数用于对 GPU 上的矩阵沿某个维度进行降维操作，例如求和、取最大值等。此函数支持多种降维操作，并允许指定输出数据类型以及使用 CUDA 流进行异步处理。

函数原型

void cv::cuda::reduce
(InputArray mtx,      // 输入矩阵OutputArray vec,     // 输出向量int dim,             // 降维维度：0表示按列，1表示按行int reduceOp,        // 降维操作类型（如SUM, AVG, MAX, MIN）int dtype = -1,      // 输出数组的数据类型，默认为输入相同类型Stream &stream = Stream::Null() // 可选 CUDA 流
);

参数

mtx: 输入 GPU 矩阵。
vec: 输出 GPU 向量。
dim: 指定沿哪个维度进行降维：
- 0: 按列降维（结果为行向量）。
- 1: 按行降维（结果为列向量）。
reduceOp: 降维操作类型：
- REDUCE_SUM: 求和。
- REDUCE_AVG: 平均值。
- REDUCE_MAX: 最大值。
- REDUCE_MIN: 最小值。
dtype: 输出数组的数据类型。默认为与输入相同类型。
stream: 可选 CUDA 流对象，用于异步执行。

代码示例

#include <iostream>
#include <opencv2/cudaarithm.hpp>
#include <opencv2/opencv.hpp>int main()
{// 创建一个测试矩阵cv::Mat h_mat = ( cv::Mat_< float >( 3, 3 ) << 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 9.0f );// 上传到 GPUcv::cuda::GpuMat d_mat;d_mat.upload( h_mat );// 存储降维结果的 GpuMatcv::cuda::GpuMat d_vec;// 创建 CUDA 流cv::cuda::Stream stream;// 沿列方向（dim=0）进行 SUM 操作cv::cuda::reduce( d_mat, d_vec, 0, cv::REDUCE_SUM, -1, stream );stream.waitForCompletion();// 下载结果并显示cv::Mat host_vec_sum_col;d_vec.download( host_vec_sum_col );std::cout << "Sum along columns: \n" << host_vec_sum_col << std::endl;// 沿行方向（dim=1）进行 AVG 操作cv::cuda::reduce( d_mat, d_vec, 1, cv::REDUCE_AVG, -1, stream );stream.waitForCompletion();// 下载结果并显示cv::Mat host_vec_avg_row;d_vec.download( host_vec_avg_row );std::cout << "Average along rows: \n" << host_vec_avg_row << std::endl;return 0;
}

运行结果

Sum along columns: 
[12, 15, 18]
Average along rows: 
[2;5;8]

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/81414.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

OpenCV CUDA模块中矩阵操作------降维操作

算法描述

函数原型

参数

代码示例

运行结果

相关文章

一分钟用 MCP 上线一个贪吃蛇小游戏（CodeBuddy版）

简单神经网络（ANN）实现：从零开始构建第一个模型

使用python进行人员轨迹跟踪

[强化学习的数学原理—赵世钰老师]学习笔记02-贝尔曼方程

Docker入门指南：镜像、容器与仓库的核心概念解析

大模型微调实战：基于GpuGeek平台的低成本高效训练方案

Linux：计算机的层状结构

LangGraph(四)——加入人机交互控制

数据结构【AVL树】

JavaScript【5】DOM模型

STM32烧录程序正常，但是运行异常

汽车二自由度系统模型以及电动助力转向系统模型

git提交库常用词

JavaScript 时间转换：从 HH:mm:ss 到十进制小时及反向转换

LLM智能体新纪元：深入解析MCP与A2A协议，赋能智能自动化协作

[PMIC]PMIC重要知识点总结

PYTHON训练营DAY28

机器学习-人与机器生数据的区分模型测试 -数据筛选

Data whale LLM universe

Azure 应用的托管身份与服务主体