通过特征值和特征向量实现的图像压缩和特征提取

        前文,我们在学习人工智能的线性代数基础的时候,就了解到,矩阵在人工智能中被广泛使用,接下来我们就从大家非常常见的图像开始,深度理解矩阵在人工智能中的应用。有关线性代数基础的文章可以看的我CSDN:人工智能中的线性代数基础详解-CSDN博客

        在图像处理和机器学习中,特征值和特征向量(尤其是奇异值分解,SVD)被广泛用于图像压缩和特征提取。接下来我们详细讲解图像压缩(通过SVD)和特征提取(通过PCA)的每一个步骤,包括数学原理、具体操作和示例。

一、图像压缩(通过奇异值分解,SVD)

        图像压缩的目标是减少图像数据的存储空间,同时尽量保留图像的主要信息。奇异值分解(SVD)是一种强大的工具,可以实现高效的图像压缩。SVD将A矩阵分解成三个其他矩阵的示意图如下(分两种情况):

1.数学原理

        一张图像可以表示为一个m×n 的矩阵 A,其中每个元素对应一个像素的灰度值或颜色值(注意这个不是彩色图像)。SVD将图像矩阵 A 分解为三个矩阵的乘积

其中:

  • U 是一个 m×m 的正交矩阵(即 U^{T}U=I),其列向量是 A 的左奇异向量,表示图像的行空间的基。

  • Σ 是一个 m×n 的对角矩阵对角线上的元素是奇异值 σ1​,σ2​,…,σk​,且 σ1​≥σ2​≥⋯≥σk,通常按从大到小的顺序排列​,表示每个基向量的重要性。

  • V 是一个 n×n 的正交矩阵(即 V^{T}V=I),其列向量是 A 的右奇异向量,表示图像的列空间的基。

        通过保留最大的几个奇异值及其对应的奇异向量,可以近似重构图像,从而实现压缩。例如:假设我们有一个 1080×1920 的图像矩阵 A。通过SVD分解后,我们发现前10个奇异值占据了大部分信息。因此,可以只保留前10个奇异值及其对应的奇异向量,将图像压缩为一个 1080×10 和 10×1920 的矩阵,大大减少了存储空间。

2.图像压缩的具体步骤

步骤1:图像矩阵化

        将图像数据表示为一个矩阵 A。对于灰度图像,每个像素的灰度值构成矩阵的一个元素;对于彩色图像,可以分别对RGB三个通道进行处理。

        示例:假设有一张 5×5 的灰度图像,其矩阵表示为:

步骤2:SVD分解

        对矩阵 A 进行SVD分解,得到 U、Σ 和V^{T}。分解的过程参照下图(网上下载的),其中的M为本文中的A。

       

        如何通过 SVD 分解得到奇异矩阵,以下是分解步骤:

        (1)计算 A^{T}AAA^{T}

        A^{T}AAA^{T}是对称矩阵,且它们的特征值和特征向量与 A 的奇异值和奇异向量有关。

        (2)求A^{T}AAA^{T}的特征值和特征向量

  • 计算A^{T}A的特征值和特征向量,得到矩阵 V 和奇异值的平方

  • 计算AA^{T}的特征值和特征向量,得到矩阵 U 和奇异值的平方

        (3)构造奇异值矩阵 Σ(注意是构造出来的,不是计算得到的)

  • 奇异值是A^{T}AAA^{T}的特征值的平方根。

  • 将奇异值按从大到小的顺序排列在对角矩阵 Σ 中。

        (4)构造正交矩阵 U 和 V

  • V 的列是A^{T}A的特征向量。

  • U 的列是AA^{T}的特征向量。

        (5)验证分解结果

  • 通过验证分解的正确性。

        以下是示例:假设分解结果为:

        其中三个矩阵分别为:

步骤3:选择重要的奇异值

        保留前 k 个最大的奇异值及其对应的奇异向量,其中 k 远小于 min(m,n)。这一步可以显著减少数据量。

        示例:假设我们选择 k=2(原本有5个),则新的矩阵为:

        其中:

        注意:Uk的列数跟Σk的列数相同,Vk的行数跟Σk的行数相同

以下为补充内容:

        在SVD分解后,确定保留的奇异值数量 k 是一个关键步骤,因为它直接影响到数据压缩或降维的效果。以下是几种常用的方法来确定 k 的值:

(1)累积能量百分比

        奇异值的平方通常表示矩阵的能量分布。通过计算累积能量百分比,可以选择一个 k,使得保留的奇异值能够解释大部分的能量(例如90%或95%)。

        累积能量百分比的步骤:

        1)计算所有奇异值的平方和

        2)计算每个奇异值的累积能量百分比:

        3)选择 k,使得累积能量百分比达到一个阈值(如90%)。

        示例: 假设奇异值为 σ1​,σ2​,…,σr​,当 k=10 时,累积能量百分比为92%,则可以选择 k=10。

(2)奇异值分布曲线

        通过绘制奇异值的分布曲线(通常是按降序排列的奇异值大小),观察奇异值的衰减情况。通常,奇异值会快速下降,形成一个“肘部”(elbow point),选择肘部位置作为 k 的值。

        示例: 在奇异值分布曲线上,当 k=20 时,奇异值的下降速度明显减缓,可以将 k 设为20。

(3)重构误差

        通过尝试不同的 k 值,计算重构矩阵与原始矩阵之间的误差(如均方误差MSE或Frobenius范数)。选择一个 k,使得重构误差在可接受范围内。

        重构误差的步骤:

        1)对于不同的 k,计算重构矩阵

        2)计算重构误差:

        3)选择一个 k,使得MSE小于某个阈值。

(4)基于应用需求

在某些应用场景中,可以根据实际需求选择 k。例如:

  • 在图像压缩中,选择较小的 k 可以显著减少存储空间,但可能会丢失一些细节。

  • 在图像去噪中,选择较小的 k 可以去除噪声,但可能会丢失一些高频细节。

步骤4:重构图像

        通过 Ak​ 近似重构图像。虽然 Ak​ 的维度比原始矩阵小,但可以通过以下公式重构近似图像:

        示例:重构后的图像矩阵为:

        其中\tilde{a}_{ij}是近似值。

步骤5:评估压缩效果

        通过比较原始图像和重构图像的差异(如均方误差MSE或峰值信噪比PSNR),评估压缩效果。

二、特征提取(通过主成分分析,PCA)

        特征提取是从原始数据中提取有意义的特征,以减少数据维度并提高模型性能。主成分分析(PCA)是一种基于特征值和特征向量的特征提取方法。

        假设我们有一组图像数据,每张图像有1000个像素。通过PCA,我们计算出协方差矩阵的特征值和特征向量,发现前50个特征值占据了大部分方差。因此,可以将每张图像投影到这50个特征向量上,将图像的维度从1000降为50,同时保留主要信息。

1.数学原理

        PCA通过将数据投影到方差最大的方向上,提取数据的主要特征,从而实现降维。其核心是通过协方差矩阵的特征值和特征向量来确定主成分。      

  PCA通过以下步骤实现特征提取:

步骤1:数据预处理(标准化数据

        将数据标准化,使每个特征的均值为0,方差为1。对于图像数据,可以将像素值归一化到 [0, 1] 或 [-1, 1]。

        示例:假设有一组图像数据 X,其中每一行是一个图像的像素向量。

步骤2:计算协方差矩阵

        协方差矩阵 C 表示数据特征之间的相关性:

        其中 n 是样本数量。

步骤3:求解特征值和特征向量

        计算协方差矩阵 C 的特征值 λi​ 和特征向量 vi​。特征值表示每个方向上的方差大小,特征向量表示数据的主要方向

        示例:假设特征值按大小排序为 λ1​≥λ2​≥⋯≥λd​,对应的特征向量为 v1​,v2​,…,vd​。

步骤4:选择主成分

        选择前 k 个特征值最大的特征向量作为主成分,构成投影矩阵 Vk​。

        示例:假设选择前2个主成分,则投影矩阵为:

步骤5:数据投影

        将原始数据 X 投影到主成分空间,得到降维后的数据 Y:

        示例:假设原始数据 X 是 m×d 的矩阵,投影后得到 m×k 的矩阵 Y。

步骤6:评估特征提取效果

        通过比较降维前后的数据,评估特征提取的效果。例如,可以通过重构误差或分类任务的性能来评估。

总结

  • 图像压缩:通过SVD分解图像矩阵,保留最大的几个奇异值及其对应的奇异向量,重构图像以实现压缩。

    • 将图像矩阵分解为

    • 保留前 k 个奇异值及其对应的奇异向量。

    • 通过近似重构图像。

    • 评估压缩效果。

  • 特征提取:通过PCA计算数据的协方差矩阵的特征值和特征向量,选择最重要的特征向量作为新的特征空间,实现降维。

    • 标准化数据。

    • 计算协方差矩阵并求解特征值和特征向量。

    • 选择前 k 个主成分。

    • 将数据投影到主成分空间。

    • 评估特征提取效果。

这两种方法都利用了特征值和特征向量的性质,分别在图像压缩和特征提取中发挥了重要作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/897926.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯2023年第十四届省赛真题-整数删除 暴力-->链表+小根堆

题目来自DOTCPP: 思路: ①每次找到数列中的最小值下标,然后用状态数组st标记它,相当与删除它,之后就不会访问它。 ②对最小值下标左边和右边判断一下,看有没有数字,如果有就把最小值加到两边第…

springboot438-基于SpringBoot的数字化教学资源管理系统(源码+数据库+纯前后端分离+部署讲解等)

💕💕作者: 爱笑学姐 💕💕个人简介:十年Java,Python美女程序员一枚,精通计算机专业前后端各类框架。 💕💕各类成品Java毕设 。javaweb,ssm&#xf…

蓝桥杯刷题——第十五届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组

一、0握手问题 - 蓝桥云课 算法代码&#xff1a; #include <iostream> using namespace std; int main() {int sum0;for(int i49;i>7;i--)sumi;cout<<sum<<endl;return 0; } 直接暴力&#xff0c;题意很清晰&#xff0c;累加即可。 二、0小球反弹 - 蓝…

跨境卫士跟vps哪个更好用?跨境卫士为卖家提供固定IP环境

跨境卫士是通过为卖家提供固定的环境 i p来隔离本地电脑环境&#xff0c;为卖家创造一个真实独立的物理环境&#xff0c;让买家再任意电脑&#xff0c;任意网络下都能够安全的管理账号。跨境卫士和紫鸟原理一样&#xff0c;是通过为卖家提供固定的环境 i p来隔离本地电脑环境&a…

coding ability 展开第四幕(滑动指针——巩固篇)超详细!!!!

文章目录 前言水果成篮思路 找到字符串中所有字母异位词思路 串联所有单词的子串思路 最小覆盖子串思路 总结 前言 本专栏上一篇博客&#xff0c;带着大家从认识滑动窗口到慢慢熟悉 相信大家对滑动窗口已经有了大概的认识 其实主要就是抓住——一段连续的区间 今天来学习一些滑…

图解AUTOSAR_CP_BSW_General

AUTOSAR BSW通用规范详解 AUTOSAR基础软件模块通用规范与架构解析 目录 1. 概述 1.1. AUTOSAR BSW通用规范简介1.2. 文档目的与范围2. BSW模块文件结构 2.1. 标准文件组织2.2. 命名规范3. BSW模块接口 3.1. 接口类型3.2. 模块API3.3. 配置参数4. BSW通用架构 4.1. 分层架构4.2.…

如何在Futter开发中做性能优化?

目录 1. 避免不必要的Widget重建 问题&#xff1a;频繁调用setState()导致整个Widget树重建。 优化策略&#xff1a; 2. 高效处理长列表 问题&#xff1a;ListView一次性加载所有子项导致内存暴涨。 优化策略&#xff1a; 3. 图片加载优化 问题&#xff1a;加载高分辨率…

组件通信框架ARouter原理剖析

组件通信框架ARouter原理剖析 一、前言 随着Android应用规模的不断扩大&#xff0c;模块化和组件化开发变得越来越重要。ARouter作为一个用于帮助Android应用进行组件化改造的框架&#xff0c;提供了一套完整的路由解决方案。本文将深入分析ARouter的核心原理和实现机制。 二…

Netty启动源码NioEventLoop剖析accept剖析read剖析write剖析

学习链接 NIO&Netty - 专栏 Netty核心技术十–Netty 核心源码剖析Netty核心技术九–TCP 粘包和拆包及解决方案Netty核心技术七–Google ProtobufNetty核心技术六–Netty核心模块组件Netty核心技术五–Netty高性能架构设计 聊聊Netty那些事儿 - 专栏 一文搞懂Netty发送数…

2024年12月CCF-GESP编程能力等级认证C++编程一级真题解析

一级真题的难度: ‌ CCF-GESP编程能力等级认证C++编程一级真题的难度适中‌。这些真题主要考察的是C++编程的基础知识、基本语法以及简单的算法逻辑。从搜索结果中可以看到,真题内容包括了选择题、编程题等题型,涉及的内容如C++表达式的计算、基本输入输出语句的理解…

73.HarmonyOS NEXT PicturePreviewImage组件深度剖析:高级功能扩展与性能优化策略(三)

温馨提示&#xff1a;本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦&#xff01; HarmonyOS NEXT PicturePreviewImage组件深度剖析&#xff1a;高级功能扩展与性能优化策略(三) 文章目录 HarmonyOS NEXT PicturePreviewImage组件…

Spark 中创建 DataFrame 的2种方式对比

spark.createDataFrame(data).toDF("name", "age") 和 spark.createDataFrame(spark.sparkContext.parallelize(data), schema) 创建df的方式有什么区别&#xff1f; 在 Spark 中&#xff0c;创建 DataFrame 的方式有多种&#xff0c;其中两种常见的方式…

六十天前端强化训练之第十七天React Hooks 入门:useState 深度解析

欢迎来到编程星辰海的博客讲解 看完可以给一个免费的三连吗&#xff0c;谢谢大佬&#xff01; 目录 一、知识讲解 1. Hooks 是什么&#xff1f; 2. useState 的作用 3. 基本语法解析 4. 工作原理 5. 参数详解 a) 初始值设置方式 b) 更新函数特性 6. 注意事项 7. 类组…

IEC61850标准下MMS 缓存报告控制块 ResvTms详细解析

IEC61850标准是电力系统自动化领域唯一的全球通用标准。IEC61850通过标准的实现&#xff0c;使得智能变电站的工程实施变得规范、统一和透明&#xff0c;这大大提高了变电站自动化系统的技术水平和安全稳定运行水平。 在 IEC61850 标准体系中&#xff0c;ResvTms&#xff08;r…

【JVM】GC 常见问题

GC 常见问题 哪些情况新生代会进入老年代 新生代 GC 后幸存区&#xff08;survivor&#xff09;不够存放存活下来的对象&#xff0c;会通过内存担保机制晋升到老年代。大对象直接进入老年代&#xff0c;因为大对象再新生代之间来会复制会影响 GC 性能。由 -XX:PretenureSizeT…

Audacity 技术浅析(一)

Audacity 是一个开源的音频编辑工具&#xff0c;虽然它主要用于音频编辑和处理&#xff0c;但也可以通过一些插件和功能实现基本的音频生成功能。 1. Audacity 的音频生成基础 Audacity 的音频生成主要依赖于其内置的生成器、效果器以及 Nyquist 编程语言。这些工具允许用户创…

G-Star 公益行起航,挥动开源技术点亮公益!

公益组织&#xff0c;一直是社会温暖的传递者&#xff0c;但在数字化浪潮中&#xff0c;也面临着诸多比大众想象中复杂的挑战&#xff1a;项目管理如何更高效&#xff1f;志愿者管理又该如何创新&#xff1f;宣传推广怎么才能更有影响力&#xff1f;内部管理和技术支持又该如何…

MongoDB 数据导出与导入实战指南(附完整命令)

1. 场景说明 在 MongoDB 运维中&#xff0c;数据备份与恢复是核心操作。本文使用 mongodump 和 mongorestore 工具&#xff0c;演示如何通过命令行导出和导入数据&#xff0c;解决副本集连接、路径指定等关键问题。 2. 数据导出&#xff08;mongodump&#xff09; 2.1 导出命…

京东 h5st 5.1 分析

声明: 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 逆向分析 学习了2天某物&#xff0c;f…

CentOS 系统安装 docker 以及常用插件

博主用的的是WindTerm软件链接的服务器&#xff0c;因为好用 1.链接上服务器登入后&#xff0c;在/root/目录下 2.执行以下命令安装docker sudo yum install -y yum-utilssudo yum-config-manager \--add-repo \https://download.docker.com/linux/centos/docker-ce.reposudo…