图像基础核心知识体系

news/2025/12/7 19:37:40/文章来源:https://www.cnblogs.com/rolandhe/p/19318684

一、 图像基础核心知识体系

1. 像素与分辨率

  • 像素:图像的最小单位,一个带有颜色信息的小方点。像素大小通常指图像的总像素数量(宽×高),如 1920×1080(约207万像素)。
  • 分辨率:有两个常见但易混的概念:
    • 图像分辨率:指图像本身包含的像素总数(如 1920×1080)。这是决定图像精细度的根本因素
    • 输出/打印分辨率:指每英寸长度上的像素数,单位是 PPI。它决定了图像在屏幕或纸上显示的物理尺寸。例如,一张 1920×1080 的图片,如果以 96 PPI 显示,则物理尺寸约为 50×28 厘米;如果以 300 PPI 打印,则尺寸会缩小到约 16×9 厘米。

2. 颜色模型与深度

  • RGB:最常用的加色模型,用于屏幕显示。每个像素由红、绿、蓝三个通道混合而成。
  • 颜色深度:每个像素用于存储颜色信息的比特数。常见的有:
    • 8位/通道:最常见的“真彩色”,每个通道256级,总共约1677万色。
    • 24位色:即RGB三个8位通道。
    • 32位色:通常是在24位RGB基础上增加一个8位的Alpha通道(透明度)。
  • Alpha通道:存储透明度的独立通道。RGBA即包含此通道。

3. 图像类型:位图 vs 矢量图

  • 位图:由像素点阵构成。放大必然模糊。格式如 JPG, PNG, GIF, BMP, WebP。适用于照片、复杂图像。
  • 矢量图:由数学公式定义的路径、形状、曲线构成。无限放大不失真。格式如 SVG, PDF(可包含矢量数据), AI, EPS。适用于logo、图标、图表。
  • 混合文档:如你提到的PDF,它是一个容器格式,可以同时嵌入位图和矢量图。文字和图形通常是矢量的,所以放大清晰;而嵌入的照片则是位图,过度放大依然会模糊。

4. 文件格式与压缩

  • 有损压缩:通过丢弃人眼不敏感的数据来大幅减小文件体积。JPG/JPEG 是典型代表。压缩率越高,文件越小,但画质损失(噪点、块状伪影)越严重。
  • 无损压缩:只压缩数据,不丢失任何信息。PNG 是典型代表,支持透明度。
  • GIF:颜色限制在256色,支持简单动画和透明度(但非Alpha通道)。
  • WebP/AVIF:现代格式,在同等画质下比JPG/PNG体积更小。
  • 文件大小决定因素公式(简化)
    文件大小 ≈ 图像宽度 × 图像高度 × 颜色通道数 × (压缩率影响因子)
    核心是总像素数采用的压缩算法

5. 常见操作与术语

  • 缩放:改变图像的像素尺寸。
    • 上采样:放大。需要算法(如双线性、双立方插值)来“创造”新像素,会导致模糊。
    • 下采样:缩小。需要算法来“合并”像素,通常画质损失较小。
  • 裁剪:保留图像的一部分,改变的是构图和像素尺寸。
  • 导出/另存为:在此过程中可以指定输出分辨率(像素尺寸)、文件格式、压缩质量

PPI (Pixels Per Inch) - 像素每英寸

  • 描述的是数字图像的像素密度
  • 是一个输入/显示概念
  • 表示每英寸长度上排列多少个像素
  • 主要用于屏幕显示、图像文件本身
  • 示例:一张3000×2400像素的图像,如果以300 PPI打印,则物理尺寸为10×8英寸

DPI (Dots Per Inch) - 点每英寸

  • 描述的是打印设备的物理输出能力
  • 是一个输出/印刷概念
  • 表示打印头、激光打印机或印刷机每英寸能放置多少个物理墨点
  • 主要用于印刷、打印输出
  • 示例:一台印刷机可能以2400 DPI输出,但图像本身的分辨率可能只有300 PPI

技术上的细微差别

  1. 像素 vs 墨点

    • 像素是图像信息的最小单位,包含完整的颜色信息(如RGB值)
    • 墨点是打印机实际喷出的物理墨滴,通常只有CMYK几种颜色的单色点
    • 一个像素的颜色需要多个墨点的组合来近似再现
  2. 转换关系

    • 要获得高质量的印刷品,通常需要:图像PPI × 3 ≈ 打印设备DPI
    • 例如:300 PPI的图像用1200 DPI的打印机输出效果很好
    • 这是因为打印机需要用多个墨点来模拟一个像素的颜色渐变

实际使用中的混乱

为什么人们会混用?

  1. 历史原因:早期的图像软件和扫描仪界面上常用DPI,即使它们真正调整的是PPI
  2. 软件界面误导
    • Photoshop中“图像大小”对话框显示的是“分辨率”,单位是“像素/英寸”,这实际上是PPI
    • 但很多软件(甚至Windows属性)错误地标注为DPI
  3. 近似等效:在讨论印刷质量时,300 DPI和300 PPI经常被当作同一标准

正确的理解方式

场景 应使用的术语 说明
设计网页/UI PPI 72 PPI、96 PPI等是常见的屏幕标准
准备印刷文件 PPI 要求图像提供300 PPI的源文件
讨论打印机性能 DPI 这台打印机支持1200×1200 DPI
扫描仪设置 PPI 扫描时设置为300 PPI(虽然界面可能写DPI)

记住这个简单的规则:

  • 屏幕显示和图像文件 → 用 PPI 思考
  • 物理打印输出 → 才需要考虑 DPI

在电脑中,实际上可以随意修改PPI,并不影响图片在电脑上的显示状态。 只有在打印时,某些打印软件或打印机可能才会查看这个dpi属性,并且可能会依照这个属性来调整打印时在一英寸纸张时要对应打印原图的多少个像素点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/991737.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

P14660 你不孤单,我们都在 题解

P14660 你不孤单,我们都在 题解题意 我们有 \(n\) 个朋友,每个朋友有: 当前压力值 \(a_i\) 最大承受值 \(b_i\) 我们可以选择至多一次倾诉活动: 选择任意一些人参加 所有被选中的人的压力值会变成 这些人的压力值的…

Python 潮流周刊#130:Django 6.0 发布了

本周刊由 Python猫 出品,精心筛选国内外的 400+ 信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进 Python 技术,并增长职业和副业的收入。 温馨提…

渗透测试实验一报告

实验目的和要求 实验目的:理解网络扫描、网络侦察的作用;初步掌握搭建网络渗透测试平台;了解并熟悉常用搜索引擎、扫描工具的应用,通过信息收集为下一步渗透工作打下基础。 系统环境:Kali Linux 2、Metasploitabl…

zebra zt610

zebra zt610zebra zt610 Zebra ZT610 是一台工业级条码/标签打印机。它在很多制造、仓储、物流、工控环境里都非常常见 —— 适合你之前提到的 “工厂、产测、物料管理、工控 + MES” 场景。这里是它的主要特点和适用…

基于深度学习的苹果病害检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

本文介绍了一套基于YOLO系列算法的苹果病害智能检测系统,实现了对叶枯病、锈病等多种病害的自动化识别。系统包含交互式GUI界面、模型训练框架和命令行工具,支持图片、视频及实时检测。技术栈采用Python3.10+PyQt5+S…

代码随想录Day30_贪心4

代码随想录Day30_贪心4用最少数量的箭引爆气球 思路 如果当前数组的左区间没有覆盖前一个数组的右区间,就需要新的箭来击穿。不然就更新新的右区间。 class Solution {static bool cmd(const vector<int>&a…

[论文笔记] Interleaving Static Analysis and LLM Prompting

Introduction 来自 PLDI’24 的 workshop SOAP。一种交错使用 LLM 和静态分析工具的方法,应用于 C 语言编写的系统代码中函数的错误规范推断问题。Background EESI C 语言并没有错误处理。开发者会把错误代码作为返回…

必考

必考1 全排列取消同步流,严禁混用cincout和printg 对于数组printf(“%5d”,ve[i]) 注意记得判断size大小 if (x == n + 1&&ve.size()==n) 不然可能输出无效解 ve.pop_back(); //pop_back不需要传入数 回溯…

一种 DAG 上可达性判定问题的解决方案

1. 问题简述 给定一个有向无环图 \(G=(V,E)\),记 \(n=|V|\),\(m=|E|\)。有 \(q\) 次查询,每次给定两个点 \(a\) 和 \(b\),判断是否存在一条以 \(a\) 为起点,\(b\) 为终点的简单路径。 其中 \(n,m\) 同阶,保证 \(…

网络空间威慑:通过“曝光”手段反制国家级网络间谍活动

在本期“两个极客”节目中,安全研究员The Grugq与政策情报专家Tom Uren深入探讨了是否可能通过“人肉搜索”等干扰措施来威慑国家行为体,使其停止网络间谍活动。内容涉及对特定黑客组织如“迷人小猫”的曝光案例分析…

Gemini 2.5原生音频技术与多模态能力解析

本文详细介绍了Gemini 2.5在音频对话与生成方面的原生技术能力,涵盖实时对话、可控文本转语音、多语言支持以及安全部署等核心技术架构与应用实现。Gemini 2.5的原生音频能力 Gemini自设计之初便是多模态的,原生理解…

实用指南:多种时间序列预测算法的MATLAB实现

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

[开源项目] 蜜蜂记账 v2.2 发布:暗黑模式、标签系统、预算管理等 10+ 新功能

项目介绍 蜜蜂记账(BeeCount)是一款开源的跨平台记账应用,使用 Flutter 开发,支持 iOS 和 Android。 项目最大的特点是数据自主可控:支持 iCloud、Supabase、WebDAV、S3 协议等多种云同步方案,用户可以将数据存储…

12 月记录

QOJ14945 QOJ14949 QOJ14711 QOJ14718 QOJ2064 CF2161F QOJ14685 QOJ14025 QOJ14419 https://atcoder.jp/contests/fps-24/tasks/fps_24_r QOJ14426 QOJ5039 P11983 [JOIST 2025] 展览会 3 / Exhibition 3 P13740 [NWE…

嵌入式软件架构--多窗口表明1(后台软件实现)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

【09】Word文档处理工具

【09】Word文档处理工具 原理图文档处理工具 原理图库文档处理工具 PCB文档处理工具 PCB库文档处理工具 [0901]Word文档批量转换成PDF.rar 下载链接 [0902]Word文档批量转换成TXT.rar 下载链接

谁在主导“芯片战争”

“芯片,不只是电子元件,更是国家角力的新战场。” 过去三年,全球半导体产业如同棋盘上疾速变动的局面:美国推动芯片立法、拔高工具出口壁垒;台湾、韩国厂商扩张制造版图;中国则在稀土、设备供应链端反击。参与者…

定制化 Live555 实战:按需开发低耗 RTSP 服务器,完美适配 C# 项目 - 源之缘

深耕 Live555 源码核心,具备成熟定制化开发能力,可按需打造高性能 RTSP 服务器。封装的极简 C 接口,4 步即可完成部署,C#/.NET 可无缝集成,大幅降低开发门槛。底层复用 Live555 事件驱动架构,两路高清流并发 CPU…

KEIL5软件查看函数最大调用深度12.7

KEIL5软件查看函数最大调用深度12.7在option设置Linker页面,添加--info stack再重新编译后就可以在Map文件中查看到函数调用深度这个好像没什么关系,开不开都可以看到

2025深圳CNC加工实力榜:金丰业五金塑胶以精密智造领跑,六家本土技术标杆企业核心优势深度解析

2025深圳CNC加工实力榜:金丰业五金塑胶以精密智造领跑,六家本土技术标杆企业核心优势深度解析 在制造业向高端化、智能化转型的浪潮中,CNC(计算机数控)加工技术已成为衡量一个地区乃至一个国家先进制造能力的核心…