【综述整理】2015年至2022年图像美学质量评估数据集【附下载链接】

在这里插入图片描述

文章目录

  • 2012年-美学数据集AVA-25万-MOS1~10
    • 数据集介绍
  • 2015年-移动设备拍摄CLIVE-1K-MOS1~5
    • 数据集介绍
  • 2016年-美学数据集AADB-10K-MOS1~10
    • 综述摘要
  • 2017年-美学数据集FLICKR-AES-MOS1~5
    • 数据集介绍
  • 2018年-户外自然场景KonIQ-10K-MOS1~5
    • 数据集介绍
    • 标签MOS,1-5分
  • 2019年-真实世界图像FLIVE(也称为PaQ-2-PiQ)-40K-MOS1~5
    • 数据集介绍
  • 2020年-智能手机摄影SPAQ-11K-MOS1~100
    • 数据集介绍
    • 标签MOS,1~100
  • 2022年-多主题美学TAD66K-MOS1~10
    • 数据集介绍

2012年-美学数据集AVA-25万-MOS1~10

该数据集由下面论文提出AVA: A large-scale database for aesthetic visual analysis

AVA数据集下载链接

在这里插入图片描述

Paperwithcode中AVA数据集的模型排名

AVA数据集的详细介绍与标签介绍

在这里插入图片描述

AVA数据集包含大约250,000张图像,每张图像与大约250名评分者1-10的分数分布相关。其中235,528张图像用于训练,另外20,000张图像用于测试。

数据集介绍

图像美学分析的一个数据库——AVA(Aesthetic Visual Analysis)

  1. 背景介绍

    • 随着视觉内容的不断增长,按照美学偏好来组织和导航这些内容变得越来越重要。
  2. 研究现状

    • 尽管还处于初期阶段,但关于美学偏好计算模型的研究已经显示出巨大的潜力。
  3. 研究需求

    • 为了推动这一领域的发展,需要有现实、多样且具有挑战性的数据库。
  4. AVA数据库介绍

    • AVA数据库,它包含超过250,000张图片以及丰富的元数据。
    • 每张图片都有大量的美学评分。
    • 包括超过60个类别的语义标签。
    • 与摄影风格相关的标签。
  5. AVA的优势

    • 相对于现有的数据库,AVA在规模、多样性和注释的异质性方面具有优势。
  6. 洞察美学偏好

    • 通过AVA可以提供关于美学偏好的几个关键见解。

2015年-移动设备拍摄CLIVE-1K-MOS1~5

该数据集由下面论文所提出
Massive Online Crowdsourced Study of Subjectiveand Objective Picture Quality

暂时找不到下载链接,之前的下载链接已失效

数据集介绍

一个图像质量数据库——LIVE In the Wild Image Quality Challenge Database。该数据库旨在克服现有图像质量数据库的一些局限性。

  1. 背景

    • 大多数公开可用的图像质量数据库都是在高度控制条件下创建的,通过在高质量照片上引入分级的模拟失真来形成这些数据库。
  2. 问题陈述

    • 实际上,使用典型移动设备拍摄的图像通常会受到多种失真的复杂混合影响,而这些失真不一定能够很好地通过现有数据库中的合成失真来建模。
  3. 现有数据库的限制

    • 这些现有数据库的创建者通常会在严格控制的视觉环境中进行人类心理物理研究,以获得对图像的一组统计上有意义的人类意见评分,这导致了相对于其他类型的图像分析数据库来说数据集较小。
  4. 解决方案

    • 为了解决这些问题,作者设计并创建了一个包含大量现代移动设备拍摄的图像,并带有广泛多样真实失真的新数据库。这个数据库被称为LIVE In the Wild Image Quality Challenge Database。
  5. 结果规模

    • 数据库包含了超过350,000个评分,这些评分来自对1,162张图像进行评估的8,100多名不同个体观察者。

2016年-美学数据集AADB-10K-MOS1~10

该数据集从图像美学质量评估的综述文章中提出Image Aesthetic Assessment: An Experimental Survey

AADB数据集收集了总共由190名用户评估的10,000张图像。AADB数据集中包含了8种美学因素(平衡、颜色和谐型、趣味、景深、光照、主体、三分、颜色丰富性)的二值分类评价(在单个美学因素上的“好”与“不好”),然而其美学因素的评价过于简单,不适合用于分析美学评价的主观性与多样性。

综述摘要

  1. 研究目标

    • 这篇综述的目标是回顾最近用于评估图像美学质量的计算机视觉技术。也就是说,它试图总结并分析当前技术如何判断一张照片是“美”的还是“不美”的。
  2. 评估目标

    • 图像美学评估的目标是基于摄影规则来区分高质量的照片与低质量的照片。这些规则可以用来进行二分类(即判断一张图像是好是坏)或者质量评分(给图像打分)。
  3. 文献中的方法

    • 在文献中已经提出了多种尝试解决这一挑战性问题的方法。这些方法多种多样,这篇综述试图提供一个系统化的列表来整理它们。
  4. 方法分类

    • 综述按照视觉特征类型(手工制作的特征和深度特征)以及评价标准(数据集特性和评估指标)对这些方法进行了分类。
  5. 贡献与新颖性

    • 对所审查的方法的主要贡献和新颖之处进行了强调和讨论。这有助于读者了解哪些方法在现有技术上有所改进或创新。
  6. 深度学习的应用

    • 随着深度学习技术的出现,本文还系统地评估了对于开发稳健的深度模型以进行美学评分的有用设置。这意味着作者们探讨了如何利用深度学习技术来提高美学评估的准确性。
  7. 实验与基准测试

    • 实验使用了简单而坚实的基线模型来进行,并且这些模型的表现与目前最先进的技术相当。这意味着他们测试了一些基础的方法,并证明了这些方法的有效性。
  8. 美学操控的可能性

    • 此外,本文还讨论了通过计算方法来操控图像美学的可能性。这可能涉及到如何通过算法修改图片使其看起来更美观。
  9. 未来研究参考

    • 最后,作者希望他们的综述能够作为未来研究图像美学评估的一个全面参考资料来源。

2017年-美学数据集FLICKR-AES-MOS1~5

该数据集由论文提出Personalized Image Aesthetics

该数据集可以从GitHub仓库下载和详细了解

FLICKR-AES数据集由40,000张图像组成,其美学评分范围从1到5,以反映不同的图像美学水平,每个图像由5个评分者评分。173名用户评分的35263张图像作为训练集,37名用户评分的4737张图像作为测试集。

数据集介绍

  1. 研究背景

    • 自动图像美学评分(FLICKR-AES)随着深度学习的突破而受到越来越多的关注。
    • 尽管已经有很多关于学习通用或普遍美学模型的研究,但是将个人用户的偏好纳入美学模型的研究相对较少。
  2. 研究目标

    • 研究人员解决了个性化美学的问题,表明个人的审美偏好与内容和美学属性之间存在强烈的相关性,因此个体对图像美学的感知与通用图像美学之间的偏差是可以预测的。
  3. 数据收集

    • 为了支持这项研究,研究人员首先从Flickr收集了一个大型图像数据集,并通过Amazon Mechanical Turk进行了标注。
    • 另外,他们还收集了一个较小的数据集,包含真实的个人相册,并由相册的所有者进行评分。

2018年-户外自然场景KonIQ-10K-MOS1~5

该数据集于2018年收集,在当时是第一个且最大的户外自然场景的图像质量数据集,有近1万张图像。

Paperwithcode KonIQ数据集介绍和下载

数据集介绍

KonIQ-10k 是一个用于图像质量评估(IQA, Image Quality Assessment)的大型数据集,包含了10,073张带有质量评分的图片。

  1. 数据集规模

    • KonIQ-10k 包含了 10,073 张经过评分的图像,这表明它是一个相当大的数据集,适合用来训练或测试图像质量评估模型。
  2. 生态有效性

    • 这是第一个旨在生态有效性的“野外”数据库。“野外”指的是这些图像是在自然条件下获取的,而不是在实验室环境中制造的。这意味着图像中的失真(如模糊、噪声等)是真实世界中可能出现的情况,而不仅仅是人为引入的。
  3. 内容多样性

    • 数据集涵盖了多种多样的内容,这意味着图像可能包括不同的场景、物体、颜色等等,这有助于模型学习到不同条件下的质量评估标准。
  4. 质量相关指标

    • 数据集不仅包含图像本身,还包括与图像质量相关的各种度量或指标,这些信息可以帮助研究人员更好地理解图像质量的变化。
  5. 众包质量评分

    • 数据集中的图像质量评分是通过众包的方式获得的,即从大量的普通用户那里收集评价。具体来说,有1,459名参与者为这些图像提供了大约120万次的质量评分。
  6. 研究目的

    • 这些众包的数据为开发更加通用的图像质量评估模型铺平了道路。因为这些评分更接近于普通人对图像质量的看法,而非专业标准,所以使用这样的数据集训练出来的模型可能会更符合实际应用的需求。

标签MOS,1-5分

在这里插入图片描述

图像质量评估数据集中评分标签文件的信息如下,具体来说:

  1. image_name: 图像文件的名称。这是用来唯一标识数据集中每一张图像的信息。

  2. c1-c5: 每个ACR值对应的评分次数。这里的ACR(Absolute Category Rating)是指绝对分类评级,通常是一个固定的等级范围,在这里使用的是1到5的等级。例如,如果某张图片的c5值为100,那么意味着有100个人给这张图片评了最高的5分。

  3. c_total: 对于每一张图像,总共有多少次评分记录。这个值是c1c5的总和,表示该图像总共收到了多少个评分。

  4. MOS (Mean Opinion Score): 基于5点尺度的平均意见分数。这是所有评分的算术平均值,反映了大众对于图像质量的整体看法。在这个上下文中,MOS是将所有针对特定图像的评分相加后除以评分次数得到的结果。

  5. SD (Standard Deviation): MOS的标准差。标准差是一种统计量,用于衡量一组数值的离散程度。在这个情况下,标准差显示了人们对同一图像质量评分的一致性或变化性。

  6. MOS_zscore: 用户评分首先按用户进行标准化处理,即每个用户的评分都转换成了z分数(Z-score)。Z-score是一种统计测量,它描述了一个值与平均值之间的距离,以标准差为单位。这种标准化处理可以消除个体评分者之间可能存在的评分偏好的差异,使评分更具可比性。

2019年-真实世界图像FLIVE(也称为PaQ-2-PiQ)-40K-MOS1~5

该数据集由Facebook AI论文提出From Patches to Pictures (PaQ-2-PiQ): Mapping the Perceptual Space of Picture Quality

PaQ-2-PiQ官网介绍

PaQ-2-PiQ的Github链接 93star

Paperwithcode的PaQ-2-PiQ的排名

FLIVE下载教程

数据集介绍

  1. 问题背景

    • 盲/无参考感知图像质量预测是一个重要的未解决问题,对社交媒体和流媒体行业具有重大影响,每天影响数十亿观众。
    • 这个问题的重要性在于,随着社交媒体和流媒体服务的普及,图像质量对用户体验至关重要,而现有的技术还无法很好地解决这一问题。
  2. 现有挑战

    • 目前流行的NR预测模型在处理真实世界中受到损伤的图像时表现不佳。这意味着现有的算法在实际应用中并不能有效地评估图像质量。
  3. 数据规模

    • 为了解决这个问题,研究者们建立了一个迄今为止最大的主观图像质量数据库,包含了大约4万张真实世界中的受损图像和12万个小块(patches),并收集了大约400万个针对这些图像的人类质量评价。

    图像来源

    • 图像来源AVA数据集、PASCAL VOC 数据集两个数据集

2020年-智能手机摄影SPAQ-11K-MOS1~100

SPAQ数据集由下面论文提出Perceptual Quality Assessment of Smartphone Photography

SPAQ的Github地址

SPAQ的下载链接

在这里插入图片描述

数据集介绍

智能手机摄影质量评估数据集SPAQ:

  1. 研究背景

    • 随着智能手机成为人们拍摄照片的主要工具,其摄像头的质量以及相关的计算摄影模块已成为消费者市场中评价和排名智能手机的一个实际标准。
  2. 研究目的

    • 进行迄今为止最全面的智能手机摄影感知质量评估研究。
  3. 数据库介绍(SPAQ)

    • SPAQ是一个包含由66款不同智能手机拍摄的11,125张图片的数据库。每张图片都附有详细的注释信息。
  4. 注释信息

    • 图像质量(总体评价)。
    • 图像属性(如亮度、色彩丰富度、对比度、噪点、锐度等)。
    • 场景类别标签(如动物、城市风光、人物、室内场景、风景、夜景、植物、静物等)。
  5. 数据收集环境

    • 所有图像都是在一个受控的实验室环境中收集的人类意见。
  6. 附加数据

    • 记录了所有图像的可交换图像文件格式(EXIF)数据,以帮助进行更深入的分析。

标签MOS,1~100

在这里插入图片描述

2022年-多主题美学TAD66K-MOS1~10

该数据集由论文提出Rethinking Image Aesthetics Assessment: Models, Datasets and Benchmarks.

该数据集的Github仓库,可以下载数据集和了解数据集

TAD66K数据集包含66,000张图片,涵盖47个流行主题,每张图片都根据专门的主题评估标准,1200多人参与1到10的评分=。其中52248进行训练,另外14079进行测试。

数据集介绍

“Theme and Aesthetics Dataset with 66K images”(简称TAD66K)的数据集,该数据集是专门为图像审美分析(Image Aesthetic Analysis, IAA)设计的

  1. 数据集名称和规模

    • TAD66K是一个大型数据集,包含66,000张图像,旨在用于图像审美分析。
  2. 数据集的特点

    • 主题导向:这个数据集包含了47种流行的主题,并且所有的图像都是根据主题精心挑选的。
  3. 美学标准和注解

    • 除了常见的美学标准之外,TAD66K为这47种不同的主题提供了专门的美学标准。
    • 每个主题的图像都是独立标注的,这意味着每个主题的图像都有自己的特定标准。
    • 每张图像至少含有1200条有效的注解,这是目前最丰富的注解量之一。
  4. 高质量注解的价值

    • 这些高质量的注解有助于更深入地了解模型的性能,意味着研究人员可以通过这些详细的注解更好地评估和改进他们的算法或模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/57890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ 二级测试卷及答案

1.与指定数字相同的数的个数 题目描述:输出一个整数序列中与指定数字相同的数的个数。 输入 输入包含三行: 第一行为N,表示整数序列的长度(N≤100); 第二行为N个整数,整数之间以一个空格分开; 第三行包含一个整数,为指定的数字m。 输出 输出为…

Excel做数据匹配

方法一:使用VLOOKUP函数 ‌假设数据结构‌: Sheet A (A列是ID,B列开始是其他数据)Sheet B (A列是ID,B列是你想显示在Sheet A中的数据) ‌在Sheet A中添加VLOOKUP函数‌: 选择Sheet A中你想显示Sheet B数据的第一个单元…

信息安全工程师(72)网络安全风险评估概述

前言 网络安全风险评估是一项重要的技术任务,它涉及对网络系统、信息系统和网络基础设施的全面评估,以确定存在的安全风险和威胁,并量化其潜在影响以及可能的发生频率。 一、定义与目的 网络安全风险评估是指对网络系统中存在的潜在威胁和风险…

《复旦学报(自然科学版)》

《复旦学报(自然科学版)》主要刊登数学、物理 学、化学、生命科学、计算机科学、材料科学、环境科学、信息科学(通信科学、电子工程学、微电子学、光科学、生物医学工程)、管理科学等学科领域的基础研究和应用研究方面的学术论文、研究快报、研究简报和综述等。 1.来稿要求及注…

记一次:使用使用Dbeaver连接Clickhouse

前言:使用了navicat连接了clickhouse我感觉不太好用,就整理了一下dbeaver连接 0、使用Navicat连接clickhouse 测试连接 但是不能双击打开,可是使用命令页界面,右键命令页界面,然后可以用sql去测试 但是不太好用&#…

LeetCode_231. 2 的幂_java

1、题目 231. 2 的幂https://leetcode.cn/problems/power-of-two/ 给你一个整数 n,请你判断该整数是否是 2 的幂次方。如果是,返回 true ;否则,返回 false 。 如果存在一个整数 x 使得 n ,则认为 n 是 2 的幂次方…

6.1 特征值介绍

一、特征值和特征向量介绍 本章会开启线性代数的新内容。前面的第一部分是关于 A x b A\boldsymbol x\boldsymbol b Axb:平衡、均衡和稳定状态;现在的第二部分是关于变化的。时间会加入进来 —— 连续时间的微分方程 d u / d t A u \pmb{\textrm{d}…

Spring微服务学习笔记之Spring Cloud Alibaba远程服务调用实战

Spring微服务概述 微服务是一种架构风格,它将单个应用程序拆分为一组小型、独立的服务,每个服务实现特定的业务功能,并且可以独立部署和扩展。Spring 微服务即基于Spring Cloud框架构建的微服务应用。Spring Cloud提供了一系列工具和服务来简…

CTF--Misc题型小结

(萌新笔记,多多关照,不足之处请及时提出。) 不定时更新~ 目录 密码学相关 文件类型判断 file命令 文件头类型 strings读取 隐写术 尺寸修改 文件头等缺失 EXIF隐写 thumbnail 隐写 文件分离&提取 binwalk foremo…

Java安全——AES(对称加密)和 RSA(非对称加密)的实现

目录 一、对称加密和非对称加密 1.对称加密 常见算法 2.非对称加密 常见算法 3.对称加密和非对称加密的对比 二、AES(对称加密) 1.生成AES密钥 2.加密数据 3.解密数据 完整代码 三、RSA(非对称加密) 1.生成RSA密钥对…

索引的使用和优化

索引就是一种快速查询和检索数据的数据结构,mysql中的索引结构有:B树和Hash。 索引的作用就相当于目录的作用,我么只需先去目录里面查找字的位置,然后回家诶翻到那一页就行了,这样查找非常快, 创建一个表结…

日常实习与暑期实习详解

日常实习与暑期实习详解 问了下正在实习的同学,发现天要塌了–才知道日常实习是没有笔试的 1. 实习的定义 1.1 日常实习 日常实习是企业长期招聘的实习岗位,通常没有时间限制。企业会在需要时进行招聘,招聘对象包括在校大学生和大一、大二的…

苍穹外卖 新增套餐接口

新增套餐主要的坑:新增时操作数据库,不能使用简单的Insert注解,因为要使用到数据库自增的id值,所以说必须使用XML配置数据库;必须要注意建立好套餐和对应菜品之间的关联。 SetmealController package com.sky.control…

短视频矩阵系统源码开发优势,短视频矩阵系统oem部署

短视频矩阵系统就是在多个短视频平台上构建自己的内容生态,通过多平台、多账号、多内容的运营策略,实现品牌曝光、用户引流、产品销售等目的。短视频矩阵的核心在于通过矩阵式的布局,实现资源优化配置和利用,提升企业市场竞争力。…

2024年【安全员-A证】最新解析及安全员-A证作业考试题库

安全生产是企业发展的基石,关系到每一位员工的生命安全和企业的长远发展。为了提升安全管理人员的专业素养和应对突发事件的能力,2024年【安全生产模拟考试一点通】发布了最新的【安全员-A证】考试解析及题库,旨在帮助考生顺利通过考试&#…

.Net 8 Web API CRUD 操作

本次介绍分为3篇文章: 1:.Net 8 Web API CRUD 操作https://blog.csdn.net/hefeng_aspnet/article/details/143228383 2:在 .Net 8 API 中实现 Entity Framework 的 Code First 方法https://blog.csdn.net/hefeng_aspnet/article/details/1…

【C++干货篇】——类和对象的魅力(四)

【C干货篇】——类和对象的魅力(四) 1.取地址运算符的重载 1.1const 成员函数 将const修饰的成员函数称之为const成员函数,const修饰成员函数放到成员函数参数列表的后面。const实际修饰该成员函数隐含的this指针(this指向的对…

Facebook登录客户追踪:了解用户访问路径,优化客户体验

随着数字化转型的不断加速,精准的客户数据收集和用户行为追踪成为企业提升用户体验和优化业务流程的关键。Facebook登录作为一种便捷的第三方登录方式,已经被广泛应用于各类网站和应用中。它不仅简化了用户的注册与登录流程,还帮助企业获得用…

nuxt3项目创建

安装 npx nuxilatest init <project-name> 此时会出现报错&#xff0c;需要在host文件中加入 185.199.108.133 raw.githubusercontent.com 再次执行命令&#xff0c;进入安装 此处选择npm&#xff0c;出现下图表示安装成功 启动项目 执行npm run dev&#xff0c;访…

【力扣 + 牛客 | SQL题 | 每日4题】牛客大厂笔试真题SQLW6, W7, W8

1. 牛客大厂笔试真题SQLW6&#xff1a;统计所有课程参加培训人次 1.1 题目&#xff1a; 描述 某公司员工培训信息数据如下&#xff1a; 员工培训信息表cultivate_tb(info_id-信息id,staff_id-员工id,course-培训课程)&#xff0c;如下所示&#xff1a; 注&#xff1a;该公…