情绪识别论文阅读——Eyemotion - 详解

news/2025/9/28 20:22:53/文章来源:https://www.cnblogs.com/lxjshuju/p/19117536

Eyemotion: Classifying facial expressions in VR using eye-tracking cameras

问题:当你戴着一个VR头盔(头戴显示器)时,你的大半张脸都被遮住了。你的朋友在虚拟世界里看到的只是一个冷冰冰的卡通头像(Avatar),根本看不到你真实的皱眉、微笑、惊讶等表情。这就像隔着墙和人聊天,失去了面对面交流的丰富性,社交体验大打折扣。

解决方案:既然看不到整张脸,那就只看眼睛来猜出整个表情。

  1. 借用现成的设备:巧妙地利用了现在很多高端VR头盔里就是他们没用任何外接摄像头,而自带的一个小摄像头
  2. 收集“表情”数据:他们请了23个人戴上VR头盔,并让他们做出各种表情(比如开心、惊讶、厌恶等)。同时,头盔里的红外摄像头就一直拍下他们眼睛的照片。这样,他们就得到了一套非常独特的数据库:成千上万张“眼睛照片”和对应的“表情标签”
  3. 教AI学习: 他们使用了卷积神经网络(CNN) 模型。
  4. 个性化提升(关键创新点):他们发现每个人的眼睛和表达习惯都不一样。为了让AI更准,他们加入了一个**“个性化”** 步骤。轻松说,就是让新用户先对着头盔做几个标准表情,让AI快速学习一下该用户的独有特点,之后AI对这个用户的判断准确率就能立刻提高大约4%。这就像给AI做了一个简便的“用户人脸校准”。
  5. 实时变脸(应用):最后,他们把该技术用了起来。当你在VR里聊天时,系统实时分析你的眼睛,猜出你的表情,继而立刻让你在虚拟世界里的Avatar做出对应的丰富表情。

**核心创新点:**别人做表情识别,要么需要看全脸,要么需要加装一堆奇怪的传感器。而该论文的途径,只用VR设备自带的、现成的一个小摄像头,就能构建不错的表情识别效果,而且还做了一个很巧妙的‘个性化’功能来让它更准。

数据

精细肌肉动作(Facial Action Units - AUs):这是科学家定义的一套编码框架,用来精确描述面部肌肉的细微运动。比如:

根本情绪表情(Emotive Expressions):这就是我们普通人更容易理解的整体情绪,比如:

如何收集数据

表演-模仿”流水线:

  1. 提供样板: 先录好了专业演员做各种表情的视频。
  2. 用户模仿:参与者来到实验室,看着屏幕上的演员视频,模仿着做出同样的表情
  3. 自动打标:在“模仿”,所以系统就知道,就是因为用户在他模仿的这段时间里,摄像头拍到的所有眼睛图像,对应的就是当前这个表情标签。这样就构建了海量数据的自动、准确标注,完全不需要人工一张张去标。
  4. 增加多样性:为了让数据更丰富,他们还会让用户在做表情时,眼睛跟着一个随机移动的靶点看(这样眼球位置就有变化),或者让他们摘下头盔再重新戴上(模拟日常生活中头盔佩戴位置会滑动的情况)。

清洗和增强

  1. 数据清洗(Data Cleanup):
    • 问题:用户在实验过程中会不由自主地眨眼,这些眨眼图片会干扰AI学习“故意做的表情”(比如wink)。
    • 解决方案:他们训练了一个小的AI分类器,专门用来识别和过滤掉所有“眼睛闭上”的图片,只留下眼睛睁开的有效数据。
  2. 数据增强(Data Augmentation):
    • 问题:数据量可能还是不够多,AI容易学“死记硬背”(过拟合)。
    • 解决方案:对现有的图片进行一些微小的、合乎情形的改动,来创造出“新”图片。比如:
      • 把图片稍微旋转一点点(因为人头也会微微晃动)。
      • 稍微调整一下亮度(模拟不同人的肤色和反光)。
    • 他们做得非常谨慎。比如他们绝不会把图片左右翻转,因为“左眼wink”翻转后就变成“右眼wink”了,标签就错了。

个性化

不同人的眼睛外观差异巨大(比如眼皮单双、眼窝深浅、眼睛大小),这些差异与表情无关,但却会干扰AI的判断。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/921084.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年山东设备回收公司TOP交易服务推荐排行榜,济宁,梁山设备回收,二手,饮料,食品,制药,实验室,生产线,化工厂,废旧,大型,专业设备回收公司推荐

工业消防设备在长期使用后,面临更新迭代与淘汰处理的问题,而设备回收环节却存在诸多行业痛点。部分回收企业缺乏专业技术支撑,对缆式线型感温火灾探测器、分布式光纤感温火灾探测器等专用设备的性能判断不准确,导致…

棋盘覆盖难题

棋盘覆盖难题2025-09-28 20:19 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: …

做了个TIFF图片格式转换工具,感觉怎么样?

​在日常办公、图片处理或素材整理场景中,TIFF格式图片因画质高清、支持多层存储的特点被广泛使用,但它也存在文件体积大、兼容性较弱的问题——不少常用软件、社交平台或文档编辑器对TIFF格式支持有限,这时将其转换…

vlookup一定要补足最后的,0)

vlookup一定要补足最后的,0)如题

C#后遗症,掉了个坑,特此记录

String512 str1 = "123123"; 与 String512 str2; str2 = "456"; 有何区别?之前用C#其实是不在意这个问题的,直到今天用CPP写了个String512类,才知道这里面原来还有说法..首先, String512 str1 = …

曾记否 -- Words to be remembered 2025.9.28

曾记否, 在石外楼看旗, 敢面疾风! 节选自 我们的体系, 永不会被表里不一的邪恶势力摧毁一点 -- Words to be remembered 2025.9.28

网站开发需要的技术直接ip访问网站

出品 | 《大咖来了》 一边是企业上云这一毋庸置疑的发展趋势,但另一边,云数据泄露事件的频繁,却让不少企业谈“云”色变。 2020年2月,万豪酒店520万客人信息被泄露,英国信息专员办公室(ICO)对其进行了1840万英镑(约1.…

日常掉坑记录: 关于位操作

char a[8] = { 0x01, 0x02, 0x03, 0x04 };int b = 0;memcpy(&b, a, 4);char c = (b>>8)&0xFF;c是多少?答案: 0x02掉坑原因: 搞反了小端模式下>>符号的操作结果.右移8位, 指的是变量所包含的字节整…

WPF XAML资源文件中的换行、回车、空格及Tab的转义

符号 十六进制 十进制回车 
 换行 
 空格   Tab 	

网站怎么做切换中英文免费制作表格的app

无论在我们的工作中还是在我们的生活中,我们都会用到多线程的知识,今天就给大家讲一下如何使用多线程。 序幕 线程的启动 如何使线程暂停 如何使线程停止 线程的优先级 线程安全相关的问题 我们首先要知道进程和线程分别是什么? 进程 - 进…

广州番禺网站公司做那种事情的网站

ChatGPT无限次数:点击直达 ChatGPT 专属指南:利用ChatGPT提升论文写作效率 引言 随着人工智能技术的不断发展,如今许多工具被开发出来,以帮助人们更高效地进行各种工作。其中,ChatGPT作为一个强大的语言生成模型,不仅…

longchain4j 学习系列(2)-调用远程deepseek

接上一篇继续,longchain4j支持open-ai兼容的各种模式,包括deepseek 一、修改pom依赖1 <!-- LongChain4j OpenAI Integration (支持DeepSeek) --> 2 <dependency> 3 <groupId>dev.langchain4j&…

收汇核销简介

收汇核销是我国外汇管理制度中的一项核心环节,目的是确保“货物确实出口、外汇确实收回”,防止虚假出口、骗税、热钱流入等风险。虽然 2012 年起全面电子化,不再盖章,但“核销”逻辑仍在系统后台运行,是出口企业办…

macOS 彻底卸载和重装 Node.js 指南

彻底卸载 Node.js 卸载步骤 # 1. 卸载 npm sudo npm uninstall npm -g# 2. 删除 Node.js 核心文件和配置 sudo rm -rf /usr/local/lib/node /usr/local/lib/node_modules /var/db/receipts/org.nodejs.* sudo rm -rf /…

2025最新国内过滤器品牌 TOP10 权威测评推荐厂家与选购指南

随着工业制造、环保水处理、医疗净化等领域的快速发展,过滤器作为关键配套设备,其性能与品质直接影响生产效率、产品质量及环境安全。2025 年国内过滤器市场呈现技术迭代加速、细分场景需求升级的特点,企业对过滤器…

Python 将 HTML 转换为纯文本 TXT (HTML 文本提取) - 实践

Python 将 HTML 转换为纯文本 TXT (HTML 文本提取) - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Conso…

0135_MVC 设计模式:让代码架构更清晰

MVC 设计模式:让代码架构更清晰一、什么是 MVC 设计模式? MVC 全称是Model(模型)、View(视图)、Controller(控制器),它不是一种具体的技术,而是一种 “分而治之” 的代码架构思想。核心逻辑是将软件系统的三…

网站建设 意识形态每天能赚30 50元的捕鱼游戏

原型模式创建对象不调用原对象的构造函数&#xff0c;是直接copy原对象的浅克隆&#xff1a;对值类型的成员变量进行值的复制,对引用类型的成员变量只复制引用,不复制引用的对象.深克隆&#xff1a;对值类型的成员变量进行值的复制,对引用类型的成员变量也进行引用对象的复制. …

30天Python编程挑战 - 从零基础到全栈开发

30天Python编程挑战是一个完整的Python学习教程,从基础语法到高级应用,涵盖变量、函数、面向对象、Web开发、数据分析等核心内容。通过30天的系统学习,帮助初学者掌握Python编程技能,为数据科学、Web开发和自动化脚…

怎么做淘宝网站推广菏泽市住房和建设局网站

作为域管理员&#xff0c;在日常工作中使用ADUC&#xff08;AD用户和计算机&#xff09;工具在图形界面中进行账号管理操作可谓是家常便饭了。然而一个个增加、移动、删除用户&#xff0c;这样操作有时真的够烦&#xff0c;当管理大批量的账户时&#xff0c;重复操作浪费的时间…