小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像。

DynamicFace是一种新颖的面部视频交换方法,旨在生成高质量且一致的视频面部图像。该方法结合了扩散模型的强大能力和可插拔的时间层,以解决传统面部交换技术面临的两个主要挑战:在保持源面部身份的同时,准确传递目标面部的运动信息。通过引入四种细粒度的面部条件,DynamicFace能够对面部特征进行更精确的控制,从而实现高保真度的面部交换。实验结果表明,该方法在图像质量、身份保留和表情准确性方面均优于现有技术,并且能够有效地扩展到视频领域,展示了其强大的应用潜力。

相关链接

  • 论文:http://arxiv.org/abs/2501.08553v1

  • 主页:https://dynamic-face.github.io/

论文介绍

人脸交换将源人脸的身份转移到目标人脸,同时保留目标人脸的表情、姿势、头发和背景等属性。先进的人脸交换方法取得了令人满意的结果。然而,这些方法经常无意中从目标人脸转移身份信息,损害与表情相关的细节和准确的身份。

论文提出了一种新方法 DynamicFace,利用扩散模型和即插即用时间层的强大功能进行视频人脸交换。首先使用 3D 面部先验引入了四个细粒度的人脸条件。所有条件都设计为相互分离,以实现精确和独特的控制。然后采用 Face Former 和 ReferenceNet 进行高级和详细的身份注入。通过在 FF++ 数据集上的实验证明了提出的方法在人脸交换方面取得了最先进的成果,展示了卓越的图像质量、身份保存和表情准确性。此外,该方法可以通过时间注意层轻松转移到视频领域。

可组合的面部条件。提出的方法目标是将面部分解为四个条件,并捕捉每个条件的独特用法。条件相互解开,并通过 3D 面部先验提供必要的指导。

方法

所提方法的概述。 VAE 编码器和 ReferenceNet 从源人脸中提取详细特征,然后通过空间注意将其合并到稳定扩散主 UNet 中。人脸编码器使用查询转换器从源人脸图像中提取高级特征,然后通过交叉注意将其注入 ReferenceNet 和主 UNet。四个可组合的人脸条件被输入到四个专家引导器中,并在潜在空间中与融合网络融合。时间注意旨在提高跨帧的时间一致性。在迭代去噪之后,主 UNet 的输出由 VAE 解码器解码为最终的动画视频。

结果

在 FF++ 上进行定性比较。提出的方法对于看不见的数据分布表现良好,并且还可以更好地保留身份(例如形状和面部纹理)和包括表情和姿势在内的运动。

FFHQ 上的定性比较。提出的方法可以生成具有准确身份和包含表情、姿势和凝视的精确运动的高分辨率人脸。结果的背景也更加逼真。

更多结果

结论

论文提出了一种名为 DynamicFace 的新方法,该方法利用强大的预训练扩散模型和精细解开的面部条件,在图像和视频领域实现了令人满意的换脸效果。实验表明,设计的面部条件可以对所需信息(例如形状、表情、姿势、光线和背景)提供精确而独特的证据。已经采取了多项措施将扩散模型应用于换脸,包括 Face Former、ReferenceNet、Mixture-of-Guiders 和运动模块。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/69387.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用 DataX 连接 Easysearch

DataX DataX 是阿里开源的一款离线数据同步工具,致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。 本篇主要介绍 DataX 如何将数据写入到 Easysearch,对于各种数据源的连接…

redis底层数据结构——整数集合

文章目录 定义内部实现升级升级的好处提升灵活性节约内存 降级总结 定义 整数集合(intset)是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层…

【力扣题解】63. 不同路径 II

😊博主目前也在学习,有错误欢迎指正😊 🌈保持热爱 奔赴星海🌈 文章目录 一、题目1、题目描述2、基础框架3、原题链接 二、解题报告1、思路分析2、代码详解 三、本题知识 一、题目 1、题目描述 给定一个 m x n 的整数数…

【原创】Android Studio Ladybug 中Gradle配置

使用Android Studio创建项目后,由于需要下载的一下文件在国外,加上网速的问题,以及防火墙的问题,不少文件难以下载。常常导致项目创建后,要等很长时间,各种折腾,结果一个demo都跑不起来。 经过…

数据治理双证通关经验分享 | CDGA/CDGP备考全指南

历经1个月多的系统准备,本人于2024年顺利通过DAMA China的CDGA(数据治理工程师)和CDGP(数据治理专家)双认证。现将备考经验与资源体系化整理,助力从业者高效通关。 🌟 认证价值与政策背景 根据…

04-删除有序数组中的重复项

给你一个 非严格递增排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。元素的 相对顺序 应该保持 一致 。然后返回 nums 中唯一元素的个数。 考虑 nums 的唯一元素的数量为 k ,你…

结合个人经历谈谈企业数字化

转眼间专注于从事企业数字化转型的工作已经3年。在这之前我做了8年的开发工作,8年间从最开始的软件开发岗位到高级开发工程师,再到资深开发工程师,主要使用的语言是java,其次js、python、存储过程plsql等。因为各种原因&#xff0…

Linux(20)——调度作业

目录 一、调度延迟的用户作业: 1、延迟的用户作业: 2、查看延迟的用户作业: 3、从计划中删除作业: 二、调度周期性用户作业: 1、周期性用户作业: 2、调度周期性用户作业: 3、用户作业格…

高级记事本 Sublime Text 下载与使用教程:附百度网盘地址

一、引言 在编程和文本编辑领域,Sublime Text 被誉为一款功能强大的高级记事本。它以其轻量级、高效、多语言支持等特点,深受开发者和文本工作者的喜爱。本文将详细介绍 Sublime Text 的下载方法、安装步骤、使用技巧,并提供百度网盘下载地址…

【论文翻译】DeepSeek-V3论文翻译——DeepSeek-V3 Technical Report——第一部分:引言与模型架构

论文原文链接:DeepSeek-V3/DeepSeek_V3.pdf at main deepseek-ai/DeepSeek-V3 GitHub 特别声明,本文不做任何商业用途,仅作为个人学习相关论文的翻译记录。本文对原文内容直译,一切以论文原文内容为准,对原文作者表示…

DeepSeek从入门到精通教程PDF清华大学出版

DeepSeek爆火以来,各种应用方式层出不穷,对于很多人来说,还是特别模糊,有种雾里看花水中望月的感觉。 最近,清华大学新闻与传播学院新媒体研究中心,推出了一篇DeepSeek的使用教程,从最基础的是…

Filter -> MaskFilter遮罩滤镜详解

MaskFilter 作用对象:MaskFilter 主要用于Paint的外观效果,给用Paint绘制的内容添加模糊或者浮雕效果应用效果: MaskFilter 处理位图的遮罩效果,影响绘制的边缘或整体形状主要用于模糊处理、浮雕效果等,通过影响绘制对…

51单片机俄罗斯方块计分函数

/************************************************************************************************************** * 名称:scoring * 功能:计分 * 参数:NULL * 返回:NULL * 备注:采用非阻塞延时 ****************…

论文阅读:MGMAE : Motion Guided Masking for Video Masked Autoencoding

MGMAE:Motion Guided Masking for Video Masked Autoencoding Abstract 掩蔽自编码(Masked Autoencoding)在自监督视频表示学习中展现了出色的表现。时间冗余导致了VideoMAE中高掩蔽比率和定制的掩蔽策略。本文旨在通过引入运动引导掩蔽策略&#xff0…

晶闸管的静态与开关特性

1. 静态特性 晶闸管的静态特性,是指晶闸管承受变化率较小的正向/反向阳极电压与漏电流之间的关系(即伏安特性),可使它导通的门极电压与电流之间的关系(即门极特性)和正向通态电流与电压之间的关系(即通态特性)。 位于第一象限的是正向特性。当门极开路时()时,…

基于机器学习时序库pmdarima实现时序预测

目录 一、Pmdarima实现单变量序列预测1.1 核心功能与特性1.2 技术优势对比1.3 python案例1.3.1 时间序列交叉验证1.3.1.1 滚动交叉验证1.3.1.2 滑窗交叉验证 时间序列相关参考文章: 时间序列预测算法—ARIMA 基于VARMAX模型的多变量时序数据预测 基于机器学习时序库…

centOS8安装MySQL8设置开机自动启动失败

提供一个终极解决方案虽然systemctl 更符合管理预期但是不能用 使用一下命令 修改配置文件、修改mysql.service全是问题 systemctl start mysqld systemctl enable mysqld systemctl daemon-reload完全不生效各种报错 提示配置文件内容有问题 Main process exited, codeexite…

Naive UI去掉n-select下拉框边框,去掉n-input输入框边框

1、第一种通过js去掉 <template><div><div style"margin-top:10px;width: 100%;"><dade-descriptions><tr><dade-descriptions-item label"代理名称"><dade-input placeholder"代理名称"></dade-…

webpack配置之---output.chunkLoadTimeout

output.chunkLoadTimeout output.chunkLoadTimeout 是 Webpack 配置中的一个选项&#xff0c;用于设置在加载异步 chunk&#xff08;代码块&#xff09;时&#xff0c;超时等待的时间&#xff08;以毫秒为单位&#xff09;。如果在指定的时间内无法加载 chunk&#xff0c;Webp…

Qwen2-VL-2B-Instruct 模型 RK3576 板端部署过程

需要先在电脑上运行 RKLLM-Toolkit 工具&#xff0c;将训练好的模型转换为 RKLLM 格式的模型&#xff0c;然后使用 RKLLM C API 在开发板上进行推理。 在安装前先查看板端的内存容量&#xff0c;和自己模型占用大小比较一下&#xff0c;别安装编译好了不能用。 这里我就是先尝试…