昆明做网站哪家网站美工如何做

diannao/2026/1/26 9:22:39/文章来源:
昆明做网站哪家,网站美工如何做,网站添加白名单,盲盒小程序开发目录 1.效果展示和玩法场景 2.GeneFace原理学习 3.数据集准备以及训练的过程 5.遇到的问题与解决方案 6.参考资料 一、效果展示 AI数字人进阶--GeneFace#xff08;1#xff09; AI数字人进阶--GeneFace#xff08;2#xff09; 想象一下#xff0c;一个专为你打造的…目录 1.效果展示和玩法场景 2.GeneFace原理学习 3.数据集准备以及训练的过程 5.遇到的问题与解决方案 6.参考资料 一、效果展示 AI数字人进阶--GeneFace1 AI数字人进阶--GeneFace2 想象一下一个专为你打造的AI数字人不仅可以代表你在屏幕上出现还能带来实实在在的商业价值。之前sadtalker照片说话的应用场景不同定制的视频数字人的应用场景就不仅仅是娱乐而可以带来更多价值自媒体运营短视频带货数字人直播等等现在抖音、视频号中看到的刘润等很多视频都是来自于其数字人。 由于其训练成本比较高现在一般的玩法是提供模板视频任务用户输入自己的文字或者语音使用选择的模板生成对应的视频。也可以允许个人上传视频进行定制单独收费。 二、GeneFace原理学习 实现高嘴形对齐(lip-sync)、高视频真实度(video reality)、高系统效率(system efficiency)的虚拟人视频合成。 整体架构如下 首先处理输入的语音并提取关键特征音高和语音 然后预测说话时面部的动作特别是嘴唇和面部表情 最后这些预测被转换成视频帧 通过一系列图像处理技术确保生成的视频真实和清晰 1. 音频处理 系统首先接收输入的语音有两个关键部分 音高编码器(Pitch Encoder)这个部分捕捉语音中的音高变化因为音高声音的高低对理解说话者的情感和意图很重要。 HuBERTHuBERT是Facebook开发的一种自监督学习模型用于音频表示学习。用于从语音中提取更丰富的特征如语速、重音、语音的节奏等与音高信息结合以预测面部动作。 2. 面部动作预测 音频信息会被用来预测人脸的动作特别是嘴唇和面部表情。这个步骤包括 音高感知音频到动作模型Pitch-Aware Audio2Motion这部分使用前面提取的音频特征来预测面部关键点的动作关键点是面部的重要部位如眼角、嘴角等。 Landmark LLE Proj帮助模型理解不同面部关键点之间的关系并确保预测的动作自然和准确。 3. 视频合成 系统将预测的面部动作转换为实际的视频帧。这一过程包括以下几个部分 即时动作到视频模型Instant Motion2Video把预测的关键点动作转换成连续的视频帧形成一个可以播放的视频。 超分辨率处理为了确保生成的视频质量尽可能高系统会对视频帧进行超分辨率处理提升图像的清晰度和细节。 Volume Renderer用于渲染三维数据以产生真实感的二维图像增强视频的真实性。 三、数据集准备以及训练推理的过程 3.1 训练视频的要求 训练视频的质量直接影响了训练的结果一般有下面几个重要的要求 1. 训练视频最好3-5分钟每一帧都要人脸头部要一直面对镜头不能太偏 2. 需要对录制视频进行预处理降噪、音频重采样为16000HZ视频裁剪为512*512帧率25fps 3. 裁剪后的视频要保证 头部在视频中占据相对较大的区域。 4. 推理的音频尽量和训练的语调保持一致增加真实感 关于预处理部分前面写了篇文章提供了预处理脚本可以直接使用 3.2 数据处理的脚本音频特征提取、截帧、抠图、人脸landmark提取以及3dmm生成、将数据打包为npy export PYTHONPATH./export VIDEO_IDxxxexport CUDA_VISIBLE_DEVICES0 mkdir -p data/processed/videos/${VIDEO_ID} #音频特征提取hubert以及melpython data_gen/utils/process_audio/extract_hubert.py --video_id${VIDEO_ID}python data_gen/utils/process_audio/extract_mel_f0.py --video_id${VIDEO_ID}# 截帧、抠图mkdir -p data/processed/videos/${VIDEO_ID}/gt_imgsffmpeg -i data/raw/videos/${VIDEO_ID}.mp4 -vf fps25,scalew512:h512 -qmin 1 -q:v 1 -start_number 0 -v quiet data/processed/videos/${VIDEO_ID}/gt_imgs/%08d.jpgpython data_gen/utils/process_video/extract_segment_imgs.py --ds_namenerf --vid_dirdata/raw/videos/${VIDEO_ID}.mp4 --force_single_process # 提取2D landmark用于之后Fit 3DMMpython data_gen/utils/process_video/extract_lm2d.py --ds_namenerf --vid_dirdata/raw/videos/${VIDEO_ID}.mp4 # Fit 3DMMpython data_gen/utils/process_video/fit_3dmm_landmark.py --ds_namenerf --vid_dirdata/raw/videos/${VIDEO_ID}.mp4 --reset --debug --id_modeglobal # 将数据打包python data_gen/runs/binarizer_nerf.py --video_id${VIDEO_ID}3.3 训练模型 需要分为两步训练Head NeRF 头部模型和Torso NeRF躯干模型 # 训练 Head NeRF 模型# 模型与tensorboard会被保存在 checkpoints/exp_nameCUDA_VISIBLE_DEVICES0 python tasks/run.py --configegs/datasets/videoid/lm3d_radnerf_sr.yaml --exp_namemotion2video_nerf/videoid_head --reset # 训练 Torso NeRF 模型CUDA_VISIBLE_DEVICES0 python tasks/run.py --configegs/datasets/videoid/lm3d_radnerf_torso_sr.yaml --exp_namemotion2video_nerf/videoid_torso --hparamshead_model_dircheckpoints/motion2video_nerf/videoid_head --reset 如果从头开始训练加上-reset否则去掉即可实现继续上次step继续训练 训练的过程比较耗时4090显卡两个模型都训练完大概需要十几个小时需要注意训练过程中是否有log报错信息代码中可能会catch如果出现错误继续执行可能存在训练模型异常数据集的准备十分关键如果准备不到位很可能就要来来回回折腾很多次。第四节大家会看到一些由于训练视频数据问题导致的奇葩现象。 3.4 推理 推理就很快了十几秒的视频生成也就十几秒钟的时间 ​​​​​​​ 推理脚本. (输入音频支持mp3,会重采样为16k)CUDA_VISIBLE_DEVICES0 python inference/genefacepp_infer.py --head_ckpt --torso_ckptcheckpoints/motion2video_nerf/videoid_torso --drv_auddata/raw/val_wavs/input.mp3 --out_name output.mp4 四、遇到的问题和解决方案 记录有价值的问题和解决方案避免踩坑 4.1 工程类错误 1Inference ERROR: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! 环境问题按照readme重新创建venv环境 2数据处理环节提取图片时卡住 加上 --force_single_process可以解决 python data_gen/utils/process_video/extract_segment_imgs.py --ds_namenerf --vid_dirdata/raw/videos/${VIDEO_ID}.mp4 --force_single_process https://github.com/yerfor/GeneFacePlusPlus/issues/98 (3) loss_output[ambient_loss].item() AttributeError ​​​​​​​ Traceback (most recent call last): File tasks/radnerfs/radnerf_sr.py, line 293, in _training_step current_ambient_loss loss_output[ambient_loss].item()AttributeError: int object has no attribute item| WARNING: ERROR calculating ambient loss| WARNING: ERROR calculating ambient loss 修改代码兼容即可 ​​​​​​​ try: current_ambient_loss loss_output[ambient_loss].item()except AttributeError as e: current_ambient_loss loss_output[ambient_loss] 4.2 效果类问题 1推理后的视频人脸直接糊掉了 原因人脸占的区域太小了训练后效果很差我这个视频原始宽高就比较小 544x900的裁剪为512x512后人脸区域就是很小改为256x256就满足要求但是需要对齐进行超分到512x512再进行训练 2推理后画质降低 可以尝试修改lm3d_radnerf_sr.yaml和lm3d_radnerf_torso_sr.yaml中的lambda_lpips_loss 例如从 0.001 到 0.003。 https://github.com/yerfor/GeneFacePlusPlus/issues/29 五、参考资料 GeneFace: Generalized and StableReal-Time 3D Talking Face Generation  https://genefaceplusplus.github.io/ 【AI数字人-论文】GeneFace https://blog.csdn.net/weixin_42111770/article/details/136052069 GeneFacehttps://github.com/yerfor/GeneFacePlusPlus/tree/main GeneFace保姆式训练教程 https://www.bilibili.com/video/BV1xx421f7PV/?spm_id_from333.788.recommend_more_video.1vd_source03a763fa6cf49b01f658f32592f5a6f3AI数字人方案、多种解决方案全解析 https://www.bilibili.com/video/BV1KC4y137TT/?p2spm_id_frompageDriverAI 数字人训练GeneFace https://www.bilibili.com/video/BV1LB421z76c/?vd_source03a763fa6cf49b01f658f32592f5a6f3 感谢你的阅读 接下来我们继续学习输出AIGC相关内容关注公众号“音视频开发之旅”,回复“数字人” 获取资料一起学习成长。 欢迎交流

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/88020.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

天津市做网站的公司有哪些贵阳奇点未来网站建设

一、简述效果:实现功能:长按Button时改变Button显示文字,弹出Dialog(动态更新音量),动态生成录音文件,开始录音;监听手指动作,规定区域。录音状态下手指划出规定区域取消录音,删除生…

做电影网站都需要什么工具定制虚拟偶像app

文章目录 一、插件介绍二、idea社区版安装MybatisCodeHelperPro插件三、问题记录1. DatabaseHelper插件 加载不了部分数据库链接的列信息2. DatabaseHelper插件 数据库列显示顺序错乱3. MybatisCodeHelperPro插件 数据库字段不提示4. MybatisCodeHelperPro插件 特殊字段增加反引…

网站自己可以做么网站建设功能报价表

1、打开企业微信,点击“通讯录”。 企业微信怎么删除好友 企业微信如何删除成员 2、找到要删除的成员,点击。 企业微信怎么删除好友 企业微信如何删除成员 3、在个人信息页面,点击“⋮”。 企业微信怎么删除好友 企业微信如何删除成员 …

怎么接网站来做国外二级域名免费申请

全世界只有3.14 % 的人关注了青少年数学之旅快节奏的现代社会中,每个人都疲于奔命,“丧、累、太难了”已成为成年人的生活主题。难得的闲暇时间,公众号是不可或缺的消遣方式。但我们被海量数据淹没,越来越多的公众号只是消耗情绪&…

制作网站可以赚钱吗seo的网站建设

大家好,欢迎来到雄雄的小课堂,那个……辣椒酱很好吃的,哈哈哈哈!今天给大家分享的内容是利用CSS制作网页的动画。辣椒酱:自从有了这款辣椒酱,拌饭再也不用老干妈CSS变形CSS的变形包括这么几种效果&#xff…

营销型网站建设价格是多少制作网页时采用的最基本的语言是

分层思想,是应用系统最常见的一种架构模式,我们会将系统横向切割,根据业务职责划分。MVC 三层架构就是非常典型架构模式,划分的目的是规划软件系统的逻辑结构便于开发维护。MVC:英文即 Model-View-Controller&#xff…

江油网站建设网站结构是体现的

【day0】 要坐大巴去北京……(没错是大巴!)然而说好的六点走,生生等到了七点……不过一路上还是很happy的!某导游兔子 然而到华电之后,身子都散架了……这次的酒店在北农,感觉还可以&#xff0c…

微信网站制作教程wordpress 拖拽排序插件

如果在使用 Rollup 写 require 而 Rollup 默认使用的是 ECMAScript 模块系统。 要解决这个问题,你需要在 Rollup 的配置文件(通常是 rollup.config.js)中使用插件来将 CommonJS 模块转化为 ECMAScript 模块。需要配置2个插件 import resolv…

学校网站建设过程树莓派可以做网站空间吗

一,操作系统的体系结构 内核 内核是操作系统最基本、最核心的部分,实现操作系统内核功能的那些程序就是内核程序这其中:时钟、中断、原语是与硬件关联最紧密的模块,而进程管理、存储器管理、设备管理更多的是对数据结构的操作&…

成都微网站建设地方网站做哪些内容

ONLYOFFICE是由领先的IT公司—Ascensio System SIA经验丰富的IT专家开发的项目。这是一款强大的在线编辑器,能够为提供高效的文本文档、电子表格、演示文稿、表单和 PDF 编辑工具。 继 ONLYOFFICE 文档 v8.0发布后,适用于 Linux、Windows 和 macOS 的免费…

谷歌seo专员学好seo

http://www.iteye.com/topic/540423转载于:https://www.cnblogs.com/ct732003684/archive/2013/01/21/2869376.html

wordpress多域名多站点安徽住房和城乡建设厅网站首页

重学SpringBoot3-内容协商机制 ContentNegotiationConfigurer接口配置内容协商URL参数Accept头使用Url扩展名 自定义内容协商格式步骤1: 注册自定义媒体类型步骤2: 实现HttpMessageConverter接口步骤3: 使用自定义HttpMessageConverter 注意点 在 Spring Boot 3 中,…

html手机网站如何制作wordpress论坛模版

前言 本章我们基于重构的方式进行一个 MVVM 的实战,我们将一个新闻列表的普通实现,一步一步的改造成 MVVM 的架构模式,一共分为上中下三个章节,本章继续上一章,开始中篇的讲解; 控件化 我们本章向控件化进…

常用的网站开发语言有哪些个人域名备案查询

css高度设置为auto后,设置的边框 ie正常 火狐 就没有边框了,解决方法 之前是这样写的 #right_bottom { width: 790px; height:auto; border: #EBEBEB 1px solid; } 最后添加了一个overflow: hidden;属性ok了,ie火狐都可以显示边框 即: #right_bottom {…

做的网站加载太慢怎么办注册网站有什么风险吗

公司一台服务器,上面装了filezilla server后,按平常配置好了,但是在本地用FTP客户端不管怎么连接都连接不上,本地FTP客户端总提示连接失败,远程filezilla server的界面也没有提示有人连接, 仔细看了一下&am…

桂林哪里做网站东莞网站建设公司排名

笔记本电脑的电池健康状况至关重要。延长电池寿命可以帮你省下不少钱。对于长时间充电的Windows 11笔记本电脑用户来说,将电池电量限制在80%是很重要的。 虽然操作系统没有提供设置自定义电池充电限制的内置方法,但仍有一些方法可以在Windows 11中配置电池设置,并将其限制在…

充值选建设银行打不开网站网站安全建设的重要性

参考《计算机组成》(北京大学 MOOC) 1 异常与中断的来源(为什么需要中断) 首先,说明一下异常和中断这两个概念。 它们两个唯一的区别,就是,没有什么区别。只是不同的地方不同的时间不同的人的…

南京企业建站系统模板nodejs 做网站

一、基于域名的虚拟主机 修改配置文件/usr/local/nginx/conf/nginx.conf 创建新的虚拟主机的根目录和默认网页index.html 重新加载nginx的配置文件 查看两个虚拟主机 因为这两个域名是随便写的,所以需要修改windows系统的hosts文件,让电脑能够解析www.a.…

常州网站seo做网站需要空间

450. 删除二叉搜索树中的节点 给定一个二叉搜索树的根节点 root 和一个值 key,删除二叉搜索树中的 key 对应的节点,并保证二叉搜索树的性质不变。返回二叉搜索树(有可能被更新)的根节点的引用。 一般来说,删除节点可…

手游门户网站建设网站开发必须要做前端吗

我们借鉴之前抓取台风路径数据的例子,试一试抓取降水量数据:之前我们访问过这个网站,也试着抓取过数据,不过在谷歌浏览器中我们只能够找到两天的数据,但是通过台风路径数据抓取,我们猜想只要我们向服务器提…