RVC WebUI(Retrieval-based-Voice-Conversion-WebUI)配置 - 实践

news/2025/10/1 16:10:55/文章来源:https://www.cnblogs.com/yxysuanfa/p/19122510

RVC WebUI (Retrieval-based Voice Conversion,檢索式語音轉換) 為一款開源的AI翻唱軟體,可以依照你的意思,讓AI為你唱首歌。

譬如,我讓川普翻唱Radiohead的High And Dry:

這款軟體最大的特色是複製人聲和訓練模型的成本很低,不用太高階的顯示卡就能跑!

1. RVC WebUI不是什麼

RVC WebUI為Gradio寫成的網頁前端介面,背後使用VITS技術合成語音。

單就RVC WebUI的功能來說,它並非從無到有全自動生成歌曲的AI,它不是Suno AI,也不是文字轉語音服務,而是協助你製作AI翻唱的工具。RVC WebUI的功能是學習某人的聲音,並讓它模仿原本的聲調生成新的人聲音訊,就好像歌手翻唱別人歌曲的概念。

腦筋動的比較快的用戶應該能發現,其實「模仿他人聲音」不一定要用在歌曲上面。RVC WebUI產出的檔案是純人聲,因此用來當「變聲器」也是可行的。

像是你自行錄製一段說話的聲音,訓練為模型,再讓RVC WebUI轉換,變成另外一個人說話的聲音。RVC WebUI的作者確實有做了一個變聲器的小軟體go-realtime-gui.bat,能夠搭配OBS Studio直播使用,實現即時變聲,但只適用Windows。若要在Linux與macOS使用RVC做即時變聲器,那麼這個專案Realtime Voice Changer Client比較合適。

另外,RVC WebUI沒有文字轉語音的功能,你得準備一段錄音讓他複製。若要複製聲音唸出指定文字的,建議使用RVC-Boss/GPT-SoVITS-WebUI。

2. RVC WebUI的處理步驟

使用之前,你需要準備預先訓練好的人聲模型,或者是一段人聲錄音,讓RVC WebUI學習。

RVC WebUI沒有生成音樂的功能,曲子要另外準備。

然後,你要準備另一段要模仿的對象的人聲音訊,RVC WebUI將將提供的人聲複製過去,生成新的人聲音檔。

如果你覺得純音訊的素材很難找,RVC WebUI作者已經幫你考慮過這個問題了。RVC WebUI內建UVR (Ultimate Vocal Remover)模型,能夠快速將人聲和伴奏音樂分離出來。這樣的話你只要準備一首歌曲的音檔,便能取得該曲子的純人聲與純音樂了。

一切處理完成後,你要手動用Audacity將RVC WebUI產生的檔案合併。

3. RVC WebUI硬體需求

RVC WebUI支援Linux、Windows、macOS系統。

本軟體可以透過Nvidia或AMD或Intel的GPU加速運算。

推理,也就是複製人聲,需要VRAM >=4GB

訓練自訂人聲的模型,需要VRAM >=6GB

4. 安裝RVC WebUI

參照Github安裝指示。Linux需要自行建立Python環境,至於Docker版要自己包。

  1. 以Ubuntu為例,安裝ffmpeg和aria2,等會會用到
sudo apt install ffmpeg aria2
  1. Nvidia GPU需要安裝CUDA

  2. 安裝Anaconda

  3. 建立Python 3.8的環境

conda create -n rvc-webui python=3.8
conda activate rvc-webui
  1. 複製RVC WebU儲存庫
git clone https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI.git
cd Retrieval-based-Voice-Conversion-WebUI
  1. 安裝Nvidia GPU所需的依賴套件
pip install torch torchvision torchaudio
# 防止fairseq conflict,需要降級pip版本 https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/issues/2452
pip install "pip<24"
pip install -r requirements.txt
# 解決Gradio版本太舊的問題 https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/issues/2355
pip install gradio==3.48.0
  1. 執行指令稿,下載需要的模型
./tools/dlmodels.sh
  1. 手動下載rmvpe模型,放到RVC專案的目錄
wget https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
  1. 啟動RVC WebUI,瀏覽器應該會自動開啟http://localhost:7865
python infer-web.py

5. 用UVR分離人聲與音樂

#

這裡準備的是「被模仿的人聲」。

  1. 從歌曲抽取出人聲,或者準備一段清晰的錄音。譬如,我利用yt-dlp下載YouTube的歌曲,轉檔為mp3。

  2. 將該檔案放到RVC WebUI程式所在目錄的/dataset

Retrieval-based-Voice-Conversion-WebUI
├── dataset
│   └── high-and-dry.mp3
  1. 開啟RVC WebUI,進入伴奏人聲分離頁面。左邊輸入歌曲檔案路徑,模型使用HP5_only_main_vocal,用於分離人聲與音樂。 ![](images/Screenshot2025-03-02 ebp.webp)

  2. 點選轉換,處理後的檔案即會輸出到RVC WebUI程式所在目錄的/opt之下。裡面vocal-開頭的檔案即分離出來的純人聲,instrumental-為純音樂。

Retrieval-based-Voice-Conversion-WebUI
├── opt
│   ├── instrumental-high-and-dry.mp3
│   └── vocal-high-and-dry.mp3

6. 下載RVC人聲模型

訓練人聲模型需要準備許多音檔,並且要調參數,很耗費時間。

我這裡使用預先訓練好的模型檔,網路上有很多站點提供下載。

譬如,下載Tump RVC模型,得到model.pthmodel.index檔案。

将model.pth 放置在 ./assets/weights/model.pth

model.index别名后放置在 /log/model/add_model.index

注意文件的对应关系。

7. 複製歌曲人聲

  1. 進入RVC WebUI的模型推理頁面

  2. 推理音色,選取剛剛下載的川普人聲模型(model.pth)

  3. 變調,如果原本兩個人的聲音差距不是很大,維持預設。

  4. 待處理音頻檔案路徑,輸入要模仿的人聲路徑。

  5. 最後輸入川普人聲模型index檔案路徑(model.index)

  6. 點選轉換,等待處理完成。

  7. 完成後,點畫面右下角播放器,下載處理好的檔案。

8. 將新人聲與音樂合起來

這個可以用Audacity處理。

把人聲以及純音樂兩個檔案拖進去,成為二個音軌,試聽效果。再點選檔案 → 匯出聲音,完成合併。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/924002.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

有哪些网站可以做h5莱芜十大首富

原标题&#xff1a;从安卓换到苹果到底是什么感受&#xff1f;最后一个让我彻底放弃了iPhone&#xff01;iPhone X是近几年来苹果最具创新力的iPhone&#xff0c;然而高昂的售价让很多消费者望而却步。随着今年苹果秋季新品发布会的临近&#xff0c;苹果即将发布价格更低廉&…

个人资料库网站怎么做资源下载类网站源码

Java 中的并发包指的是 java.util.concurrent(简称 JUC)包和其子包下的类和接口,它为 Java 的并发提供了各种功能支持,比如: 提供了线程池的创建类 ThreadPoolExecutor、Executors 等;提供了各种锁,如 Lock、ReentrantLock 等;提供了各种线程安全的数据结构,如 Concur…

第一次软工作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/202501SoftwareEngineering这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/202501SoftwareEngineering/homework/13546这个作业的目标 自我介绍,初…

Nginx核心配备详解:访问控制、用户认证与HTTPS部署

Nginx核心配备详解:访问控制、用户认证与HTTPS部署pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas"…

深入解析:5. Prompt 提示词

深入解析:5. Prompt 提示词2025-10-01 15:59 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important;…

基于Python+Vue开发的婚恋交友管理系统源码+运行步骤

项目简介该项目是基于Python+Vue开发的婚恋交友管理系统(前后端分离),这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Python编程技能,同时锻炼他们的项目设计与开发能力。通过学习基于…

南通医院网站建设方案网站 mysql数据库 字符

一直以来玩各种开发板&#xff0c;焊接水平太差始终是阻碍我买性价比高的板子的最大原因。淘宝上好多芯片搭载上肥猪流板子是不包排针焊接的。终于下定决心要克服这个困难。不过&#xff0c;只是会焊接排针在高手面前最好不要说自己会焊锡&#xff0c;这应该是两码事。 首先上…

详细介绍:Python 编辑器:PyCharm

详细介绍:Python 编辑器:PyCharm2025-10-01 15:45 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !impo…

2025 年搅拌机设备厂家 TOP 企业品牌推荐排行榜,盘点磁混凝系统 / 发酵罐 / 刮泥机 / 推进式 / 脱硫侧搅拌机公司推荐!

在当前工业生产领域,搅拌机作为关键设备,广泛应用于石化、化工、新能源、环保等多个行业,其性能与质量直接影响生产效率和产品品质。然而,随着市场需求的不断增长,搅拌机生产厂家数量持续增加,行业内产品质量参差…

福州市 2025 国庆集训 Day1 前三题题解

福州市 2025 国庆集训 Day1 前三题题解 别问为啥只有前三题,因为后面我不会…… Day1 题单 T1 旅行 传送门 注意到 \(P\) 非常小,所以可以考虑指数级别的做法。 考虑状压 dp。设 \(f_{s,u}\) 表示经过 \(P\) 内的点集…

Python常用数据类型详解:字符串、列表、字典全解析

在 Python 学习过程中,理解数据类型是基础也是关键。Python 的核心数据类型能够帮助开发者高效处理不同类型的数据,本篇文章将系统介绍三种最常用的数据类型:字符串(String)、列表(List)、字典(Dict),并结合…

【自学笔记】Redis 飞快入门

【自学笔记】Redis 飞快入门pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco",…

做网站工作室名字安徽二建标准

参考链接&#xff1a; Python中的私有变量 我们这里就直奔主题&#xff0c;不做基础铺垫&#xff0c;默认你有一些Python类的基础&#xff0c;大家在看这篇博客的时候&#xff0c;如果基础知识忘了&#xff0c;可以去菜鸟教程 从一个简单的类开始 class A(): #定义一…

强连通,Tarjan,缩点

在本文中,我们用 \(f(x,y)=1\) 来表示 \(x\) 可以到达点 \(y\),用 \(g(x,y)=1\) 表示 \(f(x,y)=1\) 且 \(f(y,x)=1\)。 I、强连通 对于图 \(U\) 上的任意两点 \(x\) 和 \(y\),如果有 \(g(x,y)=1\),那么称 \(x,y\) …

实用指南:K8s日志架构:Sidecar容器实践指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

做网站时量宽度的尺子工具thinkphp做的网站源码

目录结构 全局文件 1.app.json 文件 用来对微信小程序进行全局配置&#xff0c;决定页面文件的路径、窗口表现、设置网络超时时间、设置多 tab 等。文件内容为一个 JSON 对象。 1.1 page用于指定小程序由哪些页面组成&#xff0c;每一项都对应一个页面的 路径&#xff08;含文…

企业网站建设综合实训心得wordpress安装系统

http://home.cnblogs.com/blog/转载于:https://www.cnblogs.com/yanyanhappy/archive/2012/09/07/2675050.html

彩票网站自己可以做吗wordpress加密页面访问

文章目录 一、 Zookeeper常用命令1. zk服务命令2. zk客户端命令 二、HBASE常见运维命令1. 集群启动关闭2. 扩容增加regionserver3. 下线regionserver ing 一、 Zookeeper常用命令 例如&#xff1a;ZOOKEEPER_HOME&#xff1a;/opt/zk/zookeeper 1. zk服务命令 1. 启动ZK服务…

Python方案--交互式VR教育应用开发

Python方案--交互式VR教育应用开发pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco&…

纯Qt代码实现onvif协议设备端/onvif设备模拟器/onvif虚拟监控设备/桌面转onvif

一、前言说明 在视频监控系统的开发中,ONVIF(Open Network Video Interface Forum)作为行业标准协议,被广泛应用于设备与平台之间的互联互通。通常我们认为,ONVIF 协议的设备端实现应运行在摄像头等嵌入式下位机上…