史上最强声音克隆工具来袭!可克隆声音和情感!完全免费,甚至可与商用工具一决高下,效果超炸裂,不容错过!
ฝัง
- เผยแพร่เมื่อ 5 ส.ค. 2024
- 这个是我最近发现的新的声音克隆工具,并且可以使用自己的声音,将文字朗读出来,效果比剪映的语音克隆工具还要好。仅仅需要一分钟的语音数据样本,就可以一比一复刻你的声音!
在本期视频中,我将详细的介绍这个工具的使用方法, 我将告诉大家,如何使用这个工具来训练声音模型,并且轻轻松松实现声音克隆自由!在视频的最后,有更大的惊喜等着大家,各位小伙伴们一定要看到最后哦!接下来,我们一起来看看怎么使用吧!
========================================
GPT So-Vits链接:github.com/RVC-Boss/GPT-SoVIT...
colab在线使用链接:colab.research.google.com/git...
不限制电脑配置,操作超简单版本已更新: • 最强本地声音克隆工具,超高还原度!完全免费|...
========================================
00:00 本期内容介绍
01:40 安装gpt so vits
02:42 操作流程
03:07 使用自己的声音进行演示
10:04 使用网络语音素材进行合成(音频前置性处理) - วิทยาศาสตร์และเทคโนโลยี
不限制电脑配置,可以在cpu运行的版本已更新,讲解视频在此:th-cam.com/video/l-Ael0k8WE0/w-d-xo.html
本期录制视频存在一定的问题,后期剪辑做的不好,给各位看官小伙伴造成了一定的视觉影响,在这里向大家道歉!后续的视频我会更加注重如何提高出镜画面,给大家带来更好的视觉体验!
统一回答一些问题:1、没有换脸。
2、不是数字人,所有的出镜视频都是我自己录制的。
看了这么多教程,只有你的视频我觉得是对小白指导最清晰的。加油!
感谢支持!
必须感谢分享!
我在2个月前都有看见过这个软件,一直没有搞定----看了几个人的教程,都是含含糊糊,说得一点都不清楚,丫的就是博取流量的,---你这个是真棒,教程非常详细,真心不错。对小白来说非常不错。-----小白基本上是照做的,可是那些大佬的教程都是蜻蜓点水的走马观花。完全看不懂。 感谢你分享的教程
感谢支持!
很厉害的讲解,头一次看,收益了❤
感谢支持!
好厲害,講的太詳細了。
感谢支持!
厉害 感谢分享
感谢支持!
厉害啊!🎉
感谢支持!
已订阅
感谢支持!
我是個小白一直想要學習克隆音色,但都找不到適合自己克隆的資源,謝謝九姨的分享,我會常關注您的視頻向您學習並點讚
感谢支持!
實際上,最後的推理部分是完全沒必要手動切割文字的😂,下面的工具是多餘的。因為目前版本有一個「怎麼切」就在那個工具上方,直接選擇那個選項就好了。通過觀察控制台,可以發現它本身就實現了切割功能。比如我選擇以標點符號切割,那麼就算你是直接放進去長文本(我直接把我一整章小說3000多字放進去了),它在後台也是一句一句轉換的。所以那個下面的手動切割目前是個重複功能,又或者根本不是讓你這樣用的
原来如此,感谢小伙伴提示!
非常不错 介绍的很易懂❤
感谢支持!
@@jiuyixiaoketang 手动运行环境 出错困难 ,我的批处理运行后报错,手动是不是要安装PIP这个环境命令和Python最新版本
SyntaxError: invalid syntax
出现这个错误 无法运行批处理
Traceback (most recent call last):
File "D:\GPT-SoVITS-beta0217\webui.py", line 4, in
import json,yaml,warnings,torch
File "D:\GPT-SoVITS-beta0217
untime\lib\site-packages\torch\__init__.py", line 934, in
from .storage import _StorageBase, TypedStorage, _LegacyStorage, UntypedStorage, _warn_typed_storage_removal
File "D:\GPT-SoVITS-beta0217
untime\lib\site-packages\torch\storage.py", line 12, in
import numpy as np
File "D:\GPT-SoVITS-beta0217
untime\lib\site-packages
umpy\__init__.py", line 143, in
from . import lib
File "D:\GPT-SoVITS-beta0217
untime\lib\site-packages
umpy\lib\__init__.py", line 25, in
from .index_tricks import *
File "D:\GPT-SoVITS-beta0217
untime\lib\site-packages
umpy\lib\index_tricks.py", line 12, in
import numpy.matrixlib as matrixlib
File "D:\GPT-SoVITS-beta0217
untime\lib\site-packages
umpy\matrixlib\__init__.py", line 4, in
from .defmatrix import *
File "D:\GPT-SoVITS-beta0217
untime\lib\site-packages
umpy\matrixlib\defmatrix.py", line 1
ctivenorcal.com,truthordare-game.com,xn--solitr-kostenlos-spielen-ubc.de,zatznotfunny.com,vegansandr data = _convert_from_string(data)
^
SyntaxError: invalid syntax
D:\GPT-SoVITS-beta0217>pause
@@zhangbinjie 具体在哪一步出现的
厉害呀,九姨不仅颜值高,而且讲的通俗易懂,佩服之极!
感谢支持❤️
脸明显不是本人啊,男的都有可能
@@yangeiliu-dn8hb 你说什么就是什么咯
@@yangeiliu-dn8hb 不会是网恋被男的骗过所以看谁都像男的吧,不会是现实卑微小伙,网络找存在感吧,不会吧不会吧,怎么有人破防了呀,开始攻击长相了啊,难道你的妈妈没有按上眼睛吗
@@yangeiliu-dn8hb不会是网恋被男的骗过所以看谁都像男的吧,不会是现实卑微小伙,网络找存在感吧,不会吧不会吧,怎么有人破防了呀,开始攻击长相了啊,你那是俩眼珠嘛,那不纯纯俩铃铛啊,用不着的话捐给有需要的人,网络不是你的法外之地
九姨太厉害了👍
感谢支持!
这个好
感谢支持!
太神了
💓
博主你好,软件安装好以后,开启语音切割以后只有一段,不能切分成多个语音片段是什么原因? 依赖软件环境配置都弄好了,卡在这好几天了 求帮助
谢谢,我的声音训练完成了,还需要一个图片会说话的教程,逼真一些的
这个之前就有做过相关题材
感谢漂亮姐姐的耐心分享,我想请问一下,可以克隆多个人的声音并且保存,用的时候随时切换吗!!
可以的
我很早就會用了嘿嘿
好耶!
您好,按照您的步骤操作下去,到开启一键三连的时候,中途报错 1Aa-文本获取进程失败,然后提示错误:没有找到进程“23908”和错误:没有找到进程“19976”,这样应该怎么解决,求指教。
请问微调训练的时候,提示页面太小无法完成操作,是什么回事?有没有大神
这是一个恨棒的频道,我已经订阅。 想请问若这个开源软件更新后,我是需要重新再下载一次吗?并且需重复在执行一次模型训练的动作吗?谢谢您
这个更新版本公开后才知道,但是模型应该不需要重新训练
@@jiuyixiaoketang 非常感谢您的回覆,另外我想请问这个开源软件可以使用繁体中文进行操作吗?
@@user-lc8ht2gy6m 需要自行测试,我这边没有测试过繁体
@@jiuyixiaoketang 好的,感謝您的回覆!
训练语音前的步骤卡停:填上list文件标注路径后打钩,运行框一会就提示ERRNO13 权限被拒绝。
请问老师,每次关机重启之后还得重新训练模型吗?
不需要,直接从加载模型和推理那一步开始就行
今天一直在玩這個, 訓練都沒問題, 但是訓練完得到 類似的 me.ckpt, me.pth 的模型出來後, 我看影片上, 又拿了別的視頻過來使用, 這個用意在哪??? 可以拿你自己的模型, 取代掉別的視頻內某個人的聲音???
没理解你的意思,这个本来就是一个声音克隆工具,主要目的就是克隆不同的声音来使用
已點閱,我想問我以下載以解壓,但進去的時候它說找不到路徑,這問題有可能是記憶體容量不夠嗎?
有没有可能是系统不兼容一键包
00:00 GPT so waits声音克隆工具免费且效果超炸裂
01:50 Download and deploy the voice cloning tool
03:20 使用克隆工具切割音频文件和识别字幕
04:54 音频处理速度与电脑配置成正比
06:25 如何进行声音模型的微调训练
08:07 使用最强声音克隆工具合成多语言音频
10:11 使用UVR5工具处理音频素材
11:41 AI声音克隆工具效果超炸裂
这个特别适合初学者去玩,纯说话。要爱好的话,可以花点功夫去玩SVC,可以唱歌
过段时间会发布更实用的版本,正在做调整!
求问博主,我打标工具开启后,没有进入新界面亚,这是怎么回事呢?
九姨厉害!看过您之前的视频,有两个问题想请教。1.人在大陆,使用ADS指纹浏览器和静态住宅IP地址显示的是美国,而纳税信息填写的是大陆,收款银行是中信银行。这样不会被youtube发现信息不匹配而封号吗?2.电脑的时区要不要调整到和静态IP匹配的时区,而电脑的和浏览器的语言改为英语?
这个不会产生封号问题,因为本来TH-cam可选地区就没有中国,选择别的节点是很正常的现象
谢谢九姨的回复。你能帮我回答第二个问题吗?2.电脑的时区要不要调整到和静态IP匹配的时区,而电脑的和浏览器的语言改为英语?
不需要进行更改
谢谢指导 祝你好运🙏
不客气❤️
感谢九姨分享,请问后面文字转语音遇到多音字你是怎么处理的?
你找一个同音字代替上就可以了
我开启微调后,开启sovits 和开启gpt训练也显示完成,但是在进程中显示报错,卡在这一部,不能进行一下部,这个是什么问题
请问一下,SoVITS模型最多是不是只能保留三个,创建三个模型以后,你再新建模型,也保存不了。
我一会测试一下再来回复,之前有做了三个模型,还没测试能不能增加
請問訓練好的模型要怎樣子可以應用到唱歌呢?
唱歌需要适应另一款软件,后期会和一个翻唱换歌词的工具一起讲
九姨!我在开始离线批量asr的时候,它进行了一半就出现了SystemError: initialization of _internal failed without raising an exception,怎么办啊
可能是系统不兼容了
請問九姨,我操作到ASR這邊之後,就沒有辦法產出其他東西了!我該怎麼做呢?
找到解決方法了,list檔案會儲存在Sovic的檔案文件夾內。 感恩九姨的分享,我成功了!
请问博主 GPT So-Vits 经常吞一段文字,有时候会出现一堆不存在朗读文本的语言,这个bug 现在是否修复了?
目前还没有
博主你好,请问“语音文本学校对标注工具”输入路径并打勾之后,不弹出新的页面怎么办呀
报错有吗
您好!请问是不是必须是NVIDIA显卡才能运行,谢谢!
是的,n卡20系列以上
打标工具已开启以后没有弹出那个界面是怎么回事
您好我依照您的方法操作,來到顯示卡訊息;出現了,很遗憾您这没有能用的显卡来支持您训。請問接下來要如何操作,謝謝
电脑的配置是什么呢?如果无法使用显卡的话,可以看看这个视频置顶评论的链接,是改良版,不限制电脑配置就可以使用。
想问一下,如果提供更多的干音素材,学习更长的时间和次数,克隆出来的时间会不会更加逼真?
会有提升但是不多,干音的时长没有质量重要
@@jiuyixiaoketang 谢谢回复,我在视频上看您的机器显卡是4070系列的,速度怎么样?
@@user-wj3xj9sc9o 按我讲的设置跑,差不多训练两分钟左右
请问训练了自己的声音后,有什么工具能把别人视频的声音换成自己的声音吗,:)
后续有这方面的更新安排
不错的教程,下次要怎么打开这个页面
运行方法一样,ui界面出现之后直接跳到加载模型和推理那一步就可以了
到最后一部刷新模型那里,两个模型列表里面就只有默认一个模型可选,没有像视频中那样可以下拉有多选项,属于什么情况?
查看一下是不是没训练出来
是,又重新试了一次,还是没有训练出来,模型文件夹里什么也没有@@jiuyixiaoketang
训练过程有报错吗
这个大模型,虽然需要准备的样本比较短,但对样本的质量要求比较高,包括参考样本的语气,不然还是会很奇怪的
这个感觉问题不大,基本上的一些影视原声,自己的声音都可以达到要求。
期待最新升级版!!!
我会第一时间更新的!
请问这个能把音频文件直接变声吗?还是只能输入文字变声
目前只能输入文字,后续会升级
九姨厉害!九姨能否透露,能够支持CPU更快运行的最新版本在哪里?
技术小伙伴还在测试,大概月底或者四月上旬公开,到时候我会发视频说明😊
@@jiuyixiaoketang大姨子是项目组成员吗?这么清楚的吗
@@youtube-user-offical 不是哈
九姨 我切分完视频后,进行Asr操作之后,me.list里面只有一条文本 切分的其他音频都没出来 这个是怎么回事呀
具体报错是什么
这个可以支持 根据时间戳的字幕 生成音频吗?
做不到
能不能出一个Mac版本的教程啊😊😊😊
原理都差不多,这边没有mac电脑进行测试❤️
可以介绍下AI超元域这款开源多AI软件吗
等我研究研究
你好 想問可以培育中文以外的?因為參照步驟 韓文的會卡在asr那階段..產生不出pth
目前只能中文
@@jiuyixiaoketang 感謝回答 如果日後有其他語言版 再請教導
❤️
@@jiuyixiaoketang 再請教一下 我要下載音頻 但是他卻說無法從此網站下載 那要如何才能下載?
这个没出现过,我的一直可以下载
请问一下windows下载发行版本时一直链接超时是什么情况
换个节点试试
美女你好!我有一个问题,就是当我需要把一段中文内容合成英文声音的时候,字幕的内容是可以直接翻译出来的吗?如果可以,那么翻译的语意是绝对准确的吗?谢谢😮😮😮
需要自行翻译再识别
@@jiuyixiaoketang 哦,那你有没有哪个翻译软件是比较准确的介绍一下我呗。谢谢
@@user-xq8vc2rf1n gpt,deepl,谷歌翻译都挺准确,目前还没发现批量操作的软件
@@jiuyixiaoketang 好的,谢谢🙂🙂
♥
前置任务都做完了,我输入了一段书的内容进行生成,生成的语音时间1分零几秒,但是我在听的过程中发现,输出的声音会丢失内容,还会读错,是因为什么?
这也是目前存在的一些小问题,有的时候重新生成就会有改善
这个要求什么配置的显卡才能完成?
英伟达20系列以上
九姨人美又教的好,幫妳點讚,
請問合成好的語音怎麼下載下來再後製呢?
感谢支持!使用剪映或者AU将片段合并,然后导出为音频就就可以了
九姨知道那种语气的ai声音是哪个开源项目吗,比如皇上的语气和音频一段话 用事先训练好的华妃的音色说出来 但是保留了皇上的语气(比如愤怒 抑扬顿挫等 )
保留语气只能是克隆谁的声音,就保留谁的语气,比如学的是华妃的声音,保留的就是华妃的语气
@@jiuyixiaoketang 谢谢九姨回复,我的意思是每次AI都是用一段音频 Audio去驱动 就好像我本人说一段话 的mp3 然后用华妃的声音把我这段话复述出来 , 模式就是每次都是通过一段音频去复刻另外一段音频 ,而不是训练好后文字转语音
@@_vr322 就是语音转语音呀,那要考虑so vits svc,但是语气保留情况一般,gpt so vits后续会增加音视频转语音的接口,但是目前还在测试中
@@jiuyixiaoketang 谢谢,又涨知识了
@@_vr322 ❤️
为什么我的SoVITS模型列表 没有显示啊?
克隆的声音下次要再用,还需要再重新按照这个步骤走一遍吗?还是从怎么弄
不用,训练好的可以一直用
直接在推理那一步加载模型就可以了
如果我推理了一次,以后要再用这个声音,怎么办?不用每次都推理吧?
直接运行加载模型和推理步骤就可以了
在進行語音識別後,5:04 的資料夾顯示是空的,沒有list檔案,請問是哪一部份做錯了?
报错信息是什么
@@jiuyixiaoketang那個已經解決了,不過出現了新的問題,如果他顯示沒有可用的顯卡,是不是就運行不了了
@@user-qs3fv1wn2c 升级显卡驱动试试,如果是n卡20以上一般没问题
有没有免费的中文视频转英文视频的开源工具
暂时没有,有的话一般都是付费版的,商用的
为什么压缩包里有bat但是解压出来bat就不见了,压缩包里的bat打开就显示找不到指定路径
这个有很大可能是病毒,运行后就隐藏了
训练集格式化工具,“训练音频目录”没有填啊?
没理解你的表述
我在开启SoVITS训练时,报错:
AssertionError: Only GPU training is allowed.
难道笔记本没有独显跑不了么?
最低需要n卡20
虽然报错,但是也能运行。
只是出来的效果太差了,使用了自己大概65个录制句子。结果却一点都不像。可能与我不会配置有关吧。
反而使用剪影的克隆音色功能,不到10s的随意录制,出来的效果吓了我一跳。快以假乱真了。还原度感觉8.5吧能有。@@jiuyixiaoketang
一分钟就可以了,没必要录很长,我测试下来比剪映的效果好很多,剪映用的也是这个代码,而且是删减版,肯定没这个真。
用中國人的聲音,配英文,或其它小語種(比如泰文、越文),可以實現嗎?
目前只支持中英日
A卡用不了,只能用colab,但梯子不稳定,用起来有些难受。
会更新使用cpu加速的版本
MAC的咋使用呀,好像跟Windons的安装不一样🥲
github上有部署方法
好复杂啊
还好啦,操作繁琐一些,但是很简单
我几个月前就开始用了
挺好的
用中國人的聲音,配英文,或其它小語種(比如泰文、越文),可以實現嗎?
目前只支持中英日
请问苹果系统能用吗?怎么安装呢?
苹果系统可以去github上面搜索一下,有安装提示
刚刚看完视频,最后的小惊喜,这个升级版不出一集?感觉更好用一些
会出,还在测试,已经在日程上了
@@jiuyixiaoketang 期待
GPT-sovits要一句句话克隆声音吗?
z这个对显卡有什么要求,我之前用笔记本无法开启一件三连,重新组装了个电脑还是无法开启,请问问题出在哪儿?显卡是A770 16G
需要n卡20及以上
@@jiuyixiaoketang 感谢,已经换了显卡,折腾了好久终于成功了
你好,请问一下我后面 打标勾选后 页面不会跳转是什么情况呀?
底部有跳出打开界面提示嘛
尊敬的九姨你好,那个后来跳过去了,可能是我配置比较低,有点慢。可是最后一一步一直识别不到我的显卡,它提示很抱歉,识别不到我的显卡。我的4g显卡不知道是不是配置太低了。请问有什么解决方案吗?
可能和显卡有关联,可以等更新cpu加速之后试试
为什么GPT模型只有默认的?
请问一下up 推理时 SoVITS模型列表中 只有gpt sovits这个选项 没有别的数字 是为什么啊 麻烦了
看看训练后的文件夹有没有是不是没有文件
@@jiuyixiaoketang 是的...虽然不知道具体那个文件夹 但是硬盘中搜索不到
训练过程中有报错嘛
@@JKs225 我碰到过类似的问题,用手机拍照翻译了一下运行过程,意思像是内存分配不足。我才是语音时间过长或过多,训练次数过多导致的,更改后重新训练我的就有了,你可以换个简短的,尝试一下。
@@jiuyixiaoketang 没有报错的
with open(g_load_file, 'r', encoding="utf-8") as source:
PermissionError: [Errno 13] Permission denied: 换了二台电脑,一直提示这样的,请指导
具体在哪一步呢
可以用一个小时的素材吗?
切分第一步出现路径不存在,怎么解
你好,请问这个工具对电脑配置有具体要求吗?
20以上显卡基本没问题,过段时间分享新版可支持cpu加速
@@jiuyixiaoketang20以上是什么意思?
n卡20系列及以上
@@user-rn3hb8tf1q 基本上看到20默認就是Nv家的 RTX20系列基本上你要玩ai相關會建議至少2080或是3060(顯存考量)
九姨美女,这个可以用来ai翻唱歌曲吗 在线等答案
模型是通用的,但是使用这个工具目前实现不了唱歌
咦?曹操原來叫大胖橘😂
这不也是甄嬛传里的四大爷嘛,俗称大胖橘哈哈哈哈
为什么我的文案它总是要重复读,有没有什么办法解决
等升级版吧,这是源代码的问题
想用升级版的工具,有的话麻烦发下哈
会第一时间发布,最近在测试
為什麼我切完短音,合成之後都很奇怪?
具体奇怪在哪
弹出的网页打不开怎么回事
太赞了,这个怎么打赏
您的关注就是对我的厚爱!❤️
请问开启语音切割的时候显示Connection errored out.是怎么回事啊
试试重启是否可以解决
@@jiuyixiaoketang 已经解决了,谢谢
请问为什么我切割后还是一个音频呢?
提示框有没有出现报错信息
請問出現「一键三连中途报错」是我前面哪個步驟做錯了嗎?
具体命令框报错是什么
@@jiuyixiaoketang 我看跟您影片不同的地方,是我這邊顯示無可用顯卡,報錯是erro2 英文好像是無可用文件或來源
如果是显卡问题的话,可以看看是否需要升级显卡驱动,文件来源问题,可以看看前面步骤的产出文件夹或者路径是否有误
你这教程直接把我看懵了
谢谢九姨 请问中文只能普通话?可以学习广东话及输出广东话吗?
这个没试过,目前应该不行,你可以自己测试下,具体以测试为准
可以输出广东话吗?我也有这个需求哈哈哈
@@hunterdavis1631 目前还不行
@@jiuyixiaoketang好的谢谢 期待后续有各种方言训练
显卡信息那里 显示:很遗憾你没有能用的显卡来支持你的训练 然后一键三连中途报错! 九姨这个怎么解决
电脑配置方便说一下吗
请教九姨,文案字数有限制吗?
目前有一定限制,过段时间会发布升级版本,不限制字数,并且可以实现cpu加速
啥时候升级啊@@jiuyixiaoketang
过段时间,月底或者下月初,最近在测试
太厉害了 !@@jiuyixiaoketang
九姨为什么最后合成会是错误的?
具体的报错是什么