GPT-SoVITS克隆语气情感,老司机必备技巧!训练与推理细节教学,附本地运行整合包下载。
ฝัง
- เผยแพร่เมื่อ 13 มิ.ย. 2024
- GPT-SoVITS控制语速语气,老司机必备技巧!附极速版整合包下载。
整合包下载
百度网盘:pan.baidu.com/s/1ZW0pHe4vZUE_...
谷歌网盘:drive.google.com/drive/folder...
GPT-SoVITS 模型训练与推理基础教程
• GPT-SoVITS语音克隆AI,只需一分钟...
AI 翻唱歌曲
• 最强AI翻唱 RVC WebUI本地安装与使用教程
零样本声音克隆VALL-E-X,微软技术
• 三秒语音就能克隆自己的声音,VALL-E-X...
免费文本到语音工具MeloTTS
• 五款AI工具一键运行整合包,商业应用转开源,...
Meta开源,免费的文本生成音乐工具AudioCraft
• Meta开源的AI音乐生成工具,可平替Sun...
00:00 合成效果短片
01:33 内容介绍
01:59 整合包下载设置
02:28 显卡设置
03:08 虚拟内存设置
03:34 复用老版模型
04:10 语速语气技巧一
05:25 挑选参考音技巧
06:37 语速语气技巧二
07:56 语速语气技巧三
09:05 音色融合
10:19 解决复读漏读
11:07 模型训练注意事项
12:02 训练SoVITS模型
13:29 训练GPT模型
14:09 模型挑选技巧
14:39 模型分享 - วิทยาศาสตร์และเทคโนโลยี
给博主点个大大的赞!
真厉害,博主讲的好!
这个视频不仅让我对GPT-SoVITS技术有了更深入的了解,也为我提供了许多实用的训练和推理技巧。
一如既往的干货
这个必须赞一个
先点一个赞
不错啊
good
牛逼
懂了,老司机的密码是省略号。
讲的太好了!!👍🏻请问top_K这个参数影响什么,怎么设置?
影响合成音乐的随机性,越高合成结果就越多样化
三体那段笑抽了
文案太有才了。
大佬,这个软件有没有升级版,目前版本有时候生成的就会乱读
太需要了 不过这个能不能一次生成长文本 不切割呢
大佬 能不能把周星驰干声分享下
想问下博主,我的整合包是直接从GitHub下载的beta,和你发网盘的这个具体有啥区别呀?发网盘的这个是你自己魔改的吗?
功能上没有区别。我共享的也是官网github上的一个分支,推理速度更快,只是这个分支整合包没在github上放出。
哈哈 我想要買個包
大佬,星爷这个模型可以分享吗
人类历史上首部,由人工智能ChatGpt 创作的长篇小说《新人类的觉醒》横空出世。人工智能对未来世界的描述,令人惊叹!!!
总是报错啊老大,第一步标注的时候提示 gradio\deprecation.py:43: UserWarning: You have unused kwarg parameters in Textbox, please remove them: {'scale': 5}
还是连续很多条,然后后面的就不行了,模型训练不出来
設置高性能是哪個項目看不清楚 ?
大佬,能把你训练的语音模型发上来吗
前一段文案 有点意思
博主,请问不用极速版,也能达到周星驰这个效果么?还有,你的周星驰的模型能不能分享一下哈
极速版只是批量推理的速度更快,其他功能跟github上主分支的整合包没有区别;模型会在合适的时候分享给大家。
@@AIDiscovery2045 可以付费购买模型不,我自己搞得不太好用
@@yunzhao3828 明星模型不好分享,见谅
@@AIDiscovery2045我也想要星爺的模型,可以TG分享嗎
你好,感謝您的視頻教學,請問我的筆電沒有獨顯,是不是無法訓練,我在一鍵三包卡住,顯示沒有找到應用程式
是的,一鍵整合包目前只支持英偉達顯卡。可以在colab體驗,上期視頻有colab腳本
@@AIDiscovery2045 好我來試試看,感謝回覆
GPT训练 Epoch 0: 4%|▍ | 1/24 [00:07
没训练完,第1轮进度才4%...
感谢分享!提醒下谷歌网盘下载链接失效了。
drive.google.com/drive/folders/1V1RL9KjZ9_pqnyMjl9EvFLFYIobmR9TK?usp=sharing
按照视频中方法都用过了,但是生成400字左右的文案,还是会出现声音泄露,复读等现象。即使是换成了5轮次的小模型,可是还是会出现声音泄露。这怎么解决啊
那可能跟练的模型有关吧
我训练lol游戏麦林炮手的配音感觉就不像,训练了好多次了,也不知道怎么回事
1:54 总之就是让某人说出他永远绝对不会说出的话就是了
请问训练素材需要多长时间的语音?
1分钟也可,10-30分钟效果好些;像这个视频里葛大爷的声音素材只有几十秒
th-cam.com/video/W_5EXXNuXS0/w-d-xo.html
合成的语音没有声音是什么原因
有沒有適合MAC的呀?或者可以在網上科隆的。。。
这个支持mac下部署,但性能在M芯片上不如N卡
这个比博主以前介绍的VALL-E-X怎么样?
gpt-sovits强很多
老师,你百度网盘里面的GPT-SoVITS-beta0306fix2解压包解压的时候解压到80%左右有一些文件提示不支持的解压方式,GPT-SoVITS-beta版本的可以正常解压。这是什么原因?
用7zip解压
@@AIDiscovery2045 就是用的7zip解压
呃 b站刚看过
老师,这个按照流程按照了,训练的时候GPT_weights提示训练完成,但目录下 没有文件,等了好久后台 都是一样,SoVITS_weights训练正常,目录下有文件。这是什么情况呢?
训练报错了,应该在命令窗口可以看到出错信息
之前您视频的最初的那个版本,可以正常使用,前面我看您出了新的换脸教程,我安装没有成功,不知道删了什么东西,就不行,我重新按照也不行,提示找不到PIP,但是音乐克隆的又能正常使用。语音克隆不行
@@AIDiscovery2045 下面就是GPT训练后台数据,老师帮我看看哪里出了问题,万分感谢
ConnectionResetError: [WinError 10054] An existing connection was forcibly closed by the remote host 大大用文本生成语音时时有遇到过这个问题吗
看上去像是推理页面的端口被占用了。查查本地有没有开其他AI程序。或者关闭推理页面重新打开。
想训练歌周星驰配音!其实是石斑鱼配音!语调什么都很好!就是噪音太大!没法用
找干净的素材,然后用工具提取人声,去混响、回声;可以用UVR5
@@AIDiscovery2045 乾淨的也不行,並不是音質不好.是去伴奏或人聲才留下來的!最後我用 au 一點一點的去除!效果不錯!就是太費時間!不過做好了模型後面伴奏要求就沒有那麼高了!th-cam.com/users/shortsY_n8rymhanE?si=hxmAtT7miabM4Qpk 我弄的翻唱短視頻,感謝你的教程
如果我再有耐心一點!應該效果更好!還是沒有去乾淨
什么时候出cpu版或a卡版,太扯了,用不了。
凭什么迁就你?想玩就买硬件,比比来来没球用
模型列表不显示是怎么回事,没有选项呢
需要先训练模型
th-cam.com/video/BDC2aJJFSgE/w-d-xo.html
请问大哥,硬件有什么要求?
周星驰的那个声音是已经有的吗?
自己训练的模型
@@AIDiscovery2045 能放出来吗
对硬件要求太高
如何轉換廣東話歌曲?
gpt-sovits现在还转不了歌曲;要用这个:th-cam.com/video/ocXOeMZc1XI/w-d-xo.html
显存必须6G吗?
是的,老卡跑不动训练
別在嗯了 再嗯我都硬了 拳頭硬了😆
我的mac笔记本是不是用不了
支持macos,但在M芯片下性能不好,非常慢
无法解压,会提示函数错误
安装个7zip解压
我训练了好几个视频,但是最终合成出来的效果都不如你的来的真实,我的一听就是机器人读的,而且音色也不对,不知道为什么
大概率是训练素材的问题
博主引导的好,嗯啊哦开始慢慢就污了😅
博主,是不是自己的声音也是克隆出来的????😂
没有,视频里的只是我录音的测试。做视频还是用真人的声音😄
@@AIDiscovery2045 真人声音训练 效果达不到录制的吗????
@@changejoe474 这倒不是,我的视频大部分是录屏式教程,如果连声音都AI了,跟大家的距离感就更远了😄
@@AIDiscovery2045 博主,方便➕个好友?
能线上部署吗?