AI 声音克隆！堪称翻唱神器，文字转语音、语音转换，包教包会！全网最详细的 So-VITS-SVC 使用教程 | 零度解说

零度解说

มุมมอง 235 662

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 5 ต.ค. 2024
【更多资源】▶ / @零度解说
【零度博客】▶www.freedidi.com
【加入会员】▶ / @零度解说
-------------------------------------
🔔
【AI翻唱】So-VITS-SVC 4.1一键安装包下载：bittly.cc/xFQqJ
🔰 安全VPN推荐（排名前3）：
1.ExpressVPN：bittly.cc/expr...
2.Surfshark ：bittly.cc/Surf...
3.NordVPN：bittly.cc/NordVPN
🚀VPS 推荐：
1.bittly.cc/Vultr （高性能）
💓
QuickFox加速器（翻墙回国VPN）：www.quickfox.c...
回国加速VPN ：bittly.cc/qt8cx
💰比特币交易平台
1.火币官网 : www.huobi.com/...
2.门罗币：localmonero.co...
======================= -------------------------------------------------
🐎🐎
商务联系：ozabc6@gmail.com

ความคิดเห็น • 633

@zh-jj9wl ปีที่แล้ว ⁺¹³
零度解说是目前我见到最好的订阅，能清楚的教会我每一个操作，而且没有隐藏收费，支持，一直关注
@j3lvlYounger หลายเดือนก่อน ⁺¹
是的功德无量
@sff6933 25 วันที่ผ่านมา
我喜欢他的教程是因为他嘴快，像冲锋枪，突突的比较快，不浪费时间，知识的传输速率很高效，操作过程清晰不丢失任何细节。
@seediqliu ปีที่แล้ว ⁺¹³
回饋分享，結論：差強人意，低於要求。
RTX 3080 8GB Laptop，一共訓練 42400 Step，訓練時間從昨晚 10:00 ～今早 06:00。
測試一：將我的乾淨聲音，置換某一首流行歌曲（已經比照辦理抽離原唱聲音）。
測試二：將我的乾淨聲音，置換某一個單純朗讀聲音。
非常非常耗費時間，除非有更快的硬體(縮短訓練時間)，否則不建議浪費寶貴生命時間在這裡。無論如何，還是謝謝零度解說製作如此精采之解說影片，再度謝謝。
@Cat_uwu69 ปีที่แล้ว ⁺⁴
好像是可以用別人做好的模型來套進你的軟體的樣子
這樣可以省下自己訓練模型的時間
而且如果效果要好的話其實四萬多步是遠遠不夠的（如果要真的做到完美）
我記得極客灣做過一個派蒙的ai，裏面也有用到這個技術
他們可是使用了三張RTX 6000跑了20個小時
@shulinliu ปีที่แล้ว
@@Cat_uwu69 我4000多个音频文件，700多M大小，训练了7万多步，都还不完美，哈哈
@不想看大海 ปีที่แล้ว
请教一下我的笔记本是dell工作站 cpu是12代i9，显卡nvidia rtx a4500.我在数据预处理后完成度显示100%，但是下面说没有能用的显卡
@A夢-s6b ปีที่แล้ว
我乾聲只錄15分鐘
@柒柒-f7h ปีที่แล้ว
我也是这么想的，直接用现成的AI语音包替换真人语音这不就省下训练的步骤了吗@@Cat_uwu69
@YT阿立日記 6 หลายเดือนก่อน ⁺¹
零度解说是目前我见到最好的订阅，能清楚的教会我每一个操作，而且没有隐藏收费，支持，一直关注 +1
@c72manwes6 ปีที่แล้ว ⁺¹²
我使用的GPU是NVIDIA GeForce RTX 4060 Laptop 8GB，從凌晨三點訓練到早上十一點，打開tensorboard顯示我已經走了23200步。內存全程佔滿（7.6GB）。如果大家遇到爆內存的話就調低一下學習率不建議超過0.0002（上面的那個）（不是一般不需要動的那個）旁邊的批量大小。我設定上面的批量大小為12 ，下面的批量大小48。
@johncena-ep4ef ปีที่แล้ว ⁺²
录自己声音的时候，用啥声音，读书可以吗
@不想看大海 ปีที่แล้ว
请教一下我的笔记本是dell工作站 cpu是12代i9，显卡nvidia rtx a4500.我在数据预处理后完成度显示100%，但是下面说没有能用的显卡
@c72manwes6 ปีที่แล้ว
@@不想看大海試不理會他繼續下一
@wangshen6597 ปีที่แล้ว
效果如何
@pinggenzhong8389 ปีที่แล้ว
你不会多买点内存，至少32g吧
@jmtsaimomo ปีที่แล้ว ⁺³⁰
再過二年這技術超級成熟後很多都不用請配音員了
出專輯直接請歌手去錄音存檔簽合約以後都直接合成不用錄半天再調半天😎
@fuddyduddy 11 หลายเดือนก่อน ⁺¹
不可能，你總歸要有一個模版，不可能無中生有。而且涉及音域的限制，目前這技術是否100% 捕捉到個人聲線獨特處也是問題，因為歌手不止聲帶發出聲音，口喉部也會對聲音產生影響。
@funkyoby55 10 หลายเดือนก่อน
兩年太短了，要知道歌手和配音員強就強在那個情緒渲染力，
那個細微的抑揚頓挫與聲調變化，AI 目前還處理不來．因為那個數值太靠感覺了，
就算能靠手動調整，那個耗費的時間還不如直接請本人來唱，成本上不符，
　
除非是懶到完全不想靠技巧，也不在乎成果是否最佳的歌手，那就另當別論，
但除此之外還有其他問題，這東西是否會破壞音樂市場？
萬一有人的聲音原始模板流出去，版權侵犯問題又怎麼算？
　
這就跟飛行汽車一樣，不是技術有了就能投入市場，還有很多因素要考量的。
@柯佳澔 10 หลายเดือนก่อน
@@funkyoby55 AI:兩年半，我可以~
@柯佳澔 10 หลายเดือนก่อน
@@funkyoby55我剛剛才用3080 12G學習完我的人聲，耗時14小時，共計訓練了18400步。
我必須說，AI唱得真的有我的味道，可惜在一些高音(如A4以上)的表現確實是差強人意。
我想再多給它幾個小時的時間訓練，看看能不能在更完善些。
@fuddyduddy 10 หลายเดือนก่อน
@@柯佳澔好像最少要訓練 50000步，loss 在 30左右才可以好一點。
@木村世界公式 ปีที่แล้ว ⁺¹¹
磨皮有点过了啊，看着这么白嫩光滑的零度，忒不习惯了
@andyxu9031 หลายเดือนก่อน
讲解的特别清楚，必须点赞。目前我的电脑没有独立显卡，但是我有微软云Azure。因此建议博主出一期指导视频，教我们如何把声音训练模型部署到微软云Azure上。这样就不受本地电脑配置的限制了。感谢感谢！！
@江宇翔-w8c ปีที่แล้ว ⁺²
这集很专业啊涉及AI的一些调参和基础知识了零度大哥真优秀
@sonicewg ปีที่แล้ว ⁺¹⁶
已经用了一段时间了，效果还是不错的，1660ti 6G 训练的模型，训练时间会比较长，但可以跑。训练扩散模型的batch-size适当调小一点。显存小于6G的话建议在线租用GPU训练模型了，或者可以考虑另外一个开源项目DDSP-SVC(D3SP)，效果相当接近SO-VITS-SVC了，关键对显卡的要求比SO-VITS-SVC低不少，训练时间相对也非常短就可以出效果。
@OdinVicky ปีที่แล้ว ⁺¹
166训练多久
@sonicewg ปีที่แล้ว
@@OdinVicky 具体多久不记得了，都是电脑空闲的时候，比如晚上睡觉就打开训练，我自己目前用的模型1660ti用了应该不下3个晚上甚至更多吧，但就效果来说的话还是非常满意的，音色几乎分可以达到以假乱真的程度。训练的时候可以推理小段试听，效果自己觉得满意就可以了。
@ruudygh ปีที่แล้ว
请问有一款叫RVC AI的, 都是同个东西吗?
@sonicewg ปีที่แล้ว
@@ruudygh 是的，功能类似的不同项目
@食い物いっぱい ปีที่แล้ว
666
@RootTsou ปีที่แล้ว ⁺⁷
可以專門解說一集怎麼克隆自己的聲音用在製作影片上嗎？非常感謝😊
@koongy ปีที่แล้ว
你这是打算把别人的视频直接换成你的声音吗？
@RootTsou ปีที่แล้ว
@@koongy 你想太多了
@qwerasdftest ปีที่แล้ว
可以啊.不過意義不大.
@sff6933 25 วันที่ผ่านมา
就这集的教程不就很明确了吗。你这是要让手把手教你啊，不会举一反三。有了自己的声音模型，教程最后你选文字转语音不就能得到你声音的任何内容了吗。你是不是最后没注意页面上的几个功能
@sff6933 25 วันที่ผ่านมา
15:35你再看一遍。要是你自己制作录制的影片的话，你用文字转语音。如果是网上下载的电影视频，先把音频分离出来，再把音频里的语音和背景杂音分离开，然后换成你的声音模型后，再和之前分离的影片合并起来。就这集教程已经够你用了。
@Dylansam-rx5gg ปีที่แล้ว ⁺¹
非常感谢零度，也许以后能出唱歌的视频了，哈哈哈
@jasonchan7405 ปีที่แล้ว ⁺⁶
录制自己的声音样本时，是朗读的声音，还是歌唱时的声音？制作个人声音样本需要注意哪些因素？
@ghazitamala5566 4 หลายเดือนก่อน
零度真的是很棒的博主，谢谢博主。
@炊烟-v8u ปีที่แล้ว ⁺¹
哈哈对于专业的音乐人员来说，AI翻唱现阶段只是个热闹。。。
@zchan935 ปีที่แล้ว ⁺⁵⁶
作为专业音乐工作者来听，就目前的效果还是有一点瑕疵的，主要是出在歌唱情感的问题上，这个问题对于AI来说可能有点麻烦，不过按目前的AI发展速度，我估计攻克这个问题是完全有可能的，到那个时候对于一个歌手的评判标准可能会变成只需要在意他的声音是不是好听，至于是不是五音不全，有没有学过基本乐理，都已经不重要了
@keyman88866 ปีที่แล้ว ⁺⁵
有没有可能嗓音也能AI合成？😢
@Ke-vm7ln ปีที่แล้ว ⁺³
主要是训练模型不够，就像AI孙燕姿，因为用孙燕姿大量歌曲训练，模仿出得歌曲只要不是超过模型唱法得就已经听不出来，你可以搜索一下AI孙燕姿就知道了。
AI在模仿方面是人类无法想象的！
@zchan935 ปีที่แล้ว ⁺⁷
@@Ke-vm7ln 阿兄弟，你没看懂我的意思，我是指歌唱感情，孙燕姿我听过的，我的意思是就同一句歌词，换了孙燕姿本人来唱，昨天和今天唱出来的感觉也是不一样的，更何况AI歌手要面向大量的原创曲目，哪一句要轻，哪一句要重，哪一句要爆发，哪一句要收。。。这可不光是音色的问题。
@Ke-vm7ln ปีที่แล้ว ⁺¹
@@zchan935 那就是从模仿到融合了，模型是可以融合的，只要节点够多模型够大+随机因子，AI输出不是一成不变的，人类的一般创新其实也就是“模仿+融合”到变化。所以除了科研顶级创新，AI都可以做到。
@zchan935 ปีที่แล้ว
@@Ke-vm7ln 我觉得可能没有那么简单，情感本来就是AI发展中最大的瓶颈，换句话说，以后甚至是区别于人和AI的唯一标志，如果真的赋予了AI和人一样的情感，也许不见得是件好事，只是也许啊，必竟有丰富情感的AI........至少我会脑洞大开
@ALaMode. ปีที่แล้ว ⁺⁵
请问如何克隆自己的声音，然后朗读脚本给短视频配音？
@臻上官 ปีที่แล้ว
老师水平很高，我也一直有保存声音的想法
@Sincvrcom 8 หลายเดือนก่อน
零度，感谢你，我跑起来了！机器在学习中！
@wuji4145 4 หลายเดือนก่อน
零度你好, 我去到從頭開始訓練模型這一步
INFO:44k:{'train': {'log_interval': 200, 'eval_interval': 800, 'seed': 1234, 'epochs': 10000, 'learning_rate': 0.0001, 'betas': [0.8, 0.99], 'eps': 1e-09, 'batch_size': 12, 'fp16_run': False, 'lr_decay': 0.999875, 'segment_size': 10240, 'init_lr_ratio': 1, 'warmup_epochs': 0, 'c_mel': 45, 'c_kl': 1.0, 'use_sr': True, 'max_speclen': 512, 'port': '8001', 'keep_ckpts': 10, 'all_in_mem': False}, 'data': {'training_files': 'filelists/train.txt', 'validation_files': 'filelists/val.txt', 'max_wav_value': 32768.0, 'sampling_rate': 44100, 'filter_length': 2048, 'hop_length': 512, 'win_length': 2048, 'n_mel_channels': 80, 'mel_fmin': 0.0, 'mel_fmax': 22050}, 'model': {'inter_channels': 192, 'hidden_channels': 192, 'filter_channels': 768, 'n_heads': 2, 'n_layers': 6, 'kernel_size': 3, 'p_dropout': 0.1, 'resblock': '1', 'resblock_kernel_sizes': [3, 7, 11], 'resblock_dilation_sizes': [[1, 3, 5], [1, 3, 5], [1, 3, 5]], 'upsample_rates': [8, 8, 2, 2, 2], 'upsample_initial_channel': 512, 'upsample_kernel_sizes': [16, 16, 4, 4, 4], 'n_layers_q': 3, 'use_spectral_norm': False, 'gin_channels': 768, 'ssl_dim': 768, 'n_speakers': 1, 'speech_encoder': 'vec768l12', 'speaker_embedding': False}, 'spk': {'OUT': 0}, 'model_dir': './logs\\44k'}
WARNING:44k:C:\Users\tony\Desktop\So-VITS-SVC新版\新版整合包\so-vits-svc is not a git repository, therefore hash value comparison will be ignored.
./logs\44k\G_0.pth
error, emb_g.weight is not in the checkpoint
INFO:44k:emb_g.weight is not in the checkpoint
load
INFO:44k:Loaded checkpoint './logs\44k\G_0.pth' (iteration 0)
./logs\44k\D_0.pth
load
INFO:44k:Loaded checkpoint './logs\44k\D_0.pth' (iteration 0)
./logs\44k\D_0.pth
C:\Users\tony\Desktop\So-VITS-SVC新版\新版整合包\so-vits-svc\workenv\lib\site-packages\torch\autograd\__init__.py:197: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed. This is not an error, but may impair performance.
grad.sizes() = [32, 1, 4], strides() = [4, 1, 1]
bucket_view.sizes() = [32, 1, 4], strides() = [4, 4, 1] (Triggered internally at C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\torch\csrc\distributed\c10d
educer.cpp:339.)
Variable._execution_engine.run_backward( # Calls into the C++ engine to run the backward pass
但沒有進行訓練... 到底出了什麼問題, 應如何解決?
@idlegv ปีที่แล้ว ⁺¹
《有没有人告诉你》听起来很棒。
@Canal-jk3vm 10 หลายเดือนก่อน ⁺¹
啊，整完了，我13600k+32GDDR5+3080ti+pcie4 WD SN850x的硬盘，三天没关机15200step。按零度哥的操作，弄一首我老婆偶像王力宏的《你不知道的事》，准备给她一个惊喜，结果，被踢了一脚，老婆一听，说不出有什么问题，但知道是假的，叫我不要侮辱她偶像。总结一个教训，下次一定要向零度哥学完整，找个难度简单的歌送给女人，那就不会穿帮了。谢谢零度哥，这方法我老婆对我又爱又恨，但很有情调。谢谢
@popandxh 10 หลายเดือนก่อน
你好，请问sovit4.0可以达到让ai模仿自定义短语吗？还是说只能模仿上传音频？或者说可以将自定义的短语录成音频上传替换呢？
@popandxh 10 หลายเดือนก่อน
也就是说让他不必模仿歌手唱歌，而是模仿歌手的声线去说出我所设定的话。期待您的回复谢谢
@Canal-jk3vm 10 หลายเดือนก่อน
这软件是根据歌手的音调和咬字，替换成你的声音，如果你想自定义说出的内容需要另一种软件@@popandxh
@popandxh 10 หลายเดือนก่อน
好的谢谢
@@Canal-jk3vm
@KellAbel-u9d ปีที่แล้ว
感谢零度大神的分享零度我爱你！！！
@2cosXcos-1 ปีที่แล้ว
真的很有良心的實況主
@YT阿立日記 6 หลายเดือนก่อน
还是零度的影片够质量
@吃货食堂 10 หลายเดือนก่อน ⁺²
电脑内存要多大？我16g提示我内存不足😢计算了3步就停了
😊
@张生-c6e ปีที่แล้ว
非常详细，为你点赞。
@WendyHuNanNZ 5 วันที่ผ่านมา
真的大哥😂😂😂😂😂😂😂
@中國好鄰居 ปีที่แล้ว ⁺³
mac系統怎麼來處理，可以出個教材麼？謝謝
@CC01013 ปีที่แล้ว ⁺¹
我的天...AI聲音好厲害...雖然聽上去怪怪的，但有90%相似度
@黃宗翰-v7s 6 หลายเดือนก่อน
这是一个超级棒的频道，我已经订阅🎉另外想请问您一个问题，目前我已经训练一个模型将近10万步，想请问一个模型是训练越多步越好吗？还是有建议的最高上限？希望您能回覆我，万分感谢
@huapong ปีที่แล้ว ⁺¹
之前提提到过，没想到这么快就出了教程。非常详细的教程，小白一步步跟着做也能很好的完成。感谢分享。
@marketliao7950 ปีที่แล้ว ⁺¹
原来孙燕姿AI是这样子生成的，在零度这里学到很多未知的东西
@waterglod ปีที่แล้ว
谢谢分享，未来可以高度还原那些历史人物的声音
@freeheaven8579 ปีที่แล้ว
先收藏，有时间看看
@SobujSaif-of9uy ปีที่แล้ว ⁺¹
能不能做一期云端版本的
@杨超龙 2 หลายเดือนก่อน ⁺²
为什么我打不开那个tensorboard
@孙行者-r2g 7 หลายเดือนก่อน ⁺¹
零度老师啊，我是一步步安装下来的。但到了勾选GUP Conversion这一步就无法勾选了，下面三个选项是可以的。您帮分析一下，谢谢
@GRASSU-007 6 หลายเดือนก่อน
ME TOO
@user-to6si2chu ปีที่แล้ว
出了些问题
期望值：第 1 行第 1 列（字符 0）将数据集文件夹放置在dataset_raw文件夹下，数据库文件夹是”OUT"。训练时，点击“识别数据库”时就出现前面这个提示。零度老师，这个问题怎么解决？
@junzhang6753 ปีที่แล้ว
解决了吗
@xingyutong ปีที่แล้ว
请问解决了吗，我也出现一样的问题
@鬱悶的豬頭 ปีที่แล้ว ⁺¹
挂全局/代理的美国梯子
@鬱悶的豬頭 ปีที่แล้ว
@@xingyutong挂全局/代理美国的梯子
@鬱悶的豬頭 ปีที่แล้ว
@@junzhang6753 挂全局/代理美国的梯子
@fabioren3336 ปีที่แล้ว ⁺²
免費mega只能下載到65%就不讓下載了。百度不適合國外下載。能放谷歌上嗎？
@hellowe5286 ปีที่แล้ว ⁺²
可不可以把训练出来的语言模型用于文本转语音？？？
@Tibet-Beautiful ปีที่แล้ว
看看就好😇
@梓豪曾-e4w ปีที่แล้ว
每次学习安装位置，都在C盘，，都满了！
@burgerLi ปีที่แล้ว
感谢分享，很不错。
@丁当-n1m ปีที่แล้ว ⁺¹
理论上说，作者表示训练步数太多会过拟合，反而效果不好，目前我在云服务器上跑出的模型，也确实感觉5000步跟1万步区别不是很大，不知道有没人跑更多来验证这个。
@AOBONA ปีที่แล้ว
你那个基础声音训练素材用了多少分钟，我也在训练，但是感觉还是不尽人意，感觉音像，质不像。@@lonelyfq
@ZieewyZieong ปีที่แล้ว
这个比上次的效果好多了，感谢分享
@zanadu2001 6 หลายเดือนก่อน
请问，你提供AI训练用的自己的干声，是什么内容？读书、随便说话，还是也需要歌唱的录音？
@GoodLuck_613 5 หลายเดือนก่อน
挺好
@benzw ปีที่แล้ว
博主你好，有没有AI程序可以帮忙创造笑料包袱的那种智能AI，不知道你看没看过《阳光的快乐生活6》电视剧，那里面条子写了很多的笑料包袱，如果AI能创造这种相声笑料包袱就太好了。期待你的频道将来能推荐一种这样的AI相声小品笑料包袱生成程序，完成后、可以通过朗读的形式给大家念着听。估计效果会很好。
@haima9979 ปีที่แล้ว ⁺¹
顶起来
零度真是全才啊
@来都来了-u6y ปีที่แล้ว ⁺¹
有了这个技术，是不是以后你想用谁的声音（如声优，播音员）都可以拿他们作品里的声音进行训练，训练完成后直接文本转语音，用他们的声音模型生成任何你想要的内容了？
@dandelionsdontfly6422 ปีที่แล้ว
同问
@Madara-k1z ปีที่แล้ว
建议用自己的声音或者其他歌手的，在不经过他人的同意下擅自克隆伪造声音是违法行为，不可用在诈骗领域，否则后果你知道的。
@chenli1606 4 หลายเดือนก่อน
老師，音頻切割的原理是怎樣的？如果二次以上的切割，那個參數需要如何調整呢？
@rkal9527 ปีที่แล้ว ⁺³
我做到了從頭開始訓練那步也開始運行了但總是出現error, emb_g.weight is not in the checkpoint 隨後就卡住了不知道博主有甚麼解決辦法?
@cg7981 หลายเดือนก่อน
能不能出一期，最新的GPT-SoVITS的教程啊，其他人分享的都看得乱七八糟的。多谢！
@FuguiWang-d8h 11 หลายเดือนก่อน
零度老师您好，可以出一集关于手机变声器的视频吗？谢谢
@312-ou ปีที่แล้ว ⁺¹
好酷!
@mr2011vincent1 ปีที่แล้ว
11:36 你选择的是 “crepe" 作为选择训练使用的f0预测器，但我不行。因为我的显示卡不够，只有2GB，所以只能选择 “PM"
@李森-u7r ปีที่แล้ว
2g的显存可以搞吗？
@mr2011vincent1 ปีที่แล้ว
@@李森-u7r 真的不可以
@zhishidatanxian ปีที่แล้ว
大神，我把这个参数【【批量大小，每步取多少条数据进行训练，大batch有助于训练但显著增加显存占用。6G显存建议设定为4】默认是12 我设置了4 速度非常的快！！我是2060S 8G
@lonelyxz ปีที่แล้ว
8G可以设置6，再高就可能暴显存了，默认12我这跑不了，他怎么跑的搞不懂，我设置为6就OK了。
@logiclo-v7n 11 หลายเดือนก่อน ⁺¹
零度你好！前面的步骤都是根据你讲解来的，最后一步“音频转换”报错，不知何故。（有没有其他朋友遇到这种情况？）
@AChing-jg4je 11 หลายเดือนก่อน
我也碰到這問題
@AChing-jg4je 11 หลายเดือนก่อน
我成功了，看到後台說要我安裝ffmpeg，安裝完就可以轉換，但你的話要看你後臺顯示甚麼錯誤，然後進行排錯
@BilibiliVideoArchive 11 หลายเดือนก่อน
我也报错了，UTF-8
@琮哥 10 หลายเดือนก่อน
@@AChing-jg4je 你好要安裝在哪裡謝謝
@WYuan_NL ปีที่แล้ว ⁺⁶
可以将文字用我的声音读出来吗？这样做视频时就不用配音了😀
@paulyang1796 ปีที่แล้ว
我觉得可以，先用电脑文字转语音，简单生出电脑配音，再用自己训练出的声音，替换掉配音的声音，最后合成就可以了
@shengxie-dh8wi ปีที่แล้ว
好像是可以的去年司马南疫情期间的视频都是用AI配音
@sx1hd7bk5n ปีที่แล้ว
當然可以，不過效果肯定是沒本人好
@LESLIE_Q ปีที่แล้ว ⁺¹
首先感谢您的教程分享听了您分享的克隆翻唱声音我的头上出现3条线 😅 这 AI 真喳喳，我 5音不全的唱都好过它 😁
@Liam00000 ปีที่แล้ว ⁺¹
请问可以让迈克尔杰克逊和邓丽君合唱一首《愿荣光归香港》吗？
@HarryAnnalee ปีที่แล้ว
謝謝分享，非常好的教程！請問一下文本轉語音裏的選擇原始音頻音色沒有英文，怎麽加入英文的音頻音色啊！
@鱼死溪中 8 หลายเดือนก่อน
完蛋，我从切片那一步开始就搞不下去了，点开始他直接提示切片完成而且输出文件夹里没有任何文件
@alan-rp9qt ปีที่แล้ว
大v 自己要连续录入吗？读小说吗？要发音很多片段吗？
@ruudygh ปีที่แล้ว ⁺³
只能转换歌唱吗？
如果我要把川普的演讲录音，变成我的声音，能吗？
@零度解说 ปีที่แล้ว ⁺¹
可以
@jasonxien6890 5 หลายเดือนก่อน
OpenVoice V2这个出新的，效果试听了一下，比之前所有听过的，都要更逼真。请问，有兴趣做一期吗？
@汪家澤 ปีที่แล้ว
謝謝老師！
@leegarza4617 ปีที่แล้ว ⁺¹
瞬息宇宙ai绘图出个教程吧🙏
@RexChoyy ปีที่แล้ว
牛逼, 有趣多謝
@ceobtc-y5b ปีที่แล้ว ⁺²
D:\工具分享\aichangge\So-VITS-SVC新版\新版整合包\so-vits-svc is not a git repository, therefore hash value comparison will be ignored.
cmd这提示怎么弄啊？
@ceobtc-y5b ปีที่แล้ว
求解答
@qwerasdftest ปีที่แล้ว
裡面有so-vits-svc檔.和使用教程檔.如沒有就是你下載有問題
@眯眯司马 10 หลายเดือนก่อน
我也是这个，你解决了吗？
@李圣佳 6 หลายเดือนก่อน
大佬，准备自己干净的人声，然后训练出来一个自己音色的模型。这个准备的人声，是自己唱歌的声音还是普通说话的声音就行？
@YuXu-bu1zp 26 วันที่ผ่านมา
您好，零度老师，请问我一切都准备好了，但是在点击开始训练的时候突然遇到这个问题，请问怎么解决呢？INFO:44k:{'train': {'log_interval': 200, 'eval_interval': 800, 'seed': 1234, 'epochs': 10000, 'learning_rate': 0.0001, 'betas': [0.8, 0.99], 'eps': 1e-09, 'batch_size': 12, 'fp16_run': False, 'lr_decay': 0.999875, 'segment_size': 10240, 'init_lr_ratio': 1, 'warmup_epochs': 0, 'c_mel': 45, 'c_kl': 1.0, 'use_sr': True, 'max_speclen': 512, 'port': '8001', 'keep_ckpts': 10, 'all_in_mem': False}, 'data': {'training_files': 'filelists/train.txt', 'validation_files': 'filelists/val.txt', 'max_wav_value': 32768.0, 'sampling_rate': 44100, 'filter_length': 2048, 'hop_length': 512, 'win_length': 2048, 'n_mel_channels': 80, 'mel_fmin': 0.0, 'mel_fmax': 22050}, 'model': {'inter_channels': 192, 'hidden_channels': 192, 'filter_channels': 768, 'n_heads': 2, 'n_layers': 6, 'kernel_size': 3, 'p_dropout': 0.1, 'resblock': '1', 'resblock_kernel_sizes': [3, 7, 11], 'resblock_dilation_sizes': [[1, 3, 5], [1, 3, 5], [1, 3, 5]], 'upsample_rates': [8, 8, 2, 2, 2], 'upsample_initial_channel': 512, 'upsample_kernel_sizes': [16, 16, 4, 4, 4], 'n_layers_q': 3, 'use_spectral_norm': False, 'gin_channels': 768, 'ssl_dim': 768, 'n_speakers': 1, 'speech_encoder': 'vec768l12', 'speaker_embedding': False}, 'spk': {'audio': 0}, 'model_dir': './logs\\44k'}
WARNING:44k:D:\BaiduNetdiskDownload\新版整合包\so-vits-svc\so-vits-svc is not a git repository, therefore hash value comparison will be ignored.
@Canal-jk3vm 10 หลายเดือนก่อน
你的声音需要点混响润色就完美了
@mkireooh7741 ปีที่แล้ว ⁺¹
0:51 不像😅
@蒲阿瑋 ปีที่แล้ว
超級感謝，成功讓AI模仿我的歌聲唱歌了...我朋友說聽不出來是假的
@ChloeC-ch2nk ปีที่แล้ว
想问下您，您录的30分钟都是说什么呢
@蒲阿瑋 ปีที่แล้ว
@@ChloeC-ch2nk 隨便唸一本書，主要是錄音的品質要好，盡量不要有雜音和風切聲
@user-jiangmuyu 11 หลายเดือนก่อน
您好，请问一下您
用的什么录音设备
@蒲阿瑋 11 หลายเดือนก่อน
@@user-jiangmuyu 一般的蘋果耳機，然後再用軟件提取人聲
@wormfreedom 3 หลายเดือนก่อน
我都已经做到ai虚拟直播实时合成唱歌了
@张-g5d 3 หลายเดือนก่อน
博主，因为原声素材时间比较长，有没有什么办法，不在算力云上修改标注。我尝试保存到本地进行修改，但是再上传后就无法继续训练了。
@lison8184 ปีที่แล้ว ⁺¹
使用cpu不能训练啊
@Duwin68 6 หลายเดือนก่อน
有没有已经生成好的语音模型哈，分享网址在哪里？
@xingxing5621 3 หลายเดือนก่อน
零度大哥，為啥顯示“Variable._execution_engine.run_backward( # Calls into the C++ engine to run the backward pass”就停止訓練了？怎麼解決呢？盼指導！！！
@王坤-j7u ปีที่แล้ว ⁺³
我想请问一下，我再训练的时候，扫描数据集出现错误是怎么回事？
@IchinoSun 3 หลายเดือนก่อน
我也是，请问兄弟解决了吗？
@Gameson24 ปีที่แล้ว ⁺¹
我看到有別人做到男女合唱,這個VITS可以做到嗎? 能再上個教程,另外請問會有多人備份教學嗎?
@伊秋成 10 หลายเดือนก่อน
这已经不只是保姆级教学了！这是亲妈级！
@vraudiofan82 ปีที่แล้ว
零度大神，求教，需要准备的干声是正常语速的语音，还是有音高的人声呢？训练的话二者有没有区别？
@TiandaoTV 11 หลายเดือนก่อน
为什么用了12个WAV干声？ 10分钟一个WAV，准备6个能训练吗？
@laozhuang1981 10 หลายเดือนก่อน
零度老师：你好！我朋友的女儿因为车祸死了一年多了，失去了唯一的女儿他们非常痛苦，但一直瞒着他的爷爷奶奶说小孙女去国外读书了。他们害怕老年人接受不了这个现实，更担心听到这个消息会影响他们的健康问题。所以我想咨询你能不能通过AI语言模型模拟声音进行手机实时通话，还有半个月就是我朋友的女儿生日。希望能通过孙女的声音暂时安慰他们的爷爷奶奶。
@weijun-ylgm 9 หลายเดือนก่อน
自己操作应该有些难度您的想法是要时时音译功能
@卢锡安-w5b 10 วันที่ผ่านมา
RTX 3060ti，训练了一晚上，12个小时左右，只跑了1000步左右，怎么回事？
@yansheng-c2d 6 หลายเดือนก่อน
老大，我想问一下，用这个需要科学上网吗
@wangyulei3788 8 หลายเดือนก่อน
请问你用来做训练的声音有什么要求吗？可以随便读一些文字吗？
@VictorNKC 8 วันที่ผ่านมา
如果把叫床聲訓練一下它唱出來好聽嗎？
@RayHsu-e2k ปีที่แล้ว ⁺¹
零度:之前在這部（真白嫖！免費申請 office E5 開發者賬號，送5T私人網盤，附無限續期的教程！ | 零度解說）影片裡註冊著帳號無法使用了，它顯示 [您的系統管理員必須指派 SharePoint 和 OneDrive 授權給您,您才能執行此動作。}請問該怎麼處理？
@zhishidatanxian ปีที่แล้ว ⁺¹
INFO:44k:====> Epoch: 1, cost 233.54 s
INFO:44k:====> Epoch: 2, cost 206.38 s
INFO:44k:====> Epoch: 3, cost 190.13 s
INFO:44k:====> Epoch: 4, cost 212.08 s
INFO:44k:====> Epoch: 5, cost 217.87 s
INFO:44k:====> Epoch: 6, cost 191.48 s
INFO:44k:====> Epoch: 7, cost 181.72 s
INFO:44k:====> Epoch: 8, cost 205.70 s
大神，我训练的时候是这样的对吗？
@ansonvlog1863 9 หลายเดือนก่อน
太慢了
@tha7422301 ปีที่แล้ว
每一首歌都要重訓練嗎? 還是原本的聲音訓練另外可以存檔嗎
@wongyeah 10 หลายเดือนก่อน
请问是不是电脑配置的主要基本要求是？是否显卡需要好一点？
谢谢！
@nghaoyimoe9533 ปีที่แล้ว ⁺¹
百度网盘无法下载，会提示（你下载的内容包含文件夹，请使用百度网盘客户端下载。） Mega 网盘则提示（Please upgrade your account to continue Immediately, or wait 05h 24m 26s to continue for free.）如何解决？😣
@jameslin7457 ปีที่แล้ว
对比 tortoise 哪个clone质量更高一些？
@Breadman77 ปีที่แล้ว ⁺¹
請問零度老師.我家GTX970跑得動嗎??
@IchinoSun 3 หลายเดือนก่อน
老师，请问训练识别数据集的时候，提示错误：Expecting value: line 1 column 1 (char 0)，这是什么原因呀？切片音频文件夹已放到dataset_raw文件夹里了
@刘强-s7x ปีที่แล้ว
谢谢
@Ke-vm7ln ปีที่แล้ว ⁺¹
AI从模仿到融合，未来一定是创造。人类只有最最顶端科技创造才是真创造，一般的创造也就是"模仿+融合"，凭什么人类这种方法就是创造，AI就不算呢？

ต่อไป

เล่นอัตโนมัติ

ChatTTS 最强文本转语音！一键本地安装，100%成功！效果逼真如真人，完全免费开源！！| 零度解说