虽然是最牛的语音合成模型,你也得会用才行

แชร์
ฝัง
  • เผยแพร่เมื่อ 18 ก.ย. 2024
  • chatts作为目前最牛的语音合成模型。可以最大程度的模拟人类的自然发音,拥有更多的情感和节奏控制。但是它的缺点也是很明显的,那就是不够稳定,那怎样才能获得稳定的音色呢,一个视频给你讲清楚。
    ------------------------------------------------------------------------------------------------------------------------
    ChatTTS_colab
    github.com/6dr...
    音色评估系统 ChatTTS_Speaker
    github.com/6dr...
    ------------------------------------------------------------------------------------------------------------------------
    Kevin MacLeod的Folk Round根据知识共享署名 4.0许可授权用户使用。 creativecommon...
    来源: incompetech.com...
    音乐人: incompetech.com/

ความคิดเห็น • 4

  • @RealMusic008
    @RealMusic008 2 หลายเดือนก่อน

    請問現在有不限文字和音頻長度的版本嗎?音頻時長過長會不會更不穩定。

    • @sunleyan_2021
      @sunleyan_2021  2 หลายเดือนก่อน

      长文本是没有问题的

  • @sam5519
    @sam5519 2 หลายเดือนก่อน

    可以用自己的声音训练这个lora包吗?

    • @sunleyan_2021
      @sunleyan_2021  2 หลายเดือนก่อน +1

      哪个属于语音克隆的范畴,试试其他模型比如gptsotts