F5-TTS & E2 TTS Google Colab Tutorial

แชร์
ฝัง
  • เผยแพร่เมื่อ 4 ธ.ค. 2024

ความคิดเห็น • 76

  • @AbdullahJahangirr
    @AbdullahJahangirr 6 วันที่ผ่านมา

    Happy 1k subs

  • @angelochu3156
    @angelochu3156 หลายเดือนก่อน +3

    I watched many videos about F5-TTS on youtube. You are the only one who can clearly compare the original sound and clone sound in a clear manner to the watcher. Keep up the good work!

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      Glad I could help!

  • @Dex383-d8d
    @Dex383-d8d หลายเดือนก่อน

    I have already tried everything in the video and it is indeed very easy to use, the AI has its problems but I guess it will improve over time, the part of cloning the voices works 100 out of 10, I managed to confuse a friend with his own voice speaking in another language which was very funny.
    Thank you very much for the video and for taking the time to respond to my first comment

  • @MR.VAN1979
    @MR.VAN1979 หลายเดือนก่อน +2

    Your videos bring a lot of value to the community and are worthy of 1 subscription, 1 like, and 1 comment. I wish you good health and make many valuable videos for everyone to learn and follow.

  • @mekkicharfi5454
    @mekkicharfi5454 หลายเดือนก่อน +1

    Thank you very much and especially for your patience

  • @QHawk7
    @QHawk7 หลายเดือนก่อน +1

    *Great Video , thanks, Try dubbing a short documentary and import a deep voice, let's see what we can do with all available AI tools & colabs at this moment*

  • @dkerdnase
    @dkerdnase หลายเดือนก่อน +1

    Thank you so much man! You're awesome!

  • @vodkalikpatates
    @vodkalikpatates 2 ชั่วโมงที่ผ่านมา

    Thank you for the video! It's really helpful! 🙌How can i use it with another model? like, i want to try with "F5-TTS-Turkish". how can i add it properly

    • @neuralfalcon
      @neuralfalcon  8 นาทีที่ผ่านมา

      Search on Google to find out if someone has trained an F5TTS model for the Turkish language or train your own model.
      To learn how to train in different languages watch this video:
      th-cam.com/video/UO4usaOojys/w-d-xo.htmlsi=uzMKfs6sdDloKU9a

  • @xenn2996
    @xenn2996 หลายเดือนก่อน +1

    thanks for the tutorial

  • @fearai24
    @fearai24 หลายเดือนก่อน

    2nd audio and first model super

  • @411KJB
    @411KJB หลายเดือนก่อน +1

    Excellent!

  • @lsgzmc5806
    @lsgzmc5806 หลายเดือนก่อน +1

    Pls make a video on how to use multi-speech option of this model, I'm having troubles using it

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      11:18 watch this video th-cam.com/video/6i0cXSvyz98/w-d-xo.htmlsi=IZ8FKfAD7l0sqmgV

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน +1

      Use the format {emotion_name} your_text.
      For example:
      If the emotion is "happy": {happy} I won a prize.
      For multiple emotions: {happy} I'm happy. {angry} I'm angry. {sad} I'm sad.
      There’s no set order. Just indicate the needed emotion in curly braces before each sentence, like {emotion} your_text.
      Make sure you label those reference audio files the same as your emotion_name.

    • @lsgzmc5806
      @lsgzmc5806 หลายเดือนก่อน +1

      @neuralfalcon thx for helping me out

  • @Carlon15
    @Carlon15 หลายเดือนก่อน

    Can you make a video about how to train your model in a different language, please?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      github.com/SWivid/F5-TTS/discussions/143
      th-cam.com/video/RQXHKO5F9hg/w-d-xo.html

    • @neuralfalcon
      @neuralfalcon  26 วันที่ผ่านมา

      Watch this video: th-cam.com/video/GmketyZW2c4/w-d-xo.html

    • @neuralfalcon
      @neuralfalcon  17 วันที่ผ่านมา

      Watch this video : th-cam.com/video/UO4usaOojys/w-d-xo.html

  • @pneuma23093
    @pneuma23093 หลายเดือนก่อน +1

    2:57 That's Dva right?

  • @harshvaghanii
    @harshvaghanii หลายเดือนก่อน

    I've got an error in second step saying -> name 'base_path' is not defined

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      Because, you forgot to run the cell above, where base_path = "/content".
      Run the cell above first, then run the next one afterward.

  • @snakezo4218
    @snakezo4218 หลายเดือนก่อน

    is there a way to speak with our voice and make a transfer to this voice to reproduce the emotions of tones you know
    let's imagine that I play the game of an angry person can the cloned voice reproduce this angry voice ?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      Easy, Record a short, 15-second audio clip where you speak in a specific tone, like angry, sad, or happy. Use this audio as a reference in F5 TTS, and the output voice will match your chosen emotion, such as anger.

  • @QHawk7
    @QHawk7 หลายเดือนก่อน +1

    Can I get this to work on kaggle?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน +1

      Yes

    • @QHawk7
      @QHawk7 หลายเดือนก่อน

      @@neuralfalcon
      How?

    • @neuralfalcon
      @neuralfalcon  29 วันที่ผ่านมา

      @@QHawk7
      github.com/NeuralFalconYT/F5-TTS-Demo/blob/main/F5_TTS_Latest.ipynb
      You may need to run:
      !sudo apt install ffmpeg
      Ensure you are connected to a GPU runtime.
      You may also need to install torch if PyTorch is not pre-installed on Kaggle by default.
      github.com/SWivid/F5-TTS

  • @hiepinh5599
    @hiepinh5599 17 ชั่วโมงที่ผ่านมา

    can i training with own voice, for example: optimus voice..

    • @neuralfalcon
      @neuralfalcon  16 ชั่วโมงที่ผ่านมา

      Yes 100%, copy this notebook and use F5-TTS colab.research.google.com/github/NeuralFalconYT/F5-TTS-Demo/blob/main/F5_TTS_Latest.ipynb

    • @hiepinh5599
      @hiepinh5599 2 ชั่วโมงที่ผ่านมา

      I checked your collab, and it doesn't work

    • @neuralfalcon
      @neuralfalcon  9 นาทีที่ผ่านมา

      It's working

  • @asfandsherazkhan9135
    @asfandsherazkhan9135 18 วันที่ผ่านมา

    can we dubbed into other language like from english to hindi

    • @neuralfalcon
      @neuralfalcon  18 วันที่ผ่านมา

      It only supports English and Chinese , but you can train it in other languages. Watch this video to learn how:
      th-cam.com/video/GmketyZW2c4/w-d-xo.html

  • @snakezo4218
    @snakezo4218 หลายเดือนก่อน

    I tried, is it possible to make him speak with a French accent, he still has difficulty or can I speak to the creator to ask him the question?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      th-cam.com/video/RQXHKO5F9hg/w-d-xo.html

    • @neuralfalcon
      @neuralfalcon  17 วันที่ผ่านมา

      Watch this video : th-cam.com/video/UO4usaOojys/w-d-xo.html

  • @kanavwastaken
    @kanavwastaken หลายเดือนก่อน

    Can you please make it work on LightningAI bro?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      github.com/NeuralFalconYT/F5-TTS-Demo/blob/main/F5-TTS-lightning-ai.ipynb
      Download this notebook and upload it to lightning.ai/. Make sure to switch to GPU.

  • @priyakumari-ky4nn
    @priyakumari-ky4nn 26 วันที่ผ่านมา

    F5 tts Can Support Hindi voice Give Answer ?

    • @neuralfalcon
      @neuralfalcon  26 วันที่ผ่านมา +1

      It only supports English and Chinese , but you can train it in other languages. Watch this video to learn how:
      th-cam.com/video/GmketyZW2c4/w-d-xo.html

    • @priyakumari-ky4nn
      @priyakumari-ky4nn 24 วันที่ผ่านมา

      @@neuralfalcon Please you can make video realistic hindi tts voice

    • @neuralfalcon
      @neuralfalcon  17 วันที่ผ่านมา

      Watch this video : th-cam.com/video/UO4usaOojys/w-d-xo.html

  • @PratikshaPatil-r9o
    @PratikshaPatil-r9o หลายเดือนก่อน

    HEY.. IS THE PROCESS FOR E2 IS SAME?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      Yes same, just choose E2-TTS button

  • @411KJB
    @411KJB 22 วันที่ผ่านมา

    Link no longer works. Any new links?

    • @neuralfalcon
      @neuralfalcon  22 วันที่ผ่านมา

      colab.research.google.com/github/NeuralFalconYT/F5-TTS-Demo/blob/main/F5_TTS_Latest.ipynb
      Or follow official instructions:
      github.com/SWivid/F5-TTS

    • @411KJB
      @411KJB 22 วันที่ผ่านมา

      It was PERFECT for that window though and I thank you so much.

  • @RostinSino
    @RostinSino หลายเดือนก่อน

    does it work in indonesian language?🙏

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      For now it's a big 'NO' . You need to train on Indonesian language from scratch. You can use elevenlabs but it's paid.

    • @neuralfalcon
      @neuralfalcon  26 วันที่ผ่านมา +1

      Watch this video: th-cam.com/video/GmketyZW2c4/w-d-xo.html

    • @neuralfalcon
      @neuralfalcon  17 วันที่ผ่านมา

      Watch this video : th-cam.com/video/UO4usaOojys/w-d-xo.html

  • @abhishekkumar-bz1ql
    @abhishekkumar-bz1ql หลายเดือนก่อน

    Will it work with hindi language

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน +1

      For now it's a big No, you need to train for other languages From scratch

    • @abhishekkumar-bz1ql
      @abhishekkumar-bz1ql หลายเดือนก่อน

      @@neuralfalcon do you know how to train it? Or any reference video of it?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      @@abhishekkumar-bz1ql github.com/SWivid/F5-TTS/issues/87

    • @neuralfalcon
      @neuralfalcon  17 วันที่ผ่านมา

      Watch this video : th-cam.com/video/UO4usaOojys/w-d-xo.html

  • @Dex383-d8d
    @Dex383-d8d หลายเดือนก่อน

    Why did the page ask me for permission to use my microphone? Do not enter the pinned link, you will probably be hacked... The video seemed useful but better not risk it

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน +1

      Thank you for your comment! It sounds like you might not be familiar with how Gradio applications work. The page requests microphone permission because the app needs to record or upload audio in order to clone it. Our code prioritizes recording audio before launching the app, which is why microphone access is required. If you're interested, you can learn more about this in the Gradio documentation here: www.gradio.app/docs/gradio/audio .

    • @Dex383-d8d
      @Dex383-d8d หลายเดือนก่อน

      @@neuralfalcon Thank you very much for replying to my comment, I will read the documentation, it is true that I am not familiar with the application

  • @Ice_camp
    @Ice_camp หลายเดือนก่อน

    uncheck remove silence

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      You can uncheck the silence option, which may create silence in the generated audio .

  • @QHawk7
    @QHawk7 หลายเดือนก่อน +1

    *Is it Multi-language?*

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน +1

      Only English and Chinese

    • @neuralfalcon
      @neuralfalcon  17 วันที่ผ่านมา

      Watch this video : th-cam.com/video/UO4usaOojys/w-d-xo.html

  • @weini-sf3pu
    @weini-sf3pu หลายเดือนก่อน

    when use Generate TTS, get an error " FileNotFoundError: [Errno 2] No such file or directory: 'nvidia-smi' ", can you help me ?

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      @@weini-sf3pu yes send screenshot at NeuralFalcon@proton.me

    • @neuralfalcon
      @neuralfalcon  หลายเดือนก่อน

      @@weini-sf3pu first you need a GPU to use 'nvidia-smi' then if you are running in a jupyter notebook '!nvidia-smi'
      Or if you are running in terminal just 'nvidia-smi'. Else you can skip this.
      Use another way to find the cuda version to install the pytorch .