Not ElevenLabs, This new #1 Text to Speech AI is FREE!!!!

แชร์
ฝัง
  • เผยแพร่เมื่อ 24 ม.ค. 2025

ความคิดเห็น • 80

  • @1littlecoder
    @1littlecoder  14 วันที่ผ่านมา +1

    Local Setup Tutorial - th-cam.com/video/LVINm5vUSW8/w-d-xo.html

    • @NoahtheGameplayer
      @NoahtheGameplayer 12 วันที่ผ่านมา

      can't there nobody try to public it on the website?

  • @AllanMcKay
    @AllanMcKay 14 วันที่ผ่านมา +4

    Just FYI because you said you assume nobody is - but I am watching this video from LA :) and thank you - keep up the great work my friend

  • @Haidnt-c1h
    @Haidnt-c1h 14 วันที่ผ่านมา +1

    A heartfelt thank you from Vietnam! I was completely captivated by your positive and engaging voice-it’s like how you were drawn to the AI voice of Kokoro TTS. Maybe it’s something about the hormones, haha! It’s such a coincidence that I’m also a Mac user, and it’s rare to find TH-camrs in this field who provide tutorials for macOS. I’ve already subscribed to your channel and am eagerly waiting for your guide on setting up Kokoro locally. Honestly, I haven’t been able to fine-tune much with the F5-TTS-MLX model voices, so Kokoro TTS might be the perfect alternative. Once again, thank you so much!

    • @1littlecoder
      @1littlecoder  14 วันที่ผ่านมา +1

      Very glad to hear this!

  • @yazanrisheh5127
    @yazanrisheh5127 14 วันที่ผ่านมา +2

    Yes please I cant wait for the next video about doing this locally and also how to host on our cloud. Thank you!

    • @1littlecoder
      @1littlecoder  14 วันที่ผ่านมา

      done sir - th-cam.com/video/LVINm5vUSW8/w-d-xo.html

  • @AjayCoding
    @AjayCoding 15 วันที่ผ่านมา +10

    Are there any free models available for training our own voice?

    • @MrPer4illo
      @MrPer4illo 12 วันที่ผ่านมา +2

      Coqui tts

  • @imdxpertm
    @imdxpertm 15 วันที่ผ่านมา +4

    Abdul having the " Her" moment 😂
    @ 10:30. Be careful bhai!
    On serious note, I liked the comparison and looks quite promising TTS.

    • @1littlecoder
      @1littlecoder  15 วันที่ผ่านมา +1

      ScarJo is going to sue me

  • @aibuild1
    @aibuild1 15 วันที่ผ่านมา +3

    This is great! Been looking for something on the level of Eleven Labs. Appreciate your videos, also learned of Sarvam AI from you

    • @1littlecoder
      @1littlecoder  15 วันที่ผ่านมา +2

      Glad to know that. You're working with indian languages?

    • @aibuild1
      @aibuild1 15 วันที่ผ่านมา

      @@1littlecoderyeah working on a multilingual app for small businesses, and focusing on a few big countries including India

    • @nikhilsharma32907
      @nikhilsharma32907 14 วันที่ผ่านมา

      @@1littlecoder no hindi voice ?

  • @ksreedharamurthy
    @ksreedharamurthy 15 วันที่ผ่านมา +1

    Kokoro sounds good and interesting. Please make a video for local installation

  • @dulinak6251
    @dulinak6251 15 วันที่ผ่านมา +2

    is 80m params enough 🤔

  • @nocturnomedieval
    @nocturnomedieval 15 วันที่ผ่านมา +1

    Would love to have a model so good and free in spanish. BTW, you can use an LLM to check the text and put guardrails to these type of models to avoid abuse..

  • @Just2Fast24
    @Just2Fast24 13 วันที่ผ่านมา

    SF bay area in the house 💯

  • @Recuper8
    @Recuper8 15 วันที่ผ่านมา +2

    Subscribed! Please do a tutorial on how to install locally.

    • @1littlecoder
      @1littlecoder  14 วันที่ผ่านมา

      here you go! - th-cam.com/video/LVINm5vUSW8/w-d-xo.html

  • @jaoltr
    @jaoltr 15 วันที่ผ่านมา +1

    👍 Good TTS comparison of Kokoro vs ElevenLabs

  • @jsalsman
    @jsalsman 15 วันที่ผ่านมา +1

    I use Balacoon TTS because it runs in 1/50 real time on a single CPU core (for their en_us_hifi92_light_cpu.addon model). It sounds a little artificial but still perfectly intelligible, and the low load never gets in the way, unlike any of the alternatives that sound anywhere near as good.

    • @1littlecoder
      @1littlecoder  15 วันที่ผ่านมา +1

      Balacoon is the best CPU TTS I've used. The speed is quite amazing but yes the voice is just like an average TTS

    • @jsalsman
      @jsalsman 15 วันที่ผ่านมา

      @@1littlecoder have you seen the voice changer apps and cloning service Balacoon offers? They can clone from a 10 second sample. I don't know whether cloned voice production is CPU or GPU though, or its speed vs real time.

  • @MichaelBaynana
    @MichaelBaynana 14 วันที่ผ่านมา

    are there prompts for moods intonations etc??

    • @1littlecoder
      @1littlecoder  14 วันที่ผ่านมา

      Yet to figure out!

  • @arsomissaoui9548
    @arsomissaoui9548 8 วันที่ผ่านมา

    brothers, does anyone knows how to add pauses or ssml tags to this model?

  • @RandomEXE-rf6qn
    @RandomEXE-rf6qn 15 วันที่ผ่านมา

    Hey bro I'm following you for the last couple of months can you tell me the way to know about new ai products and tools

  • @atulya.anurag
    @atulya.anurag 14 วันที่ผ่านมา

    How much gpu space I need to run?

  • @shekharkumar1902
    @shekharkumar1902 15 วันที่ผ่านมา

    Can we make use of live chat with Graoq?

  • @jimandeka705
    @jimandeka705 15 วันที่ผ่านมา

    Sir, when you give tutorial, also include how to use styletts in mobile phone as well

  • @freke80
    @freke80 15 วันที่ผ่านมา

    You should add dialog to the test. Like, and then he whispered "hi, what's up.". elevenlabs will try to interpret it as dialog, but I have no idea for this new one.

  • @ayushsharma3711
    @ayushsharma3711 13 วันที่ผ่านมา

    "IDK, maybe like hormones" 😂😂
    BTW, I like the F5-tts the best open source one out there.

  • @figs3284
    @figs3284 15 วันที่ผ่านมา

    Do you know of any way to add emotion at least to some extent in post processing?

    • @1littlecoder
      @1littlecoder  15 วันที่ผ่านมา

      Generally there would be tags, but I haven't tested with this yet

    • @figs3284
      @figs3284 15 วันที่ผ่านมา

      Not specifically kokoro. I meant outside of kokoro. Is there anything like that where you can process the generated audio, and add emotion?

    • @markcasey8465
      @markcasey8465 15 วันที่ผ่านมา

      ​@@figs3284 Yes, several AI processes allow you to take generated audio and add emotion to it, Murf AI, ElevenLabs, and LOVO AI being prominent options that let you control pitch, emphasis, and other vocal elements to convey different emotions.

    • @figs3284
      @figs3284 15 วันที่ผ่านมา +1

      @markcasey8465 thanks for your reply. I should have been more specific. The appeal of kokoro is the fact that it's free and runs on anything. I was more so talking about a library or some open source project or tool to add the emotion.

  • @justtiredthings
    @justtiredthings 15 วันที่ผ่านมา

    Can it do STS, too?

    • @jsalsman
      @jsalsman 15 วันที่ผ่านมา

      It is not an STT model.

    • @justtiredthings
      @justtiredthings 15 วันที่ผ่านมา

      @jsalsman I said STS. There aren't enough tools that do speech2speech, which I think is a very valuable modality

    • @MMABeijing
      @MMABeijing 14 วันที่ผ่านมา

      ​@@justtiredthingsSts would imply is can do stt. No?

  • @xXWillyxWonkaXx
    @xXWillyxWonkaXx 15 วันที่ผ่านมา +7

    If they fix the timbre/emotions this will give ElevenLabs a run for their money. Either that or I’ll have to wait for a Chinese copycat 😂

  • @RamKumar-v3p8n
    @RamKumar-v3p8n 15 วันที่ผ่านมา

    bro could you tell the difference between open source and open access model ,it kind of confusing

  • @steve_jabz
    @steve_jabz 15 วันที่ผ่านมา

    Doesn't do cloning

  • @sps2494
    @sps2494 15 วันที่ผ่านมา

    Please do a full local tutorial

  • @saintkamus14
    @saintkamus14 15 วันที่ผ่านมา +1

    you need to say 2-4-5 so it reads it like that

  • @abhinandanpandey6513
    @abhinandanpandey6513 15 วันที่ผ่านมา

    bro please make how to run locally

  • @DD3874
    @DD3874 14 วันที่ผ่านมา

    thank you

  • @raceup
    @raceup 15 วันที่ผ่านมา +1

    Phi 4 came out. And nobody is talking about it.

  • @adnanabbasi113
    @adnanabbasi113 15 วันที่ผ่านมา +3

    Please make a full tutorial of this.

  • @zzzzzzz8473
    @zzzzzzz8473 15 วันที่ผ่านมา

    great to see opensource improvements , however it is not great , still electric robotic timbre tin-ness and an unnatural cadence to sentences like every other word might be the end of the sentence , lots of work still to do . and it is entangled by espeak dependency

  • @lseder1
    @lseder1 14 วันที่ผ่านมา

    this video should be narrated by this voice tool...

  • @SonGoku-pc7jl
    @SonGoku-pc7jl 15 วันที่ผ่านมา

    don't have spanish? :(

  • @AjayCoding
    @AjayCoding 15 วันที่ผ่านมา

    cool

  • @bomar920
    @bomar920 15 วันที่ผ่านมา

    unless it's open source like lets your train your own model, it's useless. Creator won't release the code. Don't bother

    • @1littlecoder
      @1littlecoder  15 วันที่ผ่านมา

      @@bomar920 why is it useless? Enlightenment me

    • @bomar920
      @bomar920 14 วันที่ผ่านมา

      @@1littlecoder One major limitation is that you can't use or train your own data. Instead, we have to rely on pre-existing voices, which isn't good for production.

  • @QHawk7
    @QHawk7 13 วันที่ผ่านมา

    *No Arabic* 😢

  • @siddharthv2701
    @siddharthv2701 14 วันที่ผ่านมา

    Hormones! 😂😂

  • @NoahtheGameplayer
    @NoahtheGameplayer 12 วันที่ผ่านมา

    Nah Runaway text to speech is better,
    and weight gg is better that text to speech

  • @paelnever
    @paelnever 14 วันที่ผ่านมา

    Is a shame that this model have 2 different accents for the third most spoken language in the world and voices for other less spoken languages but NONE for the second most spoken language in the world.

    • @1littlecoder
      @1littlecoder  14 วันที่ผ่านมา

      @@paelnever which one is that ?

    • @paelnever
      @paelnever 14 วันที่ผ่านมา

      @@1littlecoder If you really don't know you get the answer faster searching google or wikipedia or even asking an llm.

    • @1littlecoder
      @1littlecoder  14 วันที่ผ่านมา

      @@paelnever to ask, what is the language that you refer to? Instead of telling me that I should look up on Wikipedia or Google, you could have just answered. What is the language in one word but you didn't great! Thank you for teaching me that. I should Google or use Wikipedia. I didn't know that before feeling enlightened

    • @paelnever
      @paelnever 14 วันที่ผ่านมา

      @@1littlecoder Of course i guess you already know how to search things, i was just pointing your laziness.

  • @FerTechCH
    @FerTechCH 15 วันที่ผ่านมา +1

    Maybe hormones ? 😂

  • @cgtinc4868
    @cgtinc4868 15 วันที่ผ่านมา

    Too bad it cannot clone own voice yet!

  • @jmirodg7094
    @jmirodg7094 15 วันที่ผ่านมา

    French generation and voice is OK

  • @swapwarick
    @swapwarick 15 วันที่ผ่านมา

    Hormones 😂😂😂