BARK: Free Text to Speech & Voice Cloning

แชร์
ฝัง
  • เผยแพร่เมื่อ 19 ธ.ค. 2024

ความคิดเห็น •

  • @abhishekkrthakur
    @abhishekkrthakur  ปีที่แล้ว +17

    Please subscribe to help me keep motivated to make awesome videos like this one. :)

    • @prabhavkaula9697
      @prabhavkaula9697 ปีที่แล้ว

      Cool tutorial bhaiya 😌🙌
      Would you take up small duration text-to-video in the next tutorial?

    • @ShotterManable
      @ShotterManable ปีที่แล้ว

      You're the one sir, I just love your videos and you're a big motivation for all us wannabe pro. I follow you on twitter and youtube!

    • @michaeledison1974
      @michaeledison1974 ปีที่แล้ว

      Hello! Could I contact you please? I urgely need your help with my Diploma thesis work. Please

    • @AjaySingh-ey7gt
      @AjaySingh-ey7gt ปีที่แล้ว

      Nice Abhishek

    • @vikasrai4915
      @vikasrai4915 10 หลายเดือนก่อน

      Hey Abhishek, can we clone our own voice using this, if so can you please make a video to educate us. Great content.

  • @geekyprogrammer4831
    @geekyprogrammer4831 ปีที่แล้ว +3

    Abhishek I have been following your videos and tutorials for last 2 years. Your content was and is gold!

    • @icanyagmur
      @icanyagmur ปีที่แล้ว

      Hi bro, how did you make that your youtube profile photo ? Can you guide me ?

  • @HarendraSaiNathLella
    @HarendraSaiNathLella ปีที่แล้ว +4

    @abhishekkrthakur , at 12:28, you told to clone the bark repo. But, I could not find the exact bark repo which you have shown. Can you provide the link for the bark repo? Please

    • @sabeerfaisal2619
      @sabeerfaisal2619 10 หลายเดือนก่อน

      did u find it?

    • @magictbjc7324
      @magictbjc7324 6 หลายเดือนก่อน

      @@sabeerfaisal2619 go to the huggingface model repo for bark, there is a command "clone the repo".

  • @rushirajparmar9602
    @rushirajparmar9602 ปีที่แล้ว +8

    UnpicklingError: invalid load key, '

    • @gasper_101
      @gasper_101 10 หลายเดือนก่อน +1

      I got the same issue, did you figure out how to fix it?

    • @tarangsuri8932
      @tarangsuri8932 9 หลายเดือนก่อน +2

      i have figure out, u wanna know...

    • @kunalkumar-rv3pd
      @kunalkumar-rv3pd 8 หลายเดือนก่อน

      @@tarangsuri8932 yes please

    • @annahari610
      @annahari610 7 หลายเดือนก่อน

      ​@@tarangsuri8932 I wanna know bro. Help me for solving this issue

    • @mangeshkashid5389
      @mangeshkashid5389 6 หลายเดือนก่อน

      @@tarangsuri8932 batade bhai abhi... secret rakhane wala he kya?🤣

  • @arun279
    @arun279 ปีที่แล้ว +9

    Does the quality of the generations increase if you have longer or more samples?

  • @longfellowrose1013
    @longfellowrose1013 8 หลายเดือนก่อน

    Where's your next video! Your channel always inspires me!!!! Cant wait to watch your new video

    • @abhishekkrthakur
      @abhishekkrthakur  8 หลายเดือนก่อน

      Thank you for your kind words. Ive taken a break from making videos 🙂

    • @longfellowrose1013
      @longfellowrose1013 8 หลายเดือนก่อน

      @@abhishekkrthakur Oh, it's a pity!!! Still wish everything goes well with your life

  • @abirahmedsohan3554
    @abirahmedsohan3554 ปีที่แล้ว +3

    I am struggling with this..i dont relize how the bark folder come?
    I saw in the bark repo there is no speaker embedding..can you please give me this full code or steps which i can follow?

  • @csowm5je
    @csowm5je ปีที่แล้ว +2

    12:20 Clone which repository?

  • @souvickdas5564
    @souvickdas5564 10 หลายเดือนก่อน +1

    I am having one problem with input context length. For example given a research paper, I am trying to find relevant papers from the vector db containing 2000 papers. How to fit the entire research paper as the input? Is there any way to solve the problem? Also the vector db is huge. Is there any way to manage it efficiently?

  • @sarathkumar-gq8be
    @sarathkumar-gq8be ปีที่แล้ว +3

    In duration of 12:25 you sad clone the repo , but i don't know exact repo where it is ,can yu share the link of repo, because if go and donwload each file one by one, it's hard, especially in speaker_embedding multiple files are there

  • @HarendraSaiNathLella
    @HarendraSaiNathLella ปีที่แล้ว

    can someone tell me where is the bark repository?, which was used and shown at 12:28

  • @rachitgandhi7958
    @rachitgandhi7958 ปีที่แล้ว +5

    magic_number = pickle_module.load(f, **pickle_load_args)
    _pickle.UnpicklingError: invalid load key, '

    • @BenjiBaret
      @BenjiBaret ปีที่แล้ว

      yep, that ain't working

    • @aifarmerokay
      @aifarmerokay ปีที่แล้ว

      im also facing issue

    • @Labbsatr1
      @Labbsatr1 ปีที่แล้ว

      same issue, any updates ?

    • @rushirajparmar9602
      @rushirajparmar9602 ปีที่แล้ว

      Same issue here

    • @CS-hh1mn
      @CS-hh1mn ปีที่แล้ว

      Same issue. Has anyone been able to solve it??

  • @3Dwithdev
    @3Dwithdev 10 หลายเดือนก่อน +2

    bro please do mention the links also in the descriptions

  • @acasualdatascientist54
    @acasualdatascientist54 ปีที่แล้ว +1

    Thanks for the video, I was looking for this recently. I am too shy to talk for youtube videos was hoping to clone my voice like this for one.

  • @rushirajparmar9602
    @rushirajparmar9602 ปีที่แล้ว

    Nice tutorial Abhishek!

  • @annxiao7721
    @annxiao7721 ปีที่แล้ว

    Hi Abhishek, I really like your book, thank you so much for sharing your knowledge.

  • @CapitanMegaa
    @CapitanMegaa 5 หลายเดือนก่อน

    I have a tts read it outloud and it takes a bit to hear the tts after clicking start code.. is there a way to make it faster? you kinda get them very fast or something i have no coding experience and yours is just in another code file mine plays the sound from media player (it have to) + if text are long he reads only 14 seconds of it.. it just take sooooooooooooo long is that normal??

  • @PhilosophyResurrected
    @PhilosophyResurrected 5 หลายเดือนก่อน

    Ok, so a bit new to all this, but can you tell me what repositories you used in your bark folder? The script is missing stuff and not sure what. Thank you.

  • @alexdelaiglesia1926
    @alexdelaiglesia1926 ปีที่แล้ว

    Awesome. Video generation for the next one!

  • @PhucHoang-ng4vh
    @PhucHoang-ng4vh 7 หลายเดือนก่อน

    hi, I just found out about your AAAML book, but cant find the code repo of it, could you please share it?

  • @kumarsantosh7376
    @kumarsantosh7376 8 หลายเดือนก่อน

    Hi Sir, humble request, can you please share your journey of being kaggle grandmaster and guide the juniors out here. If you already have posted somewhere, would love to have link to it. 😁

  • @allandclive
    @allandclive ปีที่แล้ว +1

    How do you fine tune MMS-TTS models?

  • @rohmathur
    @rohmathur 8 หลายเดือนก่อน

    HI Abhishek. Thanks for posting some interesting videos. I tried doing text to speech using Bark on V100 GPU on Bark. It is taking too long. I need latency of less than a second. Can you recommend how I could achieve that.

  • @rexsan2747
    @rexsan2747 ปีที่แล้ว

    For my personal questions, can you share your method of learning something new. I really don't have method to learn data industry

  • @azer0013
    @azer0013 ปีที่แล้ว +1

    Hello thank you bro
    Where is bark folder

  • @JOHNSMITH-sj3lg
    @JOHNSMITH-sj3lg ปีที่แล้ว

    I want to clone my voice in german but it has everytime a englisch pronounce how can i set the language to german?

  • @gitc13
    @gitc13 3 หลายเดือนก่อน +1

    Requesting new videos!!!

  • @nirsarkar
    @nirsarkar ปีที่แล้ว

    Great Stuff! always. Thanks. Does Bark work on Apple silicon?

    • @nickiesnook
      @nickiesnook ปีที่แล้ว +1

      yes, just have to change device to cpu or mps

  • @mathieuduverne9261
    @mathieuduverne9261 ปีที่แล้ว

    Possible to have your wav sample you use for the voice cloning ?

  • @muhammadizhar82
    @muhammadizhar82 ปีที่แล้ว +1

    Can we generate long videos like 5 to 10 min

  • @ashuu9257
    @ashuu9257 8 หลายเดือนก่อน

    please mention the computing power required

  • @lukasfili668
    @lukasfili668 ปีที่แล้ว

    AssertionError: Torch not compiled with CUDA enabled does someone know hat this is

    • @ashwinmlk4908
      @ashwinmlk4908 ปีที่แล้ว

      same error as well, did yeah get it fixed?

    • @monilsompura
      @monilsompura 10 หลายเดือนก่อน

      Uninstall torch and reinstall it with pytorch documetation@@ashwinmlk4908

    • @CapitanMegaa
      @CapitanMegaa 5 หลายเดือนก่อน

      @@monilsompura H.O.W

  • @MotivationNation-f8b
    @MotivationNation-f8b ปีที่แล้ว

    Great video Abhishek, How can we develop our own text to speech model , it would give 3 mins of wav.file

  • @xavAk
    @xavAk ปีที่แล้ว

    You're amazing 🤩

  • @pranavnatekar4183
    @pranavnatekar4183 ปีที่แล้ว

    Great video Abhishek. Can you possibly do a video on training a multitasking model in a computer vision setting? Would love to see that.

  • @m.rr.c.1570
    @m.rr.c.1570 11 หลายเดือนก่อน

    can i change the pitch and speed of the voice in bark?

    • @AbdelmadjidLablack
      @AbdelmadjidLablack 10 หลายเดือนก่อน

      were you able to get an answer ?

  • @mind6861
    @mind6861 9 หลายเดือนก่อน

    Great vid

  • @Asli_
    @Asli_ ปีที่แล้ว

    how are you able to play audio in vs code?

    • @hutpfff1366
      @hutpfff1366 7 หลายเดือนก่อน

      you can open audio files in vs code by opening the folder in vs code and then you see them

  • @suhaaskatikaneni1925
    @suhaaskatikaneni1925 ปีที่แล้ว

    nice video!

  • @Coursdecoutureorg
    @Coursdecoutureorg 8 หลายเดือนก่อน

    sad you don't provide the full code c/C...

  • @shouldibuythisgame
    @shouldibuythisgame หลายเดือนก่อน

    Nice video

  • @zaursamedov8906
    @zaursamedov8906 ปีที่แล้ว

    is there someone that has TTS problem? I did everything tho it doesn't seem to have TTS module

  • @B.hummer
    @B.hummer 2 หลายเดือนก่อน

    if you could just find a way to make this whole coding process thingy a copy and paste experience, that will just boom!

  • @AjayiJoseph-ph8xx
    @AjayiJoseph-ph8xx 6 หลายเดือนก่อน

    Can we try doing this with a phone?

    • @noedits5543
      @noedits5543 4 หลายเดือนก่อน

      hahaha

  • @danielalejandronavarroluna8374
    @danielalejandronavarroluna8374 ปีที่แล้ว

    The echo in hindi is really cool

    • @abhishekkrthakur
      @abhishekkrthakur  ปีที่แล้ว

      thats my mistake actually, but thanks 😃

  • @talavalkov4008
    @talavalkov4008 ปีที่แล้ว

    Came here through Varun Mayya.

  • @ravitanwar9537
    @ravitanwar9537 ปีที่แล้ว +1

    not working. also please attach codes it makes the process easier

  • @Сливыприватныхкурсов
    @Сливыприватныхкурсов ปีที่แล้ว

    good, but you so small in video

  • @TheBlackClockOfTime
    @TheBlackClockOfTime ปีที่แล้ว +1

    ngl it's like a light year away from ElevenLabs