Speech Emotion Recognition [99.6% Accuracy] | Wav2Vec2 Transformers | Python

แชร์
ฝัง
  • เผยแพร่เมื่อ 11 ม.ค. 2025

ความคิดเห็น •

  • @atamir8339
    @atamir8339 3 วันที่ผ่านมา +1

    24:30 I would try on various epochs just to be sure, because if training it on more epochs would result in loss of the pretrained data then no training should be done. Good tutorial none the less 👍

  • @AyushmaShambhavi
    @AyushmaShambhavi หลายเดือนก่อน

    you tested patience level bro 😭😭😭😭😭

  • @bavishkasathyanjana1384
    @bavishkasathyanjana1384 2 หลายเดือนก่อน

    are there any models that give the classification along with the arousal and valence values?

  • @teenstementor
    @teenstementor 3 หลายเดือนก่อน +1

    I am a student trying to learn ML. Can you please show my how to use this trained model for prediction using yhat = model.predict(). I see the input X is of shape 5600,40 but when I try to predict for a new 3 second audio file, the np array default shape is 66150 and I am getting Invalid input shape error

  • @mdzaidsutar2889
    @mdzaidsutar2889 4 หลายเดือนก่อน +1

    I am a beginner can u help me , exactly how I can use your model in my machine

    • @HackersRealm
      @HackersRealm  4 หลายเดือนก่อน

      you can run the model using jupyter notebook by installing anaconda software in your machine. please check my initial videos in the playlist to get a clear idea.

  • @matutobyron2011
    @matutobyron2011 3 หลายเดือนก่อน

    A blessed day sir.
    I would like to ask how do we saved and download the model for future predictions?
    So that we won't rerun the entire code anymore.
    I would also like to ask how do we load the saved and downloaded model on other notebooks to test if it can generate prediction?

    • @HackersRealm
      @HackersRealm  3 หลายเดือนก่อน

      www.tensorflow.org/tutorials/keras/save_and_load
      please refer this link for complete detail

  • @streetridervlog3683
    @streetridervlog3683 2 หลายเดือนก่อน

    Can you define how you upload audio_path and labels

  • @jitindoriya2375
    @jitindoriya2375 4 หลายเดือนก่อน +1

    How can I use it predict for single audio file ?

    • @HackersRealm
      @HackersRealm  4 หลายเดือนก่อน

      @@jitindoriya2375 i have done it at the end of the video

    • @jitindoriya2375
      @jitindoriya2375 4 หลายเดือนก่อน

      @@HackersRealm I am an engineer, Can you also tell me if we get speaker attributions like gender or age with this wave2 transformer.? Please provide any article or link for reference

    • @jitindoriya2375
      @jitindoriya2375 4 หลายเดือนก่อน +1

      We have developed Vocie AI assistant but it was missing emotion so trying with this method.

    • @HackersRealm
      @HackersRealm  4 หลายเดือนก่อน

      @@jitindoriya2375 not really sure whether you can extract these attributes, if you find a pretrained weights of these specific applications, you could use that to get that information

  • @HansiniBandara-r5m
    @HansiniBandara-r5m หลายเดือนก่อน

    Could you please add how can I test the model with a new audio file?

    • @HackersRealm
      @HackersRealm  หลายเดือนก่อน

      I think I have added at the end, you have to give the path of the audio file and get the prediction.

  • @AasiyaFirdaus-i5p
    @AasiyaFirdaus-i5p 2 หลายเดือนก่อน

    the code link which you are providing is not accable ,please uplaod the code again

    • @HackersRealm
      @HackersRealm  2 หลายเดือนก่อน

      I have checked now, it's working without issues. May I know what issue you're facing?

  • @codeKeshav
    @codeKeshav หลายเดือนก่อน

    Make .h5 file deploy it in app. How to do that

  • @ramyeonmokja
    @ramyeonmokja 4 หลายเดือนก่อน

    I'm trying to develop a speech aggression level detection model. How can I use this to do that?? Pleasee help me!!

    • @HackersRealm
      @HackersRealm  4 หลายเดือนก่อน

      do you have the dataset similar to the same structure like in the video?

    • @ramyeonmokja
      @ramyeonmokja 4 หลายเดือนก่อน

      @@HackersRealm yes..

  • @lifterboy9875
    @lifterboy9875 3 หลายเดือนก่อน

    How can I use only one single data only one audio sir

    • @HackersRealm
      @HackersRealm  3 หลายเดือนก่อน

      @@lifterboy9875 what do you mean by single data