Speech endpoint detection algorithm (new version)

แชร์
ฝัง
  • เผยแพร่เมื่อ 14 ม.ค. 2025

ความคิดเห็น • 14

  • @Pauliomat
    @Pauliomat 3 หลายเดือนก่อน +3

    Thanks for working on these projects

  • @krosx278
    @krosx278 หลายเดือนก่อน

    wow amazing, how do you set audio index?

    • @Linguflex
      @Linguflex  หลายเดือนก่อน +1

      Use input_device_index property of AudioToTextRecorder class (hope that's what you mean)

    • @krosx278
      @krosx278 หลายเดือนก่อน

      @@Linguflex it works!! thank you...btw I want to make a question answering ai base on your RealtimeSTT transcribed. I am open for suggestion...

    • @Linguflex
      @Linguflex  หลายเดือนก่อน +1

      @@krosx278 Please look at advanced_talk.py or openai_voice_interface.py in RealtimeSTT test folder or at my LocalAIVoiceChat project

    • @krosx278
      @krosx278 หลายเดือนก่อน

      @@Linguflex I want to use llama and fine-tune it... Is that possible?

    • @Linguflex
      @Linguflex  หลายเดือนก่อน

      @@krosx278 Yes, of course

  • @monsterfan-j2m
    @monsterfan-j2m 19 วันที่ผ่านมา

    is open api is needed?

    • @Linguflex
      @Linguflex  19 วันที่ผ่านมา

      No, runs completely local

  • @CodingPuff
    @CodingPuff 3 หลายเดือนก่อน

    Interesting! What kind of models are you using

    • @Linguflex
      @Linguflex  3 หลายเดือนก่อน

      faster_whisper for speech to text, Silero VAD + webrtcvad for voice activity detection, llama 3.1 8b for sentence end verification

    • @parthpatwari3174
      @parthpatwari3174 3 หลายเดือนก่อน

      @@Linguflex llama api?

    • @Linguflex
      @Linguflex  3 หลายเดือนก่อน

      @@parthpatwari3174 LMStudio

  • @Lucia-sy7le
    @Lucia-sy7le 3 หลายเดือนก่อน

    He's so creepy.