Creating J.A.R.V.I.S.

แชร์
ฝัง
  • เผยแพร่เมื่อ 27 ก.ย. 2024
  • A sneak peek of voice-to-voice chat assistant.
    🦾 Discord: / discord
    ☕ Buy me a Coffee: ko-fi.com/prom...
    |🔴 Patreon: / promptengineering
    💼Consulting: calendly.com/e...
    📧 Business Contact: engineerprompt@gmail.com
    Become Member: tinyurl.com/y5h...
    💻 Pre-configured localGPT VM: bit.ly/localGPT (use Code: PromptEngineering for 50% off).
    Signup for Advanced RAG:
    tally.so/r/3y9bb0
    All Interesting Videos:
    Everything LangChain: • LangChain
    Everything LLM: • Large Language Models
    Everything Midjourney: • MidJourney Tutorials
    AI Image Generation: • AI Image Generation Tu...

ความคิดเห็น • 50

  • @MeinDeutschkurs
    @MeinDeutschkurs 4 หลายเดือนก่อน +2

    Wooohooo!! Yeah, can‘t wait for it! ⭐️

  • @Techonsapevole
    @Techonsapevole 4 หลายเดือนก่อน +1

    it's fast which TTS and STT did you use ?

  • @barackobama4552
    @barackobama4552 4 หลายเดือนก่อน +2

    Impressive, thanks!

  • @KiyotokaAyanakoji-ss1gn
    @KiyotokaAyanakoji-ss1gn 4 หลายเดือนก่อน +2

    What TTS are you using and is it running locally

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน +3

      Whisper but via the api. Nothing is running locally in this video. Local version will be coming soon.

    • @KiyotokaAyanakoji-ss1gn
      @KiyotokaAyanakoji-ss1gn 4 หลายเดือนก่อน

      @@engineerprompt loved it 👍

    • @Gun_ForFun
      @Gun_ForFun 4 หลายเดือนก่อน +1

      @@engineerprompt but Whisper is ASR, not TTS??

    • @snapman218
      @snapman218 4 หลายเดือนก่อน

      Gross.

    • @themax2go
      @themax2go 4 หลายเดือนก่อน

      someone already made a fully local version and works w/ little latency and with voice training. there already exist projects on github for continuous speech using a keyword to trigger recording, and a version with a ptt implementation instead of keyword

  • @borisrusev9474
    @borisrusev9474 4 หลายเดือนก่อน

    I don't get it, how's that different from GPT-4o?

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน +1

      You are right, very similar in functionality. In fact, this version is using GPT-4o for text generation. But the voice functionality is not available in GPT-4o yet.

  • @3choff
    @3choff 4 หลายเดือนก่อน

    Very interesting project! Do you use any VAD to detect the end of the request?

  • @GroqSummarizer
    @GroqSummarizer 4 หลายเดือนก่อน

    Nice!

  • @comfyuiadrian
    @comfyuiadrian 4 หลายเดือนก่อน

    Wahooo..really looking forward to your new project!

  • @Thorin632
    @Thorin632 4 หลายเดือนก่อน

    Please make beginner friendly tutorial, step by step guide on how to integrate this with localgpt 🙏🙏

  • @RickySupriyadi
    @RickySupriyadi 4 หลายเดือนก่อน

    yes please is it going open source?

  • @im-notai
    @im-notai 4 หลายเดือนก่อน

    Idk know, why there is a folder on my desktop named Jarvis-v6 since 5 months and surprisingly that's also doing the same job 😮

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน

      Would love to see what's in the folder :D I am v0 now

    • @im-notai
      @im-notai 4 หลายเดือนก่อน

      @@engineerprompt it's gonna become interesting. I thought I was the one who was able to crack speech while streaming to reduce the latency.

  • @brianpereira7757
    @brianpereira7757 4 หลายเดือนก่อน +2

    That doesnt sound like Jarvis, I want the real Jarvis voice!!!

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน +1

      Good point, I think elevanlabs have that. Will try to integrate that :)

    • @sayantandas7544
      @sayantandas7544 4 หลายเดือนก่อน

      ​@@engineerprompt How about you add a little UI also? And maybe add a button to take continuous screenshot with a regular interval as well. In that way, you will be releasing the OpenAI's demo app before OpenAI.

  • @smoofwah3552
    @smoofwah3552 4 หลายเดือนก่อน

    Is there a way to speed it up?

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน

      Yes, Groq has whisper support now. Going with that but the issue is the rate limit!

    • @alx8439
      @alx8439 4 หลายเดือนก่อน

      To use rhasspy3 as a base. It streams audio directly to asr model

  • @Soniboy84
    @Soniboy84 4 หลายเดือนก่อน

    how it's different than gpt4o voice?

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน

      that is not available yet :)

  • @danieldjinishiandebriquez1858
    @danieldjinishiandebriquez1858 4 หลายเดือนก่อน

    What apis are being used?

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน

      currently everything is openai. Just got access to whisper from Groq, will update it and hope will be much faster!

    • @danieldjinishiandebriquez1858
      @danieldjinishiandebriquez1858 4 หลายเดือนก่อน

      @@engineerprompt great! Looking forward the tutorial or git repo. Literally yesterday I was searching about Jarvis haha

  • @themax2go
    @themax2go 4 หลายเดือนก่อน

    should edit title to add "using openai"

  • @themax2go
    @themax2go 4 หลายเดือนก่อน +2

    not local. not the jarvis voice. misleading title. disappointed

    • @javiergimenezmoya86
      @javiergimenezmoya86 4 หลายเดือนก่อน

      Why do you think that is not local? The only bad thing is that he do not use voice streaming for make it faster (I did it so)

  • @temp911Luke
    @temp911Luke 4 หลายเดือนก่อน

    Nice but would be great without that annoying 2-3 sec delay.

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน

      I agree, I just got access to Groq Whisper. Will be interesting to see how that works.

    • @fontenbleau
      @fontenbleau 4 หลายเดือนก่อน

      ​@@engineerpromptGeorge Hotz on stream called groq a scam...

  • @RickySupriyadi
    @RickySupriyadi 4 หลายเดือนก่อน

    also i request a video about this vs gpt-4o

  • @joepropertykey3612
    @joepropertykey3612 4 หลายเดือนก่อน

    Right on Bro, RIGHT ON. ......... but we need the voice of Cortana for this, for when we are sitting around in our Mark V Armor and coding...:)

  • @aa-xn5hc
    @aa-xn5hc 4 หลายเดือนก่อน

    Great looking forward

  • @GetzAI
    @GetzAI 4 หลายเดือนก่อน

    EXCITED!

  • @YassineMeche
    @YassineMeche 4 หลายเดือนก่อน

    I LIKE IT GREAT JOB