人間らしく自然に会話できる音声チャットAIを作る

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 ส.ค. 2024
  • GPT-4oの新Voice Modeが中々公開されないので自宅で再現を試みます。
    前回: • 人間同等の最新AIモデル「GPT-4o」で友...
    使用するAI:
    ・GPT-4o(OpenAI API)
    ・Speech-to-Text(Google Cloud)
    ・Gemini Flash(Gemini API)
    ・Gemma 2 8b
    ・Style-Bert-VITS2
    だるまと赤べこのサイト: www.darmabeko....
    BGM:
    ・かずち - 青空空港
    ・茶葉のぎか - Soda_Soda
    ・しゃろう - superstar
    ・しゃろう - 303PM
    ・さんうさぎ - え!?やば、、、、
    VOICEVOX: ずんだもん
    X(Twitter): / darmaakabeko

ความคิดเห็น • 42

  • @H2000A.official
    @H2000A.official หลายเดือนก่อน +8

    UI超いい。右のギャルに動作あったら愛着わきそう、

    • @darmasama
      @darmasama  หลายเดือนก่อน

      UI褒めていただきありがとうございます。
      確かに、次はギャル動作に入っていくかもしれません。

  • @user-fx7nq4rf2t
    @user-fx7nq4rf2t หลายเดือนก่อน +4

    待ってましたー!

    • @darmasama
      @darmasama  หลายเดือนก่อน +1

      ありがとうございますー!

  • @bananaapple338
    @bananaapple338 หลายเดือนก่อน +2

    興味深い!! 公開が待たれます。

    • @darmasama
      @darmasama  หลายเดือนก่อน

      ありがとうございます!引き続きよろしくお願いします。

  • @user-ru6ep3rx8e
    @user-ru6ep3rx8e หลายเดือนก่อน +1

    これにポイントに応じた関係性が構築出来たらヤバそう(語彙消失)

    • @darmasama
      @darmasama  หลายเดือนก่อน +1

      内部の関係値などで再現できたらめちゃくちゃ楽しそうですね...

  • @BANIYAMA
    @BANIYAMA หลายเดือนก่อน +4

    これ更に別に「あー」「うん」「えっと」「んー」みたいなのを最初にランダムに挟むようにすれば、間をもう少し自然に短くできるんでしょうか?

    • @darmasama
      @darmasama  หลายเดือนก่อน +1

      なるほど、できると思います!
      RAGで複雑な挙動を導入する時などに役に立ちそうです。

  • @user-sy9gh6oy1s
    @user-sy9gh6oy1s หลายเดือนก่อน +1

    私も待ってました。
    ありがとう。

    • @darmasama
      @darmasama  หลายเดือนก่อน

      いつもご視聴ありがとうございます!

  • @d-mato
    @d-mato 18 วันที่ผ่านมา

    6:56 知ってる話題で急に早口になるオタクムーブかわいい笑

    • @darmasama
      @darmasama  15 วันที่ผ่านมา

      まさにそれだ笑笑

  • @samuraicompassion1796
    @samuraicompassion1796 หลายเดือนก่อน

    待ってました!
    これは凄い

  • @sagasngai
    @sagasngai หลายเดือนก่อน

    個人でこれだけできるのか!すごすぎる!!

    • @darmasama
      @darmasama  หลายเดือนก่อน

      ありがとうございます!

  • @opandapanda3478
    @opandapanda3478 หลายเดือนก่อน

    マジですごい〜!
    自分も作ってみようかな...

    • @darmasama
      @darmasama  หลายเดือนก่อน

      ありがとうございます!
      作ってみましょう

  • @yotakato9163
    @yotakato9163 หลายเดือนก่อน

    悲しい企画の第二弾ですねwww
    でも割り込みできるのはスゴイ!

    • @darmasama
      @darmasama  หลายเดือนก่อน

      第三弾、第四弾と悲しみを増していくので今後ともよろしくお願いします笑

    • @yotakato9163
      @yotakato9163 27 วันที่ผ่านมา

      @@darmasama 楽しみにしています

  • @---fv2dl
    @---fv2dl หลายเดือนก่อน

    同じようなものを作ろうと技術もないくせに挑戦し難航していましたw
    すごいです!

    • @darmasama
      @darmasama  หลายเดือนก่อน +1

      ありがとうございます!
      お互い頑張っていきましょう

  • @hiroyukifuruta2725
    @hiroyukifuruta2725 29 วันที่ผ่านมา +1

    OpenAIのデモも、スマホにケーブルぶっさしていたから、遅延対策がうまく解決できていないんだろうなぁと思ってた。LLama3.1の7Bの量子化版とか、それなりに性能が良いから日常会話のような短く単純な内容なら、ローカルでやった方が会話として成立するのかも? クラウド全盛時代にオンプレミスに回帰って面白いなぁ

    • @darmasama
      @darmasama  21 วันที่ผ่านมา

      スマホにケーブル...なるほどです。見落としてましたがそういうことですね...
      ここにきてクラウドが追い詰められる構図はめちゃくちゃ面白いですよね。

  • @samuraicompassion1796
    @samuraicompassion1796 หลายเดือนก่อน

    Llama3とかローカルLLMを用いて、完全無料のものを作っても面白そうですね!

    • @darmasama
      @darmasama  หลายเดือนก่อน +1

      提案ありがとうございます!
      ゆくゆくはそちらに踏み入っていこうと考えています。

  • @tamorika111
    @tamorika111 หลายเดือนก่อน

    ありがとうございます!自然で凄いです!ちなみに割り込みのときマイク2つを動かしておくというはどういうことなのでしょうか?

    • @darmasama
      @darmasama  หลายเดือนก่อน

      ありがとうございます!
      音声認識セッションを一度切らないと文章を確定できない、しかし一度切ってつけ直すと0.5秒ほど遅延してしまう、なので「今のセッションを切る」「別の既に準備完了しているセッションをスタートする」
      これを同時にやれば早くなる、ということです!

    • @tamorika111
      @tamorika111 หลายเดือนก่อน

      なるほど!ありがとうございます!

  • @kenjjray7542
    @kenjjray7542 หลายเดือนก่อน

    動機はどうかも高性脳!

  • @user-og4dn1pj7m
    @user-og4dn1pj7m หลายเดือนก่อน

    th-cam.com/video/HE0mAgDAx-Q/w-d-xo.html
    UI見てたら「あなたは世界の終わりにずんだを食べるのだ」思い出すわ。
    あと、割り込み出来るようになったら、一気に会話感増してて嬉しい。

    • @darmasama
      @darmasama  หลายเดือนก่อน +1

      ああ、もしかして無意識にこれを参考にしたのかも...笑

  • @mido-nd3td
    @mido-nd3td หลายเดือนก่อน

    嫌なやつw

    • @darmasama
      @darmasama  หลายเดือนก่อน

      デモなので...

  • @capskey666
    @capskey666 หลายเดือนก่อน

    嫌なやつだな草 時代はローカル!
    コパイロット+PCもはよ欲しい!

    • @darmasama
      @darmasama  หลายเดือนก่อน

      いつもはこんなんじゃないですから。
      コパイロット+PCでローカルLLM動く時代が来るんでしょうか?今後が気になります!

  • @miru136
    @miru136 หลายเดือนก่อน

    待ってました!

    • @darmasama
      @darmasama  หลายเดือนก่อน +1

      ありがとうございます!