ChatGPTとWhisperのAPIを使用して、AIと話せる会話アプリを作ってみた【Python初心者でも使えるコード付きで解説】
ฝัง
- เผยแพร่เมื่อ 16 ก.ค. 2024
- #chatgpt #AI #python #プログラミング #whisper
AIが英会話の講師になる…?
00:00 オープニング
01:02 APIKeyについて
01:53 WhisperのAPIの料金体系
02:32 WhisperのAPIの制限について
04:01 AIとの対話アプリの仕組み
06:18 コードとcolaboの使用方法の紹介
07:08 APIKeyの設定
07:33 ChatGPTのAPIを使用するためのコード
08:12 WhisperのAPIで音声ファイルを文字起こしする
09:17 ChatGPTの振舞い方を設定
09:45 UIの起動&操作方法について
10:13 会話のデモ開始
12:18 英会話の練習の設定方法
12:50 英会話の練習のデモ開始
14:22 テキストも出力させるUIに変更する
15:21 エンディング
■OpenAIのOverviewのページ
platform.openai.com/overview
■Google Colabo
colab.research.google.com/git...
※無断転載禁止
■以前の関連動画
【AIとチャット】話題のChatGPTの使い方を解説してみた
• 【AIとチャット】話題のChatGPTの使い...
ChatGPTのAPIが登場!Python初心者でも使えるコードと使用料金などについて解説してみた
• ChatGPTのAPIが登場!Python初...
■Udemy
ChatGPTAPIの使い方講座も作成しているので興味があれば是非!(クーポン発行してます!)
linktr.ee/nyanta_youtuber
■Twitter
/ vtuber_nyanta
■言語モデル関連のおすすめ書籍
・大規模言語モデルは新たな知能か――ChatGPTが変えた世界
amzn.to/3YhtYCk
大規模言語モデルがこれまでの機械学習とどのように違うのか?という点や
簡単な技術の概要がわかりやすくまとめられています。万人向けです。
・大規模言語モデル入門
amzn.to/3OAJnuh
大規模言語モデルに使われている基礎的な技術の実装と応用が学べます。
やや技術寄りですが、かなり丁寧に解説されています。
※上記製品リンクURLはAmazonアソシエイトのリンクを使用しています。
------------------------------------------------------------------------------------------------------
■楽曲提供
フリーBGM DOVA-SYNDROME : dova-s.jp/
効果音ラボ : soundeffect-lab.info/
------------------------------------------------------------------------------------------------------
Udemy始めました!(宣伝)
ChatGPTAPIの使い方講座も作成しているので興味があれば是非!(クーポン発行してます!)
linktr.ee/nyanta_youtuber
音声認識ーチャット文章生成ー音声合成が連携したアプリができたことに驚きました。今後、話者の指向にカスタマイズさせていけば、人とAIのより良いインタラクションができると思います。
すごくおもしろいですね!参考になります!
ありがとうございます!
動画作成の励みになります!!
コードが作ってあったので、直ぐに使え楽しんでいます、無料で試せるとは有り難いことです~英語は出来ませんがこれを機会に頑張って勉強します。ありがとうございました。
コメントありがとうございます!
少しでも役立ったようで嬉しいです!是非使ってみてください!
とても参考になりました。ChatGPTは英語の練習相手になるんですね😄
ありがとうございます!
ですね!英語の勉強の仕方も変わってきそうですね😄
ありがとうございます‼️
まさに夢のツールです
早速使ってみました。ただ、コードの中身は難しくて理解できないので詳しい解説もあると嬉しいです
コメントありがとうございます!
要望もありがとうございます。今後の動画では、
なるべく初心者の方にも理解してもらえるよう丁寧に解説してみます!
素晴らしいです!
これをvtuberとの会話とかできますかね?
ありがとうございます!
vtuberとの会話にも原理的にはできるかと思います!
(発音を自然にするなど工夫の余地があるかと思いますが・・・!)
ありがとうございます。まったくの初心者ですが試して動かしても全く動きませんでした。原因もわかりません。。他サイトで調べて試してみたいと思います。ありがとうございました!
凄いですねぇ〜。今後は、こういった音声でのPCやIoT機器とのコミュニケーションが行われるんですね?って言うか、小説なんかを読ませる場合、声優のキャストを決めれば昔で言う「ラジオドラマ」が出来ますね。後々、自分で配役を決められれば、とても楽しいメディアが出来るんですね。まぁ人の動きは描ききれないでしょうが、名作小説の楽しみが深くなりそうですね。それとgttsの声が良くなっていますね。前はもっと「ロボット」でした。
コメントありがとうございます!
身の回りの色々な機器が会話で操作できたり、
人格を持っているように振舞うようになったら面白そうですよね😊
gttsって昔はもっとロボットみたいな声だったのですね!
@@aivtuber2866 日本語は味気ないですが英語は結構いい感じです。
VOICEVOX(ずんだもん)とか組み込んだら、もっとなめらかに日本語を話してくれるのかな
合成音声はマイクロソフトAzureが一番なめらかだなって思ってます
VOICEVOXやマイクロソフトAzureの合成音声など、全然知らなかったです…!
今後動画を作る時の参考にさせていただきます。ありがとうございます!
@@aivtuber2866 VoiceVoxは私もPCに入れましたが、無料の割に良いですよ。でもUbuntu22.04LTSにインストールする場合はバグがあるみたいです。他のOSでは問題ないみたいです。
以前は会話アプリが使えていました。最近使ってみたら、Gradioがエラーを出すようになりました。何かGradio側でプログラムが変わったのでしょうか?
ありがとうございます!非常にありがたいです。使用しているGPTモデルは何ですか?と聞くとGPT3.5ターボでなくGPT2と返答がきたのですがわかりますか?
ありがとうございます!
モデルはコードで書いている通り、gpt-3.5-turboを使用してるかと思います!
GPT2と返ってくる理由はちょっとわかりませんね…不思議ですね…!
ChatGPTを用いた英会話練習方法を教えていただきありがとうございます。試したのですが、返答が非常に遅くなってしまっています。何が原因かわかりますでしょうか?
コメントありがとうございます!
原因としては下記が考えられます。
・Google colaboの動作が重たい
⇒左上のタブからランタイムを選んで再起動をするくらしか解決方法が思い浮かばないです・・!
・ChatGPTに入力したとトークンが多い
⇒最初は応答速度が速いのに徐々に遅くなっていく場合は、こちらかと思います。
これは、現在の実装では前の入力結果やChatGPTからの返答文を保存しているため、毎回過去の履歴を参照しながら結果を出力しているので遅くなっているのかなと思います。こちらのケースだと前の分の履歴を保存しないように変更すれば解決するかと思います!
returnしてきたmp3をそのまま自動再生することって可能でしょうか?
英語での電話対応のロープレができるので個人的に神ツールです。ありがとうございます!
というかこういうこともChatGPTに聞けばいいんだよな。。。とふと思いましたw
このコードを元にChatGPTと共に自分が使用しやすいように変更していってもいいでしょうか?(元はにゃんた氏が公開してくださったものということで確認の意味を込めて。)
コメントありがとうございます!
すみません、私も自動再生の方が会話っぽくて良いな~と思ったのですが
やり方がわからず・・・。力になれずすみません。
コード変更して使っていただいて構いません!ありがとうございます!
@@aivtuber2866 いえいえ、返信ありがとうございます!
早速聞いてみたのですが、「Gradioのウェブアプリ上で自動的に音声を再生する方法は、Gradioの機能には含まれていませんが、JavaScriptを使用して実現することができます。」という提案をいただいたので、ちょっと力技っぽいですがそっちの方向で進めてみます。
Speak to ChatGPTというグーグルのプラグインで音声認識が出来るらしいのですがこちらはどうでしょうか。
やってみたいんですけどちょっと戸惑っています。
Speak to ChatGPT初めて聞きました!
見た感じ英語対応のようですが、日本語でもいけるのか気になりますね!
いつも有益な情報をあろがとうございます、これはチャットgpt4 でも使用可能でしょうか?
いつもコメントありがとうございます!
GPT4.0のAPIでも可能だと思います!
ちょっと私はまだwaitlistで順番待ちなので手元で実装ができないのですが…!
@@aivtuber2866 ありがとうございます!
3:25 無料で会話できるという理解でいいんですかね、
聞き取りは無料でできますが、会話の回答はgpt-3.5-turboなどのAPIを使用して
生成してため、その料金は発生しますね!
コードそのまま使いましたが、返信がずっとフラグする状態で戻ってきません。何か原因は考えられますか?
私の方では正常動作するようなので
もしかしたら、OpenAIのAPIの調子が悪くて
返答が返ってこないなどの可能性はありますね!
ちょっとその他の可能性は、パッと思いつきません…すみません…!
@@aivtuber2866 返信ありがとうございます!確かにAPIかもとは思いました!また試行錯誤してみます。
有料アカウントではなかったという凡ミスでした。実装できました!
なるほどです!
実装できたようで良かったです!
ありがとうございました。同じコード実装してみましたが、送信時、エラーは発生してしまいました。「Uncaught (in promise) API Error」。色々調べてみましたが、原因ご存知でしょうか。chromeの設定でしょうか。「There are no named API Routes for(Running on local URL)」
コメントありがとうございます!
実行環境はGoogle colabo上ではなく、ローカル環境でしょうか。
ちょっと私も調べてみましたが、パッと思い当たる原因がありません。
(私の実行環境では動作するようです)
お力になれずすみません・・・!
@@aivtuber2866 ご返信いただき、ありがとございます!はい、実行環境はGoogle colabo上ではないです。ローカル環境です。Google colabo上で、やってみますね。助かります。
@@aivtuber2866 私もできました!大変にいい勉強できました!ありがとうございました。
それは良かったです!また何かあれば言って下さい!
英語で返してくれるのですが、すごい日本語発音の英語なんですよね。なんででしょうか?
gTTS(text=text_chatgpt, lang="ja", tld="co.jp", slow=False)というコードのところで
テキストを読み上げる方法を指定しているのですが、lang="ja"で日本語を指定しているので
ここをlang="en"にするとより自然な英語になるのではないかと思います!🤔
間違ってたらすみません・・・!