本当にGemini Pro1.5は凄いのか?論文を読んで解説してみた
ฝัง
- เผยแพร่เมื่อ 8 ก.ค. 2024
- こんにちは、にゃんたです。
今回は先日リリースされたGemini Pro1.5について何が凄いのか?ということを
論文からわかる範囲で解説してみました!課金を検討するべきか悩んでいる方は是非!
---------------------------------------------------------------------------
LINE公式で限定コンテンツ配布中!
▼登録はこちらから行えます▼
liff.line.me/2004040861-3Jvq4bAG
今ならキーワード「プロンプト」と入力すると
ChatGPTとClaudeのプロンプトまとめた無料プレゼントをお渡ししています!
その他TH-camでは話せなかった内容も配信していきます!
---------------------------------------------------------------------------
00:00 オープニング
01:38 Googleの言語モデル
05:54 Gemini Pro 1.5の概要
15:00 活用方法
16:09 まとめ
16:50 ウェイティングリスト登録が必要
17:05 エンディング
■ウェイティングリストリンク
japan.googleblog.com/2024/02/...
※一番下の「サインアップ」をクリックしてください
■以前の関連動画
ついに登場!GoogleのGemini Ultraについて解説してみた
• ついに登場!GoogleのGemini Ul...
OpenAI最新のEmebddingモデルって何が凄いのか解説してみた
• OpenAI最新のEmebddingモデルっ...
■Udemy
ChatGPTAPIの使い方講座も作成しているので興味があれば是非!(クーポン発行してます!)
linktr.ee/nyanta_youtuber
■X, インスタグラム
/ vtuber_nyanta
/ vtuber_nyanta
■note
note.com/nyanta123
■言語モデル関連のおすすめ書籍
[書籍]大規模言語モデルは新たな知能か――ChatGPTが変えた世界
amzn.to/3YhtYCk
[紹介動画]一流研究者による大規模言語モデルの解説がわかりやすい
• 一流研究者による大規模言語モデルの解説がわか...
■にゃんた愛用のガジェット達
HHKBのキーボード(タイピングが心地よい!)
amzn.to/3VHE4Nd
パームレスト(外出時もタイピングの位置が安定する)
amzn.to/3Rtcz7G
マウス(手の負荷が下がる!)
amzn.to/3KI72q7
iiyamaモニター(ChatGPT用にディスプレイが必要・・・!)
amzn.to/3VpljNd
モニターアーム(コスパ良かった!)
amzn.to/4bZMTaJ
■連絡先(全て返信できないかもしれません!)
vtuber.nyanta@gmail.com
※上記製品リンクURLはAmazonアソシエイトのリンクを使用しています。
------------------------------------------------------------------------------------------------------
■楽曲提供
フリーBGM DOVA-SYNDROME : dova-s.jp/
効果音ラボ : soundeffect-lab.info/
■編集
にゃんた妻
一言:カラマン語とはって調べちゃいました😀
------------------------------------------------------------------------------------------------------
#AI #生成AI #python #プログラミング #chatgpt #gemini #geminipro
素晴らしく解りやすくかったです。
また、映像見させてください。七里
ありがとうございます!
そう言って貰えてよかったです!🙇♂️
GPTのGPTたる重要な要素に、人間の専門家による細かい調整があると思います。使っていて感じるのはモデルの性能差以上に欲しい回答や、欲しい回答への誘導のしやすさが段違いかなと。
Gemini 1.5 Proに期待されていることは入力トークン数じゃなくて出力トークン数なのかなと思います。これでGPT-4 Turboと同じように4000字程度だとがっくりですね。1M読み込めて出力文字数は一括で1万字ぐらいババッと生成できるなら、多少精度が落ちても文章執筆ツールとしてGPT-4 Turboより優位に立てるんじゃないのかなと思います。
仕組み的にコンテキストウィンドウが長ければ1回の出力は最悪1トークンだけでも問題ないはずですよ。元々1トークン出力のたびに、それを入力に追加して次のトークンを計算しているだけだから。4000トークン出力したら、それを元の文章の最後に追加して続きを出力させるだけの話なので・・・問題はコンテキストウィンドウを超えた場合に前のトークンからAttensionの計算から消えて考慮されなくなるのでコンテキストウィンドウは絶対に長くないとそもそも計算できないわけですから。
確かにアウトプットの長さが増えると差別化になりそうですね!
OpenAIのモデルの出力トークン制限って
1回の計算時間を抑えたいとかなんですかね~🤔
@@hiroyukifuruta2725 自分はブログ執筆用途で使ってるんですが一括で文章生成できた方が時短になって便利だと思うんですよよね。一々続きを出力させるのも面倒かなって
多少Chat-GPTより良いのがでてきても、GPTがカスタマイズできていることから、なかなか乗り移りにくいように思う
そうですね!乗り換えはさすがにまだですね!
命題として状況説明→ そのやり取りを英会話にて・・→それを和訳してください。英語の勉強になり脳内補完も ( ゲームシナリオが秒で
長文が得意なら、複数企業の決算情報を飲み込ませて比較検証を短時間に出力させるみたいな用途に使えそうですね。
確かに、色々な文献を一気に読み込ませて
比較検証するって使い方ができれば、かなり仕事で使えそうですね!
大規模言語モデルはサービスとしては黎明期なので、パフォーマンスの公称規格が曖昧なんでしょうね。かなり熾烈なシェア競争があるんだろうなと想像しました
Googleで働いている技術者は皆とびぬけて優秀だと思うので
こういう見せ方はしたくないはずですよね・・・!
競争激しそうですね🤔
ブラウザと同じく、覇権を握る事による影響力は凄まじいのでしょうね
一般的に普及すれば、ブラウザは用無しになるのかも.......
Googleさん発表がモリモリっぽい。
ただGeminiはマルチモーダルで来ましたがfunctioncallでできることおおいですし合せ技で来たと思ってます。今回のデカい1.5というのもRagとどこまでちがうのか気になってます。
確かにAPIでGPT4+function calling使えば
マルチモーダルっぽい挙動できそうですね🤔
投資家向けの資料なのかもしれないけど、AI好きな人だったらすぐわかるような変な小細工が多いですね😅
入力上限は大いに越したことないしいい事だと思います。あと、Gemini Advancedで、日本語でもPythonの実行環境が使えるようになってました!
ですね~ 我々のように色々なAI触っている層は少数ですから
ビジネスとしては良いかもしれませんが、ちょっと悲しいですね🥲
> Gemini Advancedで、日本語でもPythonの実行環境が使えるようになってました!
ほんとですね!これは中々いい感じですね~
というかサーモンさん情報収集力高いですね😆
すみませんが素人で少しお聞きしたいのですが、gptsで例えば行政書士や司法書士などの士業に特化したチャットbotみたいなものは作れるのでしょうか。
作るとしたらknowlegeに大量の情報を入れることになるのでしょうか。
個人情報も入れるので公開はしないで社内で利用する形で知識をそれに詰め込んでいくようにしていくのでいいのでしょうか。
よろしくお願いします。
おっしゃるようにknowledgeを使ってテキスト情報を読み込ませておけば
gptsで動くものは作れるかと思います!
ただ、普通に作成すると誰でもリンクがわかればアクセスできてしまうと思うので、chatgptのteam planなどを検討すると良いかもしれません!
@@aivtuber2866 ご返信ありがとうございます。勉強になります。
テストで32万トークンの入力の場合に、処理が1分近くかかってるみたいだから、実験的限界の最大10Mトークンまで入れたら下手すると1回の処理に1時間くらいかかるんじゃないのかな?実用的ではないよね・・・だから現状は1Mトークンとしているのかもしれんけど
32万トークンで1分かかるんですね😲
確かにそうすると10Mになると推論時間めちゃくちゃかかりそうですし
10Mトークン対応のモデルはすぐには公開されなさそうですね・・・🥲
リンク先の動画で紹介されているように、3jsの様に大きなプロジェクトファイルを読み取って、その修正点を見つけるような用途では、コンテキストウィンドウの大きさは有効活用できそうですね。
th-cam.com/video/SSnsmqIj1MI/w-d-xo.html
ありがとうございます!
確かにファイル全部読んで、それに基づいて会話するとか
めっちゃ相性良さそうですね😲
結局「大多数の人にとってはChatGPTでいいじゃん」という結論にしかならないという
モデルによって文章に癖があるから特定の使い方なら上回ることはあっても総合的な性能だとGPT4の足下にすら及んでるか怪しい(Gemini Ultra含めて)のばっかですよね
Gemini Ultraがあの程度の性能だったことを踏まえるとsora公開とか関係なくGemini 1.5 Proもそんな期待してる人少ないと思います
今のところ結局ChatGPTが良さそうですよね!
ただ普段から言語モデル触っていない人は
どっちが良いのかわからなさそうという・・・🥲
使ってみましたが微妙… いろいろ頑張ってるとは思うが基本性能的にはGPT3.5にすら及ばすと言わざるを得ない。Googleは生成AIでは完全に出遅れてる。
すごいと思いますかgpt-5と比べたら...w
geminiウソ返してくるんだよね
Geminiのハルシネーションはめちゃくちゃ酷い
一時期溢れた偽AIアプリを連想させる
Copilotの設定を「厳密」にして使っている方がマシ