ขนาดวิดีโอ: 1280 X 720853 X 480640 X 360
แสดงแผงควบคุมโปรแกรมเล่น
เล่นอัตโนมัติ
เล่นใหม่
Claude 3.5 Sonnet…いきなり何やらすごいものが出てきましたね…(ボソッ
めちゃ凄そうで撮りたかったのですが外出中で撮れず‥😢
にゃんた様へ本当に技術用語やリテラシーが凄いですね❗僕なんかはまだよろよろというスピードでございます。
ありがとうございます!私もわからないことだらけで勉強中ですよ😆マイペースで頑張りましょう😊
いつも勉強させて頂いております。GPT-4oの強みは、マルチモーダル性にあると聞いたことがあります。全てのタスクを、一つのモデルで扱うこと、個々の性能で見ると下がるけれども、総合的性能では向上する。なのであえて、言語モデルに特化したGPT-4も選択できるのかなと思っています。
ありがとうございます!おっしゃるように音声とか画像などを含めて利用したい時はオムニを使ってテキストのみの場合は、GPT4を使うとか使い分けも良いかもしれませんね🤔
プログラミングに関する精度に関しては、GPT4>GPT4oだって言ってる人も結構いる印象がある気がしますねぇ
ありがとうございます!他のコメントでもGPT4の方が良いという方もいたのでここらへんは結構気になりますね🤔
4oは嘘をつくのが巧みになっている印象です。Tableauに関して言えば、完全にGPT4>4oですね。一方で、RAGの精度については、4oはかなりのものですね。
ありがとうございます!精度が上がっていくとハルシネーションも巧みになっていくのかもしれませんね・・・笑GPT4に切り替えて検証はしていませんでしたが確かにタスクによっては最適なものを探すの良さそうですね😲
AIモデルさんたちも、インスタの自撮り画像盛りまくっちゃうお年頃お嬢さんみたいな感じですね^^
AIモデルは精度の高さが命だからしょうがない
API経由で使う時は、レスポンスの速さが求められるケースも多いと思います。Groqのモデルが、あまり日本語が得意じゃないということで、4oは性能が高いのに速いので結構アドバンテージがあると思います!
実用性を考えたら速さも重要な評価指標ですよね!読んで理解するスピードより速く出力されている気がするので対話用途ではこれ以上は必要ないかもですが・・・笑
言語モデルの比較データは英語でのパフォーマンスですよね?日本語だと結果がかなり違うのではないでしょうか。個人的にはGPT-4oよりもClaude3のほうがはるかに疎通性が高い気がします。
おっしゃるように日本語だと結果が変わってきそうですね!Claude3の方がユーザーに質問を投げかけてくることが多く対話として意図を伝えやすいように感じますよね~🤔
88.7%でも86.8%でもいいのですが、誤差の範囲だと思います。ところで、ここまでくるとそろそろLLMの限界まで来ているように思えます。もし、GPT5が出て、性能が92%とかになったら、LLMは限界にきていると解釈できないでしょうか?
Gemini1.5proも凄いですが、本当に凄いのはGemini1.5flashだと思います。はっきり言って値段設定がおかしいと思うレベル。しかも、100万トークンまで使えますしね。APIを使うサービスでは、Gemini1.5flash以外選択肢はないのではと思いますね。
あまり注目されていない?気がしますがflashコスパめちゃくちゃ良いですよね😆
精度とは違った観点での比較も気になります…!個人的にはGPT4oは丁寧で文章が長くなる傾向があり要領を得てないなと感じることもあるのですが、Gemini1.5proは取捨選択できていて会話しやすくコミュニーケーションが気持ちいいなと感じます。これ精度とは違う論点ですよね?実装方針の違いとかあるのかなあと。たぶん多くのユーザーにとっては数%の精度の違いよりUXが優れてる方を選ぶん気もするんですよね。なんだかよく分からないので解説いただけると非常にありがたいです🙇♂️🙇♂️🙇♂️
ありがとうございます!単純に正しさとは別で、モデル毎に出力する文章の特徴(GPT4oは長い、Opusはユーザーに寄り添うなど?)があったりしますよね!そこらへんは好き嫌いもあるかもですが、Gemini 1.5 Proも使い込んでみて各モデル解説できたら良さそうですね!🤔
今回のGPT-4oは、あくまでマイナーチェンジかなと思います!Open AIは、わざと競合よりも少しだけ性能をアップさせている印象です笑それでもこの賢さは素晴らしいですし、より実用的です!現在も仕事でガシガシ使っていて、精度がかなり上がっていることを実感しています!GPT-4oの一番の利点は、何度リクエストを投げても制限がかかりにくくなった点です!実用性の面では圧倒的にGPT-4oですねー。以前、課金してOpusも使っていましたが、GPT-4oの方が👍
確かに今回は、音声対話機能がメインでそのために速度重視にしただけで性能が高いモデルも持ってそうですよね😆GPT-4o回数制限緩いのもヘビーユーザーにとっては嬉しいですね😊
GeminiはCoTなしなんでしょうか?
画像の評価に関してはCoT無しだと理解してます!
チャットGPTにアップしてもテキストが、抽出できませんでした。と表示されてしまうPDFがあるのですがどんな原因と解決策が考えられるか教えてもらえないでしょうか😢
私も手元で再現できていないので解決策が提示できませんが、画像などがPDFに含まれているとテキストとして認識できずエラーが出ているのかもしれません・・・!ADAで読み込んでいると思うので、エラーページは無視してテキストを抽出してくださいなどとプロンプトを入れたらどうなんでしょう🤔
Claude 3.5 Sonnet…いきなり何やらすごいものが出てきましたね…(ボソッ
めちゃ凄そうで撮りたかったのですが
外出中で撮れず‥😢
にゃんた様へ
本当に技術用語やリテラシーが凄いですね❗
僕なんかはまだよろよろというスピードでございます。
ありがとうございます!
私もわからないことだらけで勉強中ですよ😆
マイペースで頑張りましょう😊
いつも勉強させて頂いております。
GPT-4oの強みは、マルチモーダル性にあると聞いたことがあります。全てのタスクを、一つのモデルで扱うこと、個々の性能で見ると下がるけれども、総合的性能では向上する。なのであえて、言語モデルに特化したGPT-4も選択できるのかなと思っています。
ありがとうございます!
おっしゃるように音声とか画像などを含めて利用したい時はオムニを使って
テキストのみの場合は、GPT4を使うとか使い分けも良いかもしれませんね🤔
プログラミングに関する精度に関しては、GPT4>GPT4oだって言ってる人も結構いる印象がある気がしますねぇ
ありがとうございます!
他のコメントでもGPT4の方が良いという方もいたのでここらへんは結構気になりますね🤔
4oは嘘をつくのが巧みになっている印象です。Tableauに関して言えば、完全にGPT4>4oですね。一方で、RAGの精度については、4oはかなりのものですね。
ありがとうございます!
精度が上がっていくとハルシネーションも巧みになっていくのかもしれませんね・・・笑
GPT4に切り替えて検証はしていませんでしたが
確かにタスクによっては最適なものを探すの良さそうですね😲
AIモデルさんたちも、インスタの自撮り画像盛りまくっちゃうお年頃お嬢さんみたいな感じですね^^
AIモデルは精度の高さが命だからしょうがない
API経由で使う時は、レスポンスの速さが求められるケースも多いと思います。Groqのモデルが、あまり日本語が得意じゃないということで、4oは性能が高いのに速いので結構アドバンテージがあると思います!
実用性を考えたら速さも重要な評価指標ですよね!
読んで理解するスピードより速く出力されている気がするので
対話用途ではこれ以上は必要ないかもですが・・・笑
言語モデルの比較データは英語でのパフォーマンスですよね?日本語だと結果がかなり違うのではないでしょうか。個人的にはGPT-4oよりもClaude3のほうがはるかに疎通性が高い気がします。
おっしゃるように日本語だと結果が変わってきそうですね!
Claude3の方がユーザーに質問を投げかけてくることが多く
対話として意図を伝えやすいように感じますよね~🤔
88.7%でも86.8%でもいいのですが、誤差の範囲だと思います。
ところで、ここまでくるとそろそろLLMの限界まで来ているように思えます。
もし、GPT5が出て、性能が92%とかになったら、LLMは限界にきていると解釈できないでしょうか?
Gemini1.5proも凄いですが、本当に凄いのはGemini1.5flashだと思います。はっきり言って値段設定がおかしいと思うレベル。
しかも、100万トークンまで使えますしね。
APIを使うサービスでは、Gemini1.5flash以外選択肢はないのではと思いますね。
あまり注目されていない?気がしますが
flashコスパめちゃくちゃ良いですよね😆
精度とは違った観点での比較も気になります…!個人的にはGPT4oは丁寧で文章が長くなる傾向があり要領を得てないなと感じることもあるのですが、Gemini1.5proは取捨選択できていて会話しやすくコミュニーケーションが気持ちいいなと感じます。これ精度とは違う論点ですよね?実装方針の違いとかあるのかなあと。たぶん多くのユーザーにとっては数%の精度の違いよりUXが優れてる方を選ぶん気もするんですよね。なんだかよく分からないので解説いただけると非常にありがたいです🙇♂️🙇♂️🙇♂️
ありがとうございます!
単純に正しさとは別で、モデル毎に出力する文章の特徴(GPT4oは長い、Opusはユーザーに寄り添うなど?)があったりしますよね!
そこらへんは好き嫌いもあるかもですが、
Gemini 1.5 Proも使い込んでみて各モデル解説できたら良さそうですね!🤔
今回のGPT-4oは、あくまでマイナーチェンジかなと思います!
Open AIは、わざと競合よりも少しだけ性能をアップさせている印象です笑
それでもこの賢さは素晴らしいですし、より実用的です!
現在も仕事でガシガシ使っていて、精度がかなり上がっていることを実感しています!
GPT-4oの一番の利点は、何度リクエストを投げても制限がかかりにくくなった点です!
実用性の面では圧倒的にGPT-4oですねー。
以前、課金してOpusも使っていましたが、GPT-4oの方が👍
確かに今回は、音声対話機能がメインで
そのために速度重視にしただけで
性能が高いモデルも持ってそうですよね😆
GPT-4o回数制限緩いのもヘビーユーザーにとっては嬉しいですね😊
GeminiはCoTなしなんでしょうか?
画像の評価に関してはCoT無しだと理解してます!
チャットGPTにアップしてもテキストが、抽出できませんでした。と表示されてしまうPDFがあるのですがどんな原因と解決策が考えられるか教えてもらえないでしょうか😢
私も手元で再現できていないので解決策が提示できませんが、
画像などがPDFに含まれていると
テキストとして認識できずエラーが出ているのかもしれません・・・!
ADAで読み込んでいると思うので、エラーページは無視してテキストを抽出してください
などとプロンプトを入れたらどうなんでしょう🤔