- 13
- 18 055
AngrySadEight
Japan
เข้าร่วมเมื่อ 8 ก.พ. 2024
競技プログラミング(コンテスト参加・作問)についての動画を投稿します。観ていただけると、私はとても嬉しいです。
【検証】最新モデル AI、ChatGPT-4o は「ひっかけ問題」をどれくらい解けるのか?【ゆっくり実況・ゆっくり解説】
#ゆっくり解説 #chatgpt #競技プログラミング
0:00 オープニング
0:42 ルール説明
2:20 検証
10:17 エンディング
ChatGPT-4o はこちらから利用できます:openai.com/index/hello-gpt-4o/
ChatGPT-4o という、ChatGPT の最新モデルが発表されました。
正確性・速度ともに高い性能を示している対話型生成 AI であり、専門性の高い分野においても高い性能を発揮しています。
そうなれば、問題を出してどのくらい解けるのか、気になるところです。とはいっても、普通の問題を解けるかについては、既に多くの人が試みている。
そこで、今回は、「ひっかけ問題」を出題してどこまで解けるのか検証をすることに。驚きの結果となりました。
------------
当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます!
AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight
X はこちら→ x.com/sad_eight
0:00 オープニング
0:42 ルール説明
2:20 検証
10:17 エンディング
ChatGPT-4o はこちらから利用できます:openai.com/index/hello-gpt-4o/
ChatGPT-4o という、ChatGPT の最新モデルが発表されました。
正確性・速度ともに高い性能を示している対話型生成 AI であり、専門性の高い分野においても高い性能を発揮しています。
そうなれば、問題を出してどのくらい解けるのか、気になるところです。とはいっても、普通の問題を解けるかについては、既に多くの人が試みている。
そこで、今回は、「ひっかけ問題」を出題してどこまで解けるのか検証をすることに。驚きの結果となりました。
------------
当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます!
AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight
X はこちら→ x.com/sad_eight
มุมมอง: 2 905
วีดีโอ
【競技プログラミング 作問のポイント解説 #2】競プロの問題文を正しく書くには?【ゆっくり解説】
มุมมอง 4365 หลายเดือนก่อน
0:00 オープニング 0:39 Section 1 - 競プロの問題文の主な構成 1:31 Section 2 - 問題文 5:02 Section 3 - 制約、入力、出力、サンプル 7:54 エンディング 前回:th-cam.com/video/Oe3gtdLNFfU/w-d-xo.html 次回:お楽しみに 作問チェックリストはこちら:yukicoder.me/wiki/problem_checklist 「競技プログラミング 作問のポイント解説」と称して、競技プログラミングにおける作問の解説を行います。 「作問、やってみようかな…」と思っている人や、「やってみたいけど、なかなかやり方がわからない…」という方が、yukicoder に問題を投稿し、コンテストを開催する手助けとなれるような解説を行っていきます。 第 2 回目となる今回は「問題文の書き方」。 作問において、成功を...
「頭が壊れる…」をかしこく工夫して回避する!【ゆっくり解説】
มุมมอง 1.4K5 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング #atcoder 0:00 オープニング 0:36 本編 4:05 エンディング 特定のパターンが繰り返される問題などで、「ある領域に対する答え」を求めたいときなどに、「頭が壊れる」という経験をしたことはありますか。 しかし、そのような場合は、工夫をすることで、かなりシンプルな方法で答えを求めることができます。 この動画では、その方法について解説をしていきます。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→ x.com/sad_eight
【競技プログラミング 作問のポイント解説 #1】競プロの問題を思いつくには?【ゆっくり解説】
มุมมอง 1.1K6 หลายเดือนก่อน
0:00 オープニング 1:00 Section 1 - 作問の前提とは? 2:07 Section 2 - 問題の思いつき方 5:16 エンディング 次回:th-cam.com/video/uDeudtg_6-U/w-d-xo.html 今回から、当チャンネルでは「競技プログラミング 作問のポイント解説」と称して、競技プログラミングにおける作問の解説を行います。 「作問、やってみようかな…」と思っている人や、「やってみたいけど、なかなかやり方がわからない…」という方が、yukicoder に問題を投稿し、コンテストを開催する手助けとなれるような解説を行っていきます。 第 1 回目となる今回は「問題の思いつき方」。 作問の最初の関門となりがちなことが多いですが、どうすれば問題を思いつけるか、解説を行います。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発...
半分全列挙を「高速化」する【ゆっくり解説】
มุมมอง 1.9K6 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング #AtCoder ABC032-D→atcoder.jp/contests/abc032/tasks/abc032_d ABC184-F→atcoder.jp/contests/abc184/tasks/abc184_f ABC271-F→atcoder.jp/contests/abc271/tasks/abc271_f ABC326-F→atcoder.jp/contests/abc326/tasks/abc326_f ABC336-F→atcoder.jp/contests/abc336/tasks/abc336_f 東京海上日動2020-D→atcoder.jp/contests/tokiomarine2020/tasks/tokiomarine2020_d 参考資料とした半分全列挙高速化の記事→fairy-lettuce.hatenadi...
yukicoder contest 428 【ゆっくり茶番・ゆっくり解説】
มุมมอง 2236 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング コンテストページはこちら:yukicoder.me/contests/488 0:00 オープニング 0:45 A 問題 1:14 B 問題 1:48 C 問題 2:42 D 問題 3:25 E 問題 4:03 F 問題 4:38 G 問題 5:07 H 問題 6:05 エンディング 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→ sad_eight
大きい余りの計算を64 bit 整数の範囲内でやるには?【ゆっくり解説】
มุมมอง 2.8K7 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング #atcoder 0:00 オープニング 0:31 問題概要説明 1:28 Hint 1 2:02 Hint 2 2:24 答え 3:38 エンディング 動画内で取り上げる問題の概要ですが、以下の通りです。 ・A×B を M で割った余りを求める ・A, B, M は 2^60 未満の正整数 ・64 ビットより大きい整数を扱える型は使用禁止(C の int128_t、Java の BigInteger、Python の多倍長整数など、使用禁止) ・2 秒以内に実行できるようにすること ぜひ、みなさんも考えてみてください。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→twitter.c...
AtCoder Heuristic Contest 032 に参加した感想を振り返る【ゆっくり茶番・ゆっくり解説】
มุมมอง 6137 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング #atcoder コンテストページはこちら→atcoder.jp/contests/ahc032 0:00 オープニング 0:59 Section 1 - 問題概要編 2:09 Section 2 - 考察編 5:44 Section 3 - 振り返り編 7:03 エンディング 先日、AtCoder Heuristic Contest 032(AHC032)が開催されました。 その際に参加した際の一部始終、および感想を語ります。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→ sad_eight
「最小値の最大化」は二分探索!の知られざる罠……【ゆっくり解説】
มุมมอง 1.9K7 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング #atcoder ABC348-C→atcoder.jp/contests/abc348/tasks/abc348_c ARC053-C→atcoder.jp/contests/arc053/tasks/arc053_c yukicoder No.2657→yukicoder.me/problems/no/2657 競技プログラミングでおなじみの、「最小値の最大化は二分探索」という文言。 しかし、「最小値の最大化」という設定で、解法が二分探索ではないことは往々にしてあります。 つい先ほど行われた ABC348 でも、「最小値の最大化」という設定ではあったものの、二分探索するでもなく解けるものでした。 一体どのような例があるのでしょうか。動画で解説を行います。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行ってい...
要注意!ベルマンフォード法を使う際に陥りやすい「罠」【ゆっくり解説】
มุมมอง 1.2K7 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング 競技プログラミングで、ベルマンフォード法を用いる際に、負閉路検出を要求されることがあります。 その際に、問題の設定によっては間違ったやり方で判定しようとすると、答えが合わない、などということが多々あります。 そんな「陥りやすい罠」とは、どのようなものなのか。動画で解説を行います。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→ sad_eight
尺取り法と二分探索の「本当の」違い【ゆっくり解説】
มุมมอง 3.2K7 หลายเดือนก่อน
#ゆっくり解説 #競技プログラミング #atcoder 競技プログラミングの問題で、尺取り法が使われる問題は多くあります。そのような問題は「余計な log はつくものの、二分探索でも解けることが多い」とされることが多いです。しかし、「尺取り法を二分探索で代用できない」問題も存在します。そのような問題に見られる特徴は果たして何なのか。尺取り法と二分探索、この 2 つの手法の「本当の」違いは何なのかに焦点を当てる形で、解説していきます。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→ sad_eight
ARC169-Aをゆっくりが解説する【ゆっくり解説】
มุมมอง 1949 หลายเดือนก่อน
#競技プログラミング #atcoder #ゆっくり解説 問題へのリンク:atcoder.jp/contests/arc169/tasks/arc169_a ARC169-A「Please Sign」を、ゆっくりが解説します。 ちなみに、コンテスト本番の中の人の思考も、ほぼこの動画の流れの通りだったように思います。 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→ sad_eight
yukicoder contest 417 にゆっくりが挑戦する【ゆっくり茶番・ゆっくり解説】
มุมมอง 2199 หลายเดือนก่อน
#競技プログラミング #ゆっくり茶番 #ゆっくり解説 コンテストサイトへのリンク:yukicoder.me/contests/478 プログラミングで問題を解く、競技プログラミング。 そんなプログラミングコンテストに、ゆっくりが挑戦します。 0:00 オープニング 0:43 A 問題 1:23 B 問題 2:40 C 問題 3:49 D 問題 4:47 E 問題 5:45 F 問題 6:49 G 問題 8:26 エンディング 当チャンネルでは、競技プログラミング(コンテスト参加・作問など)についての発信を行っていきます! AtCoder アカウントはこちら→atcoder.jp/users/AngrySadEight X はこちら→ sad_eight
メチャクチャ分かりやすいです感謝
負閉路の頂点全部に -∞ を入れてもう一度ベルマンフォードするのが好みです
ニブタンはソートしてないと使えないイメージ
乱数の線形合同法の説明の中で Q = M/A, R = M%A, Div = B/Q, Rem = B%Q, s = Rem*A, t = Div*R として s - t < 0 なら答えは M - (s - t)、0以上なら (s - t) というやり方が載ってました。 意味はあんまりわかりませんw 常に使えるのかどうか。
そもそも1問目を二分探索で解けることを忘れていたから、全然違うじゃんってなったや
日本語が邪魔してる感じがする。。。英語で聞いたら正解するんでは🤔?
なんか、知識を問う問題が多く、思考や創造(生成)を依頼する内容が少ない。 このAIの使い方が違う この内容なら人間がググれカス。
ひっかけってそっちかあ。いっぱいの「い」を「お」に変えると何になる?みたいなやつでコンテンツポリシー突破するとかだと思った。
その手のひっかけを解かせることも一時期は考えはしたのですが、あまり良い問題が思いつかず、結局出題しないことになりました。
なんで背景のPCディスプレイが全部ブラウン管なの?
人間のミスを勝手に解釈して補完してくれるのは今の検索エンジンと同じですね。 北海道庁と東京都の面積を比べるはずが普通はない、と思っていそうです。
なお織田信成の生年月日は1987年3月25日である。(引用:Wikipedia
こちら、正しく確認しておりませんでした。これにより「完ぺきに答えてきた」は間違っており、この場をお借りして訂正いたします。とは言え、細部は間違えていながらも、ひっかけの趣旨を正しく読み取って答えを出してはいるので、正解扱いにさせていただこうと思います。
ためになった。 BGMでっか。
BGMについては、他の方からもご指摘を受け、最近の動画ではボリュームを落としています。ご理解をよろしくお願いします。
切り口ちょっと面白そうと思って見てみたけど、設問の方向性がCHAT AIに求める内容ではない
たしかに、質問する人間側の要求が誤解してる前提で答えてるからな。 これは引っ掛け問題ですの一言があると全然違う結果になりそう。
3〜4文字の漢字で出力してという問いかけをしたら3文字固定or3〜2文字の言葉しか出力できなくなりました。😮変なルート辿ったのですかね
最後の問題は語順を変えたり指示にミスは無いと言ったら認識し始めてくれはしたけど定数にAやBをかけ始めたり支離滅裂な事し始めたから中断して結局は正解出来なかったですね
chatGPTは誤字脱字があったり、質問の入力途中でうっかり送信してしまっても勝手に類推して期待通りに答えてくれることもあるので、それが影響してる部分もありそうですね。質問の最初に「ひっかけ問題です」とつけるだけで正答率が上がる気がします。
コメントありがとうございます。ご指摘の通り、確かに背景情報を付け足すのはかなり性能に影響しそうです。(今回の検証の趣旨という観点では「ひっかけ問題である」というのを明示するのはやや興醒めであるとも思いますが、実際に使うぶんにはかなり有用かもしれません)
@@AngrySadEight ひっかけ問題だと言う事が判れば、恐らく我々が考えるレベルの問題だと容易に解かれる可能性があります。 大抵のひっかけ問題は心理的なバイアスを掛けたり心理誘導する類の物ですから。 論理とアルゴリズムで回答するAIはそういう所は強そうかと。
全世界のユーザーが使うことを考えると、書いたとおりに動作するよりも、書き間違いに対して強力に補正してくれる方が役に立つ。 だから別に引っ掛け問題を解けるようになる必要もない。
毎回同じ様に「補正」されちゃうのもなぁって感じ。それこそ10回に1回くらい「最小公約数を求める」みたいな本当は必要のないはずのことをやらないといけないことはあるし、切り捨てちゃっていいのかなという気はする。とはいえ動画内でほとんどの「ひっかけ」にかからず対処できてるのは進歩を感じた
最小公約数の問題の2回目の返答は、最小公約数ではなくて最大公約数と言いたいのではないか?とこちら側のミスを汲んでくれている感じもしますね
確かにChatGPTの返答の特徴を鑑みるとご指摘の通りに思えますね。今回こそ全くの的外れでしたが、実用的には役に立つ場面もありそうだと考えています。
自分もそんな気がするのだけれど、最小公”倍”数の書き間違いと判断しなかったのはなぜだろう。 「どちらかの書き間違いではありませんか?」とか、もし最小公約数であるとすれば、質問に限らず、どの様な数も1となります」となるよね。
オーダーがより小さいのでお得、みたいな話かと思っていたらもっと実践的でためになる話だった!
m=m1×2^32+m2 と32bitで分割して(nも) mn=(m1n1)×2^64+(m1n2+m2n1)×2^32+m2n2 として実装したなぁ。 mi×njは64bitをでなくて2のべき乗倍はmod NのNの大きさによって繰り返し4倍法や繰り返し16倍法をオーバーフローしないように選んで計算する。
文章書くのがいちばん難しい
アップロードお疲れ様です! 実装を楽にする技術としてこの考え方、とても使えそう!勉強になります! (解けずに放置してるABC346-Fでも使えそうなので、この技を使ってACしてみようかな)
Omg you are so strong
競プロのポスターって背景黒がちですよね()
ちなみに私は紙に数列を書いてみて適当に線を引くとか数字に丸を付けるとかしてますが、特に思いつきません(典型ぽくて没にしている) 電車乗ってる時とか寝る前とかにぱって思いつきがちですね
投稿お疲れ様です!作問のネタになりそうなものを日常生活から探してみるの、面白そうですね! 僕もたまーーーに問題を思いついてメモしてみるときがあるのですが、解けなかったり面白くなさそうで没にしたりする問題が結構あるんですよね…
aをa%mとa%m-mのうち絶対値の小さい方にする(bも同様)ではダメなのでしょうか?
この方法ではできません。a%mとa%m-mのうち、小さい方の絶対値の最大値は、m/2程度になります。よって、この方法でa, bの絶対値を小さくしても、a×bの絶対値は最悪でm^2/4程度となり、mが最大で2^60程度となることから掛け算の計算結果が64bit型に収まりません。
普通に勘違いしてました。ありがとうございます。
3:38 の部分がグレイコードだと定数倍速くなると感じました! マージソートで計算量落ちる形になってるのすごいです!!
ご視聴ありがとうございます! ご指摘のとおり、グレイコードですと定数倍が速くなりますね(容易に非再帰に出来るというメリットもありそうです)。
うぽつです! 内容はめっちゃ面白いですが、もうちょっとBGMを小さくしていただけると助かります……!!
ご視聴ありがとうございます。 BGMの音量に関しましては、調整が不足しておりました。申し訳ございません。次回以降の動画では適切な調整を行ってまいります。
アップロードお疲れ様です! 今までO(2^n)とO(n * 2^n)の差をあまり考えずに実装をしていましたが、確かに20倍程度の高速化ってなるとかなり違ってきそうですね! 話は少しそれますが、ABC345-Dでitertools.permutationsを使って順列全列挙するとTLEするのに、DFSで実装すると間に合うのも 3:38 の理由があるかも知れなさそうだと思いました。
ご視聴ありがとうございます! 確かに、順列全列挙についても関数で行うか再帰で行うかの違いもありそうですね。
これ昔符号付き32bit整数しか使えない環境でNTT実装しようとして悩んだ記憶。懐かしい 最初に思い付いたのがGarnerでゴリ押しなんですけど、大量の素数(3つほど)を用意しなきゃいけないんですよね。 その後モンゴメリ乗算に切り替えたんですけど、前処理が面倒で結局未だに凍結状態なんですよね。 さて、どう解くのか 追記 力! 繰り返し2倍法はヒューマンリソースマシーンで使ったな…懐かしい。
M<2^60 なら、 8 倍してもオーバーフローしない((2^60-1)*8 = 2^63-8 < 2^63-1)から、繰り返し 8 乗法とかもできそう(3 倍弱速いかも?) typedef long long ll; ll multiply(ll A, ll B, ll M) { ll r = 0; while (B > 0) { if ((B & 7) != 0) r = (r + A * (B & 7)) % M; B >>= 3; A = (A << 3) % M; } return r; }
お疲れ様です。BGMがゆっくりの音声よりも大きくて辛かったです。テロップ見やすくて助かりました
ご意見ありがとうございます。 BGMの音量に関しましては、次回以降改善に努めてまいります。
今回から、動画の見やすさの改良のため、テロップの大きさを今までより少し大きくしたり、一部の演出を変更したりしています。ご意見がございましたら気軽にお申し付けいただければと思います。
Hi, I couldn't solve green or cyan question. My atcoder profile is killua123. How to reach 1200+ ratings?
I suppose it will be effective to practice solving ABC-D and ABC-E (in order to become able to solve during the contest time, speed is also important). If you become able to solve ABC-E at a rate of 50%, you can probably reach 1200+ rating.
0:16 ここの部分について、「尺取り法」と「二分探索」が逆です。訂正いたします。
1 ≤ Pi < i を見落としていてたいへんなことになった回 実験が大切なので難しかったですね