Claude vs ChatGPT Tower Defense

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 ธ.ค. 2024

ความคิดเห็น • 112

  • @TorMier1308
    @TorMier1308 3 หลายเดือนก่อน +257

    Flip did not take it out.

    • @mitchierichie
      @mitchierichie 3 หลายเดือนก่อน +13

      good old Flip

    • @TheDoubleBee
      @TheDoubleBee 3 หลายเดือนก่อน +9

      If he took it out, he'd be done for indecent exposure

    • @judeOtenyo
      @judeOtenyo 3 หลายเดือนก่อน +10

      Do we ever really know when he DOES take it out?

    • @d1ngd0
      @d1ngd0 3 หลายเดือนก่อน +3

      Thanks flip

    • @jalenh371
      @jalenh371 3 หลายเดือนก่อน +1

      Flip the 🐐

  • @evan_ry
    @evan_ry 3 หลายเดือนก่อน +31

    New LLM benchmark: PTD (prime tower defense)
    Release it on huggingface

  • @5h00G0fg
    @5h00G0fg 3 หลายเดือนก่อน +22

    Prime in excel was so funny, like i never saw this guy using a mouse

  • @myspace_forever
    @myspace_forever 3 หลายเดือนก่อน +50

    12:46 When the morning triple shot espresso kicks in

  • @fateriddle14
    @fateriddle14 3 หลายเดือนก่อน +83

    based on the title, I was expecting to see at least a full game played by 2 AIs, but... there's none. I mean, why..?

    • @myspace_forever
      @myspace_forever 3 หลายเดือนก่อน

      Because you touch yourself at night

    • @KOBE42__
      @KOBE42__ 3 หลายเดือนก่อน +1

      But, you did get a nipple rub show 🤷‍♂️

    • @rnts08
      @rnts08 3 หลายเดือนก่อน +32

      Busy yapping 😂

  • @Kane0123
    @Kane0123 3 หลายเดือนก่อน +31

    0:35 Creeps move across the screen. Describing Twitch chat? Gottem

  • @Benholio1
    @Benholio1 3 หลายเดือนก่อน +41

    Ask the AI to explain each move when submitting it. Would be interesting to see if there is a coherent strategy or if the explanation even makes sense

    • @DanielVagg
      @DanielVagg 3 หลายเดือนก่อน +11

      "show your work" is also a great way to improve LLM outputs in general

    • @moussaadem7933
      @moussaadem7933 3 หลายเดือนก่อน +5

      Just doing that would change the result

    • @hamm8934
      @hamm8934 3 หลายเดือนก่อน +7

      They’ve consistent failed to get this type of insight from chess models for decades. Its not going to be trust worthy or coherent

    • @eetoonamamanakooo
      @eetoonamamanakooo 3 หลายเดือนก่อน +3

      @@hamm8934chess models ain’t machine learning algorithms, and any of them that were, were not at this insane level of slightly stupid AI.

    • @ninjadude501
      @ninjadude501 3 หลายเดือนก่อน +3

      ​@@eetoonamamanakooo They are, indeed, machine learning algorithms (at least all of the top engines nowadays), but they are not LLMs.

  • @KillianTwew
    @KillianTwew 3 หลายเดือนก่อน +6

    "Its so hard to write good code" but also says, "all code is bad code"

  • @Benholio1
    @Benholio1 3 หลายเดือนก่อน +11

    Also for stat collection - position of towers. Then heat map!

  • @pesterenan
    @pesterenan 3 หลายเดือนก่อน +1

    It's a tuesday morning, and I'm laughing like a dum dum at the moustache programming man rubbing his nipples in an imaginary trance. Thanks!

  • @jeremyo168
    @jeremyo168 3 หลายเดือนก่อน +5

    Dude you need to use prompt caching. It will let you store and reuse the same system prompts for cheap. Cache duration is 5 min.

  • @pif5023
    @pif5023 3 หลายเดือนก่อน +7

    The new QuadrupleA game we were waiting for

  • @aerocodes
    @aerocodes 3 หลายเดือนก่อน +5

    Hahahah I can't unsee 14:10 now.
    About the game:
    Anthropic is really the king now it seems huh!?. To give Open Ai a chance try to change the numbers fed to the prompt:
    i.e: for distance maybe you could have 3-5 options like 'long-range', mid-range', 'short-range' (and add this rule explanation to the prompt as well)
    Open Ai is just terrible with numbers

  • @oscarcastillejo9685
    @oscarcastillejo9685 3 หลายเดือนก่อน +6

    is it possible that the order that you place the information to both AIs could change the results? Let's say, instead of TowerRange,Creeps,Towers is Creeps,TowerRange,Towers

  • @harshitpant07
    @harshitpant07 3 หลายเดือนก่อน +34

    mom i am studying and the moment she enters the room : 12:56 🗣 zoom in flip.. yeah zoom in

  • @cicerohellmann
    @cicerohellmann 3 หลายเดือนก่อน +5

    This weekend I was trying to do some stuff with Gipiti and I felt the thing was just not going to lend me a hand, went over Antropic and it felt like magic, the thing udnerstood my problem, the version of the library and game a viable solution I could build on top. Try Claude.

    • @nikhils7583
      @nikhils7583 3 หลายเดือนก่อน +1

      Literally got irritated with gpt for 3 hr and then went 1 prompt with sonnet

  • @benbowers3613
    @benbowers3613 3 หลายเดือนก่อน +3

    Bro the through the blinds view is so peak

  • @the_danny_g
    @the_danny_g 3 หลายเดือนก่อน +4

    Why not use prompt caching on the giant system prompt

  • @bug5654
    @bug5654 3 หลายเดือนก่อน

    Props to ZanyBots for asking about error bars when given numbers.
    Yes, I have a math degree, how'd you know?

  • @SherifNeamatalla
    @SherifNeamatalla 3 หลายเดือนก่อน

    Dude regarding the weird quirk of "different day times different results", maybe it's related to how much load the inference servers have , more load -> less resources and lower response quality

  • @marxizalias3193
    @marxizalias3193 3 หลายเดือนก่อน +8

    When Prime starts to use pivot tables to actively update their charts in real time, then maybe, MAYBE... we can stop pooping on their excel skills. :P

  • @cefcephatus
    @cefcephatus 3 หลายเดือนก่อน

    Did you make your TowerDefence available for people to code their own strategy and send it to you?

  • @RobertYeakel
    @RobertYeakel 3 หลายเดือนก่อน +1

    this is the true test of ai model performance

  • @pif5023
    @pif5023 3 หลายเดือนก่อน +1

    Can’t you let them play games randomly, with or without an adversary, and build a dataset it can use to train itself from the won games?

  • @MichaelDuder
    @MichaelDuder 3 หลายเดือนก่อน +1

    people suggesting ollama with llama3.1 are missing the point. I use that exact set up at my home. llama3.1 8b is nowhere near as capable as the larger ones hosted by anthropic and openai.

    • @_fuji_studio_
      @_fuji_studio_ 3 หลายเดือนก่อน +1

      of course lmao, you compare 8b model with around 300b model. even llama 3.1 405b model is below than claude sonet 3.5, i dont know about gpt 4o

  • @dysfunc121
    @dysfunc121 3 หลายเดือนก่อน +1

    14:54 indeed, we call this accuracy. 😉

  • @mmmhorsesteaks
    @mmmhorsesteaks 3 หลายเดือนก่อน +6

    I have seen literal babbies graphing in python with xlrd and matplotlib and here we have Rusty McZigface not managing a simple little pandas thing? Pathetic.

  • @musicmarketing
    @musicmarketing 3 หลายเดือนก่อน

    You should cache the system prompt with Anthropic
    Also, if you're not feeding the game history back into every new prompt, you should try that
    OpenAI and Anthropic have vastly different prompt styles - the same prompt may favor one or the other. You should play around with others to see if it switches.

  • @NemiriNabil
    @NemiriNabil 3 หลายเดือนก่อน

    The questions just got even bigger.

  • @ldlework
    @ldlework 3 หลายเดือนก่อน +1

    "write a python script to graph this csv data"

  • @ReedoTV
    @ReedoTV 3 หลายเดือนก่อน +4

    Can't wait for the graphics to be added!

    • @mr.k8660
      @mr.k8660 3 หลายเดือนก่อน

      Its ascii game

    • @DanielVagg
      @DanielVagg 3 หลายเดือนก่อน

      😂

  • @christcut
    @christcut 3 หลายเดือนก่อน

    How about using Sparse Priming Representation (SPR) to reduce your prompt? You could generate it using chatgpt and give it then to claud

  • @pif5023
    @pif5023 3 หลายเดือนก่อน

    New official AI benchmark, the Primeatest!

  • @alexandrecolautoneto7374
    @alexandrecolautoneto7374 3 หลายเดือนก่อน

    I'm still baffled by the idea of building a non-deterministic computer. Receiving different answers each time you run tho code is wild.

  • @crypticslug1065
    @crypticslug1065 3 หลายเดือนก่อน

    @ThePrimeTime I wonder if it would be better to just replay the GPT moves from the previous game, and have each model respond in a staggered format, producing their best "responses" to each other model's moves for an entire game. It's not as adversarial but it might get you around the token limit.

  • @Dogo.R
    @Dogo.R 3 หลายเดือนก่อน +4

    It's almost like the spreadsheet has better UI and UX than vim. He doesn't even have to count the columns to figure out what they are.

  • @rakly347
    @rakly347 3 หลายเดือนก่อน

    You can greatly cut down on the amount of tokens used by reformatting your natural language for AI. Like you can mostly use 'base' words unless you explicitly need it to be different. Meaning, no plurals, past/future tense. Like I said, in some cases where it might cause misinterpretation, you don't use base words. The reason is because base words usually are less tokens. Emphasize using Asterix's, quotes, underscore, etc.
    eg: 2 player TD game lose game all_tower destroy \*ammo health are same\* place tower in \*placement range\* json prompt prefix \_your\_ is your value
    if both player place all tower wave start. creep spawn left move right
    What would work even better is just send the codebase as the instruction sheet.

  • @jefferyosei101
    @jefferyosei101 3 หลายเดือนก่อน +3

    What the f did i just watch 14:19 😂😂😂

  • @technikschaf1574
    @technikschaf1574 3 หลายเดือนก่อน

    Is there a way you can make the collected stats public so we can play with the statistics?
    And you should absolutelly track where towers get build and destroyed.
    Source for the game would be nice too. looks like a project you could have some fun with.
    Let the Battle of the Ais begin.

  • @RealSuuu
    @RealSuuu 3 หลายเดือนก่อน +1

    Do not hallucinate

  • @eugenenalpin6058
    @eugenenalpin6058 3 หลายเดือนก่อน +3

    My man did 6 outros 😅

  • @ShootingUtah
    @ShootingUtah 3 หลายเดือนก่อน

    I use Claude until I run out of free requests then move to GPT, but honestly I rarely ask GPT for anything unless it's a tailored question I know chatgpt would answer well.

  • @pif5023
    @pif5023 3 หลายเดือนก่อน +3

    I think the Twitch chat version had more active players than concord. You can try to sell it for 100mil$!

  • @prateekm1995
    @prateekm1995 3 หลายเดือนก่อน +1

    Thats a thumbnail and a half !! Good job flip . never take it out.

  • @philipbanks8067
    @philipbanks8067 3 หลายเดือนก่อน

    prime is doing Sports Center for AI vs AI

  • @adotinthecosmos
    @adotinthecosmos 3 หลายเดือนก่อน +1

    Is this open sourced?

  • @Iswimandrun
    @Iswimandrun 3 หลายเดือนก่อน

    Random number generator powered by a wall of lava lamps in a web feed yea that could replace me

  • @Blackilykat
    @Blackilykat 3 หลายเดือนก่อน +1

    Article
    DELETE ME DELETE ME
    Guest
    DELETE ME DELETE ME

  • @smmb4818
    @smmb4818 3 หลายเดือนก่อน +1

    13:00 No Flip please stop!

  • @rawallon
    @rawallon 3 หลายเดือนก่อน

    Tell me you can yap without telling me you can yap

  • @studentofnlp
    @studentofnlp 3 หลายเดือนก่อน

    Can u go throguht Aws bedrock???

  • @losbopfos5637
    @losbopfos5637 3 หลายเดือนก่อน +6

    DELETE ME DELETE ME

    • @W0lfCL
      @W0lfCL 3 หลายเดือนก่อน

      Didn't know that you're an article or description

  • @Sancarn
    @Sancarn 3 หลายเดือนก่อน

    Would be cool to see others like llama3 too

  • @screamour
    @screamour 3 หลายเดือนก่อน

    chatgpt != skynet confirmed

  • @Miginyon
    @Miginyon 3 หลายเดือนก่อน

    Claude resubmits the entire previous chat into the llm so gonna rinse your tokens. Also means longer running games Claude should lose

  • @kiboo1212
    @kiboo1212 3 หลายเดือนก่อน

    Can we actually see them play ???

  • @Iswimandrun
    @Iswimandrun 3 หลายเดือนก่อน

    What AI beats what AI at defending ASCII towers.

  • @sir_no_name1478
    @sir_no_name1478 3 หลายเดือนก่อน

    For exactly this usecase you do can use gpt. It is literally the best thing it can code xD.

  • @erenyeager655
    @erenyeager655 3 หลายเดือนก่อน +1

    hillarious 😆

  • @user-pt1kj5uw3b
    @user-pt1kj5uw3b 3 หลายเดือนก่อน

    Ima be real I have no idea how this game works

  • @DrInnappropriate
    @DrInnappropriate 3 หลายเดือนก่อน

    tons of steps to just read the output. Spend a few minutes and format it in the code. Your future self will thank you

  • @KillianTwew
    @KillianTwew 3 หลายเดือนก่อน

    I do not know the leglity of this, but if Im allowed to share my Anthropic account we could get you some more tokens

  • @Archsage
    @Archsage 3 หลายเดือนก่อน

    Influencagen LOL sounds like Influenza

  • @KillianTwew
    @KillianTwew 3 หลายเดือนก่อน

    Anthropic specifically says, "the longer your context window, the less prompts you can use". That mean if you send a single prompt of 1000 words, that'll eat more of your total tokens for that time frame than a single prompt with 40 words. If you could compress the data in your json youll expand your totals prompts

  • @maxave7448
    @maxave7448 3 หลายเดือนก่อน

    Todays fun fact: the spinning loading wheel icon is called a throbber! Have fun knowing that for the rest of your life

  • @crahs8
    @crahs8 3 หลายเดือนก่อน

    I have no clue what is going on in this game

  • @michealkinney6205
    @michealkinney6205 3 หลายเดือนก่อน

    #AgressiveAI is a much better name for OpenAI.

  • @The_1ntern3t
    @The_1ntern3t 3 หลายเดือนก่อน

    It's wild that it even produces semi-workable results. A few years ago, this would've been world news.

  • @perz1val
    @perz1val 3 หลายเดือนก่อน

    Mom cancel my basketball stream pacman broke obs again

  • @jnevercast
    @jnevercast 3 หลายเดือนก่อน

    OpenRouter will give you more Anthropic tokens (:

    • @jnevercast
      @jnevercast 3 หลายเดือนก่อน

      Anthropic also has a beta feature to prepare your system prompt and pay for it once. (Prompt caching)

  • @az8560
    @az8560 3 หลายเดือนก่อน

    Pythetic?

  • @TheLombudXa
    @TheLombudXa 3 หลายเดือนก่อน

    Damn dude, this looks like someone doing stuff 40 years ago. Is Linux still that far behind?

  • @claucmgpcstuf5103
    @claucmgpcstuf5103 3 หลายเดือนก่อน +1

    LOL ZOMIN ON THA MANLI thing yea .. lol .. ai is not yea generativ ey lol yea .. but it haz it uses is . but

  • @Kazz471
    @Kazz471 3 หลายเดือนก่อน

    Use Claude on AWS

  • @sebastianwapniarski2077
    @sebastianwapniarski2077 3 หลายเดือนก่อน +1

    I still don't get what this game is about.

  • @asdjzcx2619
    @asdjzcx2619 3 หลายเดือนก่อน

    If he learns python he will realize vim is not that good

  • @josipX
    @josipX 3 หลายเดือนก่อน +1

    why do the graphics suck

    • @CrYpt001
      @CrYpt001 3 หลายเดือนก่อน +2

      ASCII is cool as hell for programmers .

    • @josipX
      @josipX 3 หลายเดือนก่อน

      @@CrYpt001 yeah totally cool as a graphics engine

  • @sam.Ibrahem
    @sam.Ibrahem 3 หลายเดือนก่อน

    First ?

  • @__________________________8790
    @__________________________8790 3 หลายเดือนก่อน

    First

  • @plusone.network
    @plusone.network 3 หลายเดือนก่อน

    Give me money, money me, money now, me a money needing a lot now

  • @vmachacek
    @vmachacek 3 หลายเดือนก่อน

    this is super cool, keep your bearing, its a good stuff 🫡

  • @notapplicable7292
    @notapplicable7292 3 หลายเดือนก่อน +8

    DELETE ME DELETE ME

  • @sakurad49
    @sakurad49 3 หลายเดือนก่อน

    First

  • @mmmhorsesteaks
    @mmmhorsesteaks 3 หลายเดือนก่อน +2

    DELETE ME DELETE ME