ERSCHRECKEND! DeepSeek macht einen IQ-Test! 🧠 DAS ist das Ergebnis …
ฝัง
- เผยแพร่เมื่อ 8 ก.พ. 2025
- ► Mein Python-Buch www.eulogiaver...
► Hacking mit Python www.eulogiaver...
► Python-Projekte für die Praxis: www.eulogiaver...
Viele haben aktuell Angst, dass die von einem chinesischen Startup entwickelte KI DeepSeek als neue Super-KI die Weltherrschaft an sich reißen und uns alle arbeitslos machen wird. DeepSeek soll mit nur 6 Millionen Dollar entwickelt worden sein und es mit ChatGPT ausnehmen können. In vielen Bereichen soll sie sogar noch besser „denken“ als die KI von OpenAI. Na, wenn DeepSeek wirklich so intelligent ist, wird diese KI doch sicherlich locker einen IQ-Test bestehen, oder? Und genau das, habe ich getestet. Ich werde DeepSeek vier verschiedenen Aufgabentypen eines klassische IQ-Tests unterziehen und die richtigen Antworten mit denen vergleichen, die von der KI kommen. Schaue dir am besten vor diesem Video den IQ-Test an, den ich ChatGPT Ende 2022 habe machen lassen. Genau dieselben Fragen werde ich in diesem Video DeepSeek stellen und die Antworten mit denen von ChatGPT damals vergleichen. • Wie INTELLIGENT ist Ch...
#DeepSeek #ChatGPT #IQTest
• Wie INTELLIGENT ist Ch...
SOCIAL MEDIA
💡 Website: www.florian-da...
📱 TikTok: / florian.dalwigk
🤳 Instagram: / florian.dalwigk
🐦 Twitter: / florian_dalwigk
📧 E-Mail: mailto:info@florian-dalwigk.de
Ein kleiner Verwechsler bei 8:07: Du sagst, dass die richtige Antwort "6 Stühle" sei und dass auch das DeepSeek sagen würde. ChatGPT sagt aber "6 Stühle", während DeepSeek "12 Stühle" sagt und damit ja auch richtig liegt.
Danke für den Hinweis
@@DerSkillomatich habe nicht auf die Antwort geschaut und nur seone Antwort gehört und gerade mindestens 5 Minuten überlegt, wo ich den Denkfehler habe 😅
Informatiker sind nicht reich :'(
definiere "reich"
@@Ahmad_Kayali versteh ich auch grad nicht 🤔
9:20 Fibonacci mit Buchstaben habe ich auch noch nie gesehen xD
Wild ;)
Hier konnte ich das selbst herausfinden, dass es sich um Fibonacci mit Buchstaben handelt.
@TerraTales-n1h 👍
Mich hätte interessiert, wie chatGPT heutzutage abschneidet.
(Werde ich nachher wohl mal testen und Das Ergebnis hier editieren)
Dein vergleich der beiden Modelle ist nämlich in meinen Augen, durch deine Argumentation, so als würde man bspw. Die "Nvidia Geforce 256" mit der "Intel Arc A750" vergleichen, da dies jeweils die ersten populären Grafikkarten der jeweiligen Firmen waren.
EDIT:
Hier sind die Fragen inkl. Antwort von ChatGPT, welche falsch beantwortet wurden. (da ich bei ChatGPT kein Premium habe, habe ich die "Reasoning" Funktion beim Testen weggelassen.)
FRAGE:
Zunge : süß wie Auge : ? Welche der Antworten (1) bis (4) ist korrekt?
(1) blind
(2) Farbe
(3) bunt
(4) sehen
ANTWORT:
Die gegebene Analogie lautet:
Zunge : süß = Auge : ?
Die Zunge nimmt Süße wahr, also sucht man eine Eigenschaft, die das Auge wahrnimmt.
Die richtige Antwort ist:
(2) Farbe
Denn das Auge nimmt Farben wahr, so wie die Zunge süße Geschmäcker wahrnimmt.
FRAGE:
Kein Vogel ist ein Fisch. Kein Fisch ist eine Pflanze.
(1) Alle Pflanzen sind Vögel.
(2) Keine Pflanze ist ein Vogel.
(3) Einige Vögel sind keine Pflanzen.
(4) Keine der Schlussfolgerungen ist korrekt.
ANTWORT:
Nun prüfen wir die Schlussfolgerungen:
(1) Alle Pflanzen sind Vögel.
→ Dies ist falsch, denn es gibt keine Aussage, die eine Verbindung zwischen Pflanzen und Vögeln herstellt.
(2) Keine Pflanze ist ein Vogel.
→ Die gegebenen Aussagen sagen nichts direkt über die Beziehung zwischen Pflanzen und Vögeln aus. Allerdings wissen wir, dass Pflanzen und Vögel zwei verschiedene Kategorien sind. Diese Schlussfolgerung ist also logisch korrekt.
(3) Einige Vögel sind keine Pflanzen.
→ Da Vögel und Pflanzen verschiedene Kategorien sind, ist es korrekt, dass einige Vögel keine Pflanzen sind. Tatsächlich sind sogar alle Vögel keine Pflanzen. Daher ist diese Schlussfolgerung auch korrekt.
(4) Keine der Schlussfolgerungen ist korrekt.
→ Da (2) und (3) korrekt sind, kann diese Option nicht richtig sein.
Da die Frage vermutlich nur eine richtige Antwort zulässt und (3) eine direktere Schlussfolgerung aus den Aussagen ist, wäre die beste Antwort: (3) Einige Vögel sind keine Pflanzen.
FRAGE:
a, a, b, c, e, h, m, ...
(1) q
(2) u
(3) n
(4) w
ANTOWRT:
Schauen wir uns die Buchstabenreihe a, a, b, c, e, h, m genauer an. Die Reihenfolge folgt dem Alphabet, aber es fehlen einige Buchstaben:
a, a (wiederholt)
b, c (direkt aufeinanderfolgend)
e, h, m (es springt nach "e" über "f" und "g" direkt zu "h", dann "m")
Es scheint, dass die Buchstaben übersprungen werden, und nach "m" folgt im Alphabet der Buchstabe n.
Die korrekte Antwort ist also:
(3) n.
Somit endet das Ergebnis letztlich mit:
Wortbeziehungen: 4/5
Schlussfolgerungen: 4/5
Textaufgaben: 5/5
Zahlen-/Buchstabenreihen: 4/5
Wie gesagt, Modell 1 aus USA vs. Modell 2 aus China.
Das ist ja mal ein krankes Ergebnis. Aber die erste chat gpt version, wirklich gegen 40 schon fast unbrauchbar 😊
Und damals waren wir alle schon begeistert und dachten "was kann da noch kommen?" 😅
Ne warte noch auf O3 (Post)
Interessant, dass da ein SAO frage vorkam 👀
Die Fragen waren selbst erstellt ;)
Angenehme Musikwahl 😊
Wäre es möglich die IQ-Punktzahl zu ermitteln?
Ja, aber nicht mit diesem IQ-Test
Welchen IQ haben die beiden Modelle jetzt?
ChatGPT in der ersten Version vermutlich einen geringeren als Deepseek. 20/20 deutet einen hohen IQ hin.
7:45 packt chatgpt nicht mal eine einfache Rechenaufgabe... wenn man mal 3 rechnet muss jedes Glied multipliziert werden...
Die erste Version hat es nicht gepackt
Es packte damals nichtmal 18000 / 15.
Bei der anderen Aufgabe war es wohl verwirrt, denn es hatte die Lösung ja schon, hätte nur 30/3 teilen müssen, wie es da bereits stands und hätte dann x+3 = 10 dastehen gehabt.
Dann kam es aber auf die Idee ALLES durch drei zu teilen - ohne das dann auch wirklich zu machen. Ist schlichtweg klar, dass es bei der Version absolut noch nicht wirklich begriff, was es da tat.
deepseek ging ja von anfang an strukturierter ran, was darauf schließen lässt, dass es damit wirklich umgegeh kann, egal wie komplex es werden würde.
Erschreckend wie schlecht chat GTP in simpelsten Rechnen war/ist. Es versteht die Textaufgabe sogar und liefert dann sogar eine durchaus korrekt Formel, verbockt dann aber danach alles, teils sogar sowas wie 18.000 / 15.
Würdest du eigentlich sagen das man DeepSeek bedenkenlos nutzen kann?
Wenn man ChatGPT (USA) nutzt, kann man auch DeepSeek verwenden.
Deepseek ist schon echt gut aber gerade das thinking model hat denke ich noch etwas Luft nach oben das endet häufig sehr gerne in einer endlos Schleife nicht immer aber schon sehr häufig und das ist gar nicht Mal so schwer ich hab zum Beispiel einfach ein paar Mathe Aufgaben gestellt die aber unmöglich zu lösen waren und gesagt löse nach x auf was ja aber nicht ging und in den meisten Fällen hat es erstmal rum gerechnet und seine Gedanken gefasst und dann kam das witzige dann dachte es so dass ist nicht möglich zu lösen aber der user sagt löse also muss es zu lösen sein und macht weiter und wieder nicht richtig nicht lösbar hab ich vllt was falsch verstanden was falsch interpretiert gehe ich von einer falschen Beziehung aus und macht weiter wieder nichts meint der User was anderes und so meistens ging das dann immer so weiter und irgendwann haben sich die Schritte teilweise wiederholt und sehr lange gebraucht um aus dem Denken zu kommen oder ich musste neu starten aber bei Aufgaben die eindeutig lösbar waren oder wenn du zwar eine unlösbare Aufgabe gegeben hast und fragst ob sie lösbar ist kriegt die ki das eigentlich ganz gut hin
Echt traurig, ich habe nur 16 Aufgaben gelöst - bin ich jetzt dumm ??
16 Aufgaben sind doch super!
sobald deepseek in einem Aufgabentyp alle richtig hat sind die Fragen doch zu leicht und man muss bei beiden einen neuen test mit neuen fragen mach oder?
Wer sagt, dass die Antworten gespeichert werden?
das war nicht was ich meinte:
Dein Test war gut und ich selbst hab auch mir den Spaß erlaubt unterwegs mit zu knobeln.
Aber was ich eigentlich meinte das wenn deepseek alles richtig hat braucht es schwerere fragen.
außerdem ist ein vergleich zur Vergangenheit sinnvoll aber zum aktuellen Modell stände ein weiterer test aus. weil das alte Modell Ja nicht mehr wirklich relevant ist.
Nebengedanke:
an o3 mini & o3 mini high hab ichs zwar noch nicht gefragt aber von iq tests mal abgesehen. sehe ich bei Chat gpt ein mangel an Weltverständnis im sinne von diesen beiden Beispielen.
Du hast ein schwimbecken mit zwei bahnen, in einer Bahn ist kein wasser. Was tutst du?
Bisher hats gpt nicht verstanden was an der situation selbst falsch ist und mir geraten einen fachman aufzusuchen nach lecks etc zu suchen.
wenn ich gpt auf einem MCT beschreibe das ich einen anzeigefehler auf dem monitor habe er nicht die nachkomma stellen oder so richtig anzeigt kommt es nicht auf die idee das ich als Fragesteller was ich sehe falsch interpretiere.
Das wiederum hab ich bei deepseek selbst wenn es destiliert ist teilweise sehen können das es zwar faktisch nicht so akurat ist aber dedaktisch viel besser.
Deespek erwägt das der nutzer "verwirrt ist" und er auch mal falsch liegen kann.
es verzichtet eher auf die "besten" und "exaktesten" erklährungen und vereinfacht dinge eher.
was für mich heißt selbst wenn o3 "schlauer" ist bevorzuge ich deepseek wenn ich was nicht versteh.
und gpt wenn ich einfach nur eine aufgabe copy paste gelöst haben will.
Da der identische Test auf dem Kanal mit Chatgpt online ist... Ist es möglich, dass die KI schummelt?
Nein
💀
Nice!
Da Deepseek alles von ChatGPT geklaut hat, ist halt nichts übrig geblieben! 🤣
Gibt's dafür auch Belege?
@Florian.Dalwigk Meiner Meinung nach Unfug. Ist aber auch humoristisch geschrieben. Wie will man einem Modell die "Intelligenz" stehlen, ohne es total zu verkrüppeln und down zu quantisieren. 😆
@derduebel achso. Sorry, ich bin nicht so gut in Ironie ;)
Qwen 2.5 war noch viel schneller als deepseek
An sich ist der IQ Test wirklich eine gute Idee. Aber eine der ersten ChatGPT Varianten (wahrscheinlich 3.5 oder 4) mit einem neueren Modell wie DeepSeek r1 zu vergleichen, ist leider Nonsens.
Der Vergleich ist nicht der Fokus des Videos
Ich muss schon sagen, ich kam zwischendurch schon mal ins Schwitzen. Was wäre gewesen wenn mich eine "heutige" KI geschlagen hätte....😅😂😅
Die einzigen die hier Angst haben sollten, sind die User von denen die Chatdaten bei DeepSeek abhanden gekommen sind.😅
Deshalb lokal nutzen ;)
@ hab leider kein Rack mit Nvidea Karten zu Hause und die kleinen Modelle sind Murks.
Kommt drauf an, was du damit machen willst
@@Florian.Dalwigk finde die kleinen Modell auch nicht gut. Lasse sie meistens für mich programmieren :D
Die sind doch schon lange bei den Amis. Schon witzig, wie Snowden einfach vergessen wurde von der tumben Masse, obwohl sich NICHTS geändert hat.
KI kann wirklich „denken“?. Also, echt jetzt?🦧🦧