Schritt für Schritt - Multiple lineare Regression in R rechnen und interpretieren

แชร์
ฝัง
  • เผยแพร่เมื่อ 14 ธ.ค. 2024

ความคิดเห็น • 150

  • @StatistikamPC_BjoernWalther
    @StatistikamPC_BjoernWalther  6 หลายเดือนก่อน

    📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]

  • @katharinatrachte512
    @katharinatrachte512 3 ปีที่แล้ว +24

    Vielen herzlichen Dank!!! Wünschte an der Uni würde das auch so gut erklärt! Wäre ziemlich aufgeschmissen gewesen ohne deine Videos

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Hallo Katharina, danke für dein Lob! Freut mich, wenn dir die Videos helfen. :-)
      Viel Erfolg weiterhin!
      Viele Grüße, Björn.

  • @sidneyno144
    @sidneyno144 4 ปีที่แล้ว +16

    Tausend Dank!
    Ich glaube mit dem Video hast du meine Seminararbeit gerettet!
    Sollte ich dich jemals treffen, hast ein Bier bei mir gut :D

  • @dominiktubben7266
    @dominiktubben7266 3 ปีที่แล้ว +11

    Ein komplexes Thema für alle Nichtstatistiker einfach erklärt. Vielen Dank 👍🏻

  • @ToutClan
    @ToutClan ปีที่แล้ว +3

    TÜV geprüfter Ehrenmann.

  • @Ri0m0
    @Ri0m0 4 ปีที่แล้ว +1

    Ich wollte mich mal fett bedanken :D Ich hab diese Woche meine Klausur in Statistik mit R wegen corona online geschrieben und dank dir konnte ich alles ausfüllen ^^ Dabei hab ich gaaaaarkeine Ahnung gehabt :D Rückblickend hat das sogar eigentlich spaß gemacht. Vielen dank für die hilfe ^^

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว +1

      Freut mich, wenn die Videos dir so sehr helfen konnten! Weitersagen hilft dem Kanal am meisten. :-)
      Viele Grüße, Björn.

  • @rafaelt.2635
    @rafaelt.2635 4 ปีที่แล้ว +2

    Vielen Dank für diese tiefgründige Erklärung. Du hast mir sehr geholfen!

  • @StatistikamPC_BjoernWalther
    @StatistikamPC_BjoernWalther  4 ปีที่แล้ว +1

    Bei Fragen und Anregungen zur multiplen linearen Regression und deren Interpretation in R nutzt bitte die Kommentarfunktion

    • @Kraeuterkeule
      @Kraeuterkeule 4 ปีที่แล้ว

      Hello hab mal ne Frage wie ist in dem Fall ein sehr niedriger R-squared wert von um die 7-8 % einzuschätzen ?
      Sieht dann so aus, als wenn mein Datensatz groß genug wäre die βi's genau zu schätzen, aber Ihre Kovariablen schlechte Arbeit beim Erklären und\oder Vorhersagen der Antwortwert leisten = ist dies bedenklich ?
      Auf eine Antwort würde ich mich freuen (;

  • @ВладимирЛев-щ1н
    @ВладимирЛев-щ1н 4 ปีที่แล้ว

    Kann mich nur anschließen! Mal wieder ein richtig gutes Video und die Erklärungen zur Interpretation sind super verständlich! Seitdem ich ihre Videos nutze, um R zu verstehen, macht mir das Arbeit damit Spaß! Mich würde, wie im anderen Kommentar bereits erwähnt wurde, interessieren, ob man bei unterschiedlichen Skalen mit verschiedenen Skalenniveaus standardisieren sollte, nicht nur für die Berechnung von multiplen Regressionen, sondern auch für andere Verfahren.
    🙂

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo, das muss man generell nicht tun. Die Interpretation von Koeffizienten ist ohne Probleme möglich. Lediglich in wenigen Ausnahmefällen ist es notwendig, z.B. um standardisierte Koeffizienten im Rahmen der Regression zu erhalten oder bei der Moderation eine sinnvollere Interpretation vornehmen zu können.
      Viele Grüße, Björn.

  • @serotragtmantel3982
    @serotragtmantel3982 2 ปีที่แล้ว

    Danke Danke Danke ! Ohne deine Videos wäre ich lost.

  • @fawazalizzy3446
    @fawazalizzy3446 3 ปีที่แล้ว +6

    Wir wollen dich als unseren Übungsleiter! Great videos! Viele Grüße von den TU Berlin Studenten.

  • @lanaschludi5466
    @lanaschludi5466 3 ปีที่แล้ว +5

    Sollte man die Annahmen einer linearen Regression (z.B. Multikollinearität, Heteroskedaszidität etc.) vor oder nach z-Standardisierung der Variablen prüfen oder spielt das keine Rolle? Vielen Dank für deine Videos!

  • @davila1906
    @davila1906 4 ปีที่แล้ว

    Vielen vielen Dank für die super Erklärungen und die Mühe. So deutlich und klar, einfach perfekt erklärt. Bitte mehr davon. Lg

  • @ballndkrump
    @ballndkrump 3 ปีที่แล้ว +1

    Danke! Hat mir sehr weitergeholfen! Super erklärt.

  • @marshallwaters996
    @marshallwaters996 3 ปีที่แล้ว +1

    Mega schon nach den ersten Minuten! Vielen Dank!!

  • @senor6909
    @senor6909 2 ปีที่แล้ว

    11:23 Wie interpretiert man die z-standardisierten Werte? Der niedrigere Wert im Estimate hat einen höheren Einfluss auf die unabhängige Variable?

  • @Strogames
    @Strogames 3 ปีที่แล้ว +1

    Super hilfreich! Besonders die kleinen Zusammenfassungen waren super :-)

  • @batearedfox1
    @batearedfox1 ปีที่แล้ว +1

    Phantastisch erklärt, dankeschön!

  • @Satoshi467
    @Satoshi467 3 ปีที่แล้ว +1

    Hallo Björn! Vielen Dank für diese super hilfreichen Videos...mir persönlich würde ein Video über die Pfadanalyse in R gerade extrem helfen da ich das bald in meiner Masterarbeit rechnen werde :) Viele Grüße!

  • @leaschuurmans4940
    @leaschuurmans4940 4 ปีที่แล้ว +3

    Tolles Video! Ich bin im Masterstudium nun zum ersten Mal mit R konfrontiert und als SPSS User war ich erstmal total überfordert. Aber mittlerweile finde ich total spannend, welche Möglichkeiten man mit R so hat. Toll, dass du dazu nun auch Video machst! Kommt zufällig demnächst was zu Mixed Effect Models in R? Das fände ich sehr spannend.

    • @leaschuurmans4940
      @leaschuurmans4940 4 ปีที่แล้ว

      Und SEMs mit Lavaan fände ich auch super interessant!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว +2

      Hallo Lea, freut mich, wenn du in R vorankommst. Mixed Modelle gehören nicht so wirklich zu meinem Lieblingsgebiet, eine kleine Einführung könnte -irgendwann- tatsächlich mal folgen. SEM finde ich persönlich ganz schrecklich und vermeide ich tunlichst. Ich verwende lieber gleich valide Skalen. ;-)

  • @dg.o.6515
    @dg.o.6515 4 ปีที่แล้ว +2

    Super Video. Das hat mir sehr weitergeholfen! Vielen Dank :)

  • @dandudas8543
    @dandudas8543 3 ปีที่แล้ว

    Bei der Minute 12:17 vergleichst du standardisierte Outputs von R und Spss. Warum gibt R ein Intecept von -1.5....aus währen in Spss kein Intercept ausgegeben wird? Danke!

  • @christiandrengk6214
    @christiandrengk6214 3 ปีที่แล้ว +2

    Hey, auch ich möchte mich einmal ganz ganz herzlich für deine Videos bedanken!
    Dann hätte ich die Frage, ob du mal etwas zu Strukturgleichungsmodellen in RStudio machen könntest. Das wäre wirklich klasse.

  • @MBison-oc5tc
    @MBison-oc5tc 3 ปีที่แล้ว +1

    dankeeeeee!!!!! bitte mehr von sowas!!!!!!!

  • @nguewouorachel6142
    @nguewouorachel6142 2 ปีที่แล้ว +1

    Danke sehr ,das war mir sehr hilfreich

  • @juliankuehn2721
    @juliankuehn2721 3 ปีที่แล้ว

    Was kann ich über die Erwartungstreue der Schätzer in diesem Modell sagen?

  • @tsumakana4185
    @tsumakana4185 2 ปีที่แล้ว

    Kurze Frage dazu, ich habe in meiner Abschlussarbeit Cluster meiner Datensätze gebildet gebildet, auch mit
    einigen (7) ausgeschlossenen Datensätzen. Wenn ich eine Variable habe,
    welche von allen teilnehmern (also auch die aus der cluster
    augeschlossenen) Datensätze hat, darf ich dann auch damit auch
    Korrelationen mit den Anfangsgebildeten Clustern betrachten oder muss ich
    dafür die ausgeschlossenen Datensätze auch aus der betreefenden Variable ausschließen?

  • @nils2527
    @nils2527 4 ปีที่แล้ว +3

    Super Video! wie immer ;)
    Kommt noch ein Video zur moderierten Regression in "R"? Ich wüsste gerne ob man bei einer moderierten Regression bei der man mit verschiedenen Skalenbereichen arbeitet z-standartisieren soll/muss? Bei einer einfachen linearen regression muss man das ja nicht oder?
    LG

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว +1

      Hallo Nils, danke für dein Lob!
      Nein, z-standardisieren muss man nicht. es wird aber empfohlen (Hayes, 2018) dies noch mal zu tun und zu rechnen, um die Effekte miteinander vergleichen zu können.
      Ein Video zur Moderation in R steht schon afu der Liste, der nächste Aufnahmezyklus ist aber noch ein bisschen hin.
      Viele Grüße, Björn.

  • @maxwelll1
    @maxwelll1 3 ปีที่แล้ว

    Wie sieht es denn aus wenn man mit korrelierten bzw. unkorrelierten Prädiktoren arbeiten muss? Gibt es da auch ein Video?

  • @makaveli_9457
    @makaveli_9457 ปีที่แล้ว

    Hallo Bjoern, ich habe viele relativ grosse Datensaetze, welche ich versuche mit dem biglm() paket zu handeln. Das Problem ist, wichtige Kennziffern wie R_squared und F Statistiken gibt mir dieses Paket gar nicht aus. Gibt es da eine Moeglichkeit dies zu umgehen?

  • @Juju-ju7uj
    @Juju-ju7uj 3 ปีที่แล้ว

    Wenn meine x Variablen die selbe Skala haben, kann ich dann anhand der hier gezeigten Werte erkennen, welche Variable einen größeren Einfluss hat?

  • @Pebo42
    @Pebo42 11 หลายเดือนก่อน

    Danke für die tolle Erklärung, ich hätte eine Frage: Ich habe das so Verstanden, dass das Multiple R-squared der Korrelationskoeffizient ist, allerdings bekomme ich, wenn ich cor(x,y) in RStudio eingebe einen anderen Wert raus. Woran liegt das?

  • @larasauer5032
    @larasauer5032 2 ปีที่แล้ว

    Gibt es so etwas wie eine „Maximalanzahl“ an Prädiktoren? Weil ich habe gehört, dass es zu „Overplotting“ kommen kann… Aber sobald ich eine unabhängige Variable entferne, wird das r-Quadrat kleiner… wäre sehr froh über einen kurzen Tipp!

  • @Doeniz1
    @Doeniz1 3 ปีที่แล้ว

    Auf der Folie ganz am Anfang von 0:06 bis 0:40 fehlt die glaube ich das Summenzeichen vor beta_n x_n.

  • @Sama-ui2re
    @Sama-ui2re 3 ปีที่แล้ว

    Sind gemischte lineare Regressionen und multiple lineare Regression das gleiche? Wenn nicht wo liegt dann der Unterschied und wie würde man gemischte lineare Regressionen in R berechnen?

  • @Schmiedemeister17
    @Schmiedemeister17 3 ปีที่แล้ว

    Hi! Vielen lieben Dank für das tolle Video. Ich bekomme als Fehlermeldung meiner Panel-Regresseion (plm) allerdings immer wieder:
    Fehler in solve.default(vcov(x)[names(coefs_wo_int), names(coefs_wo_int)], :
    System ist für den Rechner singulär: reziproke Konditionszahl = 8.32582e-22
    Meine abhängige Variable ist nicht binär.
    Kann es damit zusammenhängen, dass ein Teil meiner Variablen binär sind oder die Ausprägungen zu hoch sind?
    Lieben Dank im Voraus!

  • @frenchie9792
    @frenchie9792 3 ปีที่แล้ว

    Vielen Dank für das informative Video. :-) Ich habe gerade ein Modell erstellt und der adjusted R squared ist durch das Hinzufügen einer weiteren x-Variable unverändert geblieben. Sollte ich die Variable trotzdem im Modell behalten? Es gibt eine konzeptionelle Begründung, warum sie die y-Achse erklären könnte, aber kein "Signifikanz-Sternchen" in der entsprechenden Zeile des Summary. Vielen Dank im Voraus und VG :-)

  • @supermiimi
    @supermiimi 4 ปีที่แล้ว +1

    Hallo, eine Frage du hast gar nichts mehr zu dem Intercept gesagt? Ich verstehe das bei einer Aufgabe bei mir nicht, da geht es um Alter in Jahren (X) , Einkommen in Euro(Y) und Unternehmensgröße (Z). Das Intercept ist 907,8. Bedeutet das jetzt, dass man mit "0 Jahren 907,8 Euro verdient?"?

    • @punchline9131
      @punchline9131 3 ปีที่แล้ว

      Ja. Am besten das Alter aber mittelwert zentrieren. Dann wird die Interpretation auch sinnvoller.

  • @faith9828
    @faith9828 10 หลายเดือนก่อน

    Was sagt die F-Statistik hier genau aus? Ich habe es so gelernt, dass ein Nullmodell erstellt wird, wo geguckt wird, ob unser erstelltes Modell statistisch signifikant besser zu den Daten passt, als ein Modell (von der F-Statistik) welches nur aus dem Mittelwert der abhängigen Variable besteht. Ist das richtig?

  • @sportpferdecindygieshoidt5503
    @sportpferdecindygieshoidt5503 4 ปีที่แล้ว +1

    Sehr gute R videos! vielen Dank dafür!

  • @Bella-tm4dh
    @Bella-tm4dh 3 ปีที่แล้ว

    Eignet sich dieses Video auch für eine Mediation?

  • @Joschiiie
    @Joschiiie 3 ปีที่แล้ว

    Es gibt ja auch die Standardisierung nach Gelman 2008, bei der man auch binäre Variablen vergleichen kann. Ich habe diese in meiner Datenanalyse verwendet und dabei verändern sich die Vorzeichen der Koeffizienten. Wie kann ich das dann interpretieren. Z.b. der Plot lässt eine negative Korrelation vermuten. Die standardisierten Estimates sind aber positiv ... Hast du eine Idee? :)

  • @kathrindruke3070
    @kathrindruke3070 4 ปีที่แล้ว

    Danke für das Video. :-)
    Ich habe eine Frage zu der Interpretation.. bei meinen Daten kommen bei einer Variable einen positiven nicht signifikanten Wert raus, obwohl es sich eigentlich um eine negative Korrelation handelt. Wie interpretiere ich denn sowas? Bsp.: Affektives Commit und Fluktuation korrelieren negativ miteinander, in meiner multiplen Regression ist ß jedoch positiv.
    LG

  • @JC-lv1yn
    @JC-lv1yn 4 ปีที่แล้ว

    Hi Lieber Björn, ich möchte eine multiple Regression mit mehrer Kontrollvariablen aber einer Unabhängigen und einer Abhängigen Variable machen. Würde ich die Gleiche Funktion benutzen oder gibt es in R eine besser geeignete? Müsste ich dann auch z standardisieren?

  • @Klauskunze99
    @Klauskunze99 3 ปีที่แล้ว

    Hallo, du sagst, dass man in der ersten Regression den Einfluss nicht vergleichen kann, weil die Wertebereiche anders sind und möchtest sie über eine z-standardisierung vereinheitlichen. Angenommen die unabhängigen Variablen wären auf der selben Skala (bei mir von 1-7), könnte man sie dann vergleichen, oder ist es wichtig, dass die im Mittelwert 0 und die Standardabweichung 1 ist?

  • @apfelschorle5400
    @apfelschorle5400 ปีที่แล้ว

    vielen dank. das ist auch alles ganz neu für mich. bietet r auch die möglichkeit das ganze nett aufzubereiten, um es in die arbeit einzufügen? alle graphiken, die ich mir angeguckt habe waren für mich unverständlich....

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว +1

      Hallo, ja, man kann über RMarkdown arbeiten (etwas umständlich wenn man bei 0 anfängt) oder nutzt das Paket stargazer: th-cam.com/video/SQtQkVDl4xU/w-d-xo.html
      Viele Grüße, Björn.

  • @SarahFehrer
    @SarahFehrer ปีที่แล้ว

    Hallo Björn, danke für das super Video. Kannst Du mir verraten, ob man bei der multiplen Regression auch das Bootstrap- und Permutationsverfahren anwendet, um auf die Allgemeinheit zu schließen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว

      Hallo, nein, das ist nicht zwingend notwendig. Resampling wird meist bei Voraussetzungsverletzungen angewendet. Auf die Allgemeinheit kann man schließen, wenn die Stichprobe repräsentativ für die Grundgesamtheit/Allgemeinheit ist. Das ist im Vorfeld deskriptiv zu prüfen und meist ausreichend.
      Viele Grüße, Björn.

  • @montgomeryhartman476
    @montgomeryhartman476 4 ปีที่แล้ว

    Vielen Dank für die sehr informativen Videos!
    Aber kann mir vielleicht jemand einen Tipp geben, wie eine LR bei Einzelfallstudien funktioniert?
    Ich bin mir unsicher , ab welcher Anzahl von Probanden eine (M)LR überhaupt zulässig ist.
    Beispiel: 20 Probanden im AB Modell, Baseline: 8 Durchgänge, Intervention 36 Durchgänge.
    Frage: In wie weit hat die Anzahl der Kursteilnehmer einen Einfluss auf den Lernzuwachs (Effektstärke (Tau-U))?
    Geht das überhaupt? z.B. mit HPLM (scan) Wenn ja, wie?

  • @CeydaErtürk-i8y
    @CeydaErtürk-i8y ปีที่แล้ว

    Vielen Dank für das Video! Kurze Frage zur Interpretation: wenn der koeffizient bei der x positiv ist, heißt es steigt x, steigt auch y. Kann man das auch für den Umkehrschluss so interpretieren? Sinkt x, sinkt auch Y ?
    Vielen Dank!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว

      Hallo, exakt. Der Koeffizient gibt immer an, um wie viele EInheiten y steigt, wenn x um genau eine Einheit steigt. Das gute alte Steigungsdreieck ;-)
      Ist der Koeffizient von X1 = 3, steigt y um 3 Einheiten, wenn X1 um eine Einheit steigt. Umgekehrt, sinkt X1 um eine Einheit, fällt Y um 3 Einheiten.
      Viele Grüße, Björn.

  • @Heinz-JürgenHättig
    @Heinz-JürgenHättig ปีที่แล้ว

    Ich finde die Ausführungen zu Abischni(bbel) sehr aufschlussreich. Intelligenz ist einflussreicher als Motivation: der gute Wille allein nützt nichts.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว

      Dass es sich hier um fiktive Daten und keine empirisch gesicherten Erkenntnisse handelt, muss ich hoffentlich nicht explizit erwähnen.

    • @Heinz-JürgenHättig
      @Heinz-JürgenHättig ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Ich nehme aber an, dass den Simulationsdaten echte Populationsparameter zugrunde liegen. Wie kann man in R mehrere Variablen generieren, die miteinander korreliert sind und deren Stichprobenparameter festgelegt werden können? Das würde mich mal interessieren. Danke schon mal.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว

      Nein, der verwendete Datensatz ist ein simulierter Datensatz aus 2017, der von mir mittels Matlab erstellt wurde - die Parameter bzw. der Code zur Simulierung ist - sofern nicht schon gelöscht - auf meinem ehemaligen Uni-Server.
      Ein guter Blogbeitrag zum Thema: fredclavel.org/2019/04/17/simulating-correlated-multivariate-data/

    • @Heinz-JürgenHättig
      @Heinz-JürgenHättig ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Danke für den interessanten Blog-Betrag. Er ist zwar kein Lebensretter, aber bewahrt mich vor Selbstzweifel. Deine YTube-Beiträge sind mit die besten und Gott sei Dank nicht so weitschweifig wie zB asia-amerikanische Beiträge. Danke auch dafür.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว

      Danke für das Lob! Freut mich, wenn die Videos den Nerv treffen. Im englischen Bereich ist es wahrlich etwas schwierig, weshalb ich diese Nische auf einem anderen Kanal jetzt auch etwas bediene.

  • @odoluo7040
    @odoluo7040 3 ปีที่แล้ว

    Vielen Dank für das Video !
    Wie werden aber die P Werte für die einzelnen Koeffizienten im hintergrund berechnet ?
    Werden da alle Variablen bis auf eine "entfernt" bis eine einfache lin. Regression bleibt und schaut dann ob diese signifikant ist, oder funktioniert das anders?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว

      Hallo, das komplette Verfahren jetzt in einem Kommentar zu erklären, würde zu weit führen. Die Regression verwendet die kleineste Quadrate Methode und alle Koeffizienten werden gleichzeitig im Modell verwendet. Die Signifikanz ergibt sich zunächst aus den t-Werten und wird dann in den p-Wert umgerechnet.
      Viele Grüße, Björn.

  • @lavarnan272
    @lavarnan272 3 ปีที่แล้ว

    Hallo, ich wollte mir den Datensatz herunterladen aber ich habe im diesem Datensatz nicht die Variable Motivation gesehen.😕 ist das vielleicht der Datensatz von der Linearen Regression ?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Hallo Lavin, danke für deinen Hinweis. Ich habe den Datensatz erneut hochgeladen, diesmal mit Motivation.
      Viele Grüße, Björn.

  • @dertellerwascher6348
    @dertellerwascher6348 ปีที่แล้ว

    Wie würde ich es machen, wenn meine Daten nicht stationär sind? Soll ich die einfach vorher Differenzieren?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว

      Hallo, das klingt nach einer Zeitreihenanalyse, also Panelanalyse mit plm.
      Viele Grüße, Björn

  • @dandudas2254
    @dandudas2254 3 ปีที่แล้ว

    warum gibt mir der R Output nur 2 Zeilen für die Regressionskoeffizienten, selbst dann, wenn ich z.B. 4 unabhängige Variablen im Modell aufnehme?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว

      Hallo, jede UV sollte eine separate Zeile in der Koeffiziententabelle haben. Sind fehlende Fälle ausgeschlossen oder sind die Variablen keine Linearkombination anderer, Stichwort Dummies?
      Viele Grüße, Björn.

    • @dandudas8543
      @dandudas8543 3 ปีที่แล้ว +1

      @@StatistikamPC_BjoernWalther nee sorry, es lag an einer Klammer die ich vergessen hatte. Alles gut, und vielen vielen Dank, dass es dich gibt.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว

      @@dandudas8543 Top, gerne doch.

  • @Vanessa-vc7rx
    @Vanessa-vc7rx 3 ปีที่แล้ว

    Super Videos, danke :) Trotzdem hätte ich noch eine Frage, wenn ich die multiple Regression so eingebe wie du, erscheint jedes Mal:
    MultiBrazil

  • @nicolasneef3732
    @nicolasneef3732 3 ปีที่แล้ว

    Moin, kann ich auch statt zwei intervallskalierten Prädiktoren eine dummy-variable (z.B. 0 = männlich und 1 = weiblich) und eine intervallskaleirte Variable (z.B. Bearbeitungsdauer) rechnen? Lg

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว

      Hallo Niclas, klar, das ist überhaupt kein Problem. Du musst du lediglich darauf achten, was deine referenzkategorie ist und den Koeffizienten dementsprechend interpretieren.
      Viele Grüße, Björn.

  • @CundSS
    @CundSS 3 ปีที่แล้ว

    Kurze Frage: moderiert IQ somit dann den Notenschnitt? Dürfte man das dann so schreiben?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Nein, eine Moderation wurde hier nicht modelliert. Ein Moderator schwächt oder stärkt eine Beziehung zwischen x-Variable und y-Variable. Hier gibt es lediglich mehrere x-Variablen.
      Viele Grüße, Björn.

    • @CundSS
      @CundSS 3 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther lueben Dank für die schnelle Antwort. Wie modelliere ich in R denn Moderatoranalysen? Bin leider auf meiner Suche hierzu noch nicht fündig geworden

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      @@CundSS Interaktionsterme sind einfach das Produkt von x-Variablen. Z.B. IQ*Motivation.
      Demnächst kommt da auch ein Video zu.
      Viele Grüße, Björn.

  • @tomclaus7456
    @tomclaus7456 4 ปีที่แล้ว

    Hallo,
    vielen Dank für dein Video. Wie kann ich anhand des Outputs die Effektstärke (f) (cohens`d) ermitteln?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo Tom, d ist nur für Mittelwertvergleiche konzipiert. R-Quadrat wird bei Regressionen verwendet, welches man auch in f umwandeln kann (R-Quadrat/(1-R-Quadrat)).
      Viele Grüße, Björn.

  • @fabianfe8739
    @fabianfe8739 3 ปีที่แล้ว

    MEGA! Danke für deine tausenden hilfreichen Videos! Eine Frage: Wie muss ein nicht signifikanter p-Wert oben bei den einzelnen Koeffizienten interpretiert werden? Zwei stück von meinen fünf unabhängigen Variablen haben leider einen nicht signifikanten p-Wert. Model ist aber signifikant.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Hallo Fabian, gerne doch!
      Das ist nicht ungewöhnlich, das im Model Koeffizienten nicht signifikant sind. Die werden einfach nicht als Einflussfaktoren auf die abhängige Variable eingeordnet. Der Koeffizient wird demzufolge auch nicht interpretiert. Gründe gibt es dafür viele. Von es existiert einfach kein Zusammenhang in der Grundgesamtheit, den man in der Stichprobe auch nicht findet, über eine zu geringe Stichprobengröße, einen Stichprobenbias, eine nicht reliable/valide Messung usw. Viel Raum für Diskussion und Ausblick also. ;-)
      Viele Grüße, Björn.

    • @fabianfe8739
      @fabianfe8739 3 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Danke Björn! Wenn ich nun meine fünf UV (die fünf Sinne - sehen, hören, riechen, schmecken, fühlen) einzeln zu meiner AV berechne sind sie jedoch alle signifikant zusammenhängend. Als Gruppe fallen jedoch zwei aus dem Raster. Wie könnte man das interpretieren/ rechtfertigen?
      DANKE!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      @@fabianfe8739 Hallo Fabian, schau mal dazu hier: th-cam.com/video/VQKBEFHLw6g/w-d-xo.html&lc=UgwxQ2ciD2cqZCR6kVh4AaABAg
      Kurz aber nicht endgültig gesagt: die UV korrelieren auch untereinander, so dass Redundanzen auftreten, die sich dann in Nichtsignifikanzen äußern. Es können natürlich auch noch andere (inhaltliche) Gründe existieren.
      Viele Grüße, Björn.

    • @fabianfe8739
      @fabianfe8739 3 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Ohman - gar nicht gesehen. DANKE, genau wonach ich gesucht habe. Deine Videos und Erklärungen sind mit Abstand die besten, die es hier gibt. Danke dafür!

  • @ThisGoodLifeHope
    @ThisGoodLifeHope ปีที่แล้ว

    So finde ich in r den Stichprobenumfang?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  ปีที่แล้ว

      Hallo Suzy, schau dazu mal hier über GPower: th-cam.com/video/0pE0hRfyx1c/w-d-xo.html
      Viele Grüße, Björn.

  • @philippleeb2794
    @philippleeb2794 3 ปีที่แล้ว

    Danke für das Video!
    Wenn ich als Aufgabe habe von "s" auf "p" und "d", dann müsste ich also lm(s~d+p, data = dat) verwenden oder andersrum?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Hallo Philipp, so wie du es beschreibst, ist s die unabhängige Variable und p und d sind abhängige Variablen. In einer Regression kann es aber nur eine abhängige Variable geben. Deswegen vermute ich, dass du p und d auf s rechnen sollst. Dann wäre es so wie du es beschreibst richtig.
      Viele Grüße, Björn.

  • @JohannMeier-lm2jh
    @JohannMeier-lm2jh 2 ปีที่แล้ว

    Moin, ich habe meinen eigenen Datensatz und mein p-wert ist exakt gleich. Ist das ein krasser Zufall oder gibt es dafür eine Erklärung?

  • @akin65
    @akin65 4 ปีที่แล้ว

    Hallo Björn, danke für die ganzen Videos, sehr verständlich erklärt. Könntest du vielleicht ein Video hochladen mit den ganze Annahmen und wie man sie in R testet?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo und danke für dein Lob!
      Ein paar sind schon in dieser Playlist zu finden: th-cam.com/play/PLJ8d6dduOfrpBSBxM6YPPWYfHAaupaPEw.html
      Viele Grüße, Björn.

  • @Kraeuterkeule
    @Kraeuterkeule 4 ปีที่แล้ว

    Hello hab mal ne Frage wie ist in dem Fall ein sehr niedriger R-squared wert von um die 7-8 % einzuschätzen ?
    Sieht dann so aus, als wenn mein Datensatz groß genug wäre die βi's genau zu schätzen, aber Ihre Kovariablen schlechte Arbeit beim Erklären und\oder Vorhersagen der Antwortwert leisten = ist dies bedenklich ?
    Auf eine Antwort würde ich mich freuen (;

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo Tobias, niedrige R² deuten daraufhin, dass es für die Erklärung der AV noch geeignetere UV gibt/geben könnte. Ist der Datensatz groß genug, werden die Koeffizienten irgendwann automatisch signifikant, das R² gibt dir die mit der Modellgüte eine bessere Möglichkeit der Einschätzung.
      Viele Grüße, Björn.

  • @Strinanana
    @Strinanana 2 ปีที่แล้ว

    vielen Dank für das Video! bei mir ist es so, dass die unabhängige Variable im Nettomodell grösser geworden ist. diese müsste doch bei integration der störvariablen kleiner werden. wie kann das sein? danke!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 ปีที่แล้ว +1

      Hallo Nadja, der Koeffizient kann sich, ebenso wie der p-Wert vergrößern oder verkleinern. Was sich erhöhen sollte, ist die Varianzaufklärung der AV, was du aber an einem signifikanten Delta F siehst.
      Viele Grüße, Björn.

    • @Strinanana
      @Strinanana 2 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther danke dir!! :)

  • @melixy3545
    @melixy3545 4 ปีที่แล้ว

    Danke für das hilfreiche Video! Bei mir funktionieren die Befehle nicht. Welche packages brauche ich dafür?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo, welche Befehle funktionieren denn nicht?
      lm ist standardmäßig in R implementiert und sollte in jedem Fall gehen.
      Viele Grüße, Björn.

  • @mabi3212
    @mabi3212 4 ปีที่แล้ว

    Wäre das eigentliche eine Difference in differences (DID)??? Wenn nein, hast du dazu noch ein Video?
    Davon abgesehen, vielen Dank für deine Videos =)

  • @dominikbernard9939
    @dominikbernard9939 3 ปีที่แล้ว

    Hallo Björn,
    wie kann man die BLUE Annahmen in R überprüfen?
    P.S. deine Videos retten uns in der Abteilung (Customer Insights bei einem großen Konzern) häufig den Allerwertesten ;)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว

      Hallo Dominik, freut mich, wenn euch die Videos voranbringen. ;-)
      Die BLUE-Annahmen habe ich im wesentlichen in dieser Playlist zusammengefasst: th-cam.com/play/PLJ8d6dduOfrpBSBxM6YPPWYfHAaupaPEw.html
      Die Linearität könnte man per Streudiagramm (jede UV zu AV) prüfen. Das halte ich aber für unnötig, da mir bei nicht hinreichender Linearität der F-Test ohnehin um die Ohren fliegt.
      Endogenität als Korrelation von UV und Störterm ist theoretisch per Hausman-Test prüfbar, aber auch da sehe ich bei einer sauberen theoretisch-konzeptionellen Modellherleitung keine Notwendigkeit - Ursache für Endogenität ist nämlich fast immer das Weglassen von Variablen (omitted variable bias).
      Viele Grüße, Björn.

  • @fishermensfriendzzz9175
    @fishermensfriendzzz9175 4 ปีที่แล้ว

    Hallo, ich hätte eine allgemeine Frage: Ich habe eine abhängige Variable (ordinal) und mehrere unabhängige Variablen (sowohl nominal als auch metrisch). Kann ich die multiple Regression anwenden oder muss ich in dem Fall viele einzelne Regressionen machen und je nach Paarung der Skalenniveaus unterschiedliche Korrelationskoeffizienten berechnen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo Eric, eine ordinale Variable schreit normalerweise nach einer ordinalen Regression. Mitunter kann man argumentieren, dass die ordinale Variable quasimetrisch ist - gerne von Psychologen angewandt. An sich musst du bei mehreren AV auch mehrere Regressionen rechnen. Ob linear oder ordinal ist jedoch in deinem Fall individuell zu prüfen.
      Viele Grüße, Björn.

  • @punchline9131
    @punchline9131 3 ปีที่แล้ว

    Je mehr Variablen ich in mein Regressionsmodell übernehme, desto geringer wird das N im Modell, also die Anzahl der Personen, deren Werte für die Berechnung der Regression verwendet werden. Hat jemand hierfür eine Erklärung?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Hallo, das liegt an listenweise Ausschluss von Fällen bei fehlenden Werten. Du hast salopp gesagt wenige vollständige Beobachtungen.
      Viele Grüße, Björn.

    • @punchline9131
      @punchline9131 3 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Danke👍 mir ist es dann tatsächlich selbst noch eingefallen 😀

  • @user-vk5so2mc1c
    @user-vk5so2mc1c 2 ปีที่แล้ว

    wie rechne ich die e zahlen aus???????

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 ปีที่แล้ว

      Hallo, das ist die wissenschaftliche Schreibweise für Nachkommastellen. Rechnen muss man da nichts.
      Viele Grüße, Björn.

  • @jennofer
    @jennofer 4 ปีที่แล้ว

    Hallo, vielen Dank für das tolle Video! :-) Gibt es eine Möglichkeit, ein Übersteuern durch zu viele Variablen zu prüfen? Woher weiß ich, wann ich "zuviele" Variablen verwendet habe?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo Jennifer, das kann man pauschal nur so beantworten, das es so wenige UV wie möglich und so viele wie nötig sein sollten. Kritisch im statistischen Sinne wird es immer dann, wenn es mehr Variablen als Beobachtungen gibt. Eine grobe Richtlinie zur Stichprobengröße in Abhängigkeit der #UV beschreibe ich hier: th-cam.com/video/4kl9zb1fqQU/w-d-xo.html Ansonsten wäre eine Poweranalyse im Vorfeld natürlich auch nicht verkehrt. ;-)
      Generell gilt stets: jede Einflussvariable muss ja konzeptionell irgendwie hergeleitet werden.
      Viele Grüße, Björn.

    • @jennofer
      @jennofer 4 ปีที่แล้ว +1

      @@StatistikamPC_BjoernWalther Hallo Björn, vielen lieben dank für die Antwort. Das hilft mir auf jeden Fall weiter, Danke :-)

  • @ds221b
    @ds221b 4 ปีที่แล้ว

    Gibt es eine Möglichkeit meinen R Wert zu erhöhen? Genaueres Messen bringt mir leider nichts und sonst brauche ich vielleicht eine andere Regression?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว +2

      Hier muss ich ganz deutlich warnen. Das Ziel ist es nicht, mit irgendwelchen "Taschenspielertricks" einen bestimmten Wert zu erhöhen oder zu senken, sondern objektiv die erhaltenen Ergebnisse zu präsentieren. Die Ergebnisse sind wie sie sind. Wenn begründeter Verdacht besteht, dass die konzeptionelle Herleitung der Hypothesen überarbeitet werden sollte, dann kann dies Grundlage für die erneute Berechnung mit einem angepassten Modell sein, wo sich mitunter ein anderes Bestimmtheitsmaß zeigt.
      Ich gebe zusätzlich zu Bedenken, dass v.a. Stichprobenauswahl ein entscheidender Punkt ist. Wenn sich kein linearer Zusammenhang zeigt, würde das auch indirekt über die ANOVA ersichtlich. Dennoch sollte in der Diskussion ausführlich auf mögliche Gründe der geringen Varianzaufklärung eingegangen werden.
      Viele Grüße, Björn.

    • @ds221b
      @ds221b 4 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Du hast absolut Recht. Der Wert soll nicht verfälscht werden, aber ich suche eine Funktion bzw Zusammenhang der nicht so einfach abzubilden ist. Danke für die Antwort

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว +1

      @@ds221b Dann wäre evtl. eine zusätzliche (begründete) Aufnahme weiterer UV denkbar, ein anderes Sample oder eine nichtlineare Funktion. Allerdings ist letzteres schon alles andere als trivial, v.a. bei der Interpretation und erst recht bei der Begründung, dass es z.B. quadratisch o.ä. ist.
      Viele Grüße, Björn.

    • @ds221b
      @ds221b 4 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Ja, genau. Da muss ich mich dann einlesene und sehen wie ich das analysieren kann.

  • @lavarnan272
    @lavarnan272 3 ปีที่แล้ว

    wie kann ich diesen datensatz runterladen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว

      Hallo Lavin, der ist in der Videobeschreibung verlinkt.
      Viele Grüße, Björn.

    • @lavarnan272
      @lavarnan272 3 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther oh ja, aber auf diesem Datensatz sehe ich die Variable Motivation nicht 😕 ich glaube das ist der Datensatz von der Linearen Regression

  • @susanneheinen5269
    @susanneheinen5269 3 ปีที่แล้ว

    Huhu, ich hätte auch eine kurze Frage:) wenn ich eine Regressionsgleichung aufstelle, berücksichtige ich nur die ß die signifikante p-werte habe oder werden alle ß berücksichtigt?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Hallo Susanne, die Konstante interessiert dich nur bei Prognosen und da ist der p-Wert egal. Bei der Interpretation von Einflüssen ignoriert man die Konstante.
      Viele Grüße, Björn.

    • @susanneheinen5269
      @susanneheinen5269 3 ปีที่แล้ว

      Perfekt, ich danke dir! Bei der multiplen Regression nach der LMS Methode kann ich dann nur eine Prognose aufstellen, oder? Mehr Möglichkeiten hat man da nicht?

  • @Draxler2Punkt0
    @Draxler2Punkt0 4 ปีที่แล้ว

    Guten Tag, danke für das tolle Video!
    Ist es möglich die Y-Variable als Logarithmus zu schreiben, da meine Y-Variable eine Quote ist und ich den prozentuale Veränderung ausgeben haben möchte? Ich bekomme dann leider immer einen Fehler ausgegeben.
    Danke im Voraus!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo, gern geschehen.
      Wenn du bereits eine Quote hast, kannst du doch die Veränderung in Prozent direkt ablesen. Da braucht man nichts hin und her transformieren. Ist nur unnötige Arbeit und fehleranfällig.
      Viele Grüße, Björn.

  • @kytohd5542
    @kytohd5542 3 ปีที่แล้ว

    Super video! Darf man die scale Funktion auch bei Variablen verwenden, die als dummy kodiert sind, also bei 0 und 1? Das wäre extrem wichtig zu wissen :)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว +1

      Hallo und danke für dein Lob! Eine z-Standardisierung bei einer kategorialen Variable funktioniert nicht, da diese keinen Mittelwert und keine Standardabweichung haben.
      Viele Grüße, Björn.

    • @kilianjaehne8496
      @kilianjaehne8496 ปีที่แล้ว

      @@StatistikamPC_BjoernWalther Wichtige Info, habe ich fast falsch gemacht.

  • @hopelesscynic1584
    @hopelesscynic1584 4 ปีที่แล้ว

    Hi, super Video! Kann man auch testen, ob sich die Regressionskoeffizienten signifikant voneinder unterscheiden, also überprüfen, ob der größere Effekt auch signifikant größer ist? Und Gäbe es dafür auch eine Möglichkeit, das in SPSS umzusetzen? Bin für Hinweise dankbar. ;)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 ปีที่แล้ว

      Hallo, danke!
      Nein, so etwas kann man nicht untersuchen. Mit den standardisierten Koeffizienten kannst du allerdings sehen, welcher Koeffzient relativ betrachtet welche Einflussstärke hat.
      Viele Grüße, Björn.

  • @JenViva288
    @JenViva288 3 ปีที่แล้ว

    Super Video. Schade, dass es keins zur Moderator-/Mediatoranalyse in R von Ihnen gibt :(

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 ปีที่แล้ว

      Hallo Jen, das steht auf der Liste und wird in der nächsten Aufnahmesession auch dabei sein.
      Viele Grüße, Björn.

  • @PG-mu7mz
    @PG-mu7mz 3 ปีที่แล้ว

    Hallo,
    danke für deine tollen Videos, du hilfst mir aktuell sehr bei meiner Bachelor Arbeit.
    Ich möchte eine multiple lineare Regression machen in der ich aber nicht 2 Variableneinflüsse vergleichen sondern eher 2 Gruppen.
    In meinem Fall also z.B die drei Gruppen: Unternehmenswachstum~ Unternehmen die international stark aktiv sind, Unternehmen die international moderat aktiv sind, Unternehmen die international nicht aktiv sind.
    Dazu habe ich leider noch kein Video gefunden, ich hoffe mein Anliegen ist verständlich.
    Ich freue mich auf eine Rückmeldung

    • @PG-mu7mz
      @PG-mu7mz 3 ปีที่แล้ว

      warscheinlich ist es dann einfach Regression mit Dummys oder ?

  • @ThisGoodLifeHope
    @ThisGoodLifeHope ปีที่แล้ว +1

    ❤ merci

  • @Luki_-pq4uy
    @Luki_-pq4uy 3 ปีที่แล้ว +1

    dankeeee

  • @sophiehansen2023
    @sophiehansen2023 10 หลายเดือนก่อน +1

    👏

  • @denisneznanow2571
    @denisneznanow2571 3 ปีที่แล้ว

    top

  • @franziskahansel
    @franziskahansel 2 ปีที่แล้ว

    Hi lieber Björn! Du hilfst uns gerade echt sehr durch die Hausarbeit 😊 - Wir müssen dort mit Preisen arbeiten und bekommen deshalb einen sehr hohen MSE Wert. - Ist das normal, mit hoch meine ich 3208573682 - Obwohl das Modell mit einem Bestimmtheitsmaß von 0.6417 ausgegeben wird ;) - Pls send help !!!