Linearität als Regressionsvoraussetzung prüfen

แชร์
ฝัง
  • เผยแพร่เมื่อ 13 ธ.ค. 2024

ความคิดเห็น • 34

  • @romina3703
    @romina3703 3 ปีที่แล้ว +1

    Dieses Video ist sooo gut, vielen vielen Dank!

  • @annaasatryan4128
    @annaasatryan4128 2 ปีที่แล้ว +1

    Vielen Dank für das sehr hilfreiche Video. Eine Frage habe ich noch: Wenn zwischen einigen unabhängigen Variablen und der abhängigen Variable ein linearer Zusammenhang erkennbar ist, es aber auch unabhängige Variablen gibt bei denen gar kein Zusammenhang zur abhängigen Variable erkennbar ist, kann man trotzdem noch eine lineare Regression durchführen oder wäre das problematisch?

    • @RegorzStatistik
      @RegorzStatistik  2 ปีที่แล้ว +1

      Gar kein Zusammenhang (Streudiagramm einfach eine chaotische Punktwolke) ist kein Problem, dann wird der Prädiktor einfach nicht signifikant. Ein Problem wäre ein systematisch nicht-linearer Zusammenhang (u-förmig, umgekehrt u-förmig, gebogen).

    • @annaasatryan4128
      @annaasatryan4128 2 ปีที่แล้ว

      Herzlichen Dank für Ihre schnelle Antwort! Sie haben mir sehr weitergeholfen.

  • @aldoraine7848
    @aldoraine7848 2 ปีที่แล้ว +1

    Danke für das tolle Video!
    Ab welcher Anzahl an Daten ist die Anwendung des Lowess-Verfahrens sinnvoll?
    Gibt es hierzu Angaben in der Literatur?

    • @RegorzStatistik
      @RegorzStatistik  2 ปีที่แล้ว +1

      Ich kenne dazu keine Angaben. Wenn man für Zwecke der Linearitätsprüfung auf JASP zugreift, hat man die Option, für die Anpassungslinie auch noch ein Konfidenzintervall graphisch anzuzeigen, so dass man dann besser einschätzen kann, wie realistisch die Lowess-Linie ist. Für SPSS kenne ich da selbst jedoch keine Option.

    • @aldoraine7848
      @aldoraine7848 2 ปีที่แล้ว

      @@RegorzStatistik
      Okay, danke für die schnelle Antwort!

  • @jobu4832
    @jobu4832 3 ปีที่แล้ว +1

    Vielen Dank dafür! Die Linearität im Streudiagramm kann ich überprüfen, wenn ich eine UV und eine AV habe. Was ist nun aber, wenn ich mehrere Parameter habe? Dann geht ein Streudiagramm nicht mehr (bzw. nur ein 3-D). Man kann die Linearität durch Signifikanzen überprüfen, indem man die Parameter vorher quadriert. Können Sie dazu helfen? Vielen Dank für die Mühe!

    • @RegorzStatistik
      @RegorzStatistik  3 ปีที่แล้ว +1

      Wenn ich mehrere Prädiktoren habe, dann prüfe ich die Linearität, indem ich entweder für jede Prädiktor-Kriteriums-Kombination ein Streudiagramm aufrufe oder, bei SPSS, indem ich im Regressionsdialog bei den Diagrammen "partielle Regressionsdiagramme" anfordere, also bivariate Streudiagramme unter Auspartialisierung der anderen Prädiktoren.
      Im Prinzip könnte man natürlich auch einfach von der Annahme ausgehen, dass man einen quadratischen Zusammenhang hat, und das dann über eine polynomiale Regression prüfen. Wie man mit quadratischen Parametern die Regression durchführen kann, siehe hier:
      th-cam.com/video/qtqn-KJeK4w/w-d-xo.html
      Aber ich mache das nur, wenn ich in den Streudiagrammen zumindest erste Anzeichen für einen nicht-linearen Zusammenhang sehe.

    • @jobu4832
      @jobu4832 3 ปีที่แล้ว

      @@RegorzStatistik Jetzt hat es auch einen Namen bekommen :-) Ganz herzlichen Dank für die super schnelle Klärung und Hilfe!

  • @anja8301
    @anja8301 4 ปีที่แล้ว +1

    @Regorz Statistik. Ich habe eine Frage zur Überprüfung der Linearitätsannahme bei der Moderation. Ich hätte sie nur für der Zusammenhang von UV und AV geprüft aber nicht für den Moderator und die AV und nicht für dern Interaktionsterm und die AV ist das richtig oder muss ich das für die anderen 2 fälle auch prüfen. Vielen Dank für deine tollen Viedeos und deine Seite! Die waren mir bisher sehr hilfreich!

    • @RegorzStatistik
      @RegorzStatistik  4 ปีที่แล้ว +1

      Eigentlich ist es so, dass eine multiple Regression voraussetzt, dass es jeweils ein lineares Verhältnis zwischen einem Prädiktor und dem Kriterium gibt. Und in der moderierten Regression hat man (mindestens) drei Prädiktoren, UV, MOD und Interaktion.
      Insofern würde ich da tatsächlich für alle drei prüfen, ob sie in einem linearen Zusammenhang mit der AV stehen (Ausnahme bei einem dichotomen Moderator, da macht diese Prüfung für Moderator und Interaktion wenig Sinn, da man bei dichotomen Variablen die Linearität nicht so prüfen kann).

    • @anja8301
      @anja8301 4 ปีที่แล้ว

      @@RegorzStatistik Vielen Dank für deine super schnelle Antwort! Daran anschließend habe ich noch eine Frage zur praktischen Umsetzung. Das heißt ich prüfe das 3 mal mit Streudiagrammen oder kann ich das auch kombiniert prüfen?

    • @RegorzStatistik
      @RegorzStatistik  4 ปีที่แล้ว +1

      Ich prüfe es tatsächlich in so einem Fall lieber mit drei Streudiagrammen.

    • @anja8301
      @anja8301 4 ปีที่แล้ว

      @@RegorzStatistik Vielen, vielen Dank, Ich habe noch eine letzte Frage: ein wagerechter Strich im Streudiagramm bedeutet ja, dass kein Zusammenhang vorliegt. Aber ist kein Zusammenhang eine Verletzung der Linearität? In meinem Fall gibt es keinen Zusammenhang zwischen dem X und Y bei dem ich eigentlich einen Moderator nachweisen wollte. Und eine letzte Frage hat es einen Nachteil, wenn ich nur die Linerität der Residuen mit einem QQPlot prüfe?

    • @RegorzStatistik
      @RegorzStatistik  4 ปีที่แล้ว +1

      Kein Zusammenhang ist m.E. kein Problem, lediglich ein nicht-linearer Zusammenhang ist problematisch. Und QQPlot ist für diese Prüfung m.E. nicht geeignet.

  • @angelikadreiling4552
    @angelikadreiling4552 5 ปีที่แล้ว

    Vielen Dank für das Video. Wie muss die Lowess-Kurve denn im Residuendiagramm aussehen? Muss es da auch ein linearer Zusammenhang sein oder genauso wie bei der Heteroskedastizität gleichmäßig um Null verteilt?

    • @RegorzStatistik
      @RegorzStatistik  5 ปีที่แล้ว +1

      Im Residuendiagramm müsste die Lowess-Kurve bei Linearität eine horizontale Linie sein, es sollten die Residuen also überall gleichermaßen viel über und unter der Nulllinie liegen. (Es ist insofern nicht genau gleich wie bei der Homoskedastizität, da durchaus auch Heteroskedastizität als "liegender Trichter" gleichzeitig mit Linearität vorliegen kann.)
      In der Praxis sehe ich das - außer bei sehr großen Datensätzen und bei Skalen mit sehr vielen Items - aber so gut wie nie. Meistens finde ich mit Lowess eine chaotische Zick-Zack-Linie.
      Ein Problem zeigt die Kurve hingegen dann an, wenn es einen erkennbar gebogenen Verlauf gibt, wenn es also eine systematische (!) Abweichung von der Form einer horizontalen Linie gibt. Gute Beispiele dafür findet man bei Baltes-Götz auf S. 30-33
      www.uni-trier.de/fileadmin/urt/doku/linreg/linreg.pdf

    • @angelikadreiling4552
      @angelikadreiling4552 5 ปีที่แล้ว

      @@RegorzStatistik vielen Dank für die ausführliche Antwort.

  • @aldoraine7848
    @aldoraine7848 2 ปีที่แล้ว

    Ich habe nochmals eine Frage zu dem Lo(w)ess Verfahren:
    Wenn ich eine multiple Regressionsanalyse rechne - muss ich dann für jeden einzelnen Prädiktor einzeln testen, ob der Zusammenhang zwischen diesem und der AV linear ist?
    Und wenn einer dieser vielen Zusammenhänge nicht lineare ist, ist die Voraussetzung verletzt?

    • @RegorzStatistik
      @RegorzStatistik  2 ปีที่แล้ว

      Ja + Ja
      Wobei man bei einer Verletzung nur für einen Prädiktor auch lediglich für diesen Prädiktor eine Alternative finden muss (z.B. durch zusätzliche Aufnahme des Quadratterms dieses Prädiktors = polynomiale Regression, aber eben nur für diesen Prädiktor).

    • @aldoraine7848
      @aldoraine7848 2 ปีที่แล้ว

      @@RegorzStatistik Okay, dankeschön!

  • @inf3rnomajestic164
    @inf3rnomajestic164 2 ปีที่แล้ว

    Vielen Dank für das super Video!
    Es stellt sich für mich nur noch die Frage ob eine Regressionsanalyse auch bei einer Chaotischen Punktewolke durchgeführt werden kann (kein Zusammenhang erkennbar)?
    Ist das überhaupt dann noch sinnvoll?

    • @RegorzStatistik
      @RegorzStatistik  2 ปีที่แล้ว

      Im Regelfall wird das Ergebnis dann nicht signifikant sein. Allerdings traue ich hier dem Hypothesentests etwas mehr als meinem Augenschein - es ist durchaus denkbar, dass ein schwach signifikanter Zusammenhang existiert, den ich visuell nicht direkt wahrnehme. Insofern würde ich den Test trotzdem durchführen - mit wenig Hoffnung auf ein sign. Ergebnis.

    • @inf3rnomajestic164
      @inf3rnomajestic164 2 ปีที่แล้ว

      @@RegorzStatistik Super, vielen Dank für die ausführliche Antwort:)
      Gibt es dafür irgendeine Quelle die besagt, dass selbst bei einer chaotischen Punktewolke es Sinn machen kann eine Regression durchzuführen?
      Es ist immer nur von der Rede der Voraussetzung der Linearität vorhanden:(

    • @RegorzStatistik
      @RegorzStatistik  2 ปีที่แล้ว +1

      @@inf3rnomajestic164 Ich weiß da leider keine konkrete Quelle (vielleicht im Buch von Andy Field?) - da man normalerweise für elementare Standardverfahren wie die Regression keine Quellen nennen muss, habe ich da nie irgendwo bewusst nachgesehen.

  • @django2141
    @django2141 5 ปีที่แล้ว

    Danke für das superhilfreiche Video! Ich hätte eine Frage und zwar mache ich eine Mediationsanalyse und hab beim a-Pfad einen nicht-linearen, sondern quadratischen Zusammenhang gefunden (also zwischen Prädiktor und Mediator). Wenn ich jetzt den Prädiktor quadriere, passen ja die Zusammenhänge zu den Kriterien nicht mehr, hast du da vielleicht eine Idee, wie ich damit umgehen kann?

    • @RegorzStatistik
      @RegorzStatistik  5 ปีที่แล้ว

      Danke für das Feedback! Ich selbst bin noch nie in diese Situation mit nicht-linearer Mediation gekommen, aber es gibt dazu bereits Literatur, z.B. einen recht häufig zitierten Artikel von Hayes und Preacher (2010). "Quantifying and testing indirect effects in simple mediation models when the constituent paths are nonlinear." Multivariate behavioral research, 45(4), 627-660. Das hört sich vom Abstract so an, als wenn es auf deine Situation zutreffen könnte.
      Das dort genannte Makro "MEDCURVE" kann man wohl auch auf der Seite von Hayes herunterladen: afhayes.com/spss-sas-and-mplus-macros-and-code.html
      Aber wie gesagt, ich habe damit noch keinerlei praktische Erfahrung.

    • @django2141
      @django2141 5 ปีที่แล้ว +1

      @@RegorzStatistik Klingt super, ich schaus mir gleich mal an! Ganz ganz lieben Dank dir und noch einen schönen Sonntag:)

  • @bene5794
    @bene5794 4 ปีที่แล้ว +1

    Guten Tag,
    ich würde gerne quasi eine Moderatoranalyse mit 2 UA und 1 AV durchführen. In der Theorie ist bekannt, dass je größer UA1 (Zeit) ist, desto kleiner AV. Bei UA 2 (Moderator) nimmt man nur an, dass AV kleiner wird, wenn UA 2 steigt...
    Eine Voraussetzung der Moderatoranalyse ist die Linearität. Allerdings musste ich leider feststellen, dass überhaupt keine Linearität anhand der Daten vorliegt (Streudiagramm). Auch mit Transformieren kam ich zu keine guten Ergebnisse und frage mich nun was ich tun kann?
    Hätte jemand ein Tipp 😞? (Arbeite mit SPSS)

    • @RegorzStatistik
      @RegorzStatistik  4 ปีที่แล้ว

      Ist ein nicht-linearer Zusammenhang (z.B. u-förmig oder umgekehrt u-förmig) oder ist einfach gar kein Zusammenhang (diffuse Punktwolke)? Zweiteres wäre ja durchaus OK, wird dann ggf. nicht signifikant.

  • @mrs.unknown6098
    @mrs.unknown6098 ปีที่แล้ว

    Vielen lieben Dank! :)
    Ich habe eine hierarchische multiple Regression durchgeführt und bei mir kam leider keine Linearität heraus und laut Hebelwert gibt es auch Einflussausreißer.. alle anderen Voraussetzungen sind aber erfüllt! Mit welcher Begründung könnte man die Regression trotzdem durchführen?😅

    • @RegorzStatistik
      @RegorzStatistik  ปีที่แล้ว

      Wenn ein Zusammenhang nicht-linear ist, empfiehlt es sich, neben dem Prädiktor auch noch dessen Quadrat mit einzubeziehen (polynomiale Regression) .
      Wenn man einen nicht-linearen Zusammenhang als linear modelliert, riskiert man verzerrte Ergebnisse - da kenne ich leider keine Begründung, mit der man doch die normale Regression ohne Quadratterm rechtfertigen kann.