Genau das Video, nach dem ich gesucht habe. Schöner Aufbau von Anfang an, Erklärung der verschiedenen Variablen und Formeln, als auch die Herleitung dieser. Tausend Dank! :)
Tolles Video, danke dafür! Könnte man eine multiple lineare Regression dann auch nutzen um einen Verlauf zum Beispiel zu bemessen? Also vor einem Eingriff wurden Patienten zum Beispiel zu ihren Schmerzen befragt und danach. Dann interessiert mich ja vor allem ob meine Prädiktoren wie Alter, Geschlecht, Vorerkrankung usw mit einer Abnahme (oder Zunahme) der Schmerzen assoziiert sind. Könnte man dann einfach die Differenz der Mittelwerte als abhängige Variable einsetzen? Und zweite Frage wenn die Schmerzen vor der OP nicht normalverteilt sind, aber die Differenz zwischen den Mittelwerten (was man dann ja untersuchen will) schon, kann ich die Analyse durchführen, oder? Und zuletzt was wäre denn die Alternative, wenn meine Daten die Voraussetzungen nicht erfüllen? Gibt es dann überhaupt eine alternative Analyse, die man dann nutzen könnte um Prädiktoren zu suchen?
Hallo, danke für dein feedback! 1) Ja eine Regression kann man dann verwenden: die Differenz zwischen vorher und nachher ist die abhängige und du möchtest wissen welchen Einfluss die anderen Variablen darauf haben. 2) Deine abhängige Variable ist dann ja normalverteilt! Du musst natürlich auch die anderen Bedingungen Prüfen, vor allem das der Fehler Epsilon normalverteilt ist! 3) Da gibt es verschiedene Möglichkeiten, oft geht man den Weg, dass man die Ränge anstatt der wahren Werte nimmt.
Noch einmal eine kurze Frage: Ich habe sehr, sehr viele (sicherlich über 50 oder mehr) unabhängige Variabeln, die ich testen möchte. Anfangs erschienen einige davon auch signifikant, aber als ich dann mehr und mehr von ihnen eingepflegt habe, lief zum einen DataTab immer langsamer und zum anderen ging dann die Signifikanz von praktisch jeder unabhängigen Variablen verloren. Gibt es da eine Lösung? Kann man vorher die Variablen einzeln in einfachen linearen Regressionen testen und dann für die multiple lineare Regression nur noch die Variablen nehmen, die in der einfachen linearen Regression statistisch signifikant waren oder ist das dann falsch? Vielen herzlichen Dank!
Hallo Stefanie, wenn es möglich ist, kannst du mir ja deine Daten einmal schicken, dann werfe ich einen Blick rein (mathias.jesussek.datatab.de)! Mit zu vielen unabhängigen Variablen muss man immer ein wenig vorsichtig sein! Das r Quadrat wird immer größer und natürlich kann es sein, dass Variablen "ähnlich" sind und dann der Regressionskoeffizient nicht mehr so groß ist. Am besten man schaut auf die standardisierten Regressionskoeffizienten und nimmt nur die Variablen mit den größten Werten und schaut wie sich das r Quadrat ändert, wenn man eine Variable entfernt. 50 Variablen sind natürlich recht viel! Dementsprechend viele Fälle muss es auch geben! Ich hoffe das hat geholfen!
@@datatab Hallo Mathias! Vielen Dank für die Antwort und das Angebot. Ich muss die Tabelle etwas in Ordnung bringen, bevor jemand anders damit etwas anfangen kann, aber dann melde ich mich gern!
Für alle die Statistik einfach verstehen möchten, unser Buch ist draußen: datatab.de/statistik-buch 🙂
Genau das Video, nach dem ich gesucht habe. Schöner Aufbau von Anfang an, Erklärung der verschiedenen Variablen und Formeln, als auch die Herleitung dieser. Tausend Dank! :)
Einfach spitze, Ihre Videos! Vielen Dank :)
Great effort and explaine and hope add more topic in forecasting technique
Many thanks!!! I will put it on my to do list!
Tolles Video, danke dafür! Könnte man eine multiple lineare Regression dann auch nutzen um einen Verlauf zum Beispiel zu bemessen? Also vor einem Eingriff wurden Patienten zum Beispiel zu ihren Schmerzen befragt und danach. Dann interessiert mich ja vor allem ob meine Prädiktoren wie Alter, Geschlecht, Vorerkrankung usw mit einer Abnahme (oder Zunahme) der Schmerzen assoziiert sind. Könnte man dann einfach die Differenz der Mittelwerte als abhängige Variable einsetzen?
Und zweite Frage wenn die Schmerzen vor der OP nicht normalverteilt sind, aber die Differenz zwischen den Mittelwerten (was man dann ja untersuchen will) schon, kann ich die Analyse durchführen, oder?
Und zuletzt was wäre denn die Alternative, wenn meine Daten die Voraussetzungen nicht erfüllen? Gibt es dann überhaupt eine alternative Analyse, die man dann nutzen könnte um Prädiktoren zu suchen?
Hallo, danke für dein feedback!
1)
Ja eine Regression kann man dann verwenden: die Differenz zwischen vorher und nachher ist die abhängige und du möchtest wissen welchen Einfluss die anderen Variablen darauf haben.
2)
Deine abhängige Variable ist dann ja normalverteilt! Du musst natürlich auch die anderen Bedingungen Prüfen, vor allem das der Fehler Epsilon normalverteilt ist!
3)
Da gibt es verschiedene Möglichkeiten, oft geht man den Weg, dass man die Ränge anstatt der wahren Werte nimmt.
Noch einmal eine kurze Frage: Ich habe sehr, sehr viele (sicherlich über 50 oder mehr) unabhängige Variabeln, die ich testen möchte. Anfangs erschienen einige davon auch signifikant, aber als ich dann mehr und mehr von ihnen eingepflegt habe, lief zum einen DataTab immer langsamer und zum anderen ging dann die Signifikanz von praktisch jeder unabhängigen Variablen verloren. Gibt es da eine Lösung? Kann man vorher die Variablen einzeln in einfachen linearen Regressionen testen und dann für die multiple lineare Regression nur noch die Variablen nehmen, die in der einfachen linearen Regression statistisch signifikant waren oder ist das dann falsch? Vielen herzlichen Dank!
Hallo Stefanie, wenn es möglich ist, kannst du mir ja deine Daten einmal schicken, dann werfe ich einen Blick rein (mathias.jesussek.datatab.de)! Mit zu vielen unabhängigen Variablen muss man immer ein wenig vorsichtig sein! Das r Quadrat wird immer größer und natürlich kann es sein, dass Variablen "ähnlich" sind und dann der Regressionskoeffizient nicht mehr so groß ist. Am besten man schaut auf die standardisierten Regressionskoeffizienten und nimmt nur die Variablen mit den größten Werten und schaut wie sich das r Quadrat ändert, wenn man eine Variable entfernt. 50 Variablen sind natürlich recht viel! Dementsprechend viele Fälle muss es auch geben! Ich hoffe das hat geholfen!
@@datatab Hallo Mathias! Vielen Dank für die Antwort und das Angebot. Ich muss die Tabelle etwas in Ordnung bringen, bevor jemand anders damit etwas anfangen kann, aber dann melde ich mich gern!