단순회귀분석과 다중회귀분석에 사용한 독립변수가 동일한데, 실상 다중회귀분석의 경우 독립변수간에 독립성이 있어야 하잖아요. 예를 들어 household wealth 와 floor material 의 경우는 잘살면 바닥재를 좋은 걸 쓰는 것처럼 두 변수가 상당히 비슷해 독립적이지 않은데요. 이 경우 지도교수님 왈 '다중 회귀분석에서는 둘 중 하나의 변수만 넣어서 분석을 해야 한다'고 합니다. 근데 어떻게 다중회귀분석과 단순회귀분석의 변수가 동일할 수 있을까요? 제가 참고하고 있는 논문도 대표님이 말씀하신 것처럼 단순/다중 같은 변수를 분석했거든요. 그리고 변수들의 독립성 검정은 어디서 할 수 있나요?
안녕하세요. household wealth 와 floor material의 경우 이론적 구분, 연구자 의도, 분석 상황 등에 따라 둘 다 넣을수도 있을 것이고, 하나만 넣을수도 있을 것입니다 '잘 살면 일반적으로 고급 바닥재를 쓰지'고 생각할 수도 있지만, '잘 산다고 모두가 고급 바닥재를 쓰진 않을거야'라고 생각할 수도 있을 것입니다. 전자로 생각한 연구자는 둘 중 하나만 쓰겠지만, 후자로 생각한 연구자는 둘 모두 사용할 것입니다 혹은 이런 것을 확실히 고려하지 않았더라도 실제 통계분석을 진행하였을 때 상관분석에서 두 변수 간의 상관이 너무 높거나, 회귀분석에서 공선성 통계량이 좋지 않게 나타난다면 둘 중 하나만 사용하게 될 것입니다 이러한 상황에 의해 단순회귀분석에서 사용한 독립변수 중 일부가 다중회귀분석에서 최종적으로는 쓰이지 않는 상황이 존재합니다
변수들의 독립성은 상관관계를 살펴보거나, 회귀분석의 공선성 통계량을 검토하시면 됩니다 다만 회귀분석의 독립성 가정이란 오차(또는 잔차)의 독립성을 말하는 것으로 변수들 간에 꼭 독립적이어야 할 필요는 없습니다 애초에 통제변수를 투입하는 행위나 매개효과를 분석하는 행위 등은 독립변수들 간의 상관을 이용한 분석방법입니다 이 때문에 위의 household wealth 와 floor material의 예시를 분석할 때에 개인적인 의견을 말씀드리면..둘은 개념적으로 확연히 구분이 되며, 통계적 관련성이 클 것이 우려되는 상황이므로 이를 확인해보고, 통계적으로 상관이 너무 크지 않으면(다중공선성 문제가 없다면) 둘 모두를 투입해야 할 것입니다 만약 단순회귀분석에서 둘 모두 유의하였다고 가정할때, 다중회귀분석에서 둘 모두 유의하다면 애초에 연구에서 하나를 배제할 필요가 없었던 것이고, 다중회귀분석에서 하나만 유의하다면 해당 변수가 종속변수와 더 직접적인 관련이 있는 것입니다
좋은 질문 감사합니다.^^ 질문하신 것 처럼 상관관계 계수가 높은 것(유의성이 높은 것)만 추려서 다중회귀분석을 돌릴수도 있고 회귀식을 만들수도 있습니다. 그러나 본 강의의 사례에서는 본인이 유의미할 것으로 예측한 변수가 단순회귀분석과 다중회귀분석의 결과가 다를 때의 사례를 설명하였기 때문에 Sam 님이 생각하신 방법으로는 해결이 어려울 수 있습니다. 그리고 연구자가 통계결과를 내기전에 설계단계에서 선정한 독립변수를 일부만 분석에 사용할 때는 그렇게 분석하는 이유가 분명하게(합리적 근거- 대부분 이론적 근거) 있어야 하는데 상관관계가 높다는 통계분석결과에 근거한 분석은 심사자를 납득시키기 어려울 수 있습니다. 보고서의 경우는 충분히 해볼 수 있는 시도 입니다. 다만 논문은 근거가 더 명확히( 이론적배경) 제시되어야 하므로 논문에 넣기 어려울 수 있습니다. 도움이 되셨길 바랍니다.
이런 질문을 올려주신거가 너무 도움이되네요 이런게 진짜 막상할때 궁금했거든요
단순회귀분석과 다중회귀분석에 사용한 독립변수가 동일한데, 실상 다중회귀분석의 경우 독립변수간에 독립성이 있어야 하잖아요. 예를 들어 household wealth 와 floor material 의 경우는 잘살면 바닥재를 좋은 걸 쓰는 것처럼 두 변수가 상당히 비슷해 독립적이지 않은데요. 이 경우 지도교수님 왈 '다중 회귀분석에서는 둘 중 하나의 변수만 넣어서 분석을 해야 한다'고 합니다. 근데 어떻게 다중회귀분석과 단순회귀분석의 변수가 동일할 수 있을까요? 제가 참고하고 있는 논문도 대표님이 말씀하신 것처럼 단순/다중 같은 변수를 분석했거든요. 그리고 변수들의 독립성 검정은 어디서 할 수 있나요?
안녕하세요. household wealth 와 floor material의 경우 이론적 구분, 연구자 의도, 분석 상황 등에 따라 둘 다 넣을수도 있을 것이고, 하나만 넣을수도 있을 것입니다
'잘 살면 일반적으로 고급 바닥재를 쓰지'고 생각할 수도 있지만, '잘 산다고 모두가 고급 바닥재를 쓰진 않을거야'라고 생각할 수도 있을 것입니다. 전자로 생각한 연구자는 둘 중 하나만 쓰겠지만, 후자로 생각한 연구자는 둘 모두 사용할 것입니다
혹은 이런 것을 확실히 고려하지 않았더라도 실제 통계분석을 진행하였을 때 상관분석에서 두 변수 간의 상관이 너무 높거나, 회귀분석에서 공선성 통계량이 좋지 않게 나타난다면 둘 중 하나만 사용하게 될 것입니다
이러한 상황에 의해 단순회귀분석에서 사용한 독립변수 중 일부가 다중회귀분석에서 최종적으로는 쓰이지 않는 상황이 존재합니다
변수들의 독립성은 상관관계를 살펴보거나, 회귀분석의 공선성 통계량을 검토하시면 됩니다
다만 회귀분석의 독립성 가정이란 오차(또는 잔차)의 독립성을 말하는 것으로 변수들 간에 꼭 독립적이어야 할 필요는 없습니다
애초에 통제변수를 투입하는 행위나 매개효과를 분석하는 행위 등은 독립변수들 간의 상관을 이용한 분석방법입니다
이 때문에 위의 household wealth 와 floor material의 예시를 분석할 때에 개인적인 의견을 말씀드리면..둘은 개념적으로 확연히 구분이 되며, 통계적 관련성이 클 것이 우려되는 상황이므로 이를 확인해보고, 통계적으로 상관이 너무 크지 않으면(다중공선성 문제가 없다면) 둘 모두를 투입해야 할 것입니다
만약 단순회귀분석에서 둘 모두 유의하였다고 가정할때, 다중회귀분석에서 둘 모두 유의하다면 애초에 연구에서 하나를 배제할 필요가 없었던 것이고, 다중회귀분석에서 하나만 유의하다면 해당 변수가 종속변수와 더 직접적인 관련이 있는 것입니다
@@드림셀파 아~ 정말 속 시원한 답변 주셔서 너무 감사합니다. 이제 밥을 먹어도 소화가 될 것 같아요
독립변수 간에 상관성이 너무 높아서 다중공선성이 발생하였습니다 그런데 이론상으로 도출한 것들이라 ㅠㅠ상관표를 제시하고 나서 독립변수 간 상관성이 높아 단순회귀를 하고자 한다..라고해도될까요?ㅠ변수를 합치거나 뺄수가 없거든요 이론으로 도출한 변수들이라서요
잘 들었습니다. 도움이 많이 됐어요. 그러면 독립변수 중에 유의성이 높은 것만 추스려서 다중회귀분석을 다시 돌리는 것도 가능하지 않나요? 9:00에 요인 3, 5, 7 만 갖고 분석을 한 뒤 회귀식을 만들면 되지 않나요?
좋은 질문 감사합니다.^^
질문하신 것 처럼 상관관계 계수가 높은 것(유의성이 높은 것)만 추려서 다중회귀분석을 돌릴수도 있고 회귀식을 만들수도 있습니다.
그러나 본 강의의 사례에서는 본인이 유의미할 것으로 예측한 변수가 단순회귀분석과 다중회귀분석의 결과가 다를 때의 사례를 설명하였기 때문에 Sam 님이 생각하신 방법으로는 해결이 어려울 수 있습니다.
그리고 연구자가 통계결과를 내기전에 설계단계에서 선정한 독립변수를 일부만 분석에 사용할 때는 그렇게 분석하는 이유가 분명하게(합리적 근거- 대부분 이론적 근거) 있어야 하는데 상관관계가 높다는 통계분석결과에 근거한 분석은 심사자를 납득시키기 어려울 수 있습니다.
보고서의 경우는 충분히 해볼 수 있는 시도 입니다. 다만 논문은 근거가 더 명확히( 이론적배경) 제시되어야 하므로 논문에 넣기 어려울 수 있습니다.
도움이 되셨길 바랍니다.