첫강의 부터 차근차근 듣고 있습니다. 비전공자이지만 회사내 필요에 의해 혼자서 공부하고 있습니다. 책만 볼때는 전혀 이해안되었는데, 선생님 강의를 통해 많이 이해하고 갑니다. 감사합니다. 이번강의중 문의사항이 있는데요. 독립변수가 증가하면 자유도가 1씩 손실이 된다는데 이게 무슨 뜻인가요?
좋은 강의 너무 감사합니다 독립변수의 증가는 자유도 1 손실이라고 하셨는데 바로 앞강의에서 회귀분석에서 자유도는 1이라고 하셨잖아요그럼 자유도는 1-1=0 이 되는건 아닐텐데 대체 무슨 말인지 모르겠습니다 ㅜ 또 t test 를 처음배울때 자유도는 n-1 이라고 하셨잖아요 n이 표본의 개수인데 독립변수의 증가랑 자유도랑 대체 무슨 상관인지 모르겠습니다 ㅜ
글쎄요.... 특별한 기준이 있다기 보다는 누가 봐도 차이가 크다?? 이런 정도라고 보시는게 좋을것 같습니다. 사실 완벽한 기준은 없기때문입니다. 예컨데 0.2차이가 나면 안된다라고 하면 0.19는 되나요? 혹은 0.21은 안되나요? 이런식이 되거든요. 이건 어디까지나 연구자의 판단입니다만 상식선에서 보면 되지 않을까 생각됩니다.
네 ^^ 아주 애매한 문제이지요. 일단 가장 중요한 것은 모델이 합리적인가라는 부분입니다. 만약 기존의 이론과 실증연구 결과에 비추어 볼때 매우 중요한 변수가 모델에서 빠져있다면 R-square값에 관계없이 Model mis-specification문제에 빠진겁니다. 이럴경우 낮은 R-square는 이 문제의 결과이므로 심각한 문제가 됩니다. 그러나 과거에는 높은 R-square에 목숨을 걸었다면 요즘은 다소 다릅니다. 어떤 연구들은 낮은 R-square에도 불구하고 높게 평가 되기도 하지요. 마찮가지로 변수의 유의성은 물론 당연히 중요합니다만 어쩌면 더 중요한 것은 왜 유의한지 혹은 왜 유의하지 않은지에 대한 이론적 논리적 합리적인 설명입니다. 아무리 유의해도 설명이 안되는 혹은 논리적으로 말도 안되는 결과는 아무리 유의하고 R-square가 높아도 아무 소용없는 무가치한 결과 입니다. 사회과학연구적 접근에서는 그래서 통계값 이전에 이론과 논리 및 기존 연구를 바탕으로 하는 합리적인 가설이 중요하고 이 가설을 데이터분석 결과 통계적으로 뒷받침 하느냐 마느냐가 중요합니다. 다만 최근의 머신러닝 등의 빅데이터를 바탕으로 한 분석은 이론과 논리보다 결과적 정확성을 더 중요시합니다. 문제는 이러한 정확성을 Cross validation 이라고 하는데 이것은 R-square 와는 다르다보니 단순 R-square만으로는 판단이 어렵습니다.제가 드릴수 있는 조언은 하나의 값에 너무 집중하기 보다는 큰그림을 먼저 보시라고 권해드립니다 ^^ 도움이 되셨으면 좋겠네요 ^^
답변 잘 받아습니다. 더 첨언하자면 제가 검토한 데이터는 외기온도 및 습도 변화에 따른 건물의 냉방부하변화 예측을 알아보려고 약 5일 정도의 데이터를 얻었고 회귀분석을 한 결과값입니다. 추세선 기준으로 데이터가 넓게 퍼져있어 사용가치가 의심되어 전문가 의견을 듣고자 문의한 겁니다. 만약 사용가치가 있다면 온.습도 데이터를 토대로 건물부하량을 예측할 수 있을듯 합니다
@@9520006 사회과학 연구는 아니군요 ^^ 실험 데이터의 경우 실험연구의 조건에 보다 신경을 쓰시면 좋은 경우가 있습니다. 예컨데 ANOVA에서 Repeated measures ANOVA의 사용 같은 경우입니다. 저는 선생님의 분야를 잘 모릅니다만 데이터를 수집하는 조건의 다양성 자체가 별도의 중요한 변인일수도 있습니다. 부디 좋은 결과 있으시길 바랍니다 ^^
안녕하세요 궁금한 점이 있어 질문드려요. 종속변수가 0점에서 10점 사이의 점수를 매긴 데이터인데 이 데이터를 연속형 변수로도 볼 수 있다고 해서 회귀분석을 실시 해봤는데 독립변수가 많은데도 불구하고 R square가 0.3정도이고 adj.R square 도 비슷해요. 잔차도도 보면 직선 여러개가 일정한 간격으로 그려져 있는 모양(빗금을 그린 모양)이면 패턴이 있는 건가요...? 이 경우는 회귀분석을 하기에는 적합하지 않은 모델인가요?
친구 소개로 듣게 됐는데 여태 들어본 강의중 최고의 강의인것 같습니다. 도움이 많이 됐습니다 감사합니다!
감사합니다. 친구분께도 감사의 말씀 전해주세요 ^^
통계를 통해 논문을 쓰고자 하는 모든 초보 연구생들이 꼭 봐야 할 필수 동영상이네요. 너무 잘 만들어주셔서 공부하듯이 한강 씩 매일 보고 있어요. 매번 감사합니다.
감사합니다 ^^ 추가적인 컨텐츠로 또 찾아뵙겠습니다
강의 볼때마다 감탄하고갑니다 ㅎㅎ
광고를 다 사회복지와 관련된 광고이네요. 이거 보면서 기부 신청했습니다. 좋은 일 하시네요
좋은강의
진짜 대학생인데 너무너무 강의 감사합니다. 통계학이 좀 재미있어졌어요. ㅎㅎ^^
회귀분석땜시 여기저기돌아다니는데 완전 😀 👍 😀 고맙습니다~~~구독좋아요 꾸욱!!!!
선생님 감사합니다 사랑합니다
좋은 영상 늘 감사합니다.
쩐다 진짜
너무 유익해요!
감사하고 또 감사합니다 ㅠ sse ssr sst 넘나 짱났는데 동그라미 그림으로 한방에 딱.. ㅠ.ㅠ
저도 잘 배웠습니다. 감사합니다^^
제가 더 감사하네요 ^^
ㅎㅎ 졸네요 시간이 지나도 명강의입니다
대학 강의를 듣다가, 잔차분석을 왜하는건지 설명은 없고 계산하는법만 알려주고 있어서 돌아버리는줄 알았습니다. 여기와서 답을 찾고 갑니다 ㅠ
1분쯤에 표준오차라고 쓰여있는데
표준편차라고 읽으시는데..
뭐가 맞나요?
목소리도 좋으시고 귀에 쏙쏙 들어오게 강의해주셔서 열심히 듣고있는데..
그래도 통계는 넘 어려운거 같아요
좋은 강의 감사합니다^^
^^ 죄송합니다 표준오차가 정확한 표현입니다 ^^ 제 눈과 입이 뭔가 잘못 된듯 합니다 ^^
@@SapientiaaDei 우와 답글도 달아주시다니 넘 감동이네요
팬입니다^^♥ 싸인도 받고싶을만큼요^^
정주행 하겠습니다!! 5회독!! 모르면 외워!!
👍👍
첫강의 부터 차근차근 듣고 있습니다. 비전공자이지만 회사내 필요에 의해 혼자서 공부하고 있습니다. 책만 볼때는 전혀 이해안되었는데, 선생님 강의를 통해 많이 이해하고 갑니다. 감사합니다.
이번강의중 문의사항이 있는데요. 독립변수가 증가하면 자유도가 1씩 손실이 된다는데 이게 무슨 뜻인가요?
저도 이 부분이 궁금하네요 ㅜ
통계적인 개념을 너무 잘 설명해주셔서 큰 도움이 되고있습니다
듣다가 한가지 여쭙고 싶은 것이 있어요
R2는 왜 하필 이런 기호로 표시하는 것인지요?
담주 시험인데,, 슨상님 머리 잠깐만 좀 빌려주세요~
저두요~~
좋은 강의 너무 감사합니다
독립변수의 증가는 자유도 1 손실이라고 하셨는데 바로 앞강의에서 회귀분석에서 자유도는 1이라고 하셨잖아요그럼 자유도는 1-1=0 이 되는건 아닐텐데 대체 무슨 말인지 모르겠습니다 ㅜ
또 t test 를 처음배울때 자유도는 n-1 이라고 하셨잖아요 n이 표본의 개수인데 독립변수의 증가랑 자유도랑 대체 무슨 상관인지 모르겠습니다 ㅜ
선생님~ 친절한 설명에 감사드려요... R스퀘어가 높을 때이지만 그 변수가 종속변수에 미치는 영향력이 낮을 경우도 있나요? 그렇다면 무슨 잘못이 있어서 그런건지 궁금합니다. 늘 건강하십시오!!^^
안녕하세요. 강의 잘들었습니다. 논문을 보던와중 Pseudo R square를 보게 되었는데 이건 무슨 의미 인가요?
항상 잘듣고 있습니다. 독립변수를 추가할때 자유도를 1잃게 되어 비용손실이라고 하셨는데, 잘 이해되지 않아서요ㅜ t-test에서 자유도가 커질수록 표준정규분포를 사용할 수 있다고 한것과 연결이 잘 되지 않아요ㅜ 설명 부탁드립니다ㅜㅜ
형님 r 스퀘어가 1퍼센트면 근데 통계적으로는 유의하다면 어떻게 해석해야하나요?
선생님 너무 잘 듣고 있는데 혹시 영상의 PPT 자료는 공유가 불가능한가요? 가끔 특정 부분이 생각이 안날때 다시 영상보기 보단 자료 보는게 더 빠를 것 같아서요
죄송합니다 지금은 PPT공유를 하짗않고 있습니다 ^^ 이해 부탁드립니다 ^^
@@SapientiaaDei 감사합니다 선생님!
t테스트와 R스퀘어로 회귀분석을 검정할 수 있을 것 같은데, 둘 중 하나만 봐도 될까요?? 두개가 비슷한 역할을 하는것 같은데..
독립변수가 2개인 고정효과 모형을 돌렸는데, 결정계수가 0.02이고 수정된 결정계수가 마이너스(-)로 나오네요. 그러면 무의미한 분석인거죠?
안녕하세요. 강의 감사히 잘 듣고있습니다.
R2와 Adj.R2가 크게 다르면 의미없는 독립변수를 많이 넣었다는 의미라고 배웠습니다.
여기서 크게 다르다는 기준을 어떻게 가져가야할 지 모르겠어서요..
보통 어느 정도 차이나야 의미가 없는 것으로 판단하시나요?
글쎄요.... 특별한 기준이 있다기 보다는 누가 봐도 차이가 크다?? 이런 정도라고 보시는게 좋을것 같습니다. 사실 완벽한 기준은 없기때문입니다. 예컨데 0.2차이가 나면 안된다라고 하면 0.19는 되나요? 혹은 0.21은 안되나요? 이런식이 되거든요. 이건 어디까지나 연구자의 판단입니다만 상식선에서 보면 되지 않을까 생각됩니다.
@@SapientiaaDei 빠른 답변 정말 감사드립니다! 통계는 알면 알수록 주관적인거 같아요...
@@조서영-g3q 계속 변화하고 발전한다고 보면 되지 아낳을까요??
통계초보입니다.
어떤 분산된 데이터의 R square 가 0.23 이고 독립변수는 유의한값이라고 하면 이들 데이터는 사용할가치가 있는 데이터인지 궁금합니다. 맥락없이 질문드려 죄송합니다^^
네 ^^ 아주 애매한 문제이지요. 일단 가장 중요한 것은 모델이 합리적인가라는 부분입니다. 만약 기존의 이론과 실증연구 결과에 비추어 볼때 매우 중요한 변수가 모델에서 빠져있다면 R-square값에 관계없이 Model mis-specification문제에 빠진겁니다. 이럴경우 낮은 R-square는 이 문제의 결과이므로 심각한 문제가 됩니다. 그러나 과거에는 높은 R-square에 목숨을 걸었다면 요즘은 다소 다릅니다. 어떤 연구들은 낮은 R-square에도 불구하고 높게 평가 되기도 하지요. 마찮가지로 변수의 유의성은 물론 당연히 중요합니다만 어쩌면 더 중요한 것은 왜 유의한지 혹은 왜 유의하지 않은지에 대한 이론적 논리적 합리적인 설명입니다. 아무리 유의해도 설명이 안되는 혹은 논리적으로 말도 안되는 결과는 아무리 유의하고 R-square가 높아도 아무 소용없는 무가치한 결과 입니다. 사회과학연구적 접근에서는 그래서 통계값 이전에 이론과 논리 및 기존 연구를 바탕으로 하는 합리적인 가설이 중요하고 이 가설을 데이터분석 결과 통계적으로 뒷받침 하느냐 마느냐가 중요합니다. 다만 최근의 머신러닝 등의 빅데이터를 바탕으로 한 분석은 이론과 논리보다 결과적 정확성을 더 중요시합니다. 문제는 이러한 정확성을 Cross validation 이라고 하는데 이것은 R-square 와는 다르다보니 단순 R-square만으로는 판단이 어렵습니다.제가 드릴수 있는 조언은 하나의 값에 너무 집중하기 보다는 큰그림을 먼저 보시라고 권해드립니다 ^^ 도움이 되셨으면 좋겠네요 ^^
답변 잘 받아습니다.
더 첨언하자면 제가 검토한 데이터는 외기온도 및 습도 변화에 따른 건물의 냉방부하변화 예측을 알아보려고 약 5일 정도의 데이터를 얻었고 회귀분석을 한 결과값입니다.
추세선 기준으로 데이터가 넓게 퍼져있어 사용가치가 의심되어 전문가 의견을 듣고자 문의한 겁니다. 만약 사용가치가 있다면 온.습도 데이터를 토대로 건물부하량을 예측할 수 있을듯 합니다
@@9520006 사회과학 연구는 아니군요 ^^ 실험 데이터의 경우 실험연구의 조건에 보다 신경을 쓰시면 좋은 경우가 있습니다. 예컨데 ANOVA에서 Repeated measures ANOVA의 사용 같은 경우입니다. 저는 선생님의 분야를 잘 모릅니다만 데이터를 수집하는 조건의 다양성 자체가 별도의 중요한 변인일수도 있습니다. 부디 좋은 결과 있으시길 바랍니다 ^^
답변 감사드립니다. 추후 궁금한 사항있으면 문의 드리겠습니다
안녕하세요 궁금한 점이 있어 질문드려요.
종속변수가 0점에서 10점 사이의 점수를 매긴 데이터인데 이 데이터를 연속형 변수로도 볼 수 있다고 해서 회귀분석을 실시 해봤는데 독립변수가 많은데도 불구하고 R square가 0.3정도이고 adj.R square 도 비슷해요. 잔차도도 보면 직선 여러개가 일정한 간격으로 그려져 있는 모양(빗금을 그린 모양)이면 패턴이 있는 건가요...? 이 경우는 회귀분석을 하기에는 적합하지 않은 모델인가요?