엑셀에서 회귀분석을 실행하면 회귀모형의 설명력을 나타내는 결정계수가 나옵니다. 이 결정계수는 파이썬에서 R2(R제곱)으로 표시됩니다. 제가 영상에서 이 결정계수를 회귀계수라고 표현했는데 잘못된 표현입니다. 회귀계수는 단순 회귀모형 y=ax + b 과 같은 경우 'a'에 해당하는 부분을 회귀계수라 합니다. 지금껏 제가 잘못 표현하고 있었습니다. 여기 아래 어느 댓글에서 구독자 한 분께서 지적해주셨는데, 제가 간과하고 있었습니다. 죄송합니다.
엑셀 초보자로서 강의 내용이 아주 깔끔하고 이해하기 정말 쉬웠습니다. 다만 제가 스스로 데이타를 가지고 회귀분석을 하려니 만만치 않습니다. 즉 Y축 값 입력시에는 별 문제가 없는데 X축 값을 입력하려면 "LINEST함수가 에러값을 반환했습니다. 입력범위를 다시한번 확인하십시오" 라는 문구가 뜨며 더이상 진행이 안됩니다. 또 혹시나 해서 데이타를 행방향으로 배열해서 시도 하면 X축 값 입력시 열 갯수가 16개를 넘을 수 없다는 경고 메시지가 나옵니다. 몇번을 반복해 보아도 마찬가지입니다. 제가 무엇을 잘못 했을까요? 참고로 데이터 배열을 열 방향으로 했을 때 행 갯수는 2056개 정도 입니다. 혹시 이 댓글을 보시게 되면 답변 부탁드립니다.
@@엑셀디자인 아 그렇군요 빠른 답변 정말 감사합니다^^ 그런데 제가 이영상을 보고 바로 회귀분석 실습을 해보았는데요, 여러모로 유명한 에빙하우스의 망각곡선 자료를 가지고 알려주신 방법대로 회귀분석을 하였더니 유의한 F의 값이 0.160364875789757이 나왔습니다. 회귀계수가 0이 아니기 때문에 회귀분석이 데이터값을 반영을 한다고 하는게 맞나요? 그리고 동시에 0.05보다는 작지 않은 값이 나온걸 봤을 때 대립가설은 채택할 수 없는건가요?
안녕하세요 대학원 연구방법론 과제로 회귀분석을 해야하는데요 많은 도움을 받고 있습니다. 감사드립니다. 질문이 있습니다. 주제는 마음대로 할 수 있어서 저는 영화 머니볼에서 홈런이나 타율보다 출루율이 높은 선수에 가치는 두는 것을 보고 과연 그러한지 궁금해서 올해 메이져리그 30팀 정규시즌 승률을 종속변수로 두고, 팀 타점/홈런/출루율/타율 4가지를 독립변수로 하는 단순회귀분석을 해보았습니다. 타점: 상관계수(0.76), 조정된 결정계수(0.562), 유의한 F (p값) (0.000001) 홈런: 상관계수(0.71), 조정된 결정계수(0.482), 유의한 F (p값) (0.000013) 출루율: 상관계수(0.59), 조정된 결정계수(0.319), 유의한 F (p값) (0.000676) 타율: 상관계수(0.32), 조정된 결정계수(0.073), 유의한 F (p값) (0.080453) 댓글에 보니 조정된 결정계수가 0.6을 넘어야 유의하다고 하셨는데요 저의 경우에 4가지 모두 결정계수가 0.6에 못미치니 전부 유의하지 않아서 대립가설이 채택되지 못하고 전부 귀무가설로 결론나는지요? 아니면 p값에서 타율은 8%이상으로 5%를 넘어서 귀무가설이지만 나머지 타점/홈런/출루율은 조정된 결정계수가 0.6에는 못 미치나 p값이 5% 이하로 나와서 대립가설로 채택 될 수가 있는지요? 곧 Research Proposal을 제출해야하기에 급해서 이런 장문의 질문을 남기게 되네요 죄송합니다.
회귀분석 설명을 알기쉽게 설명해주셔서 진심으로 감사합니다. 한가지 궁금한 점이 있습니다. 1인당 소득(단위:만원)에 따른 쌀 소비량(KG), 밀가루 소비량(KG), 육류 소비량(KG) 데이터셋을 맞추고 회귀분석을 실행하려고 합니다. 1인당 소득이 종속변수가 되고, 나머지 쌀,밀가루,육류는 독립변수가 됩니다. 1인당 소득은 단위가 만원이라 데이터수치자체가 큽니다. 그대로 회귀분석을 진행해도 되나요? 아니면 단위를 변화시켜줘야 할까요?ㅠㅠ
안녕하세요 :) '만원'으로 절사된 채로 분석 진행하셔도 괜찮습니다. 검증을 위해 숫자0을 더 붙여서 '원' 단위로 분석 진행해 보세요. (raw data가 이미 절사된 채로 수집된 자료라면, 0을 더 붙이는게 크게 의미가 없습니다) 아마 같은 결과가 나올겁니다. 회귀식으로 보면 되겠지요. 혹시 다르게 나오면 댓글 달아주세요.
강의보고 궁금한게 있어서 글 남깁니다ㅜㅜ "결정계수 > 분산분석 P값(유의한F) > 독립변수 P값" 순으로 해석하셨는데 1. 만약 결정계수가 애초에 0.3보다 작으면 저 회귀분석 결과를 가져가는게 적합하지 않은걸까요?(뒤에껀 볼 것도 없이) 2. 결정계수가 낮은데도, 다른 수치는 0.05 미만으로 나오기도 하나요? 3. 반대로 결정계수가 높은데, 독립변수 P값이 0.05가 넘을 수도 있나요? 4. P값이 정해지는 기준이, 독립변수 데이터들이 종속변화를 잘 설명하는 정도로 결정되는건가요? 아니면 독립변수 안에서의 데이터 일관성인가요?
반갑습니다:) 결정계수는 0~1 사이, 1에 가까울 수록 회귀모형의 설명력이 커집니다. 그러면 0에 가까울 수록 회귀모형이 데이터를 반영하는 비율이 떨어지겠지요. 그러면 결정계수가 어느 정도까지 유의하다고 봐야할까? 이 부분에서 학자들 별로 조금씩 차이는 있습니다만 보통 0.6 이상 정도로 보고 있습니다.
다시 아래에 정리해보겠습니다. 회귀분석에서 '결정계수' 가 회귀계수입니다. 다중회귀분석에서는 독립변수가 여러개이므로 '조정된 결정계수' 또한 살펴보고 보고서에 언급이 필요합니다. 회귀식은 Y = aX + b X : 독립변수 Y : 종복변수 a : 선의 기울기 b : 절편
그래프에서 0과 가까운 쪽이 좌상향이면 0과 먼 쪽은 자연스럽게 우하향의 직선이 그려지겠지요. 그러면 이것을 '음의 직선 상관관계에 있다' 라고 해석. 반대로 그래프의 0과 가까운 쪽이 좌하향이면 0과 먼쪽은 우상향의 직선이 그려지겠지요. 이것은 '양의 직선 상관관계에 있다' 라고 해석합니다. 주의할 점은 분포도를 보고 대강 시각적으로 상관관계 여부를 파악한 뒤, 그 다음 단계에서 상관분석을 통해 상관계수를 보고 정확히 파악해야 합니다. 분포도만 보고 '상관관계가 있다' 라고 해석해서는 안됩니다.
@@wkdeee 강하지는 않지만 두 변수가 어느 정도 상관관계는 있어 보입니다만.. 회귀계수는 얼마인가요? 지금 지정하신 독립변수 말고, 다른 변수로도 분석해보세요. 더 나아가서 다중회귀분석도 해보심이 좋을듯합니다. 회귀분석의 회귀식 확정여부는 다양한 변수를 가지고 분석 후 결론이 내리는 것이 좋습니다.
오래된 데이터셋입니다. 아래의 경로에서 유의미한 최신 자료를 다운로드 받아서 회귀분석을 해보세요. 예를 들면, '한국의 1인당 국민총소득에 따른 Co2 배출량을 예측' 하고자 하면 - 1인당 국민총소득: KOSIS > 국제통계 > 주제별 국제통계 > 국민계정 - 1인당 Co2 배출량: KOSIS > 국제통계 > 주제별 국제통계 > 환경
급하게 숙제하다가 좋은 영상이 있어서 질문 남깁니다. 제가 지금 학교에서 어느 특정한 지역의 1년 강수량 (독립변수는 month입니다) 데이타를 이용해서 그걸로 사인함수를 그리고, 자신이 세운 사인함수 식과 데이타가 얼마나 매치되는지 알아보기 위해 regression을 쓰라고 하십니다. 이렇게 사인함수의 regression을 구할 때에도 직선의 함수를 구하는게 옳은 방식인가요? 영상 정말 잘 봤습니다!!
반갑습니다 :D MS의 답변이 더 명확할겁니다. 아래의 링크를 참조해주세요. support.office.com/ko-kr/article/%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%97%90-%EA%B0%80%EC%9E%A5-%EC%A0%81%ED%95%A9-%ED%95%9C-%EC%B6%94%EC%84%B8%EC%84%A0-%EC%84%A0%ED%83%9D-1bb3c9e7-0280-45b5-9ab0-d0c93161daa8
프랜시스 골턴이라는 영국의 유전학자가 부모와 자녀 세대의 키의 관계를 연구했습니다. 부모의 키가 상당히 크거나 작으면 자녀들도 확 크거나 작아야 하는데 전체 키의 평균으로 돌아가려(회귀, regress)는 속성을 찾아내고 이를 회귀분석이라고 정의했고, 이 후 다른 학자가 회귀분석 이론을 수학적으로 정립해냈습니다. 주변에 부모님은 키가 별로 크지 않은데 자녀들이 키가 늘씬늘씬한 것을 보면 이 이론이 생각납니다 :)
한국데이터베이스진흥원에서 주최하는 자격증이군요. 처음 알았습니다. 잠깐 서치해보니 비전공자도 몇달간만 공부하면 가능하다고들 말하고 있네요. 제 이야기를 해드리면... 비전공자로 오래 전 정보처리기사 자격증을 취득하고 이쪽에서 쭈욱~ 강의와 개발을 진행해 오고 있습니다. 처음엔 엑셀 -> 데이터 자동화에 대한 니즈가 생겨 -> VBA 공부 -> 통계에 홀릭되서 2년간 통계학 독학 -> 통계, 가상분석으로 강의 범위 확장 -> 시각화에 대한 니즈가 생겨 -> 지금은 태블로(BI tool) 공부하면서 새로운 커리큘럼 개발 중. 어느 외국기업의 데이터 사이언스 프로세스를 예를 들면 Python으로 서버, 클라우드, DBMS 등에서 데이터를 가져다가 엑셀로 전환 -> 엑셀과 vba로 가공 -> QlikSense로 데이터 분석과 시각화 -> 보고서 생성. 아무튼 요즘 기업 내부적으로 '데이터 분석' 에 대한 니즈가 폭발적으로 늘어가고 있는 추세입니다. 시험만을 위한 공부가 아니라 실무에서 '양질의 데이터를 가져와서 > 가공 > 분석> 시각화'를 할 수 있는 실무 실력을 겸비하는 공부가 되길 바랍니다. 응원합니다!!!
@@kkk7549 제 전공, 나이는 오프라인 교육에서는 숨길 것 없이 다 깝니다만, 온라인에서는 조심하는 편입니다^^ 진로에 대해 고민이 많으신 듯합니다. 공부하면 공부가 늘고, 걱정하면 걱정이 늘더군요. 움직이면서 충돌과 융합을 통해 버릴건 버리고, 받아들일건 취하는게 좋지 않겠나...하는 제 개인적 생각입니다. 화이팅입니다🍀
엑셀에서 회귀분석을 실행하면 회귀모형의 설명력을 나타내는 결정계수가 나옵니다.
이 결정계수는 파이썬에서 R2(R제곱)으로 표시됩니다.
제가 영상에서 이 결정계수를 회귀계수라고 표현했는데 잘못된 표현입니다.
회귀계수는 단순 회귀모형 y=ax + b 과 같은 경우 'a'에 해당하는 부분을 회귀계수라 합니다.
지금껏 제가 잘못 표현하고 있었습니다.
여기 아래 어느 댓글에서 구독자 한 분께서 지적해주셨는데, 제가 간과하고 있었습니다.
죄송합니다.
진짜 지금까지 이렇게 쉬운설명은 없었습니다.
계속 들어도 너무 좋아요
고등학생 문과인데 어느 내용도 빠짐없이 이해가 됐어요 정말 잘가르치세요!!
확실히 알았어요. 감사합니다~~
유익해요 목소리 너무나긋나긋하시네요
감사합니다 ♡
이분이 제일 강의 꼼꼼하게 해주는듯하네요 ㅎㅎ 좋은 강의 감사합니다^^
제가 더 감사드려요 :D
제가 너무 좋아하는 이쁜 목소리를 갖고 계시네요. 영상 보는 내내 편안해서 좋았습니다. 유익한 영상 만들어주셔서 감사합니다. :)
ㅎ~~~~ 감사합니다😄🌷
하 진짜 너무 감사해요ㅠㅠ 이번 대학과제때문에 정말 막막했는데 모든 강의 깔끔하고 간단하게 정리해주셔서 전부 다 끝냈어요!!! 사랑해요ㅠㅠ
아이구~~ 애 많이 쓰셨습니다♡♡♡
선생님 너무 감사합니다~ 회귀분석 정말 어렵다고 생각했는데, 선생님 덕분에 정말 쉽게 배웠습니다. 감사합니다!
댓글 남겨주셔서 감사드립니다 :D
너무 좋은 컨텐츠를 찾았습니다.❤️
반갑습니다~~⚘
선생님 정말로 감사합니다. 저희 교수님과 똑같이 설명하시는데, 더 좋았습니다.
이해하기도 편하고요. 감사합니다.
고맙습니다 :D
교수님이 전공자이시고 전문가이시므로
교수님의 분석을 기준으로 삼으셔요.
저의 설명은 보조적 수단으로 :)
와 자세한 설명 정말 감사합니다 ^^
선형 회귀분석 정말궁금했는데..
비전공자도 알수 있어서 최고입니다ㅎㅎ
감사합니다~~^^좋은 분석 잘 배우고 갑니다~~^^구독.좋아요 누르고 갑니다~~^^
감사합니다 ~~^^
이번주 행운이 함께하시길 기원드립니다 ~~^^
좋은 강의 감사합니다. 다중 회귀 분석에 대해서도 알려주시면 감사하겠습니다!
방금 다중회귀분석 영상 올렸습니다.🤗
@@엑셀디자인 와우 너무 감사합니다!
정말 감사한 영상이네요 ^^ 우와 엑셀로도 이런 멋진 통계분석이 가능하군요
엑셀이 내장하고 있는 이 외의 검정, 통계분석들
모두 '통계학'에 바탕을 둔 모델입니다.
전문 통계분석 툴과 결과값을 비교해도 똑 같습니다.
알면 알수록 엑셀 정말 잘 만들었다는 생각이 듭니다.
또 계속 진화하고 있습니다. BI툴로써 말입니다.
엑셀디자인 올려주신 영상 본 후로 통계가 친근하게 다가와요 ☺️👍👍👍
좋은 강의 감사합니다!
저 또한 감사드립니다~~
선생님, 영상이 너무 유익하네요, 감사합니다
유익한 댓글, 고맙습니다 :)
좀 더 회귀분석에 대해 다뤄줬으면 좋겠어요^^ 정말 상세한 설명 감사해요
네, 그래 보겠습니다.
아름다운 봄 날 되세요~⚘
엑셀 초보자로서 강의 내용이 아주 깔끔하고 이해하기 정말 쉬웠습니다. 다만 제가 스스로 데이타를 가지고 회귀분석을 하려니 만만치 않습니다. 즉 Y축 값 입력시에는 별 문제가 없는데 X축 값을 입력하려면 "LINEST함수가 에러값을 반환했습니다. 입력범위를 다시한번 확인하십시오" 라는 문구가 뜨며 더이상 진행이 안됩니다. 또 혹시나 해서 데이타를 행방향으로 배열해서 시도 하면 X축 값 입력시 열 갯수가 16개를 넘을 수 없다는 경고 메시지가 나옵니다. 몇번을 반복해 보아도 마찬가지입니다. 제가 무엇을 잘못 했을까요?
참고로 데이터 배열을 열 방향으로 했을 때 행 갯수는 2056개 정도 입니다. 혹시 이 댓글을 보시게 되면 답변 부탁드립니다.
유료 온/오프라인 강의가 생긴다면 좋겠어요 👍👍
유익한 강의 감사합니다^^
댓글 감사드립니다 :D
이해하기 쉬운 설명 감사합니다 :)
댓글 감사합니다 :D
예시에서 전기소모량이 모두같을때는 어떻게 하죠? 전기소모량이 모두 100이다 라고 데이터가있으면...
잘봤습니다!!!!!!!
고맙습니다 :D
선생님.,독립변수나 종속변수의 값이 정규분포를 따르지 않으면 회귀분석을 돌려볼 필요가 없는건가요?
잘보고 갑니다 감사합니다 이해가 쏙쏙되네요.
자세하게 설명해주셔서 좋아요 ㅜㅜ 혹시 다중회귀분석에 대한 설명도 있는지 궁금하네요
메모해두겠습니다.
시간이 허락하는대로 영상 만들어 올릴께요.⚘
방금 다중회귀분석 영상 올렸습니다.😃
기업의 매출이나 영업이익을 입력한 후 주가도 ㅇㅖ측해볼수잇겟네요
네. 맞습니다.
조금 더 다양한 예측을 위해서는
엑셀의 가상분석의 하나인 '해찾기'를 병행해서 분석해보시면 좋겠습니다.
개발도구>엑셀 추가기능>해찾기.. 체크 후 > 데이터 메뉴의 우측 끝에 '해찾기' 위치.
너무나도 감사합니다! 대학 공부중인데 너무 좋은 설명 감사합니다. ANOVA 엑셀 분석도 혹시 영상 올려주실수 있으신가요?
네, 조만간 올려 보겠습니다 :)
영상 너무 감사합니다~~
반갑습니다~~💐
통계청 통계교육원 엑셀 강좌에서는 단순 회귀분석에서는 조정된 결정계수의 값이 의미가 없다고 하는데 이에 대해서 알려주실 수 있나요?
견해가 일치되지 않아서 저도 어렵습니다만,
단순: 결정계수
다중: 결정계수와 조정된 결정계수를 모두 언급해줘야 함이 맞는 것 같습니다.
@@엑셀디자인 아 그렇군요 빠른 답변 정말 감사합니다^^ 그런데 제가 이영상을 보고 바로 회귀분석 실습을 해보았는데요, 여러모로 유명한 에빙하우스의 망각곡선 자료를 가지고 알려주신 방법대로 회귀분석을 하였더니 유의한 F의 값이 0.160364875789757이 나왔습니다. 회귀계수가 0이 아니기 때문에 회귀분석이 데이터값을 반영을 한다고 하는게 맞나요? 그리고 동시에 0.05보다는 작지 않은 값이 나온걸 봤을 때 대립가설은 채택할 수 없는건가요?
잘 듣고 있습니당 ㅎㅎ
댓글 잘 보고 있습니다♡
귀중한 자료 정말 감사합니다. 스승님!
이런게 엑셀에서 구현될줄은 생각도 못했네요.
참고로 신뢰도 구간 95%를 설정했기 때문에 유의한 F값 즉 P값에 의한 귀무가설,대립가설 판단하는 기준이 5% 인거죠?
네네. 맞습니다.🤗👍
항상 많이 배웁니다. 그런데 혹시 데이터분석을 어떻게 여나요? 3:00 에 보시면 화면에 데이터로 가신다음 분석을 클릭하라고 하는데 제 엑셀에는 그런 표시가 없습니다. 답변 부탁드립니다.
그러게요..가르쳐주지도 않고 클릭하라고 하니 말입니다..ㅜ.ㅜ
데이터분석 02-1 영상을 살펴보세요.
여는 방법을 알려줍니다 :)
엑셀디자인 정말 죄송한데 그 영상에도 봤는데 화면이 짤려서 안 보이네요. 저는 데이터 텝에 아무리봐도 데이터 분석 버튼은 안보이네요..
제 엑셀에는 기본에 없어서 옵션창에서 추가기능으로 분석도구를 넣어야 할 거 같습니다.
안녕하세요 대학원 연구방법론 과제로 회귀분석을 해야하는데요 많은 도움을 받고 있습니다. 감사드립니다. 질문이 있습니다.
주제는 마음대로 할 수 있어서 저는 영화 머니볼에서 홈런이나 타율보다 출루율이 높은 선수에 가치는 두는 것을 보고 과연 그러한지 궁금해서
올해 메이져리그 30팀 정규시즌 승률을 종속변수로 두고, 팀 타점/홈런/출루율/타율 4가지를 독립변수로 하는 단순회귀분석을 해보았습니다.
타점: 상관계수(0.76), 조정된 결정계수(0.562), 유의한 F (p값) (0.000001)
홈런: 상관계수(0.71), 조정된 결정계수(0.482), 유의한 F (p값) (0.000013)
출루율: 상관계수(0.59), 조정된 결정계수(0.319), 유의한 F (p값) (0.000676)
타율: 상관계수(0.32), 조정된 결정계수(0.073), 유의한 F (p값) (0.080453)
댓글에 보니 조정된 결정계수가 0.6을 넘어야 유의하다고 하셨는데요
저의 경우에 4가지 모두 결정계수가 0.6에 못미치니 전부 유의하지 않아서 대립가설이 채택되지 못하고 전부 귀무가설로 결론나는지요?
아니면 p값에서 타율은 8%이상으로 5%를 넘어서 귀무가설이지만 나머지 타점/홈런/출루율은 조정된 결정계수가 0.6에는 못 미치나
p값이 5% 이하로 나와서 대립가설로 채택 될 수가 있는지요?
곧 Research Proposal을 제출해야하기에 급해서 이런 장문의 질문을 남기게 되네요 죄송합니다.
이분 학식이 뛰어나시네~
일반적으로 엑셀 잘한다는 사람보다도 걍 엑셀 자체 모든걸 다 다룰줄 아는 하람이시네~
어머나~~~~ 과찬이십니다.
위험한 시기, 건강하십시오~~♡
회귀분석 설명을 알기쉽게 설명해주셔서 진심으로 감사합니다. 한가지 궁금한 점이 있습니다. 1인당 소득(단위:만원)에 따른 쌀 소비량(KG), 밀가루 소비량(KG), 육류 소비량(KG) 데이터셋을 맞추고 회귀분석을 실행하려고 합니다. 1인당 소득이 종속변수가 되고, 나머지 쌀,밀가루,육류는 독립변수가 됩니다. 1인당 소득은 단위가 만원이라 데이터수치자체가 큽니다. 그대로 회귀분석을 진행해도 되나요? 아니면 단위를 변화시켜줘야 할까요?ㅠㅠ
안녕하세요 :)
'만원'으로 절사된 채로 분석 진행하셔도 괜찮습니다.
검증을 위해 숫자0을 더 붙여서 '원' 단위로 분석 진행해 보세요.
(raw data가 이미 절사된 채로 수집된 자료라면, 0을 더 붙이는게 크게 의미가 없습니다)
아마 같은 결과가 나올겁니다.
회귀식으로 보면 되겠지요.
혹시 다르게 나오면 댓글 달아주세요.
선생님, 더미처리하는 변수들의 경우도 열대로 값을 넣어주면 되는건지 궁금해요
엑셀 회귀분석 대화상자 내에서 더미변수로 변환해주는 옵션은 없으니
워크시트에서 범주형 변수를 더미변수로 바꿔서 입력한 후, 회귀분석 진행하시면 됩니다.
강의보고 궁금한게 있어서 글 남깁니다ㅜㅜ
"결정계수 > 분산분석 P값(유의한F) > 독립변수 P값" 순으로 해석하셨는데
1. 만약 결정계수가 애초에 0.3보다 작으면 저 회귀분석 결과를 가져가는게 적합하지 않은걸까요?(뒤에껀 볼 것도 없이)
2. 결정계수가 낮은데도, 다른 수치는 0.05 미만으로 나오기도 하나요?
3. 반대로 결정계수가 높은데, 독립변수 P값이 0.05가 넘을 수도 있나요?
4. P값이 정해지는 기준이, 독립변수 데이터들이 종속변화를 잘 설명하는 정도로 결정되는건가요? 아니면 독립변수 안에서의 데이터 일관성인가요?
sti.kostat.go.kr/coresti/site/edu/edu_ulearn/list.do?gmenu=3&rmenu=01&cmenu=010402
통계교육원에서 제공되는 무료 통계 관련교육입니다.
'엑셀로 배우는 통계분석'도 있습니다.
한 번 살펴보세요.
덕분에 통계를 잘 배우고 있습니다. 감사합니다.
질문이 하나 생겨 여쭈어봅니다.
회귀분석에서 결정계수가 어느 정도가 나와야지 유의한 관계성이 있다고 판단하나요?
(결정계수가 어느 정도 1에 가까워지면, 유의한 F값이 유의하다고 보면 될까요?)
반갑습니다:)
결정계수는 0~1 사이, 1에 가까울 수록 회귀모형의 설명력이 커집니다. 그러면 0에 가까울 수록 회귀모형이 데이터를 반영하는 비율이 떨어지겠지요. 그러면 결정계수가 어느 정도까지 유의하다고 봐야할까?
이 부분에서 학자들 별로 조금씩 차이는 있습니다만
보통 0.6 이상 정도로 보고 있습니다.
@@엑셀디자인 빠르고 친절한 설명감사드립니다.
영상에서 조정된 결정계수가 회귀계수라고 하셨고 그 값은 0.995059인데, 왜 회귀식(y=2x+10)의 회귀계수는 2로 나오죠?
다시 아래에 정리해보겠습니다.
회귀분석에서 '결정계수' 가 회귀계수입니다.
다중회귀분석에서는 독립변수가 여러개이므로
'조정된 결정계수' 또한 살펴보고 보고서에 언급이 필요합니다.
회귀식은 Y = aX + b
X : 독립변수
Y : 종복변수
a : 선의 기울기
b : 절편
선생님 다중회귀분석에서는 산포도와 추세선을 못그리나요? 혹시 그릴수 있다면 종속변수 수에 따라 추세선의 수도 늘어나는걸까요?
독립변수들과 종속변수들 범위를 선택 후 > 삽입 > 분산형 차트를 선택하면 됩니다.
추세선도 여러개가 나오겠지요.
하지만 무의미하지 않겠습니까?
안녕하세요 선생님
질문이있어 댓글남기게되었습니다.
산점도 분산형차트가 좌상향,우상향 데이터 상관관계가있다고하셨는데,
좌상향이면 음의상관관계가있고 우상향이면 상관관계가있는건가요?
만약 좌하향또는 우하향이면 어떤관계가있는건지 알려주실수있을까요??ㅜㅜ
또 하나는 회귀분석 할때 잔차표시하는이유도 알수있을까요?
그래프에서 0과 가까운 쪽이 좌상향이면
0과 먼 쪽은 자연스럽게 우하향의 직선이 그려지겠지요.
그러면 이것을 '음의 직선 상관관계에 있다' 라고 해석.
반대로
그래프의 0과 가까운 쪽이 좌하향이면
0과 먼쪽은 우상향의 직선이 그려지겠지요.
이것은 '양의 직선 상관관계에 있다' 라고 해석합니다.
주의할 점은
분포도를 보고 대강 시각적으로 상관관계 여부를 파악한 뒤,
그 다음 단계에서 상관분석을 통해
상관계수를 보고 정확히 파악해야 합니다.
분포도만 보고 '상관관계가 있다' 라고 해석해서는 안됩니다.
회귀식이 통계적으로 유의한가를 검정하기 위해서입니다.
영상에서는
회귀계수, P-Value, 잔차가 0에 가까운지..이것으로
회귀식의 유의성을 검정하였습니다.
@@엑셀디자인 감사합니다 선생님 ㅎㅎ 지금 확인하였습니다... 정말 도움이 많이 되었습니다 감사합니다!!
선생님 안녕하세요..! 좋은 강의 감사드려요!! 혹시 잔차가 음수로 나와도 회귀식이 타당하다고 볼 수 있나요?? 물론 0에 아주아주 가까울때요!
안녕하세요:)
회귀식을 확정하기 위한 검증 중의 하나가
잔차가 0에 가까워야 한다는 것이지요.
회귀계수가 0.6 이상이었고,
P-Value도 0.05보다 작았다면
잔차가 그 정도면 문제 없습니다.
헉 빠른 답변감사합니다!! 하나만 더 여쭤봐도 될까요ㅠㅠ..혹시 유의한 F값이나 P-값이 0.049로 나오면 유의하다고 봐도될까요?? 0.05랑 가까워도 작기만 하면 되는걸까요..?
@@wkdeee
유의하다고 하기엔 p값이 애매모호 하군요.
상관분석 부터 다시 해보시지요.
상관계수가 1이나 -1에 가까운 강한 상관관계에 있는지..
@@엑셀디자인 상관계수는 -0.755로 나왔는데 이럴경우 상관분석으로만 설명해야할까요??
@@wkdeee 강하지는 않지만 두 변수가 어느 정도 상관관계는 있어 보입니다만..
회귀계수는 얼마인가요?
지금 지정하신 독립변수 말고, 다른 변수로도 분석해보세요.
더 나아가서 다중회귀분석도 해보심이 좋을듯합니다.
회귀분석의 회귀식 확정여부는
다양한 변수를 가지고 분석 후
결론이 내리는 것이 좋습니다.
상관계수의 제곱이 결정계수(회귀계수)의 제곱인가요???
안녕하세요 :)
단순회귀분석(변수가 하나)일 때는
'상관계수의 제곱=결정계수의 제곱'이 맞습니다.
혹시 본 예제 교제 출처를 알 수 있을까요!
오래된 데이터셋입니다.
아래의 경로에서 유의미한 최신 자료를 다운로드 받아서 회귀분석을 해보세요.
예를 들면,
'한국의 1인당 국민총소득에 따른 Co2 배출량을 예측' 하고자 하면
- 1인당 국민총소득: KOSIS > 국제통계 > 주제별 국제통계 > 국민계정
- 1인당 Co2 배출량: KOSIS > 국제통계 > 주제별 국제통계 > 환경
급하게 숙제하다가 좋은 영상이 있어서 질문 남깁니다. 제가 지금 학교에서 어느 특정한 지역의 1년 강수량 (독립변수는 month입니다) 데이타를 이용해서 그걸로 사인함수를 그리고, 자신이 세운 사인함수 식과 데이타가 얼마나 매치되는지 알아보기 위해 regression을 쓰라고 하십니다. 이렇게 사인함수의 regression을 구할 때에도 직선의 함수를 구하는게 옳은 방식인가요? 영상 정말 잘 봤습니다!!
반갑습니다 :D
MS의 답변이 더 명확할겁니다. 아래의 링크를 참조해주세요.
support.office.com/ko-kr/article/%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%97%90-%EA%B0%80%EC%9E%A5-%EC%A0%81%ED%95%A9-%ED%95%9C-%EC%B6%94%EC%84%B8%EC%84%A0-%EC%84%A0%ED%83%9D-1bb3c9e7-0280-45b5-9ab0-d0c93161daa8
통계학에 대해서 잘모르는 1인입니다.
회귀분석 도대체 어디로 회귀 돌아간다는 의미인지 잘 모르겠네요
두변수간에 상관관계만 분석하는데 회귀가 왜 나오는지 ㅠㅠ
프랜시스 골턴이라는 영국의 유전학자가 부모와 자녀 세대의 키의 관계를 연구했습니다. 부모의 키가 상당히 크거나 작으면 자녀들도 확 크거나 작아야 하는데 전체 키의 평균으로 돌아가려(회귀, regress)는 속성을 찾아내고 이를 회귀분석이라고 정의했고, 이 후 다른 학자가 회귀분석 이론을 수학적으로 정립해냈습니다.
주변에 부모님은 키가 별로 크지 않은데
자녀들이 키가 늘씬늘씬한 것을 보면 이 이론이 생각납니다 :)
ADsP 비전공자가 공부해서자격증 따기까지 얼마나 걸리고 어느정도 활용성이 있는 취업등 향후 진로에 어떻게 활용가능한지 궁금합니다.
한국데이터베이스진흥원에서 주최하는 자격증이군요. 처음 알았습니다.
잠깐 서치해보니 비전공자도 몇달간만 공부하면 가능하다고들 말하고 있네요.
제 이야기를 해드리면...
비전공자로 오래 전 정보처리기사 자격증을 취득하고 이쪽에서 쭈욱~ 강의와 개발을 진행해 오고 있습니다.
처음엔 엑셀 -> 데이터 자동화에 대한 니즈가 생겨 -> VBA 공부 -> 통계에 홀릭되서 2년간 통계학 독학 -> 통계, 가상분석으로 강의 범위 확장 -> 시각화에 대한 니즈가 생겨 -> 지금은 태블로(BI tool) 공부하면서 새로운 커리큘럼 개발 중.
어느 외국기업의 데이터 사이언스 프로세스를 예를 들면
Python으로 서버, 클라우드, DBMS 등에서 데이터를 가져다가 엑셀로 전환 -> 엑셀과 vba로 가공 -> QlikSense로 데이터 분석과 시각화 -> 보고서 생성.
아무튼
요즘 기업 내부적으로 '데이터 분석' 에 대한 니즈가 폭발적으로 늘어가고 있는 추세입니다. 시험만을 위한 공부가 아니라 실무에서 '양질의 데이터를 가져와서 > 가공 > 분석> 시각화'를 할 수 있는 실무 실력을 겸비하는 공부가 되길 바랍니다.
응원합니다!!!
@@엑셀디자인 답변 감사합니다. 전공을 어떤쪽으로하셨는지 알려주실 수 있으신지, 독학하고 진로전향하신 시기의 나이대가 어느정도셨는지 궁금합니다.
@@kkk7549
제 전공, 나이는 오프라인 교육에서는 숨길 것 없이 다 깝니다만, 온라인에서는 조심하는 편입니다^^
진로에 대해 고민이 많으신 듯합니다.
공부하면 공부가 늘고, 걱정하면 걱정이 늘더군요.
움직이면서 충돌과 융합을 통해 버릴건 버리고, 받아들일건 취하는게 좋지 않겠나...하는 제 개인적 생각입니다. 화이팅입니다🍀
추세선 추가가 없는데 어떻게 해야하나요?
산포도 그래프에서 점 하나 클릭 > 오른쪽 버튼 클릭 > 팝업 메뉴 > '추세선 추가'...
메뉴가 나올텐데요....
제가 엑셀2010버전을 쓰고있는데 3분5초 데이터분석에서 저 데이터분석 창 뜨게하는부분이 어디를 눌러야 나오는지 모르겠는데 혹시 2010버전으로도 알수있을까요?ㅜ
모든 버전이 똑같습니다.
'엑셀 데이터분석 #02-1' 영상 앞부분을 참조하세요.
혹시 개발도구 메뉴는 꺼내실 수 있으신가요?
파일>옵션>리본사용자지정>우측 박스>개발도구..에 체크.
아하 해결했습니다! 좋은정보 감사합니다!
저만 그런가,,, 영상 속 마우스랑 화면이 왜 싱크가 안 맞아보이는지
정확히 기억은 안나지만 90번대 영상부터는 그 문제가 발생하지 않습니다.
화면녹화 sw를 바꾸었습니다.
좀 천천히 했으면 좋겠어요
와
유후