수식 없는 카이스퀘어

ASDF 오터의 통계

มุมมอง 23 481

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 9 ส.ค. 2020
통계
연구방법론
사회과학
카이스퀘어
#카이스퀘어 #ADsP #데이터분석준전문가 #ADP #데이터분석전문가

ความคิดเห็น • 61

@Mr1333334 3 ปีที่แล้ว ⁺¹⁷
저 댓글 절대 안남기는데 컨텐츠가 너무 좋아서 남기고 가요 ㅠㅠㅠ 진짜 저만 알고 싶을정도로....ㅋㅌㅋㅋ 퀄리티 좋은 영상 제작해주셔서 너무너무 감사합니다!!!!! 😭♥️
@asdf7722 3 ปีที่แล้ว ⁺¹
헠... ㄱㅅ합니다 ㅋㅋㅋㅋㅋㅋㅋㅋ
@dde3664d 2 ปีที่แล้ว ⁺¹¹
이 썸네일을 보고 들어오지 않는다면 통계학도라고 할 수 없다
@LQJPark ปีที่แล้ว ⁺⁴
좋아요를 하나밖에 누르지 못하는게 슬퍼요 감사합니다
@user-os2sg1nn6e ปีที่แล้ว ⁺⁶
어찌어찌 흘러 들어와 영상 하나씩 곱씹어보면서 보고있습니다.
학부때 그저 암기로 넘어갔던 내용들인데, 비로소 이해하게 되었습니다. 감사합니다 :)
@user-gf7qk5ds7i ปีที่แล้ว ⁺³
설명 감사합니다. 누가 그랬죠. 쉽게 설명할 수 없으면 제대로 아는 게 아니다라고 ... 이걸 보고 진정아는게 뭔가를 알게 되었습니다
@helookscool ปีที่แล้ว ⁺⁴
명쾌.
@jungminpark-et7iy ปีที่แล้ว ⁺³
너무나 감사합니다 형님..
@eskim5975 3 ปีที่แล้ว ⁺⁸
감사합니다 선생님.... 사는 동안 적게 일하시고 많이 버세요.... 이 영상 덕분에 대충 개념을 잡았습니다!! ㅠㅠ
@asdf7722 3 ปีที่แล้ว ⁺²
아 지금 넘 아쉬운게 공지에도 썻지만 며칠전부터 진짜 메인 영상들 다 잠궈논상태에여 ㅠㅠ 6월말에 제대로 복귀할게여... 기다려주십쇼
@BobSangmin 3 ปีที่แล้ว ⁺⁶
감ㅁ사합니다
@asdf7722 3 ปีที่แล้ว ⁺²
좋은 말씀 감사합니다~:)
@user-vj4ie5rv9o 2 ปีที่แล้ว ⁺⁴
감사합니다 형님
@asdf7722 2 ปีที่แล้ว ⁺²
감사합미다 형님
@user-gn6lq7vi3b 3 ปีที่แล้ว ⁺¹¹
평소에 어떤 공식이나 개념을 보면 그냥 외우고 지나가기보단 왜 그런지를 많이 따지는 편인데 이게 시간이 지날수록 점점 어려워 지더라고요... 그러다가 이 동영상과 t분포에 대한 동영상을 보게 됐는데 진짜 사막의 오아시스 같은 느낌이였습니다 .... 구독이랑 좋아요 눌렀는데 하나밖에 안 눌리는게 아쉽네요 ㅎㅎㅎ 정말 감사합니다
@asdf7722 3 ปีที่แล้ว ⁺²
요즘 넘 바빠서 어떻게하나 햇는디.. 앞으로도 계속 만들게여.. ㅋㅋㅋ
@starinthesky8646 3 ปีที่แล้ว ⁺⁸
다른영상 더 봐야겟네요. 중요한건 수포자인 제가 대충 크기가 큰지작은지를 알려면 분산을 알아야한다는거... 그건 기억에 남네요. 감사함다.. 구독 오지게 박고 다른 영상도 봐야겟네요!!
@asdf7722 3 ปีที่แล้ว ⁺²
포인트를 잘 잡으셧네요 ㄱㅅ합니다
@yanbechu 3 ปีที่แล้ว ⁺¹⁰
엑스제곱인줄; 못 읽어서 왔어요 쥘쥘 ㅠㅠㅠㅠ 곧 시험인데 정말 미티겠어요 ANOVA 나오니까 포기하고 싶어요 하...
@asdf7722 3 ปีที่แล้ว ⁺¹
ㅋㅋㅋ 저도 못 읽었는데 하다보면 어느순간 빡 다 됨니다 ㅋㅋ 걱정안하셔도 됩니다
@hyeok0902 3 ปีที่แล้ว ⁺⁹
카이제곱 설명을 봐도 왜 쓰는 건지 몰랐는데 영상 덕분에 알았습니다.
표준정규분포의 "분산"이 큰지? 작은 지? 궁금하니까 이 "분산"의 분포를 보고 큰지? 작은 지? 알 수 있는 거군요.
@asdf7722 3 ปีที่แล้ว ⁺³
그쳐 ㅋㅋ 분포를 알아야 크고 작음을 말할수 잇는.. 정확하게 이해하심 굿굿
@hyeok0902 11 หลายเดือนก่อน ⁺¹
@@asdf7722 안녕하세요ㅎㅎ 카이제곱 다시 보려고 찾아왔는데 답변을 해주셨었네요 감사합니다. 한 가지 더 궁굼한게 있는데요. 다른 분의 영상에서 카이제곱검정이 기대값과 비교하여 차이가 있는지 없는지 확인하는 분석이라고 했습니다.(분산분석과 비슷하게요). 본 영상에서는 카이제곱에 대한 이론적인 설명을 해주셨는데, 혹시 실제 예시를 활용하여 어떻게 이용되는지 영상으로 만들어 주실 수 있을까요?
@asdf7722 11 หลายเดือนก่อน
네 곧 만들게요
@choi8695 2 ปีที่แล้ว ⁺⁵
'표준정규분포'의 분산 이 큰지? 작은 지? 라고 하셨는데 표준정규분포는 항상 분산이 1(상수같은존재?)아닌가요? 정규분포에서의 분산이 큰지 작은지 라고 이해하면 되는걸까요?
@user-kd1su6pz6m 3 ปีที่แล้ว ⁺⁶
좋은 영상 감사합니다. 한가지 궁금한게 있습니다. 교재에서는 모분산의 추정량으로 사용되는 표본분산의 표본분포를 이해하는데 활용된다고 하는데 5:31 의 말과 같은 말인가요???
@asdf7722 3 ปีที่แล้ว ⁺²
ㅇㅇ 맞아요!!
@user-py7ss8sd8y ปีที่แล้ว ⁺³
이것을 바탕으로 수식과 그예시를 통해 더 깊게 이해할 수 있는 영상은 계획없으신가요 ㅠㅠ
@asdf7722 ปีที่แล้ว ⁺¹
고민중입니다
@joonion 2 ปีที่แล้ว ⁺⁶
썸네일이 궁금해서 미칠 것 같아요. 왜 빌 게이츠가 1818년에 태어나서 2180년에 죽는지... 사진은 왜 잡스인지... 알려주세요. 제발. 😭
@asdf7722 2 ปีที่แล้ว ⁺³
주니온 연구소장님 궁금하게 하려고
@joonion 2 ปีที่แล้ว ⁺²
@@asdf7722 ㅠㅠ.
@user-ws4gv2ze6z 3 หลายเดือนก่อน
카이제곱 분포를 따르기 때문이죠
@user-yr1td4uv6h หลายเดือนก่อน
어허 사진은 스티브잡스입니다
@user-ll2xn4cx8e 3 ปีที่แล้ว ⁺⁵
정말 좋은 설명 감사합니다. 처음에 t분포부터 해서 F분포까지 이해가 하나도 안 되었는데,
영상을 보고 다시 책을 보니 신기하게도 어느 정도 이해가 되기 시작했습니다.
한 가지 이해가 잘 안 되는게
카이스퀘어분포가 자유도가 1인 경우에는 t분포를 제곱한 분포라고 설명한 부분이 있었는데(다른 영상에서 나왔을 수도 있습니다), t분포의 평균은 0이면 카이스퀘어 분포에서도 0에서의 확률밀도함수값이 제일 큰 거라고 생각되는데, 왜 평균이 자유도를 따르나요?
@asdf7722 3 ปีที่แล้ว ⁺¹
너무 날카로운 질문인데요 잠시만여 생각좀 해보겟습니다
@user-gg2qi4yq4x 3 ปีที่แล้ว ⁺⁷
생각한 걸 대신 얘기해 봐도 될까요?
카이제곱분포는 t분포를 그대로 제곱한 게 아닙니다. t분포는 한 개의 표본(No. of sample=1) 내에서 그 표본집단의 값들이 t분포를 따를 시 표본집단 내 한 개 샘플 값이 얼마나 크거나 작은지를 알려 준다 치면, 카이제곱분포는 ☆☆☆여러 개의 표본들☆☆☆(No. of samples>1)마다 각각 편차 제곱의 합(=분산x표본크기)을 구했을 때, 그 분산x표본크기 값이 얼마나 자주 나오는지를 밀도함수로 나타낸 겁니다. 통계학자들이 특정 샘플크기의 무수히 많은 표본마다 실험적으로 카이제곱을 구해 봤더니, 각 카이제곱이 카이제곱분포표의 빈도만큼 나왔다는 겁니다.
그런데! 정상적인 자료일수록 정규분포를 따르게 되기 때문에 대부분의 자료는 카이제곱의 값이 분산x표본크기에 근접합니다(일치하진 않습니다. 사실은 자유도를 곱해야 하는데 표본크기를 곱하면 1 더 큰수가 곱해지니까요. 그래도 확실히 비례는 하죠!!). 어떤 분포의 카이제곱 값이 최빈값보다 작은 경우, 그 분포는 정규분포 혹은 다른 보통의 표본들보다 평균 주위에 값들이 거의 너무 몰려 있다는 거고, 카이제곱 값이 너무 커지면 정규분포 혹은 정상적인 다른 표본들보다 너무 퍼져 있다는 뜻이 됩니다.
요는 다음과 같습니다
1. 왜 카이제곱을 t의 제곱으로 헷갈리는 게 이상한 게 아니라 자연스러운 일인가? 그것은 t는 표준화된(평균이 0인)편차, 카이제곱은 표준화된 편차의 제곱인 표준화된 분산을 다루기 때문입니다. 편차와 분산의 관계, 그리고 두 분포 모두 표준화된 표본을 대상으로 한다는 사실을 생각하면 충분히 헷갈릴 수 있습니다.
2. 그럼에도 왜 t를 직접 제곱하면 안 되는가. t는 분석 대상이 ☆한 개의 표본집단☆내에서 특정 한 값 즉 확률변수의 표준화된 편차를 구하는 것이고. 카이제곱은 ☆여러 개의 표본 집단들☆ 중 특정 한 집단의 분산, 즉 확률변수들을 요약한 값인 통계량이, 다른 가능한 표본집단들에 비해 얼마나 이상한지 그 분산값!의 편차를 구하는 것이기 때문에(카이제곱의 값이 최빈값에서 멀어질수록 다른 표본들에 비해서 분산값이 이상하다). 비교 대상이 다른 겁니다.
저도 전공생이 아니고 혼자 공부하는 입장인지라 틀렸을 수 있지만 제가 답을 내린다는 느낌보다는 토론을 통해서라도 답을 찾아갈 수 있으면 좋겠습니다 :) 이 댓글도 그런 의미에서 제 의견을 공유한 것에 불과하니 편하게 코멘트 주세요.
@asdf7722 3 ปีที่แล้ว ⁺³
@@user-gg2qi4yq4x 와
@yiangseng 2 ปีที่แล้ว ⁺⁵
이번 영상도 무척 감사합니다. 또 많이 얻어갑니다-! 한 마디로, "1) 카이는 어떤 임의의 확률변수들을 통칭한 것, 2) 카이스퀘어는 그러한 확률변수들의 제곱값, 3) 표준정규분포의 분산은 '확률변수 제곱값이 보이는 분포'를 따른다."라고 이해하면 될까요? 카이스퀘어 자체는 분산과 다른 개념이죠?
@asdf7722 2 ปีที่แล้ว ⁺³
굿굿 일단은 거의 맞아요 미묘하게 지금 좀 더 채워지면 좋은 부분은 잇는데
그쵸 분산의 분포가 일반적으로 카이스퀘어 분포를 따르는거에요
카이스퀘어는 분포에 대한 얘기
@yiangseng 2 ปีที่แล้ว ⁺³
@@asdf7722 오오--감사합니다! 답변 받는 영광! yay!
@asdf7722 2 ปีที่แล้ว ⁺²
😉
@user-bs1ps9xx9x 3 ปีที่แล้ว ⁺⁵
감사합니다! 덕분에 수식으로는 전혀 이해안되던 내용을 알 수 있었어요! 그런데 유의수준과 p값이라는게 무엇인지 가르쳐주실 수 있나요? 희귀한 경우를 판단하는 기준이라는데 고등학생이라 잘 이해가되지 않아서요...
@asdf7722 3 ปีที่แล้ว ⁺³
오.. 고등학생이 카이스퀘어를 공부하신다니........(충격)... 뭔가 엄청난 진로를 준비하시나보군요? 즐겁게 보셨다니 다행입니다. :) 유의수준과 p값은 사실 엄밀히 말하면 조금 다른데, 일단은 지금은 비슷한 의미라고 생각하시면 좋습니다. 그리고 그것이 무엇을 의미하는가?! 바로............. "경솔한 정도"를 의미합니다. 자세한 내용은 th-cam.com/video/kfl2f8cZwdY/w-d-xo.html
를 보시면, 바아로 이해되실 겁니다.
@user-bs1ps9xx9x 3 ปีที่แล้ว ⁺³
@@asdf7722 답변 감사드립니다!
@asdf7722 3 ปีที่แล้ว ⁺⁴
통계 공부하기 어려운데 같이 열심히 재밌게 해보자구요
@user-fr4vv7vt8q 2 ปีที่แล้ว ⁺⁵
좋은 영상 잘 봤습니다. 질문이 있네요.. 샘플사이즈가 커질수록 카이제곱 값은 믿을게 못된다 이 말의 정확한 의미가 어떤걸 말하는지 잘 모르겠네요.. 샘플사이즈가 크면 분산을 추정할 필요가 없어져서 그런건가요? 아니면 가설을 기각하기가 힘들다는 의미인가요.. 답글 남겨주시면 감사합니다~
@asdf7722 2 ปีที่แล้ว ⁺³
먼저 이 설명은 어디까지나 간단하고 비유적인 설명이란걸 염두에 두세요
샘플사이즈가 커지면 카이스퀘어값은 실제 그 차이가 잇건없건 커져버려서 그렇습니다
예를 들어 음식에 들어가는 청량고추 수가 매운맛을 결정한다고 해보겟습니다. 보통 1인분 음식에 하나나 두개만 들어가도 맵다고 할수 잇은데..100개가 들어갓으면 먹다가 위에 구멍나서 골로 가겟죠? 반대로 1/10개만 들어가면 별로 안맵겟죠?
근데 만약 1000인분 음식에 청량고추가 100개 들어갓다고 생각해보세요. 이건 별로 안매운 거 잖아요? 근데도 100개 들어갓죠 왜냐면 인분수가 많으니까. 즉 인분 수(샘플 수)가 커질수록 안맵더라도 들어가는 청량고추수가 많아집니다 자연스럽게. 그래서 샘플 수가 커지면 단순히 청량고추수(카이스퀘어 값)가 매운 정도라고 볼 수 없다고 대충이해하시면 될듯
@user-fr4vv7vt8q 2 ปีที่แล้ว ⁺³
@@asdf7722 아하! 5G LTE 답변 정말 감사드립니다! 무슨의미인지 알았습니다 ㅎㅎ
@asdf7722 2 ปีที่แล้ว ⁺²
👍
@hahaha9763 2 ปีที่แล้ว ⁺¹
@@asdf7722 저도 영상보며 이분과 동일한 궁금증이 생겼는데 답댓을 봐도 의문이 완전히 해소되지 않아서 여쭤봅니다.
카이제곱분포에서 자유도가 커질수록 분포의 피크는 오른쪽으로 이동하고 피크의 높이는 낮아지는데, 그래서 내가 얻는 카이제곱값도 대체로 숫자가 커질거다라고 이해가 됩니다. 카이제곱 분포가 분산의 분포라고 하셨는데, '분산이 크다= 개별 표본이 평균에서 많이 떨어져있다'잖아요. 카이제곱이 분산을 나타내는거면 df가 클수록 분산이 커진다는 뜻인가요? t분포에서는 df가 클수록 오히려 z분포에 가까워지는데 그 제곱의 합인 카이제곱분포는 df가 클수록 왜 못믿을게 되는지 잘 이해가 안 됩니다. ㅠㅠ 상식적으로는 df=sample size가 클수록 좋은 거 아닌가요??
아니면 df가 클수록 카이제곱도 크게 나올 가능성이 높아서 카이제곱은 크게 나올수록 검정결과가 못미덥기때문에 df가 큰 경우에는 카이제곱 검정은 잘 쓰지 않는다는 것인가요?
@asdf7722 2 ปีที่แล้ว ⁺²
마지막 문단 정답 본인이 잘 이해하고 잇음
@user-od7oi6wu8i ปีที่แล้ว ⁺¹
궁금한 게 있어요.
1. 표준정규분포의 분산은 카이제곱분포를 따른다고 하셨는데요, 표준정규분포의 분산은 언제나 1 아닌가요?
2. 표준정규분포의 분산이 카이제곱분포를 따른다면 분산이 편차의 제곱(정확히는 편차제곱의 평균)이니까, 이것도 제곱값이므로 카이제곱분포를 따른다는 말씀이신가요?
@lunal6928 3 ปีที่แล้ว ⁺⁴
적합도 검정을 공부하다가 생각난건데요 왜 제가 가진 결과를 정규분포로 가정하고 분석을 하는거에요?
@kiyongkim3303 2 ปีที่แล้ว ⁺⁵
(1) 일반적으로 갯수가 많아지면 정규분포에 가까워지고, 그래서 (2) 옛날부터 정규분포를 많이 연구해왔어서 구래요
@asdf7722 2 ปีที่แล้ว ⁺⁴
ㅋㅋㅋㅋㅋㅋㅋ 동의합니다
@colacan92 2 ปีที่แล้ว ⁺³
"일반적으로 갯수가 많아지면 정규분포에 가까워지고"
@user-go4sb6re4y 2 ปีที่แล้ว ⁺³
표준정규분포는 항상 분산이 1이죠?
@asdf7722 2 ปีที่แล้ว ⁺¹
그렇...지요..?
@colacan92 2 ปีที่แล้ว ⁺²
... 라기 보다는 분산이 1이 되도록 만든...거죠...?
@user-go4sb6re4y 2 ปีที่แล้ว ⁺⁴
표준 정규분포의 분산이 1인데, ‘표준정규분포의 분산은 어떤 분포를 따를까?’ 라는 말이 잘 와닿지 않아서요 ㅎㅎ

ต่อไป

เล่นอัตโนมัติ