좋은 강의도 빠른답변도 너무 감사합니다. 더미변수를 이용하여 다중회귀분석을 돌려봤는데요.. 질문이 있습니다. 1. 보통 회귀분석의 가정을 검정한 결과 다중공선성 문제, 자기상관이 없음에 대해 확인을 하는데 이 부분은 어떻게 되는건가요? 2. 결과표를 그릴 때 B값, 베타값 같은 걸 표기했었는데요...복합표본 일반선형모형에서는 어떤 값을제시하면될까요?
안녕하세요 소장님, 궁금한점이 있습니다. 예를 들어 30세 이상 케이스, 흡연하는 케이스, 검진 받은 케이스 이렇게 3가지 조건으로 표본 선정을 가정합니다. 그럼 각각 한번씩 변수(f_OOO) 만들어야 하는건 아닐텐데, 하나의 f_age 변수 이후 나머지 표본을 어떻게 제외해나가야 하는지 알고싶습니다. 그리고 소장님께서 선보이신 방법외로 케이스 선택으로 조건선택으로 활용하여도 같은 결과를 얻게 되는지 여쭙습니다.
안녕하십니까. 고령화 패널데이터의 경우 기존 연구에서는 "고령화 연구패널조사는 층화집락추출법을 이용하여 표본추출이 이루어졌으므로 층화변수, 집락변수, 가중치 를 지정하였으며" 라고 표기가 된 연구들이 있는데 국건영과 다르게 계층과 군집이 나와있지 않은데 따로 (kstrata, psu) 계층에 필터 변수만 넣고 가중치만 입력해서 분석하여도 되는지 문의드립니다 또한 9차 단일시점만 분석할때 통합횡단가중치를 적용하여도 되는지 문의드립니다. 언제나 감사드립니다. 지도교수님 같으십니다
안녕하세요. 저는 한국복지패널조사 자료를 분석하려고 하는데... 이 데이터에서는 psu/kstrata와 같은 집락/층화 변수가 없습니다. 가이드에서는 1단계 가구의 소득과 가구언의 경제상태, 2단계 일반가구와 저소득 가구로 층화이중추출을 했다고 하는데 혹시 어떻게 psu/kstrata와 같은 변수를 만들 수 있을가요? 너무 어렵네요 ㅠㅠ
1. 대상자 연령인 사람을 1로 하는 변수 F.age 생성 2. 암진단을 받았으면 0, 안받았으면 1 인 변수 F.cancer 생성 3. F.age.cancer = sum(F.age, F.cancer) 4. F.age.cancer 2-->1, 1 -->0, 0 -->0 으로 코딩변경
@@DrLeeIlHyun 박사님, 안녕하세요! 강의 정말 잘 들었습니다. 저는 국건영 자료 중에서 만 19세 이상 성인 대상자 중 암 진단을 받은 사람이며 현재 암 치료를 받지 않고 있는 사람만을 데이터로 보려고 합니다. 박사님께서 보여주신 강의에서는 처음 19-64세의 사람만을 필터링하였는데, 그 이후 와상이 없고, 정상인 사람들까지 추가 필터링 되는 과정의 방법이 궁금합니다. 위의 댓글과 같은 맥락의 질문 같아서 답글 답니다. F.변수 생성까지는 하였는데 이후 F.age.cancer =sum( F.age.cancer) 이러한 부분을 어떻게 실행하는지에 대해 여쭙고 싶습니다. 복합표본 설계 강의가 많이 없는데 잘 알려주셔서 감사드립니다:)
안녕하세요 강의 너무 감사드립니다. 저는 이항 로지스틱 회귀분석을 돌리려고 하는데 그 전에 오즈비를 이용해서 혼란변수들을 확인한 후 그것들을 통제하고 로짓 회귀분석을 해야하는걸로 알고 있습니다. 그런데 오즈비를 구하는 법을 모르겠어요ㅜㅜ(하나씩 넣어보는건지, 아니면 변수들을 모두 넣고 오즈비를 하나씩 돌리는건지) 또, 통제할 변수들은 범주형이고 독립변수는 연속형일땐 어떤식으로 해야 하나요..? 제발 살려주세요ㅜㅜ!!
1. 혼란 or 통제 변수들 중에서 유의하게 나온 변수와 독립변수를 같이 투입해서 분석합니다. 혼란변수라고 생각되면 유의하지 않아도 투입할 수 있습니다. 2. 범주형 변수는 "범주형 공변량" 옵션을 사용합니다. 또는 "요인" 항목이 있으면 "요인"에 범주형 변수를 입력합니다. 또는 범주형 변수를 dummy 변수로 만든 후 그 더미변수를 입력합니다.
강의감사합니다. [질문] 다른 변수로 코딩에서.. 위 18세이하or65세 이상 제외까진 알겠는데요.. 이후 암진단(n=469) 다른 변수로 코딩할 때, 모든 암(위암, 간암...기타암까지)을 다른 변수로 코딩하나요..아니면 이전단계에서 만들어진 F.age에서 하는지요.. 특히 원자료에서 이미 0,1로 코딩되어 있는데 이를 다시 0,1로 코딩하여.. n=469를 추출하는지요.. 부탁드립니다.. 선생님..
암 진단에 관련된 변수가 8개 있습니다. 가장 간단한 방법은 개별 암진단 변수를 0,1 로 만듭니다. 그런 다음 이 8개 변수를 sum 해서 새로운 변수로 만들면 0~8 사이의 값이 되겠죠. 이때 1 이상이면 암진단이라고 정의하면 됩니다. 8,9 의 사용자 결측값이 있기 때문에 그냥 sum 하면 이들 값이 카운트 됩니다. 그래서 8, 9 를 0 또는 결측값으로 변경한 다음 계산해야 합니다.
복합표본 분석 시 질문사항 있어서 문의드립니다. 일반선형분석 시 년도더미 및 산업더미를 1,0의 형태로 만들어놓았고 독립변수 중 시행 여부에 따라 1,0의 더미변수를 만들어놓았는데(연속형으로서도 쓸 수 있도록) 하지만 이것은 속성상 분명 범주형 변수일 것입니다. 그래서 복합표본 분석 시 요인(F)에 넣어서 분석을 하였는데 분석 결과가 0일 경우 음의 부호가 떴고 1일 경우에는 중복되어 아무 결과가 나오지 않잖아요. 그렇다면 0일 경우이므로 저는 1의경우가 궁금한 것이므로 분석 결과 부호 반대로 해석하여야 하는건가요? 궁금합니다.
강의 잘 듣고 있습니다. 정말 도움이 됩니다. 제가 분석 중인 복합표본 데이터에서 회귀분석을 하는 중인데 종속변수 해당 케이스가 약 40% 됩니다. 이런 경우에 Odds ratio보다는 prevalence ratio를 맞을 거 같은데 복합표본 데이터에서의 spss를 사용하여 prevalence ratio를 분석하는 방법에 대해서는 도통 정보를 찾을 수 없어 댓글로 고견을 여쭙니다.
Merge에서 대응되지 않는 변수에 (*)와 (+)가 있다고 하셨는데 새활성 데이터에 제가 사용할 변수가 있는지 체크하라고 하셨습니다. psu, kstrata, wt_itvex 세 가지가 가장 중요하다고 말씀해주셨는데, 새 활성 데이터 변수에 psu> 라고 되어있는데 이상없는건지 여쭤봅니다.
@@EFFULGENTIA 1. 상관없습니다. 2. 예. 그렇게 결측치로 나와도 무방합니다. 대상자가 12-18세이므로 그 이 외의 연령대의 값은 결측치로 나와도 분석시에 분석에서 사용이 안되기 때문에 무방합니다. 다만 복합표본 설계와 분석시에 부-모집단을 명확히 지정해야 합니다.
박사님, 안녕하세요! 강의 정말 잘 들었습니다. 저는 국건영 자료 중에서 만 19세 이상 성인 대상자 중 암 진단을 받은 사람이며 현재 암 치료를 받지 않고 있는 사람만을 데이터로 보려고 합니다. 박사님께서 보여주신 강의에서는 처음 19-64세의 사람만을 필터링하였는데, 그 이후 와상이 없고, 정상인 사람들까지 추가 필터링 되는 과정의 방법이 궁금합니다. 댓글에 답변 주신 것을 보니 F.변수 생성 이후 F.age.cancer =sum( F.age.cancer) 의 절차를 알려주셨는데 이러한 부분을 어떻게 실행하는지에 대해 여쭙고 싶습니다. 복합표본 설계 강의가 많이 없는데 잘 알려주셔서 감사드립니다:)
대상자를 선정할 때는 하나씩 차근히 해야 합니다. 대상자 기준에 해당하는 변수를 하나씩 만들어 가면서 생성합니다. 암진단 관련 변수는 8개가 있습니다. 7개 특정암과 1개의 기타암으로 구성되어 있습니다. 이 8개 변수를 새로운 변수로 만들어줍니다. 예를 들어 cancer1 ~ cancer8 로 만드는 것이죠. 이 변수들은 암 진단을 받았으면 1, 아니면 0 으로 입력합니다. 그런 다음 이 8개 변수를 합합니다. F.cancer = sum(cancer1, cancer2, ... , cancer8) 로 하면 F.cancer 변수는 0~8 의 값을 가지게 됩니다. 1 이상이면 1개 이상의 암을 진단 받은 것이므로 코딩변경을 해서 사용합니다.
살려주셔서 감사합니다 어느 수업보다 유익하고 이해가 쉬워요ㅠㅠㅠㅠㅠ
최고입니다ㅠㅠ❤
좋은 강의도 빠른답변도 너무 감사합니다. 더미변수를 이용하여 다중회귀분석을 돌려봤는데요.. 질문이 있습니다.
1. 보통 회귀분석의 가정을 검정한 결과 다중공선성 문제, 자기상관이 없음에 대해 확인을 하는데 이 부분은 어떻게 되는건가요?
2. 결과표를 그릴 때 B값, 베타값 같은 걸 표기했었는데요...복합표본 일반선형모형에서는 어떤 값을제시하면될까요?
일반적인 회귀분석 절차와 분석 결과 제시하는 것과 동일하게 하면 됩니다.
다만 복합표본에서는 정규성, 등분산성, 모형적합성은 필요가 없기 때문에 이 부분은 제외해도 됩니다.
네 감사합니다
저도 덕분에 살았습니다.
감사합니다.
아아 한달을 고생하고 나서 이 빛과소금이 있다는걸 알아냈습니다 ㅠㅠ
감사합니다 풀리지않았던 숙제 풀렸습니다
문의사항이있어 문의드립니다
1.이분형종속변수도 복합표본분석으로 위계적회귀분석을 할수있나요.
2.변수중하나 표본이 너무작어 이럴때동질성검사를하슨것으로아는데 동질성검사를 복합표본에서도 할우잏ㅇ나요
미리 감사드립니다
1. 복합표본 로지스틱 회귀분석으로 분석합니다. 물론 복합표본 위계적 로지스틱 회귀분석도 가능합니다.
2. 복합표본 t-test, 복합표본 교차분석(Rao-Scott test) 로 할 수 있습니다.
강의 잘들었습니다 감사드립니다 진심으로
안녕하세요 소장님, 궁금한점이 있습니다. 예를 들어 30세 이상 케이스, 흡연하는 케이스, 검진 받은 케이스 이렇게 3가지 조건으로 표본 선정을 가정합니다. 그럼 각각 한번씩 변수(f_OOO) 만들어야 하는건 아닐텐데, 하나의 f_age 변수 이후 나머지 표본을 어떻게 제외해나가야 하는지 알고싶습니다. 그리고 소장님께서 선보이신 방법외로 케이스 선택으로 조건선택으로 활용하여도 같은 결과를 얻게 되는지 여쭙습니다.
좋은 강의 잘 들었습니다. 처음이라서요..
제가 장애인실태조사 원자료를 승인 받아 연구논문을 쓰려고 합니다. 층화집락표본설계 방식으로 수집된 자료라면 모두 복합표본분석으로 해야한다는 거지요?
예. 가능하면 복합표본분석으로 하는 것이 좋습니다.
@@DrLeeIlHyun 좋은 강의도 빠른답변도 너무 감사합니다. 더미변수를 이용하여 다중회귀분석을 돌려봤는데요.. 보통 결과표를 그릴 때 B값, 베타값 같은 걸 표기했었는데요...복합표본 일반선형모형에서는 어떤 값을제시하면될까요?
안녕하십니까.
고령화 패널데이터의 경우 기존 연구에서는
"고령화 연구패널조사는 층화집락추출법을 이용하여 표본추출이 이루어졌으므로
층화변수, 집락변수, 가중치 를 지정하였으며" 라고 표기가 된 연구들이 있는데
국건영과 다르게 계층과 군집이 나와있지 않은데 따로 (kstrata, psu)
계층에 필터 변수만 넣고 가중치만 입력해서 분석하여도 되는지 문의드립니다
또한 9차 단일시점만 분석할때 통합횡단가중치를 적용하여도 되는지 문의드립니다.
언제나 감사드립니다. 지도교수님 같으십니다
대부분의 패널 데이터는 표본표본추출을 합니다.
다만 data 에 층화변수나 집락변수를 제공하느냐 하지않느냐의 차이일 뿐이죠.
제공하지 않는다면 가중치만 적용해서 복합표본분석을 하면 됩니다.
1개 년도만 분석할 경우에는 해당 년도의 횡단가중치만 적용합니다.
강의 잘 들었습니다. 정말 감사합니다. 국건영 원시자료 제9기 1개년도만 사용할 시 merge 자료합치기를 건너뛰고 진행하면 되는지 궁금합니다.
예. 머지하지 않고 1개년도로 분석하면 됩니다. 가중치도 그대로 사용합니다.
@@DrLeeIlHyun 감사합니다!!
감사합니다 !!!!
국건영 자료 활용 영상 중 이게 최고네요. 감사합니다.
안녕하세요??
2024년 빅데이터 자료분석 관련해서 대면으로 하시는 강의는 없는지요?
혹시 들을 수 있는 강의가 있다면 참여하고 싶어 연락드립니다.
대면 강좌는 계획 중이긴 한데, 아직 일정이 정해지지 않았습니다.
대면 강좌가 개설되면 statedu.com 홈페이지에 공지될 것입니다.
네네 대면강좌 개설되면 참여토록 할게요
강의 감사합니다. 복합표본분석으로 ANOVA(3그룹) 평균 비교 및 평균이 유의하게 차이나는지 알고 싶은데, 복합표본분석은 일반 일원배치분석할 때처럼 사후분석 및 사후검정 (집단 간 평균비교)표가 안뜨는데, 어떻게 하는지 알려주실 수 있을까요???
"추정평균" 옵션에서 "대비" 검정을 하면 됩니다.
안녕하세요 질문이있는데 혹시 일반선형모형에서 공분산분석(ANCOVA)은 어떻게 사용할수있는건가요..?ㅜ
좋은 강의 감사합니다
일반선형모형 --> 일변량
종속변수 : Y
고정요인 : X
공변량 : -----
위 메뉴에서 공변량에 covariate 를 입력하면 됩니다.
안녕하세요. 저는 한국복지패널조사 자료를 분석하려고 하는데... 이 데이터에서는 psu/kstrata와 같은 집락/층화 변수가 없습니다. 가이드에서는 1단계 가구의 소득과 가구언의 경제상태, 2단계 일반가구와 저소득 가구로 층화이중추출을 했다고 하는데 혹시 어떻게 psu/kstrata와 같은 변수를 만들 수 있을가요? 너무 어렵네요 ㅠㅠ
가중치 변수만 투입해서 설계하면 됩니다.
층화변수가 가구경제 한 가지만으로 되어 있으면 그 변수를 층화변수로 투입할 수 있습니다.
강의 정말 감사합니다! 혹시 지역사회건강조사 원시데이터에서 개인/가구 가중치를 설정할 때, 이 2개를 하나로 통합 가중치로 합쳐야 복합표본분석을 해야 할까요??
아뇨. 개인 단위로 분석하는 경우에는 개인가중치, 가구단위로 분석하는 경우에는 가구가중치를 적용해서 복합표본분석을 합니다.
복합표본 설계 강의는 찾아도 없던데. 정말 감사합니다. 변수 필터링하는거 알려주셨는데요. 그럼 F.age.cancer의 변수는 어떻게 생성해야 하나요?
1. 대상자 연령인 사람을 1로 하는 변수 F.age 생성
2. 암진단을 받았으면 0, 안받았으면 1 인 변수 F.cancer 생성
3. F.age.cancer = sum(F.age, F.cancer)
4. F.age.cancer 2-->1, 1 -->0, 0 -->0 으로 코딩변경
@@DrLeeIlHyun 우와.. 해보겠습니다. 복합표본분석 연습 중인데 쉽지가 않습니다. 박사님 정말 감사합니다. 얼마 강의도 정말 잘들었습니다.
@@DrLeeIlHyun 박사님, 안녕하세요! 강의 정말 잘 들었습니다. 저는 국건영 자료 중에서 만 19세 이상 성인 대상자 중 암 진단을 받은 사람이며 현재 암 치료를 받지 않고 있는 사람만을 데이터로 보려고 합니다. 박사님께서 보여주신 강의에서는 처음 19-64세의 사람만을 필터링하였는데, 그 이후 와상이 없고, 정상인 사람들까지 추가 필터링 되는 과정의 방법이 궁금합니다. 위의 댓글과 같은 맥락의 질문 같아서 답글 답니다. F.변수 생성까지는 하였는데 이후 F.age.cancer =sum( F.age.cancer) 이러한 부분을 어떻게 실행하는지에 대해 여쭙고 싶습니다. 복합표본 설계 강의가 많이 없는데 잘 알려주셔서 감사드립니다:)
안녕하세요 강의 너무 감사드립니다. 저는 이항 로지스틱 회귀분석을 돌리려고 하는데 그 전에 오즈비를 이용해서 혼란변수들을 확인한 후 그것들을 통제하고 로짓 회귀분석을 해야하는걸로 알고 있습니다. 그런데 오즈비를 구하는 법을 모르겠어요ㅜㅜ(하나씩 넣어보는건지, 아니면 변수들을 모두 넣고 오즈비를 하나씩 돌리는건지) 또, 통제할 변수들은 범주형이고 독립변수는 연속형일땐 어떤식으로 해야 하나요..? 제발 살려주세요ㅜㅜ!!
로지스틱 회귀분석에서 exp(B) 라고 출력된 것이 OR 입니다.
로지스틱 회귀분석에서 B 값이 나옵니다.
이 B 값으로 엑셀에서 계산하면 됩니다.
=exp(B)
예를 들어 B=0.234 라면 엑셀에서
=exp(0.234)
가 OR 입니다.
1. 혼란 or 통제 변수들 중에서 유의하게 나온 변수와 독립변수를 같이 투입해서 분석합니다.
혼란변수라고 생각되면 유의하지 않아도 투입할 수 있습니다.
2. 범주형 변수는 "범주형 공변량" 옵션을 사용합니다.
또는 "요인" 항목이 있으면 "요인"에 범주형 변수를 입력합니다.
또는 범주형 변수를 dummy 변수로 만든 후 그 더미변수를 입력합니다.
강의감사합니다. [질문] 다른 변수로 코딩에서.. 위 18세이하or65세 이상 제외까진 알겠는데요.. 이후 암진단(n=469) 다른 변수로 코딩할 때, 모든 암(위암, 간암...기타암까지)을 다른 변수로 코딩하나요..아니면 이전단계에서 만들어진 F.age에서 하는지요.. 특히 원자료에서 이미 0,1로 코딩되어 있는데 이를 다시 0,1로 코딩하여.. n=469를 추출하는지요.. 부탁드립니다.. 선생님..
암 진단에 관련된 변수가 8개 있습니다.
가장 간단한 방법은 개별 암진단 변수를 0,1 로 만듭니다.
그런 다음 이 8개 변수를 sum 해서 새로운 변수로 만들면 0~8 사이의 값이 되겠죠.
이때 1 이상이면 암진단이라고 정의하면 됩니다.
8,9 의 사용자 결측값이 있기 때문에 그냥 sum 하면 이들 값이 카운트 됩니다.
그래서 8, 9 를 0 또는 결측값으로 변경한 다음 계산해야 합니다.
쉽게 설명해주셔서 감사합니다! 이용지침서를 읽으며 이해하기 어려운 부분이 많았는데, 영상을 보고 많은 도움이 됐어요 ㅎㅎ
설명을 너무 잘 해주셔서 이해가 쉬웠습니다.
부-모집단 변수 때문에 등립성 검정을 사용할 없습니다. 연구대상이 첫번째단계의 층화변수로 지정되지 않았습니다.
복합표본계획에서 빈도분석할때는 문제가 없었는데 교차분석할때 이렇게 나왔다면 문제가 어떤것일까요??
동영상통해서 항상 너무 잘 교육받고 있습니다.
위와 같은 에러메시지가 뜬 것이죠?
복합표본 설계를 할 때 "층화변수"에 부-모집단으로 지정한 변수를 입력해 주면 됩니다.
@@DrLeeIlHyun
감사합니다~
다답변해주시구 정말 이렇게 좋은강의를 무료로들을수있어서 유익합니다
복합표본 분석 시 질문사항 있어서 문의드립니다.
일반선형분석 시 년도더미 및 산업더미를 1,0의 형태로 만들어놓았고
독립변수 중 시행 여부에 따라 1,0의 더미변수를 만들어놓았는데(연속형으로서도 쓸 수 있도록)
하지만 이것은 속성상 분명 범주형 변수일 것입니다.
그래서 복합표본 분석 시 요인(F)에 넣어서 분석을 하였는데
분석 결과가 0일 경우 음의 부호가 떴고 1일 경우에는 중복되어 아무 결과가 나오지 않잖아요.
그렇다면 0일 경우이므로 저는 1의경우가 궁금한 것이므로 분석 결과 부호 반대로 해석하여야 하는건가요?
궁금합니다.
Dummy 변수로 만든 경우 공변량에 투입해서 분석하면 됩니다.
요인에 투입해서 분석을 하면 1 이 reference, 0 이 event 가 되기 때문에 부호가 반대로 나오는 것입니다.
공변량에 투입하면 부호가 바뀌어 나올 것입니다.
@@DrLeeIlHyun 와~~ 빠른 답변 감사합니다. 궁금증이 싹 해결되었습니다^^ 감사감사~
강의 너무 감사합니다. 강의중 빈도분석에서 유의성 검증을 할때는 어떤 방법을 쓰면 될까요?
빈도분석은 유의성 검정이 없습니다.
강의 감사합니다. 강의 맨 마지막 부분에서, ANOVA의 경우 복합표본분석에서는 일반선형분석의 F값이 아닌 로지스틱회귀분석의 카이제곱 값으로 계산해야하나요?
복합표본분석에서 ANOVA 는 일반선형모형에서 분석하면 됩니다.
@@DrLeeIlHyun 감사드립니다, 교수님. 그렇다면 혹시 통계량은 ward F 값을 보아야하나요, 수정된 F값을 보아야하나요?
**아까 옵션에서
[수정된F] 클릭했으면 F값 나오고
[수정된카이제곱] 클릭했으면 X2(카이제곱값) 나옴
=> 내가 쓰고자 하는 값을 설정해서 그 값을 제시하면 되는 거 아닐까요??
강의 너무 잘 들었습니다. 국가건강영양조사는 다른 대상자로 3년간 조사하여 merge시 아래로 붙이고 가중치는 3으로 나눈다고 하셨는데, 학생건강검사는 동일대상 3년간 조사입니다. 이경우 가중치는 어떻게해야하나요?
제가 보지 못한 데이터와 가이드라인을 확인해야 정확한 답변을 드릴 수 있습니다.
다만 3개년을 반복측정한 자료의 경우 아직 복합표본분석에서는 지원하는 분석 기법이 없습니다.
강의 잘 듣고 있습니다. 정말 도움이 됩니다. 제가 분석 중인 복합표본 데이터에서 회귀분석을 하는 중인데 종속변수 해당 케이스가 약 40% 됩니다. 이런 경우에 Odds ratio보다는 prevalence ratio를 맞을 거 같은데 복합표본 데이터에서의 spss를 사용하여 prevalence ratio를 분석하는 방법에 대해서는 도통 정보를 찾을 수 없어 댓글로 고견을 여쭙니다.
유병율로서의 prevalence ratio 를 말씀하시는 것이죠? 통계 프로그램에서 아직 보지 못한 거 같습니다.
Merge에서 대응되지 않는 변수에 (*)와 (+)가 있다고 하셨는데 새활성 데이터에 제가 사용할 변수가 있는지 체크하라고 하셨습니다. psu, kstrata, wt_itvex 세 가지가 가장 중요하다고 말씀해주셨는데, 새 활성 데이터 변수에 psu> 라고 되어있는데 이상없는건지 여쭤봅니다.
문자형 변수는 > 로 표시됩니다.
@@EFFULGENTIA 1. 상관없습니다.
2. 예. 그렇게 결측치로 나와도 무방합니다. 대상자가 12-18세이므로 그 이 외의 연령대의 값은 결측치로 나와도 분석시에 분석에서 사용이 안되기 때문에 무방합니다. 다만 복합표본 설계와 분석시에 부-모집단을 명확히 지정해야 합니다.
@@DrLeeIlHyun 답변감사합니다^^
교수님꼐서 변환> 다른 변수로 코딩변경 > Filter를 구해주셨는데, 1. 데이터> 케이스선택에서 age>11 and age
@@EFFULGENTIA 다릅니다. 복합표본으로 분석하는 경우 케이스선택이 적용되지 않습니다.
박사님, 안녕하세요! 강의 정말 잘 들었습니다. 저는 국건영 자료 중에서 만 19세 이상 성인 대상자 중 암 진단을 받은 사람이며 현재 암 치료를 받지 않고 있는 사람만을 데이터로 보려고 합니다. 박사님께서 보여주신 강의에서는 처음 19-64세의 사람만을 필터링하였는데, 그 이후 와상이 없고, 정상인 사람들까지 추가 필터링 되는 과정의 방법이 궁금합니다. 댓글에 답변 주신 것을 보니 F.변수 생성 이후 F.age.cancer =sum( F.age.cancer) 의 절차를 알려주셨는데 이러한 부분을 어떻게 실행하는지에 대해 여쭙고 싶습니다. 복합표본 설계 강의가 많이 없는데 잘 알려주셔서 감사드립니다:)
대상자를 선정할 때는 하나씩 차근히 해야 합니다.
대상자 기준에 해당하는 변수를 하나씩 만들어 가면서 생성합니다.
암진단 관련 변수는 8개가 있습니다.
7개 특정암과 1개의 기타암으로 구성되어 있습니다.
이 8개 변수를 새로운 변수로 만들어줍니다.
예를 들어 cancer1 ~ cancer8 로 만드는 것이죠.
이 변수들은 암 진단을 받았으면 1, 아니면 0 으로 입력합니다.
그런 다음 이 8개 변수를 합합니다.
F.cancer = sum(cancer1, cancer2, ... , cancer8)
로 하면 F.cancer 변수는 0~8 의 값을 가지게 됩니다.
1 이상이면 1개 이상의 암을 진단 받은 것이므로 코딩변경을 해서 사용합니다.
댓글이 하나도ㅜ없다니 ㅠㅠ
강의 잘 들었습니다
감사합니다