안녕하세요, 정답은 2번이 맞습니다! 의사결정나무는 두 가지로 구분됩니다. (1) 목표 변수 범주형 > 분류 나무 (2) 목표 변수 연속형 > 회귀 나무 (1)-1 분류 나무일 경우, 분류 기준값의 선택 방법 : 카이제곱 통계량, P-값, 지니지수, 엔트로피 지수 등 사용 (2)-1 회귀 나무일 경우, 분류 변수와 분류 기준 선택 방법 : F 통계량의 F값, 분산의 감소량 등이 사용됨 공부에 도움되셨길 바랍니다! 오늘도 좋은 하루 되세요 ㅎㅎㅎ
32번에 답 4번 아닌가요? 2) 본 상황과 분산이라는 단어가 연관이 없는 것처럼 설명하셨는데, R2=SSR/SST 즉 전체 값의 변동(=평균값으로부터 떨어진 거리의 제곱 총합) 중 회귀식의 변동에 의해 설명되는 지표라는 점을 생각해보면, 변동을 분산으로 충분히 대체하여 표현할 수 있다고 생각합니다 4) Speed 변수의 p값이 낮으면 강한 유의성을 보이는 것이지, 그것이 강한 상관관계를 나타내지는 않지 않나요? 실제로 유의성은 있어도 회귀계수가 너무 작아서 버려지는 모델도 있듯이 말입니다. 회귀계수는 약 3.9인데, 저 3.9이라는 값이 강한지 약한지는 분석가의 주관이 개입되는 부분이고, 무엇보다 측정치의 단위도 나와있지 않은 상태라서 판단히 전혀 불가능하기때문에 4번이 아닌가 조심스럽게 질문드립니다 (예를들어 자동차 속도는 km/h, 제동거리는 mm 단위로 측정되었다면 시속 1km 늘어날때마다 제동거리는 3.9mm 늘어난건데 이 경우 상관관계가 강하다고 말할수없을것같아요)
해설감사합니다
내일 40회 시험보고 혹시 언제 올라오나요!?
아직 일정 확정이 나질 않아 혹시라도 올라오게 되면 답글 남겨 드릴게요! 관심 가져 주셔서 감사합니다 ㅎㅎㅎ
역시..3과목이 어렵ㅠ
ㅎㅎㅎ 초반에는 어려운데 회독 많이 하시다 보면 확 이해되는 순간이 분명 오실 거예요! 시험 얼마 안 남았지만 파이팅입니다!
21번 답 3번 아닌가요...분류기준값
안녕하세요, 정답은 2번이 맞습니다!
의사결정나무는 두 가지로 구분됩니다.
(1) 목표 변수 범주형 > 분류 나무
(2) 목표 변수 연속형 > 회귀 나무
(1)-1 분류 나무일 경우, 분류 기준값의 선택 방법
: 카이제곱 통계량, P-값, 지니지수, 엔트로피 지수 등 사용
(2)-1 회귀 나무일 경우, 분류 변수와 분류 기준 선택 방법
: F 통계량의 F값, 분산의 감소량 등이 사용됨
공부에 도움되셨길 바랍니다!
오늘도 좋은 하루 되세요 ㅎㅎㅎ
32번에 답 4번 아닌가요?
2) 본 상황과 분산이라는 단어가 연관이 없는 것처럼 설명하셨는데, R2=SSR/SST 즉 전체 값의 변동(=평균값으로부터 떨어진 거리의 제곱 총합) 중 회귀식의 변동에 의해 설명되는 지표라는 점을 생각해보면, 변동을 분산으로 충분히 대체하여 표현할 수 있다고 생각합니다
4) Speed 변수의 p값이 낮으면 강한 유의성을 보이는 것이지, 그것이 강한 상관관계를 나타내지는 않지 않나요? 실제로 유의성은 있어도 회귀계수가 너무 작아서 버려지는 모델도 있듯이 말입니다. 회귀계수는 약 3.9인데, 저 3.9이라는 값이 강한지 약한지는 분석가의 주관이 개입되는 부분이고, 무엇보다 측정치의 단위도 나와있지 않은 상태라서 판단히 전혀 불가능하기때문에 4번이 아닌가 조심스럽게 질문드립니다
(예를들어 자동차 속도는 km/h, 제동거리는 mm 단위로 측정되었다면 시속 1km 늘어날때마다 제동거리는 3.9mm 늘어난건데 이 경우 상관관계가 강하다고 말할수없을것같아요)
이와 별개로 좋은 강의 너무너무 감사드립니다. 도움이 정말 많이 됩니다
4번 제 생각에도 맞는 것 같습니다..
3과목 너무 어렵다 ㅜㅜ
그래도 포기하지 마시고 문제 풀이 + 오답노트 하시다 보면 조금씩 눈에 들어올 거예요!! 마지막까지 파이팅입니다 ㅎㅎㅎ
30번 4번아닌가요?
[표본오차는표본크기가 증가함에 따라 모집단을 더 정확히 반영하게 되어 감소한다]는 맞는 내용입니다.