더미변수 코딩할 때 n-1개 더미 변수를 활용해야 하는 이유

แชร์
ฝัง
  • เผยแพร่เมื่อ 15 ต.ค. 2024
  • #더미변수 #코딩 #n-1 #머신러닝
    더미변수의 수는 일반적으로 범주 수(n)에서 1을 뺀 n-1개를 활용하여 코딩을 합니다. 이는 perfect multicollinearity를 피하기 위해서이며, 가장 일반적인 형태의 더미변수 코딩 방법입니다. 물론, 해석에서의 용이성과 절편(intercept)의 해석을 위해 다른 방식의 코딩방법도 존재하지만, 가장 일반적인 형태입니다.

ความคิดเห็น • 11

  • @asdf7722
    @asdf7722  2 ปีที่แล้ว +2

    손이 들어갔다 나올 때 마다 초점이 다시 맞으면서 화질이 떨어지네요. 다음 번에는 초점 고정으로 해서 찍어보겠습니다.

  • @jeongakang8095
    @jeongakang8095 7 หลายเดือนก่อน +1

    안녕하세요. 더미변수 공부하면서 도대체 왜 이렇게 해야되나 정말 궁금했던 내용인데 덕분에 드디어 이해가 되었습니다!!! 괜찮으시다면 한가지 여쭤보고 싶은데, 영상과 같이 계절이라는 1가지 변수뿐만 아니라, 계절, 성별, 직업과 같이 3가지 변수를 다중회귀분석을 하기위해 더미변수로 변환하는 경우, 마찬가지로 각각의 변수에 대해 더미변수를 n-1개로 설정해야 할까요?

    • @asdf7722
      @asdf7722  7 หลายเดือนก่อน

      맞습니다

  • @sunghwanjo7977
    @sunghwanjo7977 ปีที่แล้ว +1

    통계동아리 회장님.. 최근에 자유도에 대해 찾아보다 알게됐는데 너무 재밌으십니다.. 저도 가입하고 싶은데 혹시 요즘도 동아리모임 하시나요??? 최근 모임이 7개월전인 해체한 동아리 같아 슬프네요..

  • @백경민-j1l
    @백경민-j1l 2 ปีที่แล้ว +1

    영상 잘 봤습니다. 👍

  • @try2quit
    @try2quit 2 ปีที่แล้ว +3

    결국 오버피팅 문제와 관련이 있는 거라고 이해해도 될까여?

    • @asdf7722
      @asdf7722  2 ปีที่แล้ว

      오버피팅은 추정은 일단 된건데 이경우는 아예 추정이 불가합니다
      무슨뜻으로 질문하셨는지는 알겠음다. 정보가 넘쳐난다라는 걸 짚어내신거 같은데 그런점에선 맞말. 근데 오버피팅은 정보를 너무 샘플에서만 사용했다라고 받아들이는게 나은거 같음다.

    • @try2quit
      @try2quit 2 ปีที่แล้ว +2

      앗 그렇군요! 감사합니다

  • @1ntel11
    @1ntel11 2 ปีที่แล้ว +3

    독립변수들의 독립성을 해치는걸 막는다는건가요?

    • @asdf7722
      @asdf7722  2 ปีที่แล้ว +1

      그렇게 생각하셔도 될 것 같습니다

  • @stevencval
    @stevencval 10 หลายเดือนก่อน +1

    다... 다중공선성...??