[머신러닝] 다중 분류 모델 성능 측정 (accuracy, f1 score, precision, recall on multiclass classification)

แชร์
ฝัง
  • เผยแพร่เมื่อ 19 ก.ย. 2024

ความคิดเห็น • 34

  • @JeesuKwon
    @JeesuKwon 2 หลายเดือนก่อน

    감사합니다~:)

  • @mung4878
    @mung4878 ปีที่แล้ว +1

    맨날 2by2에 교과서 같은 내용만 봤는데 쉽고 직관적인 설명 감사합니다.

  • @chungpatrcik4758
    @chungpatrcik4758 4 ปีที่แล้ว +3

    performance metric에 대해 공부하다 발견한 금맥 같은 강좌네요. 훌륭합니다~~~

  • @lololtoday
    @lololtoday 4 ปีที่แล้ว +3

    감사합니다. 이해하기 쉽게 설명해주셔서 잘이해가 되었네요.

  • @jinhwanjung4406
    @jinhwanjung4406 6 ปีที่แล้ว +4

    훌륭한 강의 잘 봤습니다. 다른 책에서 본것과 확연히 다른 insight가 있는 설명에 감사드립니다.
    1) 항상 Tumor 예제로 2 by 2 예제만 봤었는데 그 외 다른 예제를 사용해주심. -> 생각이 확장되었습니다.
    2) 마지막 Insight ( balanced data vs imbalanced data ) 를 언급
    확실히 많이 준비하신다는 느낌을 받았습니다.
    더욱이 Play List에 있는 coding 강의를 이번에 처음 봤는데, 저한테도 큰 도움이 될 것 같네요. 챙겨보겠습니다.

    • @TheEasyoung
      @TheEasyoung  6 ปีที่แล้ว

      jinhwan Jung 감사합니다 ^^ 제가 가장 듣고 싶은 댓글이네요, 강의 내용을 확실히 보시고 제가 만들면서 고려했던 점을 고스란히 칭찬해주셔서 감사합니다. 제 경험을 바탕으로 항상 채워나갈께요.

  • @flyingpinkwhale
    @flyingpinkwhale 3 ปีที่แล้ว +1

    정말 감사합니다. 빠른 이해가 필요한 시점이었는데, 너무 명료하고 자세히 설명해주셔서 크게 도움받았습니다. 감사합니다!!!

  • @so-rajung111
    @so-rajung111 4 ปีที่แล้ว +1

    이해하기 쉬운 강의 자료와 자세한 설명 정말 감사합니다~!

  • @hongkyulee9724
    @hongkyulee9724 3 ปีที่แล้ว

    😀 너무 좋은 강의 감사합니다... 하하 .... 민석님과 같은 시대에 살고 있다는 것이 너무나도 영광스럽습니다.

  • @ksjksjgg
    @ksjksjgg 3 ปีที่แล้ว +1

    이해가 잘 됩니다. 감사합니다.

  • @thegreatgaespi
    @thegreatgaespi 3 ปีที่แล้ว

    도움이 정말 많이 되었습니다. 영상 감사드립니다!

  • @hyunwookim4601
    @hyunwookim4601 6 ปีที่แล้ว +1

    좋은 강의 감사드립니다.

    • @TheEasyoung
      @TheEasyoung  6 ปีที่แล้ว

      dosiba kim 피드백 고마워요!

  • @팽도리-v6s
    @팽도리-v6s 4 ปีที่แล้ว +1

    많은 도움이 되었습니다. 감사합니다!

  • @user-rt1cr6tv5u
    @user-rt1cr6tv5u 6 ปีที่แล้ว +1

    좋은 강의 감사합니다!

  • @kim_monica89
    @kim_monica89 4 ปีที่แล้ว +1

    진짜..최고다...

  • @victorialeigh2726
    @victorialeigh2726 3 ปีที่แล้ว +1

    선생님! 좋은 강의 감사합니다.
    python, sklearn 으로 머신러닝을 공부하고 있는데 이 강의의 로보트 예제를 데이터셋으로 해서 f1_score를 적용할 경우 y_true, y_pred는 뭘로 넣어야 하나요? 여기서 헤메고 있어요 선생님 지혜를 베푸소서 ㅠㅅㅠ)

    • @TheEasyoung
      @TheEasyoung  3 ปีที่แล้ว +1

      Y_true는 정답을 y_pred는 로봇이 출력한 값을 넣습니다. 감사합니다!

  • @chanihong477
    @chanihong477 6 ปีที่แล้ว +1

    좋은 영상 감사드립니다!
    공부를 하던 중 궁금증에 생겨서 질문드립니다! ㅠㅠ
    Q) 분류 모델 성능이 아닌 연속데이터를 예측하는 회귀 모델 같은 경우 모델 성능을 어떤식으로 판단한고 선택하는지 여쭤보고 싶습니다!
    입문자로서 늘 큰 도움 받고 있습니다! 항상 좋은 강의 감사드립니다 ㅎㅎ

    • @TheEasyoung
      @TheEasyoung  6 ปีที่แล้ว

      안녕하세요. 여러 방법들이 있지만 대표적으로, 회귀 모델 같은 경우, 테스트 데이터들의 에러율을 더한 값을 평균내서 구할 수 있습니다. MSE (Mean Squared Error) 방식인데요, 아래 영상에서 MSE 관련해서는 아래 영상에서 4분 정도부터 설명 보실 수 있어요. 평균 에러율이 낮은 모델이 성능이 더 좋은 모델이라고 판단할 수 있어요.
      th-cam.com/video/MwadQ74iE-k/w-d-xo.html

  • @assethotorch2395
    @assethotorch2395 6 ปีที่แล้ว +2

    좋은 강의 감사 드립니다!! F1 score 가 클래스 불균형일때 사용하면 좋은것은 알고있는데
    micro avg F1와 macro avg F1(두 측도 계산 차이점은 알고 있습니다) 이 두 성능측도는 어느 상황일때 사용하는것이 좋은지 궁금합니다...ㅜㅜ

    • @TheEasyoung
      @TheEasyoung  6 ปีที่แล้ว +3

      ISG Geoje 안녕하세요, 아주 좋은 질문 감사합니다. 시간 관계상 제가 그 둘의 차이점은 다루지 않았는데요, 클래스중에서 많은 데이터를 가진 클래스에 편중을 두고 싶으면 micro를 쓰시고, 적은 데이터에 편중을 두시려면 macro를 쓰기도 합니다. 매크로와 마이크로의 차이점은 아래 블로그에 설명이 아주 잘되어있네요,
      unlimitedpower.tistory.com/m/entry/IR-마이크로-평균Micro-average-매크로-평균Macro-average-이란-무엇인가

    • @assethotorch2395
      @assethotorch2395 6 ปีที่แล้ว +1

      그러면 클래스 불균형일때는 분류된거 전체적으로 보고 싶을때는 두 측도 micro와 macro F1모두를 이용해야하는것같네요.. 제 논문자료가 클래스 불균형(marginal sum : 23,123,39,30)을 이루고 있거든요 아무튼
      좋은 강의 다시 한번 감사합니다!!!

    • @TheEasyoung
      @TheEasyoung  6 ปีที่แล้ว +1

      ISG Geoje 매크로와 마이크로 모두 해보고 둘의 결과가 동일하게 한가지 모델을 가리킨다면 논문 작성에 큰 문제 없어보입니다. 만에 하나 둘의 결과가 다르게 나온다면 weighted macro도 시도해보시면 좋을거 같네요. 감사합니다.

  • @우지우-d8y
    @우지우-d8y 5 ปีที่แล้ว +2

    Accuracy 구할때요. 영상에는 TP만으로 구하셨는데 제가 학교에서 교수님에게 배운 내용은 TP + TN으로 알고있는데 잘못된건가요???

    • @TheEasyoung
      @TheEasyoung  5 ปีที่แล้ว +1

      교수님께 배운 내용이 맞고, 이 영상에서도 TP + TN으로 구하고 있습니다. 교수님의 예제는 이진 분류이었던걸로 판단됩니다. 다중 분류의 경우 TP + TN / 전체 데이터가 영상에서와 같이 계산됩니다.

  • @oiojin831
    @oiojin831 5 ปีที่แล้ว +1

    좋은 강의 감사합니다 :)
    질문이 있습니다!!
    True Negative를 로봇이 알파벳을 식별하는 예시로 설명하면
    A를 예측해야되는 상황에서
    A가 아닌 다른걸 보여 줬을때
    A가 아니라고 예측하는 건가요?
    그럼 여기서
    negative라는건 원하는결과가 나오지 않은 케이스를 말하는거고
    True는 이 케이스들이 결과적으로 의도 한대로 나온는걸 말하는건가요?

    • @TheEasyoung
      @TheEasyoung  5 ปีที่แล้ว +1

      Eung Jin Lee 네 예시가 TN이 맞습니다. True 또는 False는 맞는 지 틀리는 지를 의미합니다.

    • @ysjang05050
      @ysjang05050 2 ปีที่แล้ว

      @@TheEasyoung 저도 같은 질문을 드립니다. 실제 A 클래스이지만 FN이 나오는 경우는 B-B, C-C, D-D 이렇게 대각 원소들만 해당되는 것이 아닌지요? A 입장에서는 B가 틀린 답이지만, 틀린 것을 틀리다라고 즉 B가오는 경우만(C, D는 아니라) 'True' Nagative가 아닌가요?

  • @gy1201202
    @gy1201202 3 ปีที่แล้ว +1

    근데 언밸런스한 데이터를 전처리하는 과정에서 밸런스하게 바꾸지 않는/못하는 이유는 뭔가요? 그렇게 하면 acc 그냥 써도 될 것 같은데...

    • @TheEasyoung
      @TheEasyoung  3 ปีที่แล้ว

      좋은 질문입니다. 실제 데이터 언밸런스일 경우, 언밸런스인 상태로 테스트하는 게 실제 모델이 겪을 상황에서 테스트하는 것과 동일하여 밸런스하게 바꾸지 않고 테스트하는 과정이 필요합니다. 때로는 밸런스하게 바꿔서 테스트하기도 합니다만 상대적으로 많은 데이터를 줄이는 것보단 상대적으로 적은 데이터를 더 수집하거나 가짜 데이터를 생성해서 하는 방법이 선호되기도 합니다.

  • @0hong575
    @0hong575 5 ปีที่แล้ว +1

    f1-score를 balanced data에서 사용한다면 accuracy에 비해 이점이 있을까요?

    • @TheEasyoung
      @TheEasyoung  5 ปีที่แล้ว

      0 Hong 리콜과 프리시젼을 동시에 고려했다는 점이 이점이 될 수 있습니다. ㅎ

    • @0hong575
      @0hong575 2 ปีที่แล้ว

      @@TheEasyoung 이 영상이 아직도 1만회라는게 신기하네요.