[머신러닝] 다중 분류 모델 성능 측정 (accuracy, f1 score, precision, recall on multiclass classification)

Minsuk Heo 허민석

มุมมอง 18 437

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 19 ก.ย. 2024

ความคิดเห็น • 34

@JeesuKwon 2 หลายเดือนก่อน
감사합니다~:)
@mung4878 ปีที่แล้ว ⁺¹
맨날 2by2에 교과서 같은 내용만 봤는데 쉽고 직관적인 설명 감사합니다.
@chungpatrcik4758 4 ปีที่แล้ว ⁺³
performance metric에 대해 공부하다 발견한 금맥 같은 강좌네요. 훌륭합니다~~~
@lololtoday 4 ปีที่แล้ว ⁺³
감사합니다. 이해하기 쉽게 설명해주셔서 잘이해가 되었네요.
@jinhwanjung4406 6 ปีที่แล้ว ⁺⁴
훌륭한 강의 잘 봤습니다. 다른 책에서 본것과 확연히 다른 insight가 있는 설명에 감사드립니다.
1) 항상 Tumor 예제로 2 by 2 예제만 봤었는데 그 외 다른 예제를 사용해주심. -> 생각이 확장되었습니다.
2) 마지막 Insight ( balanced data vs imbalanced data ) 를 언급
확실히 많이 준비하신다는 느낌을 받았습니다.
더욱이 Play List에 있는 coding 강의를 이번에 처음 봤는데, 저한테도 큰 도움이 될 것 같네요. 챙겨보겠습니다.
@TheEasyoung 6 ปีที่แล้ว
jinhwan Jung 감사합니다 ^^ 제가 가장 듣고 싶은 댓글이네요, 강의 내용을 확실히 보시고 제가 만들면서 고려했던 점을 고스란히 칭찬해주셔서 감사합니다. 제 경험을 바탕으로 항상 채워나갈께요.
@flyingpinkwhale 3 ปีที่แล้ว ⁺¹
정말 감사합니다. 빠른 이해가 필요한 시점이었는데, 너무 명료하고 자세히 설명해주셔서 크게 도움받았습니다. 감사합니다!!!
@so-rajung111 4 ปีที่แล้ว ⁺¹
이해하기 쉬운 강의 자료와 자세한 설명 정말 감사합니다~!
@hongkyulee9724 3 ปีที่แล้ว
😀 너무 좋은 강의 감사합니다... 하하 .... 민석님과 같은 시대에 살고 있다는 것이 너무나도 영광스럽습니다.
@ksjksjgg 3 ปีที่แล้ว ⁺¹
이해가 잘 됩니다. 감사합니다.
@thegreatgaespi 3 ปีที่แล้ว
도움이 정말 많이 되었습니다. 영상 감사드립니다!
@hyunwookim4601 6 ปีที่แล้ว ⁺¹
좋은 강의 감사드립니다.
@TheEasyoung 6 ปีที่แล้ว
dosiba kim 피드백 고마워요!
@팽도리-v6s 4 ปีที่แล้ว ⁺¹
많은 도움이 되었습니다. 감사합니다!
@user-rt1cr6tv5u 6 ปีที่แล้ว ⁺¹
좋은 강의 감사합니다!
@kim_monica89 4 ปีที่แล้ว ⁺¹
진짜..최고다...
@victorialeigh2726 3 ปีที่แล้ว ⁺¹
선생님! 좋은 강의 감사합니다.
python, sklearn 으로 머신러닝을 공부하고 있는데 이 강의의 로보트 예제를 데이터셋으로 해서 f1_score를 적용할 경우 y_true, y_pred는 뭘로 넣어야 하나요? 여기서 헤메고 있어요 선생님 지혜를 베푸소서 ㅠㅅㅠ)
@TheEasyoung 3 ปีที่แล้ว ⁺¹
Y_true는 정답을 y_pred는 로봇이 출력한 값을 넣습니다. 감사합니다!
@chanihong477 6 ปีที่แล้ว ⁺¹
좋은 영상 감사드립니다!
공부를 하던 중 궁금증에 생겨서 질문드립니다! ㅠㅠ
Q) 분류 모델 성능이 아닌 연속데이터를 예측하는 회귀 모델 같은 경우 모델 성능을 어떤식으로 판단한고 선택하는지 여쭤보고 싶습니다!
입문자로서 늘 큰 도움 받고 있습니다! 항상 좋은 강의 감사드립니다 ㅎㅎ
@TheEasyoung 6 ปีที่แล้ว
안녕하세요. 여러 방법들이 있지만 대표적으로, 회귀 모델 같은 경우, 테스트 데이터들의 에러율을 더한 값을 평균내서 구할 수 있습니다. MSE (Mean Squared Error) 방식인데요, 아래 영상에서 MSE 관련해서는 아래 영상에서 4분 정도부터 설명 보실 수 있어요. 평균 에러율이 낮은 모델이 성능이 더 좋은 모델이라고 판단할 수 있어요.
th-cam.com/video/MwadQ74iE-k/w-d-xo.html
@assethotorch2395 6 ปีที่แล้ว ⁺²
좋은 강의 감사 드립니다!! F1 score 가 클래스 불균형일때 사용하면 좋은것은 알고있는데
micro avg F1와 macro avg F1(두 측도 계산 차이점은 알고 있습니다) 이 두 성능측도는 어느 상황일때 사용하는것이 좋은지 궁금합니다...ㅜㅜ
@TheEasyoung 6 ปีที่แล้ว ⁺³
ISG Geoje 안녕하세요, 아주 좋은 질문 감사합니다. 시간 관계상 제가 그 둘의 차이점은 다루지 않았는데요, 클래스중에서 많은 데이터를 가진 클래스에 편중을 두고 싶으면 micro를 쓰시고, 적은 데이터에 편중을 두시려면 macro를 쓰기도 합니다. 매크로와 마이크로의 차이점은 아래 블로그에 설명이 아주 잘되어있네요,
unlimitedpower.tistory.com/m/entry/IR-마이크로-평균Micro-average-매크로-평균Macro-average-이란-무엇인가
@assethotorch2395 6 ปีที่แล้ว ⁺¹
그러면 클래스 불균형일때는 분류된거 전체적으로 보고 싶을때는 두 측도 micro와 macro F1모두를 이용해야하는것같네요.. 제 논문자료가 클래스 불균형(marginal sum : 23,123,39,30)을 이루고 있거든요 아무튼
좋은 강의 다시 한번 감사합니다!!!
@TheEasyoung 6 ปีที่แล้ว ⁺¹
ISG Geoje 매크로와 마이크로 모두 해보고 둘의 결과가 동일하게 한가지 모델을 가리킨다면 논문 작성에 큰 문제 없어보입니다. 만에 하나 둘의 결과가 다르게 나온다면 weighted macro도 시도해보시면 좋을거 같네요. 감사합니다.
@우지우-d8y 5 ปีที่แล้ว ⁺²
Accuracy 구할때요. 영상에는 TP만으로 구하셨는데 제가 학교에서 교수님에게 배운 내용은 TP + TN으로 알고있는데 잘못된건가요???
@TheEasyoung 5 ปีที่แล้ว ⁺¹
교수님께 배운 내용이 맞고, 이 영상에서도 TP + TN으로 구하고 있습니다. 교수님의 예제는 이진 분류이었던걸로 판단됩니다. 다중 분류의 경우 TP + TN / 전체 데이터가 영상에서와 같이 계산됩니다.
@oiojin831 5 ปีที่แล้ว ⁺¹
좋은 강의 감사합니다 :)
질문이 있습니다!!
True Negative를 로봇이 알파벳을 식별하는 예시로 설명하면
A를 예측해야되는 상황에서
A가 아닌 다른걸 보여 줬을때
A가 아니라고 예측하는 건가요?
그럼 여기서
negative라는건 원하는결과가 나오지 않은 케이스를 말하는거고
True는 이 케이스들이 결과적으로 의도 한대로 나온는걸 말하는건가요?
@TheEasyoung 5 ปีที่แล้ว ⁺¹
Eung Jin Lee 네 예시가 TN이 맞습니다. True 또는 False는 맞는 지 틀리는 지를 의미합니다.
@ysjang05050 2 ปีที่แล้ว
@@TheEasyoung 저도 같은 질문을 드립니다. 실제 A 클래스이지만 FN이 나오는 경우는 B-B, C-C, D-D 이렇게 대각 원소들만 해당되는 것이 아닌지요? A 입장에서는 B가 틀린 답이지만, 틀린 것을 틀리다라고 즉 B가오는 경우만(C, D는 아니라) 'True' Nagative가 아닌가요?
@gy1201202 3 ปีที่แล้ว ⁺¹
근데 언밸런스한 데이터를 전처리하는 과정에서 밸런스하게 바꾸지 않는/못하는 이유는 뭔가요? 그렇게 하면 acc 그냥 써도 될 것 같은데...
@TheEasyoung 3 ปีที่แล้ว
좋은 질문입니다. 실제 데이터 언밸런스일 경우, 언밸런스인 상태로 테스트하는 게 실제 모델이 겪을 상황에서 테스트하는 것과 동일하여 밸런스하게 바꾸지 않고 테스트하는 과정이 필요합니다. 때로는 밸런스하게 바꿔서 테스트하기도 합니다만 상대적으로 많은 데이터를 줄이는 것보단 상대적으로 적은 데이터를 더 수집하거나 가짜 데이터를 생성해서 하는 방법이 선호되기도 합니다.
@0hong575 5 ปีที่แล้ว ⁺¹
f1-score를 balanced data에서 사용한다면 accuracy에 비해 이점이 있을까요?
@TheEasyoung 5 ปีที่แล้ว
0 Hong 리콜과 프리시젼을 동시에 고려했다는 점이 이점이 될 수 있습니다. ㅎ
@0hong575 2 ปีที่แล้ว
@@TheEasyoung 이 영상이 아직도 1만회라는게 신기하네요.

ต่อไป

เล่นอัตโนมัติ