훌륭한 강의 잘 봤습니다. 다른 책에서 본것과 확연히 다른 insight가 있는 설명에 감사드립니다. 1) 항상 Tumor 예제로 2 by 2 예제만 봤었는데 그 외 다른 예제를 사용해주심. -> 생각이 확장되었습니다. 2) 마지막 Insight ( balanced data vs imbalanced data ) 를 언급 확실히 많이 준비하신다는 느낌을 받았습니다. 더욱이 Play List에 있는 coding 강의를 이번에 처음 봤는데, 저한테도 큰 도움이 될 것 같네요. 챙겨보겠습니다.
좋은 영상 감사드립니다! 공부를 하던 중 궁금증에 생겨서 질문드립니다! ㅠㅠ Q) 분류 모델 성능이 아닌 연속데이터를 예측하는 회귀 모델 같은 경우 모델 성능을 어떤식으로 판단한고 선택하는지 여쭤보고 싶습니다! 입문자로서 늘 큰 도움 받고 있습니다! 항상 좋은 강의 감사드립니다 ㅎㅎ
안녕하세요. 여러 방법들이 있지만 대표적으로, 회귀 모델 같은 경우, 테스트 데이터들의 에러율을 더한 값을 평균내서 구할 수 있습니다. MSE (Mean Squared Error) 방식인데요, 아래 영상에서 MSE 관련해서는 아래 영상에서 4분 정도부터 설명 보실 수 있어요. 평균 에러율이 낮은 모델이 성능이 더 좋은 모델이라고 판단할 수 있어요. th-cam.com/video/MwadQ74iE-k/w-d-xo.html
ISG Geoje 안녕하세요, 아주 좋은 질문 감사합니다. 시간 관계상 제가 그 둘의 차이점은 다루지 않았는데요, 클래스중에서 많은 데이터를 가진 클래스에 편중을 두고 싶으면 micro를 쓰시고, 적은 데이터에 편중을 두시려면 macro를 쓰기도 합니다. 매크로와 마이크로의 차이점은 아래 블로그에 설명이 아주 잘되어있네요, unlimitedpower.tistory.com/m/entry/IR-마이크로-평균Micro-average-매크로-평균Macro-average-이란-무엇인가
좋은 강의 감사합니다 :) 질문이 있습니다!! True Negative를 로봇이 알파벳을 식별하는 예시로 설명하면 A를 예측해야되는 상황에서 A가 아닌 다른걸 보여 줬을때 A가 아니라고 예측하는 건가요? 그럼 여기서 negative라는건 원하는결과가 나오지 않은 케이스를 말하는거고 True는 이 케이스들이 결과적으로 의도 한대로 나온는걸 말하는건가요?
@@TheEasyoung 저도 같은 질문을 드립니다. 실제 A 클래스이지만 FN이 나오는 경우는 B-B, C-C, D-D 이렇게 대각 원소들만 해당되는 것이 아닌지요? A 입장에서는 B가 틀린 답이지만, 틀린 것을 틀리다라고 즉 B가오는 경우만(C, D는 아니라) 'True' Nagative가 아닌가요?
좋은 질문입니다. 실제 데이터 언밸런스일 경우, 언밸런스인 상태로 테스트하는 게 실제 모델이 겪을 상황에서 테스트하는 것과 동일하여 밸런스하게 바꾸지 않고 테스트하는 과정이 필요합니다. 때로는 밸런스하게 바꿔서 테스트하기도 합니다만 상대적으로 많은 데이터를 줄이는 것보단 상대적으로 적은 데이터를 더 수집하거나 가짜 데이터를 생성해서 하는 방법이 선호되기도 합니다.
감사합니다~:)
맨날 2by2에 교과서 같은 내용만 봤는데 쉽고 직관적인 설명 감사합니다.
performance metric에 대해 공부하다 발견한 금맥 같은 강좌네요. 훌륭합니다~~~
감사합니다. 이해하기 쉽게 설명해주셔서 잘이해가 되었네요.
훌륭한 강의 잘 봤습니다. 다른 책에서 본것과 확연히 다른 insight가 있는 설명에 감사드립니다.
1) 항상 Tumor 예제로 2 by 2 예제만 봤었는데 그 외 다른 예제를 사용해주심. -> 생각이 확장되었습니다.
2) 마지막 Insight ( balanced data vs imbalanced data ) 를 언급
확실히 많이 준비하신다는 느낌을 받았습니다.
더욱이 Play List에 있는 coding 강의를 이번에 처음 봤는데, 저한테도 큰 도움이 될 것 같네요. 챙겨보겠습니다.
jinhwan Jung 감사합니다 ^^ 제가 가장 듣고 싶은 댓글이네요, 강의 내용을 확실히 보시고 제가 만들면서 고려했던 점을 고스란히 칭찬해주셔서 감사합니다. 제 경험을 바탕으로 항상 채워나갈께요.
정말 감사합니다. 빠른 이해가 필요한 시점이었는데, 너무 명료하고 자세히 설명해주셔서 크게 도움받았습니다. 감사합니다!!!
이해하기 쉬운 강의 자료와 자세한 설명 정말 감사합니다~!
😀 너무 좋은 강의 감사합니다... 하하 .... 민석님과 같은 시대에 살고 있다는 것이 너무나도 영광스럽습니다.
이해가 잘 됩니다. 감사합니다.
도움이 정말 많이 되었습니다. 영상 감사드립니다!
좋은 강의 감사드립니다.
dosiba kim 피드백 고마워요!
많은 도움이 되었습니다. 감사합니다!
좋은 강의 감사합니다!
진짜..최고다...
선생님! 좋은 강의 감사합니다.
python, sklearn 으로 머신러닝을 공부하고 있는데 이 강의의 로보트 예제를 데이터셋으로 해서 f1_score를 적용할 경우 y_true, y_pred는 뭘로 넣어야 하나요? 여기서 헤메고 있어요 선생님 지혜를 베푸소서 ㅠㅅㅠ)
Y_true는 정답을 y_pred는 로봇이 출력한 값을 넣습니다. 감사합니다!
좋은 영상 감사드립니다!
공부를 하던 중 궁금증에 생겨서 질문드립니다! ㅠㅠ
Q) 분류 모델 성능이 아닌 연속데이터를 예측하는 회귀 모델 같은 경우 모델 성능을 어떤식으로 판단한고 선택하는지 여쭤보고 싶습니다!
입문자로서 늘 큰 도움 받고 있습니다! 항상 좋은 강의 감사드립니다 ㅎㅎ
안녕하세요. 여러 방법들이 있지만 대표적으로, 회귀 모델 같은 경우, 테스트 데이터들의 에러율을 더한 값을 평균내서 구할 수 있습니다. MSE (Mean Squared Error) 방식인데요, 아래 영상에서 MSE 관련해서는 아래 영상에서 4분 정도부터 설명 보실 수 있어요. 평균 에러율이 낮은 모델이 성능이 더 좋은 모델이라고 판단할 수 있어요.
th-cam.com/video/MwadQ74iE-k/w-d-xo.html
좋은 강의 감사 드립니다!! F1 score 가 클래스 불균형일때 사용하면 좋은것은 알고있는데
micro avg F1와 macro avg F1(두 측도 계산 차이점은 알고 있습니다) 이 두 성능측도는 어느 상황일때 사용하는것이 좋은지 궁금합니다...ㅜㅜ
ISG Geoje 안녕하세요, 아주 좋은 질문 감사합니다. 시간 관계상 제가 그 둘의 차이점은 다루지 않았는데요, 클래스중에서 많은 데이터를 가진 클래스에 편중을 두고 싶으면 micro를 쓰시고, 적은 데이터에 편중을 두시려면 macro를 쓰기도 합니다. 매크로와 마이크로의 차이점은 아래 블로그에 설명이 아주 잘되어있네요,
unlimitedpower.tistory.com/m/entry/IR-마이크로-평균Micro-average-매크로-평균Macro-average-이란-무엇인가
그러면 클래스 불균형일때는 분류된거 전체적으로 보고 싶을때는 두 측도 micro와 macro F1모두를 이용해야하는것같네요.. 제 논문자료가 클래스 불균형(marginal sum : 23,123,39,30)을 이루고 있거든요 아무튼
좋은 강의 다시 한번 감사합니다!!!
ISG Geoje 매크로와 마이크로 모두 해보고 둘의 결과가 동일하게 한가지 모델을 가리킨다면 논문 작성에 큰 문제 없어보입니다. 만에 하나 둘의 결과가 다르게 나온다면 weighted macro도 시도해보시면 좋을거 같네요. 감사합니다.
Accuracy 구할때요. 영상에는 TP만으로 구하셨는데 제가 학교에서 교수님에게 배운 내용은 TP + TN으로 알고있는데 잘못된건가요???
교수님께 배운 내용이 맞고, 이 영상에서도 TP + TN으로 구하고 있습니다. 교수님의 예제는 이진 분류이었던걸로 판단됩니다. 다중 분류의 경우 TP + TN / 전체 데이터가 영상에서와 같이 계산됩니다.
좋은 강의 감사합니다 :)
질문이 있습니다!!
True Negative를 로봇이 알파벳을 식별하는 예시로 설명하면
A를 예측해야되는 상황에서
A가 아닌 다른걸 보여 줬을때
A가 아니라고 예측하는 건가요?
그럼 여기서
negative라는건 원하는결과가 나오지 않은 케이스를 말하는거고
True는 이 케이스들이 결과적으로 의도 한대로 나온는걸 말하는건가요?
Eung Jin Lee 네 예시가 TN이 맞습니다. True 또는 False는 맞는 지 틀리는 지를 의미합니다.
@@TheEasyoung 저도 같은 질문을 드립니다. 실제 A 클래스이지만 FN이 나오는 경우는 B-B, C-C, D-D 이렇게 대각 원소들만 해당되는 것이 아닌지요? A 입장에서는 B가 틀린 답이지만, 틀린 것을 틀리다라고 즉 B가오는 경우만(C, D는 아니라) 'True' Nagative가 아닌가요?
근데 언밸런스한 데이터를 전처리하는 과정에서 밸런스하게 바꾸지 않는/못하는 이유는 뭔가요? 그렇게 하면 acc 그냥 써도 될 것 같은데...
좋은 질문입니다. 실제 데이터 언밸런스일 경우, 언밸런스인 상태로 테스트하는 게 실제 모델이 겪을 상황에서 테스트하는 것과 동일하여 밸런스하게 바꾸지 않고 테스트하는 과정이 필요합니다. 때로는 밸런스하게 바꿔서 테스트하기도 합니다만 상대적으로 많은 데이터를 줄이는 것보단 상대적으로 적은 데이터를 더 수집하거나 가짜 데이터를 생성해서 하는 방법이 선호되기도 합니다.
f1-score를 balanced data에서 사용한다면 accuracy에 비해 이점이 있을까요?
0 Hong 리콜과 프리시젼을 동시에 고려했다는 점이 이점이 될 수 있습니다. ㅎ
@@TheEasyoung 이 영상이 아직도 1만회라는게 신기하네요.