Métricas para Clasificadores de Machine Learning ➤ Matriz de Confusión Precision Accuracy Recall F1

แชร์
ฝัง
  • เผยแพร่เมื่อ 26 ก.ค. 2024
  • En el contexto de clasificadores de aprendizaje de máquina, este video explica métricas para evaluarlos calculadas a partir de los verdaderos positivos, verdaderos negativos, falsos positivos y falsos negativos (que conforman la matriz de confusión). Las métricas explicadas son Precision, Accuracy, Recall y F1 score. Además, se presenta cómo evaluar vía programación a los clasificadores usando Scikit-Learn de Python.
    Para citar este recurso educativo utiliza la siguiente referencia:
    Gutiérrez-García, J.O. [Código Máquina]. (2022, 20 de Agosto). Métricas para Clasificadores de Machine Learning: Matriz de Confusión, Precision, Accuracy, Recall, F1 [Video]. TH-cam. [Incluye aquí la URL del video]
    ********************************************
    Para guiar tu aprendizaje, en este vínculo ( • Curso de Inteligencia ... ) se encuentra una guía secuencial para aprender:
    1. Programación Básica con Python;
    2. Manejo de Datos;
    3. Visualización de Datos;
    4. Análisis de Datos; y
    5. Aprendizaje de Máquina y Ciencia de Datos.
    ********************************************
    Índice del Video:
    0:00 Introducción
    0:39 Matriz de confusión
    5:17 Accuracy
    6:07 Precision y Recall
    7:49 F1 score
    8:53 Métricas con Scikit-Learn
    17:12 Clasificadores hipotéticos
    Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en:
    / shop
    El código del video está disponible en GitHub github.com/CodigoMaquina/code
    #AprendizajeAutomatizado #MachineLearning #AprendizajeDeMaquina #DataScience #ScikitLearn #SkLearn #CienciaDeDatos

ความคิดเห็น • 16

  • @CodigoMaquina
    @CodigoMaquina  ปีที่แล้ว +4

    Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en:
    facebook.com/C0d1g0Maqu1na/shop

  • @fpicado1
    @fpicado1 4 หลายเดือนก่อน +1

    De los mejores canales por mucho, mil gracias por esto!

  • @alberthpinco3543
    @alberthpinco3543 5 หลายเดือนก่อน

    Gran contenido, muy buena explicación del tema y del código

  • @carlosandrestellocardenas7536
    @carlosandrestellocardenas7536 ปีที่แล้ว +1

    Excelente su trabajo para los que estamos aprendiendo. Muchas Gracias

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Gracias a ti Carlos, por tomarte el tiempo de comentar. Saludos!!

  • @darkstyllv9251
    @darkstyllv9251 ปีที่แล้ว +1

    Muchas gracias! Lo que necesitaba!!!

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Es un placer leer que los videos son de utilidad. Ese es justo su propósito :)

  • @TOTE77
    @TOTE77 10 หลายเดือนก่อน +1

    Excelente aporte

    • @CodigoMaquina
      @CodigoMaquina  9 หลายเดือนก่อน

      @TOTE77 muchas gracias!!!

  • @edwardbrandt4868
    @edwardbrandt4868 ปีที่แล้ว +2

    Primeramente, agradecer lo excelente que es este canal llevando el conocimiento de ML en nuestra lengua, eso es impagable. Como aporte a este video quiero indicar la accuracy o exactitud es una metrica global, que indica la calidad del modelo para predecir los estados o respuestas cuando trabajamos con data supervisada. En términos simples la probabilidad de predecir cualquiera de los estados defenidos. Ahora recall y precisión no son globales como se presentó. Precison es la probabilidad del modelo de predecir un estado en particular, en este caso saludable o mortal. Por lo tanto cuando hablamos de precision debemos hacer referencia en su valor a que estado esta referencia. Lo mismo con recall o sensibilidad donde corresponde a la probabilidad de que el modelo capture la condicion particular. Es decir tendremos un recall para saludable y uno para mortal, no global. Como sugerencia la matriz de confusion si bien se puede mostrar en términos contables, es mas ludica cuando se mueatra en términos de porcentajes, y esto porque la diagonal de la matriz representa el recall que el modelo aplica al estado real. Me parecio miy bien explicar el concepto de data desbalanceada, ahora el que el clasificador tenga calificativos depende de la data, del modelo elegido, sus hiperparametros y de normalizacion o standarizacion escogida, dado que en el ejemplo se utilizo arbol de decisión no requiere normalizar la data en cuanto a modelos como svm que realizan clasificaciones basedas en distancia euclidiana para la data. Es un gran trabajo el que desarrollas, un abrazo.

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Estimado Edward gracias por toda la información que brindas. Comentarios como el tuyo son aportes muy valiosos.

  • @joseernestomoralesventura9286
    @joseernestomoralesventura9286 ปีที่แล้ว +1

    Como siempre, gracias! Me ha ayudado bastante tu explicación.

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      @joseernestomoralesventura9286 muchas gracias por seguir el contenido del canal!

  • @yuniorbatista2416
    @yuniorbatista2416 ปีที่แล้ว +1

    Los verdaderos positivos deberian estar en la parte superior Izquierda porque efectivamente eran sanas y se clasificron como sanas?

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Hola Yunior. Gracias por la pregunta. Te comento que con respecto a la posición de los verdaderos positivos en la matriz de confusión, no hay un estándar (hasta donde tengo conocimiento) para ponerlos en la parte superior izquierda o en la parte inferior derecha, siempre cuando se organicen las otras celdas y etiquetas en función de su posición. Lo más importante es llevarse es el entendimiento de los falsos positivos/negativos y los verdaderos positivos/negativos. Te agradezco tu interacción y el seguimiento al contenido de canal :)

    • @joseernestomoralesventura9286
      @joseernestomoralesventura9286 ปีที่แล้ว

      ​@@CodigoMaquina eso veo, buscando información sobre lo que retorna la matriz de confusión se encuentra que la respuesta queda en esta forma ( ('TN', 'FP'), ('FN','TP') ) . Lo mismo que preguntas @yuniorbatista2416 lo puedes reinterpretar con esto. En base a esto debes ubicar correctamente las etiquetas de tu matriz de confusión (para que no te confundas jajajaja)