Por qué y cómo codificar datos Categóricos Ordinales usando Python con sklearn y pandas

แชร์
ฝัง
  • เผยแพร่เมื่อ 14 พ.ย. 2024

ความคิดเห็น • 34

  • @CodigoMaquina
    @CodigoMaquina  2 ปีที่แล้ว +2

    👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com

  • @AlbertoPatM
    @AlbertoPatM 2 ปีที่แล้ว +10

    Actualmente estoy estudiando la maestría de Inteligencia Artificial y debo confesar que tus explicaciones me han servido para comprender mejor las bases para poder resolver muchos proyectos que nos han dejado.
    Siento que este canal está siendo infravalorado para el valor de contenido que ofrece.

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว +5

      Muchas gracias por tus comentarios. Es verdaderamente gratificante leer que el contenido que generamos es de utilidad. Cuando iniciamos este proyecto, pensamos en apoyar (aunque sea con un poco) la formación de algunas personas y afortunadamente cada vez llegamos a más personas, lo cual le da mayor sentido a nuestro esfuerzo. Agradezco tus palabras y por ahí nos vemos en más videos :)

    • @jhojansolano4249
      @jhojansolano4249 ปีที่แล้ว +1

      Tengo la misma opinión

    • @jhojansolano4249
      @jhojansolano4249 ปีที่แล้ว +1

      Muchas gracias

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      ​@@jhojansolano4249 muchísimas gracias!!!

  • @rockophill3934
    @rockophill3934 2 ปีที่แล้ว +1

    Muchas Gracias Maestro Octavio como siempre la mejor Explicación

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      Muchas gracias por el apoyo Rocko. Saludos!!

  • @danielvargasPry
    @danielvargasPry 8 หลายเดือนก่อน +2

    Bro sería genial que compartieras los notebooks, será posible?

  • @cesaraugustoperez1814
    @cesaraugustoperez1814 2 ปีที่แล้ว +1

    Octavio muchas gracias por tu explicación!

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      Es un placer. Gracias por seguir el contenido del canal :)

  • @camiloberdugo3081
    @camiloberdugo3081 2 ปีที่แล้ว +2

    Me gusto el video, Muchas gracias.

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว +1

      Muchas gracias por ver el contenido del canal y por comentar :)

  • @luckygons
    @luckygons 5 หลายเดือนก่อน

    Espero tucanal mil gracias x estos videos

  • @albertoquijnao7589
    @albertoquijnao7589 ปีที่แล้ว +1

    Muy bueno su contenido.... millones de gracias

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      @albertoquijnao7589 te agradezco mucho tus palabras.
      Dando like, comentando y/o compartiendo el video, ayudas a que este contenido llegue a más personas ¡¡¡GRACIAS!!!

  • @jucasosa5130
    @jucasosa5130 ปีที่แล้ว +1

    maravilloso..
    muchas gracias

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Es un placer. Gracias por seguir el contenido del canal :)

  • @corporacionmegamaxi7532
    @corporacionmegamaxi7532 2 ปีที่แล้ว +1

    Gracias por tu Aporte

  • @SantiagoMatiasMartinez-p3i
    @SantiagoMatiasMartinez-p3i 8 หลายเดือนก่อน

    Hola gran video, tienes alguno donde se traten valores faltantes categoricos?

  • @diegoelcrackk20159
    @diegoelcrackk20159 2 ปีที่แล้ว +1

    Buenisimo, gracias Octavio

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      Gracias por seguir el canal :)

  • @fede29262
    @fede29262 ปีที่แล้ว +1

    Muy buenos los videos Octavio, son de gran utilidad. Te hago una consulta. Lo explicado en el video para los features, se puede aplicar también a las clases? Es decir, supongamos que las clases son mas de 2 y a su vez tienen cierta relación de orden entre ellas, puedo utilizar variables numéricas para las clases (por ejemplo 1, 2 y 3) para reflejar dicha relación de orden?
    (esto serviría por ejemplo para que sea mas improbable que el modelo confunda la clase 1 con la clase 3 comparado con confundir la clase 1 con la clase 2, ya que la distancia entre las clases 1 y 3 es mayor a la distancia entre las clases 1 y 2). Se puede hacer esto? Espero que se entienda mi pregunta. Gracias y un saludo!

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Hola @fede29262 gracias por tus comentarios y por la pregunta. Igual que se realiza una codificación para las variables de entrada, también se llega a realizar para la salida de los modelos. De hecho, en general, cuando se construye una red neuronal para clasificación de múltiples clases (a pesar de que podrías tener una sola neurona de salida), comúnmente se tiene una neurona de salida para cada clase. Con esto tendrías una salida de la red neuronal similar al formato de codificación one-hot. Esto tiene la ventaja, de que dependiendo tu función de activación, podrías tomar la salida de cada neurona (asociada a una clase en particular) como la probabilidad de la instancia de pertenecer a dicha clase. Gracias por seguir el contenido del canal :)

  • @jrobledo25
    @jrobledo25 2 ปีที่แล้ว +1

    Excelente explicación Octavio y muy bueno saber en qué ocasiones podemos utilizar un método de codificación u otro, en lo personal tiendo a usar el OHE en la mayoría de los casos por lo que bien mencionas de que no conocemos qué tan equidistantes se encuentran los valores de las etiquetas 😸

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว +1

      Gracias por interactuar en el canal y compartir tu experiencia. Yo igual aprendo de los comentarios. Esta área es muy amplia y siempre hay mucho por aprender y afortunadamente muchas personas de quien aprender :)

  • @wachinrobcar
    @wachinrobcar ปีที่แล้ว +1

    Hola, hice paso a paso tu ejemplo y me dió el mismo resultado.
    Queriendo profundizar el aprendizaje, utilicé una data de 5000 filas que tiene como salida si/no, para este caso el 10% son (sí) y el 90% (no). Hice la conversión escalar, hasta ahí todo bien, pero cuando realizo la predicción todas los resultados son ceros. Imagino que es debido a la gran diferencia entre si/no, qué me recomendarías para este caso. Gracias por tus vídeos, saludos desde Perú.

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Roberto te felicito por tus esfuerzos. Te comento que el problema que podrías estar enfrentando es el de clases desbalanceadas. Aquí va un video que explica el problema y brinda una solución: th-cam.com/video/2FbugqoBz94/w-d-xo.html

  • @bryamblasrimac9945
    @bryamblasrimac9945 ปีที่แล้ว +2

    Hola octavio, se puede escalar las variables categóricas después de codificarlas mediante OrdinalEncoder?

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว +1

      @bryamblasrimac9945 gracias por la pregunta. Al respecto, efectivamente se pueden escalar las variables categóricas después de codificarlas :)

  • @joseleonardosanchezvasquez1514
    @joseleonardosanchezvasquez1514 2 ปีที่แล้ว +1

    Buenas gracias genial video. Pero me gustaría saber si para el caso ordinal si uno puede imputar los valores, por ejemplo para el caso de un préstamo del banco
    uno podría asignar los valores por ejemplo calificación crediticia mala=0, regular =6, buena=8 y excelente =10, luego normalizar y claro correr los modelos, claramente las distancia son diferentes entre categorías sobre todo a mala. Gracias y disculpa

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว +1

      Gracias por tus comentarios y por la pregunta. Desde mi punto de vista, asignar pesos específicos podría introducir todavía más sesgos. Para el caso de un clasificador, tal vez te convenga más ajustar los pesos de las clases (más que sesgar la codificación de los datos). Tal vez así obtengas el efecto deseado. Te recomiendo echarle un ojo al siguiente video th-cam.com/video/2FbugqoBz94/w-d-xo.html

    • @joseleonardosanchezvasquez1514
      @joseleonardosanchezvasquez1514 2 ปีที่แล้ว +1

      @@CodigoMaquina Gracias