Imputación (o Manejo de Datos Faltantes) con Python

แชร์
ฝัง
  • เผยแพร่เมื่อ 17 ต.ค. 2024

ความคิดเห็น • 35

  • @CodigoMaquina
    @CodigoMaquina  2 ปีที่แล้ว +1

    👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com

  • @manuelsandoval3866
    @manuelsandoval3866 4 หลายเดือนก่อน +1

    El mejor canal para aprender python

    • @CodigoMaquina
      @CodigoMaquina  2 หลายเดือนก่อน

      Muchas gracias!!!

  • @dennilsonmunozrojas9003
    @dennilsonmunozrojas9003 3 ปีที่แล้ว +5

    Uff , que pedazo de vídeo tío!! Súper genial , muchas gracias!!

    • @CodigoMaquina
      @CodigoMaquina  3 ปีที่แล้ว

      Muchas gracias por tus comentarios Dennilson :)

  • @danielmendieta2666
    @danielmendieta2666 ปีที่แล้ว +1

    Brillante como siempre!

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว +1

      Daniel muchas gracias por tus comentarios. Es un verdadero placer reconocer tus comentarios en varios videos :)

  • @jaimeavila7247
    @jaimeavila7247 2 ปีที่แล้ว +1

    Muchas gracias, me fue de mucha utilidad el video, Saludos

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      Gracias por tus comentarios :) Si tienes interés en este tema en particular, te recomiendo echarle un ojo al siguiente video donde se presentan técnicas más avanzadas: th-cam.com/video/dToVCgCPW1o/w-d-xo.html

  • @scho1z
    @scho1z 2 ปีที่แล้ว +1

    Excelente material!! muchas gracias

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว +1

      Gracias por tus comentarios y por interactuar en el canal :)

  • @diegosepulveda9077
    @diegosepulveda9077 ปีที่แล้ว +2

    muy buen video, podrías hacer uno explicando también la imputación kNN con sklearn? saludos

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Hola @diegosepulveda9077 gracias por interactuar con el contenido del canal. Por cierto, ya tenemos un video sobre imputación utilizando KNN -> th-cam.com/video/dToVCgCPW1o/w-d-xo.html

  • @JuanAndresLlanero
    @JuanAndresLlanero ปีที่แล้ว +1

    Se puede por ejemplo, hacer la media de las edades e ingresos y esos serán los valores por defecto. Muchas gracias por los vídeos he aprendido mucho.

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Libertad Python muchas gracias por tus comentarios. Con respecto a tu pregunta, en el caso general, sí es un procedimiento común utilizar las medias para completar valores faltantes. Gracias por seguir el contenido del canal :)

  • @JoseIgnacioSCNacho
    @JoseIgnacioSCNacho ปีที่แล้ว +1

    Clarísimo👋

  • @cristiancontreras352
    @cristiancontreras352 ปีที่แล้ว +1

    Me gusto mucho este video pero tengo una pregunta si quiero contar los valores de una columna y excluir los nulos sin eliminar o cambiar su valor como hago por fa

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Muchas gracias por tus comentarios. Aquí va la respuesta a tu pregunta: print(datos[datos["columna"].isnull()==False]["columna"].size)

  • @divina.glitch
    @divina.glitch 2 ปีที่แล้ว +1

    Super util!! Gracias brother!!

  • @diegojavierlievanoparra624
    @diegojavierlievanoparra624 2 ปีที่แล้ว +1

    Hola! excelente vídeo. Pero es posible dejar solamente las celdas vacías sin ningun tipo de valor? Gracias!

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว +1

      Gracias por tu comentario y por la pregunta. Sí es posible dejar las celdas vacías. De hecho, existen técnicas que pueden hacer regresión/clasificación con valores faltantes. No obstante, la mayoría de las técnicas no puede lidiar con datos faltantes. De ahí que sea común hacer una imputación. Por cierto, la siguiente semana sale un video sobre este mismo tema que tal vez sea de tu interés. Gracias por seguir el contenido del canal :)

  • @alpema80
    @alpema80 ปีที่แล้ว +1

    Muchas gracias, estoy aprendiendo pandas y este tema me llama demasiado la tención,. hay algún curso o libro donde se pueda enfocar más en este tema? Gracias.

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว +1

      Hola Alex. Gracias por tus comentarios. Te comento que en el canal tenemos una guía secuencial para aprender:
      1. Programación Básica con Python;
      2. Manejo de Datos (con Pandas y otras librerías);
      3. Visualización de Datos;
      4. Análisis de Datos; y
      5. Aprendizaje de Máquina y Ciencia de Datos.
      Échale un ojo al siguiente video: th-cam.com/video/lomJnbN5Wnk/w-d-xo.html

  • @chernsimons
    @chernsimons ปีที่แล้ว +1

    Hola, si tuviera muchos datos, quisiera imputar datos en una columna y se distribuyeran con los datos conocidos de alguna manera que pueda obtener una regresión, sería valido imputar usando esa regresión? o por otro lado imputar prediciendo esos valores con una machine learning? Valdrá la pena?

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว +1

      Hola Gonzalo muchas gracias por tu pregunta. Imputación es un tema bastante amplio y profundo y lleno de particularidades. De hecho, es un tema de investigación. En pocas palabras, sí existen métodos donde se utiliza la correlación y la regresión para imputar datos. Échale un ojo a las siguientes referencias: Little, R. J. (1992). Regression with missing X's: a review. Journal of the American statistical association, 87(420), 1227-1237 y Taylor, S. L., Ruhaak, L. R., Kelly, K., Weiss, R. H., & Kim, K. (2017). Effects of imputation on correlation: implications for analysis of mass spectrometry data from multiple biological matrices. Briefings in bioinformatics, 18(2), 312-320.

  • @oliverrojasconde9144
    @oliverrojasconde9144 2 ปีที่แล้ว +1

    Excelente video!

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      ¡Gracias por seguir al canal! :)

  • @joseleonardosanchezvasquez1514
    @joseleonardosanchezvasquez1514 2 ปีที่แล้ว +1

    Gracias buen video

  • @TechSci_
    @TechSci_ 2 ปีที่แล้ว +2

    Buen video!

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      ¡Gracias por tus comentarios!

  • @JulitoRamm1
    @JulitoRamm1 10 หลายเดือนก่อน

    y cómo haría para que los numeros del dataframe me los arroje sin decimales? entiendo que hay varias opciones pero estoy atascado, ya que cuando quiero volcar la df a un formulario en vez de introducir 150, carga 1500 interpretando que es 150.0

    • @CodigoMaquina
      @CodigoMaquina  9 หลายเดือนก่อน

      @JulitoRamm1 gracias por la pregunta. Ciertamente hay múltiples maneras de ajustar los decimales en pandas. Una es usando la función round e indicando el número de decimales a redondear; la otra es usando la función piso (floor); y por último, usando la función techo (ceil). La forma correcta, dependerá enteramente de tus requerimientos funcionales. Aquí va código de ejemplo:
      import pandas as pd
      import numpy as np
      datos = pd.DataFrame()
      datos["columna"] = pd.Series([1.11, 2.22, 3.33])
      datos["columna"].round(decimals=2)
      datos["columna"].apply(np.ceil)
      datos["columna"].apply(np.floor)