Diagramas de Caja (BoxPlots) y Datos Anómalos (outliers) con la Prueba de Tukey en Python

แชร์
ฝัง
  • เผยแพร่เมื่อ 14 พ.ย. 2024

ความคิดเห็น • 23

  • @CodigoMaquina
    @CodigoMaquina  2 ปีที่แล้ว +1

    👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com

  • @davidcardenas4266
    @davidcardenas4266 9 หลายเดือนก่อน

    Código maquina, por creadores como tú es que tengo desactivado el bloqueador de anuncios en youtube. Super excelente contenido. Gracias por tanto.

  • @foland2619
    @foland2619 4 หลายเดือนก่อน

    Gran contenido. Explicación sencilla, concisa y clara acerca del tema.

  • @cesarjoelchiroquesosa5896
    @cesarjoelchiroquesosa5896 2 ปีที่แล้ว +2

    Una explicación sumamente entendible y un material didáctico de gran valor. Muchas gracias por todo el contenido

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      Gracias por tomarte el tiempo de comentar Cesar, me alegra saber que el contenido es de tu agrado. Saludos!!

  • @abusfulcanell9374
    @abusfulcanell9374 2 ปีที่แล้ว +4

    Que belleza de canal, mil gracias por el contenido 🙏👍

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว +1

      Muchas gracias por tus comentarios tan cálidos :)

  • @rockophill3934
    @rockophill3934 2 ปีที่แล้ว +2

    Excelente Maestro Octavio, y en efecto no sabia como llamar a esos valores extra ordinarios que terminan inflando cuartiles y alejando el enfoque de los datos, considerando previamente la convención o regla de negocio para su aplicación. Agradezco su detallada y concisa explicación.👌

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      Muchas gracias por todos tus comentarios. Si te gusto este tema, te recomiendo que le eches un vistazo a la técnica de bosques de aislamiento que justo sirve para detectar datos atípicos: th-cam.com/video/n2PpD7xnPoM/w-d-xo.html

  • @CarlosAlbertoGordilloVarela
    @CarlosAlbertoGordilloVarela 6 หลายเดือนก่อน

    muchas gracias, excelente video

  • @EduardoCruz-dv3vx
    @EduardoCruz-dv3vx 2 ปีที่แล้ว +1

    Magnífica explicación.

  • @Gustavo-rb6df
    @Gustavo-rb6df ปีที่แล้ว +1

    Gracias por este contenido!!!

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Gracias a ti por comentar Gustavo. Saludos!!

  • @SELF_NATUR
    @SELF_NATUR ปีที่แล้ว +1

    gracias (Y)

  • @jorgevilas1603
    @jorgevilas1603 10 หลายเดือนก่อน

    Hola.
    No sé si este es el lugar, pero al ejecutar muestra el siguiente mensaje "System.ArgumentOutOfRangeException: El valor debe ser mayor que o igual a cero y menor que el tamaño de búfer de consola en dicha dimensión."

  • @jabesfriasmartinez6953
    @jabesfriasmartinez6953 2 ปีที่แล้ว +2

    Muy buen video me gustaría aprender a arreglar cuando tengo datos atípicos

    • @CodigoMaquina
      @CodigoMaquina  2 ปีที่แล้ว

      Gracias por tus comentarios. Para tratar datos atípicos, te recomiendo echarle un ojo al video de normalización, estandarización y escalamiento que tenemos en el canal:
      th-cam.com/video/-VuR14Qyl7E/w-d-xo.html
      También te recomiendo ver el siguiente video con otra técnica para detectar datos atípicos:
      th-cam.com/video/n2PpD7xnPoM/w-d-xo.html
      Gracias por seguir el contenido del canal.

  • @HPenarandaBello
    @HPenarandaBello ปีที่แล้ว +2

    Hola. Buen vídeo. ¿Cómo eliminar los registros que tienen datos atípicos? ¿Existe alguna librería?

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Hola @HPenarandaBello gracias por la pregunta. Todo depende del contexto, pero aquí va un par de formas: 1) Usando un escalador robusto (favor de ver el siguiente video th-cam.com/video/-VuR14Qyl7E/w-d-xo.html) 2) o aplicando filtros (favor de ver el siguiente video th-cam.com/video/U-7Q-koi-Cc/w-d-xo.html). De hecho, con filtros se podría definir un valor por defecto que reemplace a los datos atípicos de la siguiente manera:
      import numpy as np
      datos = np.array([10, 11, 12, 1000])
      datos[datos>999] = 13

  • @nikosora
    @nikosora ปีที่แล้ว +1

    muchas gracias por el video, me gustan tus videos ya que explicas con mucho detalle, me salta solo una duda, en el caso de que tenga un dataframe y quisiera visualizarlo seria igual que como lo hiciste con edades.
    Me explico tu pusiste edades y creaste un array de las edades, luego para visualizarlo pusiste plt.boxplot (edades) en el caso de una dataframe seria igual?
    es decir si importo un dataframe y lo llamo por ejemplo autos, una vez ya importado para verlo seria plt.boxplot(autos).
    muchas gracias

    • @CodigoMaquina
      @CodigoMaquina  ปีที่แล้ว

      Muchas gracias por tus comentario y por tu pregunta. Al respecto, si lo que deseas es echarle un vistazo rápido a tus datos, la clase DataFrame tiene integrado un método llamado plot -> DataFrame.plot(*args, **kwargs). Si deseas una visualización más detallada, te recomiendo echarle un ojo a nuestra playlist sobre visualización de datos: th-cam.com/play/PLat2DtY8K7YWB3X5oJiXb5qON0rA3j0J6.html