Cómo saber si los Datos siguen una Distribución dada usando Gráficos Cuantil-Cuantil (o QQ) y Python

แชร์
ฝัง
  • เผยแพร่เมื่อ 9 ก.ค. 2024
  • Los gráficos cuantil-cuantil o diagramas Q-Q se utilizan para verificar si un conjunto de datos sigue una distribución de probabilidad dada. Por ejemplo, comúnmente los gráficos QQ se utilizan para verificar si un conjunto de datos sigue una distribución normal. En este video se explica cómo construir paso a paso los gráficos Q-Q además de cómo interpretarlos. También se presenta cómo crear los gráficos Q-Q usando python de forma manual y automatizada.
    Para citar este recurso educativo utiliza la siguiente referencia:
    Gutiérrez-García, J.O. [Código Máquina]. (2023, 30 de Octubre). Cómo saber si los Datos siguen una Distribución dada usando Gráficos Cuantil-Cuantil (o QQ) y Python. [Video]. TH-cam. [Incluye aquí la URL del video]
    ********************************************
    Para guiar tu aprendizaje, en este vínculo ( • Curso de Inteligencia ... ) se encuentra una guía secuencial para aprender:
    1. Programación Básica con Python;
    2. Manejo de Datos;
    3. Visualización de Datos;
    4. Análisis de Datos; y
    5. Aprendizaje de Máquina y Ciencia de Datos.
    ********************************************
    Índice del Video:
    0:00 Introducción
    1:00 Qué es un gráfico Q-Q y para qué se utilizan
    1:39 Construcción paso a paso de los gráficos Q-Q
    22:07 Gráficos Q-Q con python
    Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en:
    / shop
    El código del video está disponible en GitHub github.com/CodigoMaquina/code
    #estadística #datascience #python #cienciadedatos #analisisdedatos

ความคิดเห็น • 21

  • @CodigoMaquina
    @CodigoMaquina  8 หลายเดือนก่อน +1

    Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en facebook.com/C0d1g0Maqu1na/shop

  • @user-th3xk4yd7n
    @user-th3xk4yd7n 5 หลายเดือนก่อน

    El video entrega contenidos con claridad y simpleza. He visto varios de tus videos y son muy útiles. Gracias por el contenido!!!

  • @Luk17a5
    @Luk17a5 7 หลายเดือนก่อน +1

    Sos un ídolo! Ojala hubiera estado este video la primera vez que me toco aprenderlo😢

    • @CodigoMaquina
      @CodigoMaquina  6 หลายเดือนก่อน

      @Luk17a5 muchas gracias por tu comentario y un gran año 2024!!!

  • @octavioh
    @octavioh 8 หลายเดือนก่อน +3

    Excelente!

    • @CodigoMaquina
      @CodigoMaquina  8 หลายเดือนก่อน

      Muchas gracias :)

  • @israelmg1749
    @israelmg1749 8 หลายเดือนก่อน +2

    Excelente contenido 👏

  • @reinerromero7265
    @reinerromero7265 8 หลายเดือนก่อน +1

    Excelente.

    • @CodigoMaquina
      @CodigoMaquina  8 หลายเดือนก่อน

      @reinerromero7265 muchas gracias!

  • @edwardbrandt4868
    @edwardbrandt4868 7 หลายเดือนก่อน +1

    Gracias Octavio por la información presentada. Debo decir que he tenido que ver el video a lo menos 3 veces para entender mejor el concepto. Porque si con los graficoa Q-Q al final vere si un dataset se ajusta a una fdp determinada (Normal, weibull, exponencial, etc), no es mas economico realizar con python una prueba de bondad de ajuste?. Es decir, si quisera saber si un conjunto de datos se ajustan a una distribución weibull, aplicando una prueba kolmogorov smirnof podria tener resultado de mi hipótesis, de la misma forma que se plantea con los graficos Q-Q. Ayudame a entender este punto por favor. Ademas de agradecer el conocimiento entregados.

    • @CodigoMaquina
      @CodigoMaquina  6 หลายเดือนก่อน +1

      @edwardbrandt4868 efectivamente los gráficos Q-Q y algunas pruebas de hipótesis se pueden utilizar para el mismo propósito. En general, las pruebas de hipótesis son mucho más utilizadas aunque los gráficos Q-Q se llegan a utilizar para checar visualmente y de una forma rápida si los datos siguen o no una distribución dada. Según este artículo de la Universidad de Virginia (library.virginia.edu/data/articles/understanding-q-q-plots), otra ventaja es que en caso de que los datos no sigan una distribución dada, los gráficos Q-Q te ayudan a ver qué puntos particulares son los que contribuyen a que no se siga la distribución. Feliz año!!!

    • @edwardbrandt4868
      @edwardbrandt4868 6 หลายเดือนก่อน +1

      @@CodigoMaquina muy agradecido...feliz 2024

  • @luisgil267
    @luisgil267 8 หลายเดือนก่อน +1

    Gran video. Para saber si los datos siguen algunas otras distribuciones conocidas como por ejemplo, exponencial, chi cuadrada etc. ¿Existes pruebas similares o como se puede determinar eso?

    • @israelmg1749
      @israelmg1749 8 หลายเดือนก่อน +3

      Las pruebas de bondad y ajuste según yo.

    • @CodigoMaquina
      @CodigoMaquina  8 หลายเดือนก่อน +1

      Estimado @luisgil267 como menciona @israelmg1749, efectivamente hay varias formas de determinar si los datos siguen una cierta distribución. De hecho, una de esas formas, es justo utilizando los gráficos q-q. En el video me enfoqué en la distribución estándar, sin embargo, es posible verificar otras distribuciones, por ejemplo, la exponencial. Aquí va un ejemplo:
      import numpy as np
      import matplotlib.pyplot as plt
      import statsmodels.api as sm
      import scipy.stats as stats
      monto_promedio = 500
      montos = np.random.exponential(monto_promedio, size=10000)
      sm.qqplot(montos, dist=stats.expon, fit=True, line="45")
      plt.show()

    • @CodigoMaquina
      @CodigoMaquina  8 หลายเดือนก่อน

      @israelmg1749 muchas gracias por apoyar a la comunidad respondiendo preguntas!

    • @luisgil267
      @luisgil267 8 หลายเดือนก่อน +1

      @@CodigoMaquina Entiendo, muchas gracias.

    • @alecg223
      @alecg223 8 หลายเดือนก่อน +1

      Las más típicas son pruebas de bondad de ajuste. Ahi tienes 2 pruebas muy usadas:
      1) Prueba de Xi-Cuadrado
      2) Prueba de K-S (Kolmogorov-Smirnov)
      El detalle lo encuentras en cualquier libro de Estadística Universitaria.
      Suerte!

  • @arturo3138
    @arturo3138 3 หลายเดือนก่อน

    ¿Que ocurre si tengo mas de 100 datos?