Cómo saber si los Datos siguen una Distribución dada usando Gráficos Cuantil-Cuantil (o QQ) y Python
ฝัง
- เผยแพร่เมื่อ 9 ก.ค. 2024
- Los gráficos cuantil-cuantil o diagramas Q-Q se utilizan para verificar si un conjunto de datos sigue una distribución de probabilidad dada. Por ejemplo, comúnmente los gráficos QQ se utilizan para verificar si un conjunto de datos sigue una distribución normal. En este video se explica cómo construir paso a paso los gráficos Q-Q además de cómo interpretarlos. También se presenta cómo crear los gráficos Q-Q usando python de forma manual y automatizada.
Para citar este recurso educativo utiliza la siguiente referencia:
Gutiérrez-García, J.O. [Código Máquina]. (2023, 30 de Octubre). Cómo saber si los Datos siguen una Distribución dada usando Gráficos Cuantil-Cuantil (o QQ) y Python. [Video]. TH-cam. [Incluye aquí la URL del video]
********************************************
Para guiar tu aprendizaje, en este vínculo ( • Curso de Inteligencia ... ) se encuentra una guía secuencial para aprender:
1. Programación Básica con Python;
2. Manejo de Datos;
3. Visualización de Datos;
4. Análisis de Datos; y
5. Aprendizaje de Máquina y Ciencia de Datos.
********************************************
Índice del Video:
0:00 Introducción
1:00 Qué es un gráfico Q-Q y para qué se utilizan
1:39 Construcción paso a paso de los gráficos Q-Q
22:07 Gráficos Q-Q con python
Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en:
/ shop
El código del video está disponible en GitHub github.com/CodigoMaquina/code
#estadística #datascience #python #cienciadedatos #analisisdedatos
Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en facebook.com/C0d1g0Maqu1na/shop
El video entrega contenidos con claridad y simpleza. He visto varios de tus videos y son muy útiles. Gracias por el contenido!!!
Sos un ídolo! Ojala hubiera estado este video la primera vez que me toco aprenderlo😢
@Luk17a5 muchas gracias por tu comentario y un gran año 2024!!!
Excelente!
Muchas gracias :)
Excelente contenido 👏
Muchas gracias!
Excelente.
@reinerromero7265 muchas gracias!
Gracias Octavio por la información presentada. Debo decir que he tenido que ver el video a lo menos 3 veces para entender mejor el concepto. Porque si con los graficoa Q-Q al final vere si un dataset se ajusta a una fdp determinada (Normal, weibull, exponencial, etc), no es mas economico realizar con python una prueba de bondad de ajuste?. Es decir, si quisera saber si un conjunto de datos se ajustan a una distribución weibull, aplicando una prueba kolmogorov smirnof podria tener resultado de mi hipótesis, de la misma forma que se plantea con los graficos Q-Q. Ayudame a entender este punto por favor. Ademas de agradecer el conocimiento entregados.
@edwardbrandt4868 efectivamente los gráficos Q-Q y algunas pruebas de hipótesis se pueden utilizar para el mismo propósito. En general, las pruebas de hipótesis son mucho más utilizadas aunque los gráficos Q-Q se llegan a utilizar para checar visualmente y de una forma rápida si los datos siguen o no una distribución dada. Según este artículo de la Universidad de Virginia (library.virginia.edu/data/articles/understanding-q-q-plots), otra ventaja es que en caso de que los datos no sigan una distribución dada, los gráficos Q-Q te ayudan a ver qué puntos particulares son los que contribuyen a que no se siga la distribución. Feliz año!!!
@@CodigoMaquina muy agradecido...feliz 2024
Gran video. Para saber si los datos siguen algunas otras distribuciones conocidas como por ejemplo, exponencial, chi cuadrada etc. ¿Existes pruebas similares o como se puede determinar eso?
Las pruebas de bondad y ajuste según yo.
Estimado @luisgil267 como menciona @israelmg1749, efectivamente hay varias formas de determinar si los datos siguen una cierta distribución. De hecho, una de esas formas, es justo utilizando los gráficos q-q. En el video me enfoqué en la distribución estándar, sin embargo, es posible verificar otras distribuciones, por ejemplo, la exponencial. Aquí va un ejemplo:
import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm
import scipy.stats as stats
monto_promedio = 500
montos = np.random.exponential(monto_promedio, size=10000)
sm.qqplot(montos, dist=stats.expon, fit=True, line="45")
plt.show()
@israelmg1749 muchas gracias por apoyar a la comunidad respondiendo preguntas!
@@CodigoMaquina Entiendo, muchas gracias.
Las más típicas son pruebas de bondad de ajuste. Ahi tienes 2 pruebas muy usadas:
1) Prueba de Xi-Cuadrado
2) Prueba de K-S (Kolmogorov-Smirnov)
El detalle lo encuentras en cualquier libro de Estadística Universitaria.
Suerte!
¿Que ocurre si tengo mas de 100 datos?