Excelente video!! muchísimas gracias Roberto! me acabo de suscribir a tu canal! pero te quería hacer una pregunta por favor, será posible que me des alguna referencia bibliográfica, es que necesito referenciar lo aprendido sobre shapiro wilk pero tiene que ser un libro muy didáctico, que se explique paso a paso como hacer esta prueba. No se si puedas ayudarme con eso!! Muchas gracias
@@jessicaalejandrariveraroja2184 hola Jessica, es complicado encontrar esa referencia bibliografica, si mal no recuerdo yo nunca la encontré, pero también recuerdo que está el artículo original del test de Shapiro Wilk y ahí viene la metodología explicada, ojo, no viene un ejercicio desarrollado, viene el método y fundamentos del test, lo puedes buscar en Google.
Lo que no me queda claro es que, en teoría si el p-value (significancia) es menor a 0.05 debería interpretarse como que la distribución es normal (paramétrica). Con lo cual, el valor de SWt (en este caso 0.908) no es mínimo, sino máximo para decir que son paramétricas. Por otro lado, qué pasa si el valor SWc está fuera de la tabla? También se extrapola verdad? Gracias
@@JRobertoJimenez muchas gracias, hace tiempo no lo hacía y me confundí con la interpretación. Gracias por tu pronta respuesta y el video. Fuerte abrazo
¿Y para qué querrías ver si los pronósticos se comportan de forma normal?, si tienes una razón, la respuesta es sí, de casi contrario no te diría absolutamente nada este test.
@@deysipaolacordovadelacruz5208 exactamente, es sobre los residuos, tengo un tutorial completo del calculo de una regresión múltiple por si gustas revisarlo en lo canal!
Esos son los residuales obtenidos en algun grupo de datos que haya hecho anteriormente. Es decir son los datos a los que les va a aplicar el shapiro wilk
De hecho estoy viendo el video y me equivoqué en esa parte, el valor p esta situado entre 0.1 y 0.5, aunque al final la conclusión si es la misma, el valor p obtenido es mayor a la significancia de 0.05 (pues el valor p esta entre 0.10 y 0.50). Si tu valor p te dio
Y ya no te respondí, si fuera el caso que comento, no hay evidencia para rechazar H0, por ende, la hipótesis nula de que tus datos se distribuyen de manera normal, si tiene sustento estadístico.
@@JRobertoJimenez Entiendo, entonces donde deberia estar el intervalo para decir que los resultados no estan distribuidos normalmente? porque mi valor de p es 0.658, quiere decir que es menor a 0.01, eso quiere decir que los datos no estan distribuidos normalmente o no?
@@JRobertoJimenez si claro y muchas gracias, me he estado rompiendo la cabeza porque es muy facil confundirse en esto!! mi muestra es de n=10 my sw c= 0.811 sw t para 0.05= 0.842 Como mi resultado es menor que 0.05 por eso decia que mi datos no siguen una distribucion normal, por ende rechazo la Ho nula verdad?
Ninguna pregunta es tonta, los datos es cualquier conjunto de datos que tu desees estudiar su normalidad: edades, pesos, ph, ingresos, residuos estadísticos (lo más común), etc.
@@JRobertoJimenez estoy haciendo para mi tesis una escala dicotomica (0 y 1) y solo tengo esos números, como en la mayoria de video veo decimales, pense que se colocaban decimales. Una pregunta mas.. Se puede hacer KR 20 en SPSSm creo que esta integrado con alpha de Crombach.. por favor quisiera saber eso
No hay nada que restrinja el test de acuerdo al tamaño de la muestra. Solo es una recomendación tener por lo menos 20 datos para que el cálculo sea robusto.
Gracias por este maravilloso video, pero me queda una duda. Porque en la ultima parte se toma 0,5, en que se basa? P tiene que ser mayor a 0,5 para ser normal y si es menor, no es normal?
Así es, si es menor a 0.05 ya no se considera normal, ese valor p es una probabilidad y si lo quieres ver así se basa en que nivel de riesgo estas dispuesta a aceptar (0.05 hace referencia a un 5% de riesgo). No es el mismo riesgo para un medicamento analizado que para un estudio demográfico. Si gustas aquí lo explico más a detalle: th-cam.com/video/dQVilzaavz8/w-d-xo.html
@@JRobertoJimenez Gracias, estoy autoaprendiendo estadística aplicada a ecotoxicología. Y me gustó mucho tu vídeo. Estoy llena de dudas. Me tendrás por aquí viendo tus vídeos y haciendo preguntas. Mil gracias de antemano
@@yuliethgomez7848 cualquier duda con gusto puedes escribirme y consultarme tus dudas, me llamó la atención tu línea de aplicación de la estadística, rjimenez150384@gmail.com
Se debe de poder, sin embargo se necesita una tabla que contenga los coeficientes para ese tamaño de muestra, tabla que te soy sincero siempre he buscado y nunca he visto.
En el caso de que n es impar se usa otra fórmula para b, en este caso tu usas la misma fórmula de cuando el números de datos(n) es par, si me podrías ayudar con esa explicación, estoy confundido.
No entiendo bien tu pregunta, pero supongo que te refieres a tener dos conjuntos de datos diferentes, pues depende que quieras analizar de estos datos, pero pude aplicar el test a cada uno.
Desconozco una tabla de ese tamaño, posiblemente debas indagar el algoritmo que genera los valores ai de la tabla, para ese tamaño de muestra detectar la normalidad de un conjunto de datos tiene bastante fiabilidad, podrías usar otro test como Anderson Darling.
Hace falta una tabla para una muestra de ese tamaño, yo no tengo esa tabla. Sin embargo el test de Ryan Joiner es muy similar, lo puedes usar en su lugar.
Es la fórmula =POTENCIA(número, exponente), así se debe declarar en Excel, a excepción que tu versión sea en Inglés y tengas que usar =POWER. Es muy sencillo, pues en el "número" colocamos la resta de cada residuo con su media y en "exponente" simplemente el cuadrado. OJO que tu excel no pida ; en lugar de ,
Excelente video, gracias me salvaste y explicaste con bastante claridad. Te agradezco y te felicito por hacer ese tipo de videos.
Agradecida de verdad por tu video. entendí mucho y me ha salvado para mi trabajo. GRACIAS!
@@stephanieibarra69 que gusto que fue para ayudarte.
graaaaaaaaaaacias!!!!!!!!!!!!
me sirvió mucho!!!!......Dios te bendiga!!!!!!!!
Que gusto que te fue util.
Si tengo dos grupos de datos, uno de pre test y otro post test, la aplico por grupo o todos los datos en una sola prueba??
muchas gracias buen hombre,esta jodido para mi esto en spss,pero asi pues si entiendo jeje xd
Excelente video!! muchísimas gracias Roberto! me acabo de suscribir a tu canal! pero te quería hacer una pregunta por favor, será posible que me des alguna referencia bibliográfica, es que necesito referenciar lo aprendido sobre shapiro wilk pero tiene que ser un libro muy didáctico, que se explique paso a paso como hacer esta prueba. No se si puedas ayudarme con eso!! Muchas gracias
@@jessicaalejandrariveraroja2184 hola Jessica, es complicado encontrar esa referencia bibliografica, si mal no recuerdo yo nunca la encontré, pero también recuerdo que está el artículo original del test de Shapiro Wilk y ahí viene la metodología explicada, ojo, no viene un ejercicio desarrollado, viene el método y fundamentos del test, lo puedes buscar en Google.
Muchas gracias, muy completo.
Gracias!
Una consulta, sabes como realizar la prueba robusta de Yuen?
excelente explicación, me gustaría saber por qué es importante determinar si la variable se distribuye normalmente o no. Muchas gracias
Muchos procesos estadísticos así lo exigen. Uno muy famoso es el análisis de residuos!
Roberto Jiménez muchas gracias 😊
La tabla del coeficiente ain para shapiro llega hasta un n de 50, que pasa si se tienen más datos que 50?
Te sugiero en ese caso realizarlo en software o bien, realizar otro test como Anderson Darling.
Lo que no me queda claro es que, en teoría si el p-value (significancia) es menor a 0.05 debería interpretarse como que la distribución es normal (paramétrica). Con lo cual, el valor de SWt (en este caso 0.908) no es mínimo, sino máximo para decir que son paramétricas. Por otro lado, qué pasa si el valor SWc está fuera de la tabla? También se extrapola verdad?
Gracias
Al contrario, si el valor p es mayor a 0.05 se dice que probablemente son normales. Y si, en esos casos debe usarse la interpolación.
@@JRobertoJimenez muchas gracias, hace tiempo no lo hacía y me confundí con la interpretación.
Gracias por tu pronta respuesta y el video.
Fuerte abrazo
Hola una pregunta el test se puede aplicar a mis pronósticos de una regresión múltiple?
¿Y para qué querrías ver si los pronósticos se comportan de forma normal?, si tienes una razón, la respuesta es sí, de casi contrario no te diría absolutamente nada este test.
Muchas gracias ya ví bien y me dice que lo aplique a los residuos con tu vídeo le entendí mejor excelente trabajo
@@deysipaolacordovadelacruz5208 exactamente, es sobre los residuos, tengo un tutorial completo del calculo de una regresión múltiple por si gustas revisarlo en lo canal!
Gracias, me ayudo muchisimo.
Me alegra Daniela!
Excelente video pero me quedo una duda, si trabajo con mas de 50 elementos uso los valores hasta en 50 en la tabla o debo de usar otro metodo ?
No he visto una tabla más grande, no digo que no exista pero yo no la he visualizado jamás, te sugiero el método de Anderson-Darling o Ryan-Joiner.
Estimado, podria responderme cuales fueron sus fuentes??
Buenos dias Roberto Jimenez excelente video, me podrias decir en donde encuentro informacion sobre las variables SWt ,SWc
Hola una consulta Xi que datos de la muestra toma, es decir de dónde sale el número - 0.52, 0.53...
Esos son los residuales obtenidos en algun grupo de datos que haya hecho anteriormente. Es decir son los datos a los que les va a aplicar el shapiro wilk
amigo cual es la fórmula que utilizaste? la general de todo el proceso.
@@matt93xd4 vela con detenimiento casi al final del vídeo, es la última fórmula antes de comparar con el valor de tablas.
Lo siento mucho pero no entendi el final, si el valor p>0.5, porque se considera que es menor de 0.05? si tengo un valor p
De hecho estoy viendo el video y me equivoqué en esa parte, el valor p esta situado entre 0.1 y 0.5, aunque al final la conclusión si es la misma, el valor p obtenido es mayor a la significancia de 0.05 (pues el valor p esta entre 0.10 y 0.50).
Si tu valor p te dio
Y ya no te respondí, si fuera el caso que comento, no hay evidencia para rechazar H0, por ende, la hipótesis nula de que tus datos se distribuyen de manera normal, si tiene sustento estadístico.
@@JRobertoJimenez Entiendo, entonces donde deberia estar el intervalo para decir que los resultados no estan distribuidos normalmente? porque mi valor de p es 0.658, quiere decir que es menor a 0.01, eso quiere decir que los datos no estan distribuidos normalmente o no?
@@eswinipi a ver, dame estos 2 datos: 1) tamaño de tu muestra y 2) SW calculado. Y con gusto te digo la conclusión.
@@JRobertoJimenez si claro y muchas gracias, me he estado rompiendo la cabeza porque es muy facil confundirse en esto!!
mi muestra es de n=10
my sw c= 0.811
sw t para 0.05= 0.842
Como mi resultado es menor que 0.05 por eso decia que mi datos no siguen una distribucion normal, por ende rechazo la Ho nula verdad?
7:51 Interpolacion falto. Buena explicacion.
Cierto. Pero si lo razonamos no hay necesidad.
Esto se debe hacer con cada una de las preguntas?
You saved me with this tutorial and I don't even speak Spanish 😂
I don't speak english so well, but I created this tutorial thinking in english people too, that is the reason of the title "shapiro Wilk test"
y el xi de dónde lo saco?
Muchas gracias por la explicación. Todo está súper claro.
Gracias!
Entendi, pero aunque parezca tonta la pregunta, como obtengo los datos iniciales, los primeros si tengo una base de datos dicotomica al inicio
Ninguna pregunta es tonta, los datos es cualquier conjunto de datos que tu desees estudiar su normalidad: edades, pesos, ph, ingresos, residuos estadísticos (lo más común), etc.
@@JRobertoJimenez estoy haciendo para mi tesis una escala dicotomica (0 y 1) y solo tengo esos números, como en la mayoria de video veo decimales, pense que se colocaban decimales. Una pregunta mas.. Se puede hacer KR 20 en SPSSm creo que esta integrado con alpha de Crombach.. por favor quisiera saber eso
@@manuelmendozauchuya9805 en ese aspecto no estoy muy informado y decir algo sería mentirte.
Con una muestra de 19 igual lo puedo usar?
No hay nada que restrinja el test de acuerdo al tamaño de la muestra. Solo es una recomendación tener por lo menos 20 datos para que el cálculo sea robusto.
Gracias por este maravilloso video, pero me queda una duda. Porque en la ultima parte se toma 0,5, en que se basa? P tiene que ser mayor a 0,5 para ser normal y si es menor, no es normal?
Así es, si es menor a 0.05 ya no se considera normal, ese valor p es una probabilidad y si lo quieres ver así se basa en que nivel de riesgo estas dispuesta a aceptar (0.05 hace referencia a un 5% de riesgo). No es el mismo riesgo para un medicamento analizado que para un estudio demográfico. Si gustas aquí lo explico más a detalle: th-cam.com/video/dQVilzaavz8/w-d-xo.html
@@JRobertoJimenez Gracias, estoy autoaprendiendo estadística aplicada a ecotoxicología. Y me gustó mucho tu vídeo. Estoy llena de dudas. Me tendrás por aquí viendo tus vídeos y haciendo preguntas. Mil gracias de antemano
@@yuliethgomez7848 cualquier duda con gusto puedes escribirme y consultarme tus dudas, me llamó la atención tu línea de aplicación de la estadística, rjimenez150384@gmail.com
@@JRobertoJimenez puedes ayudarme Roberto?
Si tengo una muestra de 60, puedo usar esta prueba? no tengo claro como unas la tabla de contraste con ese tamaño de muestra
Se debe de poder, sin embargo se necesita una tabla que contenga los coeficientes para ese tamaño de muestra, tabla que te soy sincero siempre he buscado y nunca he visto.
El test fue publicado en la siguiente revista, posiblemente ahí esté lo que buscas: Biometrika, Volume 52, Issue 3-4, December 1965, Pages 591-611
Muchas gracias!
Esta prueba solo se usa para datos menores o iguales a 50, para datos mayores se realiza kolmogorov smirnov
En el caso de que n es impar se usa otra fórmula para b, en este caso tu usas la misma fórmula de cuando el números de datos(n) es par, si me podrías ayudar con esa explicación, estoy confundido.
No comprendo muy bien la pregunta, ¿cuál formula para b de impar o impar?
@@JRobertoJimenez La fórmula de impar
Hola, una pregunta, al realizar la prueba a la hora de poner (,) en la formula excel no me lo permite, sabes de que otra forma lo podría escribir .?
Cuando estés escribiendo la fórmula en Excel siempre fíjate como te lo pide. Seguramente es ";".
Qué hago si tengo dos filas de datos?
No entiendo bien tu pregunta, pero supongo que te refieres a tener dos conjuntos de datos diferentes, pues depende que quieras analizar de estos datos, pero pude aplicar el test a cada uno.
@@JRobertoJimenez Muchas gracias.
Hola, al oprimir f4 me dice que hay muy pocos datos para realizar la operación
Como puedo utilizar la tabla de los índices ai si el tamaño de mi muestra es de 1200?
Desconozco una tabla de ese tamaño, posiblemente debas indagar el algoritmo que genera los valores ai de la tabla, para ese tamaño de muestra detectar la normalidad de un conjunto de datos tiene bastante fiabilidad, podrías usar otro test como Anderson Darling.
Si tengo una muestra de 20 datos, puedo aplicar la prueba?
Así es!!!
Y sería más conveniente que la de Kolmogorov-Smirnov?
@@mercedesmorelos3066 se supone que este test es más potente en términos estadísticos.
Eres lo maximo,
El valor de ai*Dif puede ser 0?
Nunca he visto ese caso, por ahora pensaría que no es posible.
Muy bueno el tutorial, gracias.
Se hace lo que se puede! gracias.
@@JRobertoJimenez Excelente, me pasas tus tablas?
@@manuelguerreroochoa4263 gracias, con gusto: drive.google.com/file/d/1JaqgDdqRcVURE1QilIvEvrnfmhSQlY6u/view?usp=drivesdk
Cómo se haría si tengo 2 variables X?
Inicialmente pensaría que lo tendrías que hacer con cada variable por separado.
Tengo una muestra de 1003 datos, como le puedo hacer?
Hace falta una tabla para una muestra de ese tamaño, yo no tengo esa tabla. Sin embargo el test de Ryan Joiner es muy similar, lo puedes usar en su lugar.
para muestras mayores a 50 se utiliza kolmogorof smirnov
@@manuelisaaclamabustinza6640 no precisamente, hay test más potentes que Kolmogorov y posibles de usar con muestras grandes.
Toma tus laikazos
podrias ayudarme como realizar la prueba de Doornik-Hansen en exel
La desconozco!
me perdi en la coma con el dos ...me sale error y me pone problema el excel ...me ayudas ?
Es la fórmula =POTENCIA(número, exponente), así se debe declarar en Excel, a excepción que tu versión sea en Inglés y tengas que usar =POWER. Es muy sencillo, pues en el "número" colocamos la resta de cada residuo con su media y en "exponente" simplemente el cuadrado. OJO que tu excel no pida ; en lugar de ,
Ningun de 20 a 1000 en la muestra., deben ser menor a 50 datos. OJO con eso.
@@gabrielalejandrodomingueza1558 excelente aporte, gracias amigo.
English please.... although subtitle is provided still no use, the terms used on the excel is not english making it more difficult to comprehend......
I will try to do it.
No entendí lo del complemento de la tabla T-T Yo tengo 180 datos
La tabla solo tiene para 50 datos, habrá que conseguir una tabla más grande o bien optar por otro test.