![Pablo Inchausti Estadistica](/img/default-banner.jpg)
- 105
- 77 828
Pablo Inchausti Estadistica
Uruguay
เข้าร่วมเมื่อ 24 พ.ย. 2020
This channel has videos on univatiate statistics (Frequentist and Bayesian) for students and researchers of Ecology, Environmental Sciences and other disciplines. These videos are organized in playlists. They include two graduate courses (in Spanish); Métodos estadísticos avanzados en Ecología y Evolución y Introduccción a los Métodos Estadísticos Bayesianos en Ecología, and the videos associated with my book Statistical modeling with R: a dual frequentist and Bayesian approach for life sciences (Oxford Univ Press 2023). Otros videos explican el Modelo Lineal General (ANOVA, regresión, Análisis de Covarianza), el Modelo Lineal Generalizado y el Modelo Lineal y Generalizado Mixto, así como el Modelo Aditivo Generalizado (GAM). Todos estos modelos estadísticos son ajustados con el software R y RStudio cuyo manejo básico también es explicado.
Datos, scripts y pdf de cursos: sites.google.com/view/pablo-inchausti/cursosteaching
email de contacto: pablo.inchausti.f@gmail.com
Datos, scripts y pdf de cursos: sites.google.com/view/pablo-inchausti/cursosteaching
email de contacto: pablo.inchausti.f@gmail.com
23 Chap15 Mixed hierarchical models and experimental design data GLMM proportions
The video explains the fitting of a Generalized Linear Mixed Model whose response variable has a Beta distribution and whose data from from split-plot experimental design. The Frequentist and Bayesian model fittings are discussed in details, including the assessment of the goodness of fit of models to data using a residual analysis.
มุมมอง: 48
วีดีโอ
22 Chap15 Mixed hierarchical models and experimental design data GLMM binario
มุมมอง 202 หลายเดือนก่อน
The video explains how to fit a Generalized Linear Mixed model with a binary response variable and with a randomized block design in both the Frequentist and Bayesian frameworks. The fitting of the models, the interpretation of the parameters and posterior distribution is discussed in detail. The goodness of fit of the models to data is accomplished with a residual analysis using the Dunn-Smyth...
21 Chap14 Experimental design in the life sciences
มุมมอง 212 หลายเดือนก่อน
This video discusses the principles of experimental design, and explains in detail the main types of experimental designs used in the life and environmental sciences. These are: factorial, randomized blocks, split-plot, nested, repeated measures and crossover designs. For each design, I show the main underlying ideas, the layout of the experiment, the shape of the data entry matrix, and the sta...
20 Chap13 Accounting for structure in mixed hierarchical models II
มุมมอง 332 หลายเดือนก่อน
This video shows how to fit a Linear Mixed Model in both the Frequentist and Bayesian frameworks. The interpretation of the fitted parameters is explain in each case. The goodness of fit of all models is validated with a residual analysis using the Dunn-Smyth residuals and pp-checks (for the Bayesian model), and the main results are communicated using conditional curves and other plots
19 Chap13 Accounting for structure in mixed hierarchical models I
มุมมอง 182 หลายเดือนก่อน
It gives a general explanation of the mixed/hierarchical models in statistics. It starts explaining the importance of the fundamental iid assumption of statistics, and the main reasons for departures. It explains the difference between fixed and random effects in Frequentist statistics, and the main challenges of fitting these models. It explains the main concepts of hierarchical models in Baye...
2 Chap3 Maximum Likelihood
มุมมอง 512 หลายเดือนก่อน
This video starts by giving a general definition of a statistical model, then states the importance of estimating its parameters, and finally explains the maximum likelihood method created by Fisher (1922) that became the main method of parameter estimation in Frequentist statistics
18 Chap12 GLMs for a positive, real valued response variable
มุมมอง 232 หลายเดือนก่อน
This video explains the fitting of Frequentist and Bayesian GLM when the response variable has real, strictly positive values. These GLMs employ the Gamma distribution and a log link function. The goodness of fit of the fitted models is assessed with a residual analysis using the (transformed) Dunn-Smyth residuals.
17 Chap12 GLMs for proportions odp
มุมมอง 292 หลายเดือนก่อน
This video explains the fitting of Frequentist and Bayesian GLMs when the response is a proportion, i.e.e a real value in the unit interval [0,1]. These GLMs use a Beta distribution and a logit link function. The goodness of fit of the fitted models is assessed with a residual analysis using the (transformed) Dunn-Smyth residuals.
16 Chap11 Further issues in the modeling of counts
มุมมอง 162 หลายเดือนก่อน
This video explains the relation between the old-fashioned log-linear analysis of frequencies and the count GLMs. The case study concerns a very unbalanced data set of counts that is used to explain the procedure of model selection when we are working on an exploratory mode of analysis.
15 Chap10 When the response variable is a count with many zeros
มุมมอง 313 หลายเดือนก่อน
This video explains the fitting of count GLMs when the response variable has many zeros involving mixture models. The two frameworks of mixture models for counts are explained: Zero Inflated and Zero Augmented models. The videos shows an exampled of fitting each class of mixture models in the Frequentist and Bayesian frameworks.The goodness of fit of the fitted models is assessed with a residua...
14 Chap10 When the response variable is a count
มุมมอง 213 หลายเดือนก่อน
The video explains the fitting of a GLM when the response are integers. We discuss the causes, how to evaluate and the consequences of overdispersion in count GLMs. The same initial model is fitted and a model selection exercise is done in both the Frequentist and Bayesian framework. We evaluate the goodness of fit of models to data using the Dunn-Smyth residuals, and explain the main the main ...
13 Chap9 When the response variable is binary
มุมมอง 543 หลายเดือนก่อน
This video discusses the GLM for a binary response variable. The odds ratio (and its interpretation) and the logit link function are discussed. We show a frequentist and a Bayesian model model fittings for the same data, including the use of Dunn-Smyth residuals for assessing the goodness of fit of the models to data.
12 Chap8 Generalized Linear Models
มุมมอง 283 หลายเดือนก่อน
This video gives the basic theory of the Generalized Linear Models (GLM), starting with its main motivation and interest. The three components of the GLM are described and discussed: the random component, the linear predictor and the link function. The use of randomized quantile residuals (Dunn-Smyth residuals) to assess the goodness of fit of GLMs is discussed.
11 Chap7 Model selection
มุมมอง 163 หลายเดือนก่อน
This video addresses the general problem of model selection and the use of the principle of parsimony as the conceptual basis of model selection. It also discusses model selection in the frequentist framework based on the AIC, and current ideas of model selection in the Bayesian framework based on the WAIC. The posterior predictive distribution and the pp-checks are also briefly discussed.
9 Chap6 Factorial Analysis of variance
มุมมอง 113 หลายเดือนก่อน
This video explains the Factorial Analysis of Variance that is used to evaluate the effects of (at least) two categorical explanatory variables and their interaction on the mean of a response variable. This is another case of the General Lineal Model. I explain the use of a posteriori tests when the interaction between explanatory variables is relevant using orthogonal contrasts,
7 7 Chap5 t test comparison of two means
มุมมอง 453 หลายเดือนก่อน
7 7 Chap5 t test comparison of two means
Intr a los métodos estadísticos bayesianos en Ecología: Práctico 05 partes1 y 2
มุมมอง 2262 ปีที่แล้ว
Intr a los métodos estadísticos bayesianos en Ecología: Práctico 05 partes1 y 2
Intr métodos estadísticos bayesianos en Ecología: Teórico 05 parte 2
มุมมอง 1392 ปีที่แล้ว
Intr métodos estadísticos bayesianos en Ecología: Teórico 05 parte 2
Que gran clase!!!!, tiene la disponibilidad de las bases de datos para realizar los ejemplos en R-studio?, un saludo 🙂↕️.
Gracias por tu comentario. En el sitio web: sites.google.com/view/pablo-inchausti/iniciostart encontrarás los scripts y datos para hacer los análisis (en R; R-Studio es sólo una interfase gráfica) de datos mostrados en los videos de este canal. Saludos
Excelente video, profe! Solo tengo una duda. No sé casi nada de estadística bayesiana, pero cuando dijo (más o menos en el min 7:40) que en estadística bayesiana hay solo efectos aleatorios, eso significaría que no tendría mucho sentido meter efectos aleatorios en los modelos de regresión? Es que me llamó la atención eso.
En estadística bayesiana se asocia una distr de probabilidades a cada parámetro del modelo estadístico que refleja nuestra incertidumbre/grado de conocimiento acerca de los valores de cada parámetro. Lo que no hay en estadística bayesiana son los llamados efectos fijos en estadistcia frecuentista. En estadística bayesiana hay parámetros con "efectos poblacionales" (equivalentes a los efectos fijos frecuentistas) que reflejan las relaciones para todo el set de datos. Hay tambien "efectos de grupo" (equivalentes a los efectso aleatorios frecuentistas) que denotan cómo y cuánto difiere los parámetros de cada grupo de (tecnicamente, las distribuciones posteriores de) los efectos poblacionales. Las definiciones de los parametros con efectos poblacionales y de grupo bayesianas son, a diferencia de los efectos fijos y aleatorios frecuentistas, coherentes y consistentes, ya que todo parámetro tiene asociado una distr de probabilidades. Espero que esto ayude, Saludos
Watched the video now ❤. I like the statement 'Statistics before Fisher and Statistics after Fisher.
Glad you enjoyed it!
Le agradezco enormemente por estos videos.
Me alegro que hayan sido útiles. Saludos
Buenas tardes Profesor: Sus videos están muy bien desarrollados. Gracias por compartirlos. Dos cuestiones; la primera, de donde puede bajar los datos que ha usado de ejemplos, los de las escuelas de Michigan y, segunda, que libro suyo me recomendaría. Saludos desde Córdoba, Españe
Hola, Gracias por tus comentarios. En mi sitio web: sites.google.com/view/pablo-inchausti/iniciostart puedes encontrar los datos y scripts empleados para estos videos. Hay muchos libros de estadístcia posibles, entre ellos Fox (2015), Faraway (2016) Dunn & Smyth (2018) y hasta uno mío (2023) que podrías encontrar en el sitio lib.gen.... que creo todos conocemos. Saludos,
It's great to see your content in English, Prof. Inchausti!
Thanks. I have been meaning to generate these screencasts for a while, but it is only now that I have managed to find the time to do it. I hope that there are useful. Cheers Pablo
Buenos días, una consulta. ¿Qué pasa si se obtienen valores de AIC o BIC negativos? ¿Cuál sería el criterio de elección del modelo?
Hola El valor numérico de AIC o BIC es completamente irrelevante, pudiendo ser negativo. Lo que importa son las diferencias de AIC/BIC entre modelos ajustados a los mismos datos a fin de hacer selección de modelos, si es que eso es lo que estás tratando de hacer. Saludos
Buen día! Muchísimas gracias por las explicaciones de estos videos. Por alguna razón no encuentro el video del práctico 07, el cual me interesaría poder estudiar ¿en cuál ubicación estará?
Hola, El práctico 07 no existe porque yo me equivoqué enumerando las clases y por ende los videos. Pero el curso está completo. Saludos
Buenas, qué libro recomendas para profundizar en el tema? Me gustaría usar parte de lo que explicas en mis trabajos pero debería dejar el respaldo bibliográfico correspondiente.
Hay decenas de libros sobre GLM. Puedes ver alguno de los títulos si pones "generalized linear models" + books" en el buscador de Google. Hasta yo mismo publiqué un libro que los contiene....
Si así me hubieran explicado en la universidad..
Trato de hacer los cursos y escribir los libros que me hubiera gustado recibir en la Universidad. Me alegro que te haya sido útil.
Preciosa clase, saludos desde México!
Muchas gracias. Me alegro que te haya gustado. Saludos
Profe muchas gracias por compartir su conocimiento, hay alguna forma de obtener las presentaciones de este curso? Sería estupendo
Hola, sugiero que busques en mi sitio web: sites.google.com/view/pablo-inchausti/ donde deberías encontrar la infotmación que solicitas. Saludos
muchas gracias, muy buen video!
De nada. Me alegro que te haya sido de utilidad. Saludos
Muchas gracias por la información, me ha servido mucho
Me alegro que te haya sido útil. Saludos
Excelente video. Muy apreciado. Para la tabla Anova de test secuenciales ¿existe una manera de determinar el impacto de las variables que no sea por p-value?
En estadística frecuentista o clásica (en la que se enmarca este video), el p-valor es el método aceptado para calificar el impacto de las variables a través de la significancia estadística de los parámetros del modelo. Este criterio ha sido, es, y será discutido y discutible. Entre otros muchos defectos o limitaciones, el p-valor es muy dependiente del tamaño de muestra: por ej. con n=1000, la pendiente de una regresión simple con R2=0.10 será casi seguramente estadísticamente significativa, pero el modelo será cercano a inútil. Hay otros citreios basados en la magnitud de efecto que no están relacionados con la significancia estadística. En las tablas ANOVA se hacen teste secuenciales de acuerdo al orden de entrada de las variables en el modelo, y se comparan las deviancias de pares de modelos, uno con X1 y otro con X1 y X2. Esta comparación se hace con el test (LRT) de Wilks y se evalúa la signficancia estadístcia de las diferencias de deviancias entre 2 modelos. Saludos,
Muchas gracias! fue de mucha utilidad, logré afianzar los conceptos.
Me alegro mucho. Saludos
hola Pablo, una duda, en la visualización de los resultados de donde sale el objeto pred1.zip y pred2.zip excelente tarde!
Hola, No entiendo cuá es la duda o problem al que haces alusión. Saludos,
@@PabloIEstadistica perdón, es que no me sale la grafica de la visualización de los resultados
muchas gracias doctor, es un modelo que debo de ejecutarlo para mi tesis, si por favor nos pueda proporcionar el link u otros autores que deba de leer para aprender más del modelo mixto también el de Eisenhart(1947) por favor.
Hola, puedes encontrar pdf, scripts R y los datos de cursos que dicto en sites.google.com/view/pablo-inchausti/iniciostart. donde encontrarás tambien la clase sobre modelo lineal mixto. Saludos
Realmente hay una multitud de libros de estadística que explican modelos mixtos. Solo hacer una búsqueda en internet te proporcionará una muy larga lista. Entre ellos: Fox (2015, Applied Regression Analysis and Generalized Linear Models), Faraway(2016; Extending the linear model with R_ generalized linear, mixed effects and nonparametric regression models), Gałecki & Burzykowski (2005; Linear Mixed-Effects Models Using R A Step-by-Step Approach) y hasta uno mío (Inchausti 2023, Statistical modeling with R: a dual frequentist and Bayesian approach for life sciences),
Estimado profesor Inchausti, he seguido sus videos, son excelentes, me ayudaron muchísimo a comprender temas que no tenía del todo claros. Un gran aporte que videos de esta calidad estén disponibles en español, se le agradece muchísimo. Quisiera pedirle si por favor podría facilitar las líneas de código para realizar los gráficos para visualización de residuos y evaluación en los modelos mixtos. Muchas gracias, saludos desde Italia.
Hola, Para enviar los códigos, necesitaría un email. El mío es: pablo.inchausti.f@gmail.com. De todas maneras, indico que en mi sitio web sites.google.com/view/pablo-inchausti/iniciostart se encuentran los pdf, scripts R y datos de cursos donde podrá encontrar lo que menciona. Me alegro estos videos que hayan sido útiles. Saludos
muchísimas gracias! @@PabloIEstadistica
Muchas gracias por la clase Pablo, viene bien refrescar este tipo de conceptos. Soy analista de datos marinos y me encanta el campo de la estadística y modelos predictivos relacionados con la ecología. Mi objetivo es convertirme en un referente en este tipo de modelos ecológicos y aprender al máximo de la inferencia bayesiana. Entonces mis preguntas son si estas diapositivas se pueden conseguir en algún sitio para imprimirlas y coger apuntes según comentas el curso, y por otro lado, si planteas hacer un curso sobre inferencia bayesiana en ecologia marina (no he visto aun el curso y a lo mejro es aplicable a la ecologia marina y seguramente lo sea). Quizá estas preguntas sean para el curso de inferencia bayesiana más que para este jaja Un saludo, Juan Carlos
Hola, Puedes encontrar diapos de casi todos los cursos que dictas en mi sitio web: sites.google.com/view/pablo-inchausti/iniciostart. A mi entender no existe la "estadística bayesiana/frecuentista para la biología marina" o terrestre o estuarina, ni para la mineralogía o micro-electrónica. Solo existe la estadística, y los sustantivos y adjetivos adicionales son solo para llamar la atención de un posible público objetivo. En mi país simplemente no existe la ecología marina y (casi) nadie conoce la estadística bayesiana, así que no hay chance de generar un curso de estadística bayesiana marina. Saludos
@@PabloIEstadistica De acuerdo, muchas gracias por su respuesta, seguiré investigando y no dude que veré sus cursos.
Hola Profe Pablo ¿Podria proporcionar los datos del ejmeplo de Hill et al 2004? tambien si es posile que me regale los codigo en R de los graficos nota: quise enviarle un mail pero no encntre su correo en la informacion del canal Muchas gracias
Hola Para ello precisaría un email. Puse el mío en la descripción del canal. Saludos
Muy buen video Pablo! Hice un trabajo sobre los GAM para una asignatura del Máster en Data Science que estoy cursando y tu video fue de gran utilidad para introducirme fácilmente en éste tipo de modelos, muchas gracias!
Me alegro que haya sido útil. Saludos
Hola Pablo , muy buena tus series de videos. Consulta no encuentro en tu lista el practico 06. Salta del practico 05 al 07
Hola, fue simpemente un problema de numeración. Las clases están completas. Saludos
Saludos. Excelente explicación. Existe alguna forma de realizar comparaciones múltiples luego de un ANOVA con GLM, por ejemplo luego de un anova con binomial negativa?.
Hola, vuelvo a mi oficina luego de un mes de vacaciones. La respuesta a tu pregunta es sí y se hace por las mismas razones que con un ANOVa cuando Y~Normal: para minimizar el riesgo de un detectar como significativa una comparación que no lo es. Puedes hacer esas comparaciones usando por ejemplo el paquete multcomp, o también emmeans. Saludos
Excelente video profesor, particularmente en los comentarios encontre un interesante ayuda para resolver un problema que tenia con datos inflados en ceros pero de tipo real. Probare con una hurdle-gamma. Saludos!
Me alegro que el video haya sido útil. Saludos,
¡¡Excelente catedra!! ¡Saludos!
Gracias, me alegro que haya sido útil. Saludos
Gracias. Muy claro.
Gracias por tu comentario. Saludos
Hola, gracias por el video ¿Podría compartir la base de datos para hacer el ejercico?
Hola, para compartir la base de datos, tendría que tener un email a donde enviarla. Saludos
¡Sus explicaciones son brutalmente buenas! En ningún otro canal, mucho menos de habla hispana, he encontrado tanta calidad en las explicaciones de temas así de complejos. Muchas gracias y por favor, no deje de subir contenido.
Hola Muchas gracias por tu comentario. Saludos
Hola, ¿Tendría las fuentes que utilzó para la parte de ecología?
Hola No estoy seguro de entender la pregunta. No empleé ninguna referenia bibliográfica particular para elaborar esta clase. Los diseños son los mismos en cualquier área de investigación, Saludos
Qué buen video. Pero si sí quiero observar la variación entre escuelas, ¿qué modelo tendría que usar?
Gracias. La variabilidad entre escuelas es precisamente lo que es cuantificado por la varianza de los interceptos aleatorios. Saludos
Hola Pablo, excelente y muy utiles los videos de tu canal!!! En el min 13 de este señalas como siginficativa la interacción con el sexo y el termino cuadrático del tamaño remarcando el valor de F en vez de la probabilidad... creo que debe ser una confusión ... consecuentemente el anova sin el es termino no identifica como mejor modelo al original... creo...
Hola Gracias por tus comentarios. Te prometo examinar apenas pueda (ahora estoy complicado con asuntos personales) este aspecto que señalas y enviarte un comentario por este medio. Saludos
Hola Pablo, tanto tiempo dandole a esto y me aclaraste muchos fundamentos que no tenia muy claros, muy buenos tus videos.
Hola, me alegro que sean útiles. Saludos
Gran explicación, me podrias compartir los datos de (Aho et al 2014,2017) te lo agradecería mucho
Gracias por tus comentarios. Me refiero al articulo de Aho et al (2014) Model selection for ecologists: the worldviews of AIC and BIC Ecology 95: 631-636 y al libro de Aho (2017) Foundational and Applied Statistics for Biologists Using R. CRC Press Chapman & Hall, Saludos
Hola Pablo. Gracias por la explicación cada vez entendiendo más los GLMM y R. Quisiera hacer un pequeno aporte.. En el script en el ejemplo 1, encontre como mantener las variables cuando se usa el comando melt sin necesidad de agregarlas posteriormente; el argumento id.vars se utiliza para ello, abajo te dejo el ejemplo que optimiza ligeramente el script. Saludos pred.farms.fem=melt(data=pred.farms.fem, d.vars="length",variable.name="farm",value.name="prob")
Gracias
Hola Pablo. Una consulta, con el comando ggpredict, la consola me originó el siguiente warning "Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.". No le di importancia al principio, pero el plot de de las predicciones que me origina parece estar discretizado en la banda de los errores, puede ser por eso? Como puedo corregir ese error?
Hola, el mesnaje que recibiste indica que ggpredict detectó que la variable de respuesta era log(Y) -- en lugar de Y -- y que por ende hizo la transformación inversa de las predicciones para generar el datafra,me de los valores predichos y sus IC95%. Todo correcto. Saludos
Querido Pablo, espero estos videos nunca desaparezcan (por lo menos hasta que me doctore) jajaja Un fuerte abrazo
Aquí estarán. Saludos
Muchas gracias Maestro voy a dedicarme a ver sus videos, metodica y disciplinadamente. Adios Netflix, Bienvenido don Pablo Chanel!
Hola, No hay ninguna necesidad del "maestro" pero lo agradezco. No es necesaria la "disciplina metódica" sino entender las bases de cómo razonar en estadística para tener una comprensión coherente que te ayude a aprender y hacer solo correctamente (o al menos razonablemente) los análisis. Saludos
Gracias por ayudarme a borrar de mi cabeza las tablas de contingencia, aunque, en realidad, hacía años que no utilizaba.
De nada. Yo también tuve que reaprender y borrar mucho conocimiento inútil y fragmentado que adquirí en cursos antedeluvianos de estadística. Nada de todo esto es nuevo (el 1er paper de GLM es de 1972), solo que la educación universitaria es generalmente reaccionaria o muy conservadora. Saludos,
Hola Pablo, antes que nada quisiera agradecerte por colgar todo el material del curso de manera gratuita, de manera secuencial y lógica permite ir adquiriendo los conocimientos del análisis estadístico frecuentista, lo que resulta ser una guía de un valor enorme para el que quiera aprender este tema. Respecto al video, es una lástima que luego de la pausa a la hora 27 la grabación está en negro ya que el tema de los árboles de regresión parecía interesante. Saludos y muchas gracias
No tengo idea de qué pasó en este video. Lo lamento. Tengo pendiente hacer un video exclusivo sobre los CART cuando tenfa tiempo. Saludos,
Pablo, realmente muy bien. Ahora que tengo tiempo, puedo atender a todas estas cosas que me gustan y han sido parte de mi trabajo desde hace años (me jubilé el año pasado, pero sigo trabajado en diferentes proyectos de investigación). Excelente explicación de ggplot, gracias, ya que siempre me he resistido a utilizarlo por diferentes motivos, pero lo has ido explicando muy claramente. He conseguido ir encontrando en la web los archivos de datos que has ido utilizando en el curso (fue lo más tedioso) de modo que he ido replicando absolutamente todo y... perfecto. Por otra parte, es evidente que sabes estadística con profundidad y, sobre todo, lo comunicas excepcionalmente bien. Enhorabuena, no te canses de hacerlo.
Muchísimas gracias por tus amables comentarios. Me alegro que mis videos sean de utilidad. Los hice en desesperación durante la pandemia y no encontré otra forma de compartirlos que a través de este medio. Saludos.
Excelente video. Muy interesante la parte histórica. No sabía que el libro de Bayes le llevaba más de 50 años al de Laplace
Gracias. Bayes nunca publicó ningún libro y el paper por el cual se hizo famoso fue publicado en forma póstuma por su amigo el también reverendo Richard Price. No es muy claro cuánto de este paper es de Bayes o de Price. Luego de llegar a la misma conclusión sin haber conocido el paper de Bayes, Laplace luego reconoció la primacía de este último. La forma en que hoy empleamos la regla de Bayes se debe sin embargo a la formulación de Laplace. Saludos
@@PabloIEstadistica muchas gracias profesor por la corrección. Entiendo además que la intención era contradecir a Hume, tanto respecto de Dios cómo de los milagros. Actualmente, estoy intentando implementar probabilidades en la carrera de Derecho
En efecto, Hume hablaba de lo improbable que son definir los milagros en base a la evidencia y el (luego) paper de Bayes trató de argumentar a favor de la ocurrencia de estos eventos. El libro de Weisberg (2014) Willful Ignorance The Mismeasure of Uncertainty es una excelente referencia sin entrar en los detalles más matemáticos. Saludos
@@PabloIEstadistica fantástico, lo busco ya mismo, muchas gracias por la recomendación!!!
Muy bien Pablo, francamente bien explicado.
Gracias. Saludos
Muy bien sintetizado y muy claro. Muchas gracias
Me alegro que haya sido útil. Saludos,
Hola, muchas gracias por los videos, sumamene útiles. Quiero consultarte si es posible que compartas el link de Dick 2004. Lo mencionas en en el minuto 2:53 en relación al CV. Muchas gracias!!!
La recomendacion de Dick (2004) sobre usar el valor de CV para decidir entre las dis Gama y Lognormal es realmente muy aproximado y discutible. Yo he encontrado más últil y fiable usar los graficos de las Dist acumuladas y el qqplot producidos por la librería fitdistrplus para decidir cuál de estas dos distribuciones es mejor candidata para formular el modelo estadístico. Saludos
@@PabloIEstadistica Buenísmo Pablo, gracias! Si, respecto a los gráficos tengo dudas porque mi variable es continua (con pocos datos, sólo 61) y los analizo en función de un factor con varios niveles. En fin, creo que mi dificultad se asocia a los pocos datos con los que cuento.
Me surgió una duda. Si la distribución gama es la análoga continua de la binomial negativa un posible criterio de selección de esta distribución puede ser una mayor cantidad de ceros o números bajos o el único criterio es la relación existente entre la varianza y la media? Muchas gracias por su excelente explicación
No, ya que la distr Gama solo está definida para valores reales estrictamente positivos (excluye el cero). Saludos
@@PabloIEstadistica Muchas gracias
Excelente, muy didáctico. En caso de que quisieses explorar diferentes modelos incluyendo o quitando variables, puedes usar el AUC como un criterio para seleccionar el mejor modelo o ese enfoque sería equivocado? Muchas gracias
No, el AUC o todo criterio similar al R2 o % de deviancia explicado NO debe ser utilizado como criterio de selección de modelos porque no penalizan a los modelos por su complejidad (medida a través del número de parámetros), lo que nos llevaría a seleccionar modelos estadísticos con un número creciente de términos irrelevantes. Es por ello que se crearon métricos de selección de modelos como el AIC.
@@PabloIEstadistica Muchas gracias por la aclaracion
Muchas gracias por la excelente explicacion. Me gustaría saber si la funcion de enlace es especifica y siempre se usa la misma para cada tipo de distribucion o se pueden usar distintos tipos de funcion de enlace para una sola distribucion. Muchas gracias
Formlamnente hablando, el único requisito general de todas las funciones de enlance es que sean monotónicas. Hay funciones de enlace "canónicas" deducidas a partir de la rlación entre la fórmula de la familia exponencial de distribuciones y cada función de distr de probabilidades aplicables a cada tipo de dato. Así, la función de enlace logit y log son las "funciones de enlace canónicas" para datos binarios y de conteos y que son usadas por defecto en R. Dicho esto, existen otras funciones de enlace potencialmente utilizables para cada tipo de var de respuesta, pero en la realidad casi nadie las usa y prudcen paámetros estiamdos con en general una diferencia mínima con respecto a los obtenidos con las "funciones de enlace canónicas" .
Muy didáctico. Muchas gracias
Gracias. Me alegro que haya sido de utilidad. Saludos
Muy interesante el Smart approach, no lo habia visto y me parece una herramienta que puede ser bastante util, sin embargo, me surgio una duda. Creo haber entendido que en este método el nivel de significancia del que se parte para hacer las comparaciones y ajustar mediante el FDR es dependiente del numero de comparaciones que se deseen realizar, lo entendi correctamente? si es asi, la decision arbitraria de que grupos comparar no puede afectar el valor alpha final y por ende originar resultados distintos en funcion si se añaden mas o menos grupos de comparacion a la matriz? Gracias por tan buen video
Si, en forma general, todos los métodos de ajuste del nivel de significancia dependen del número de comparaciones a realizar. La forma de esta dependencia varía según el método de ajuste (Bonferroni -- el más severo--, Duncan, FDR, etc etc etc) y hay que ver los detalles. Hasta donde investigué el FDR es uno de los métodos que reduce lo menos posble el nivel de significancia de cada comparación manteniendo cerca de 0.05 el nivel de significancia del set de comparaciones. No obstante, hay un desacuerdo importante en estadística acerca de dos puntos claves: la necesidad de hacer las correcciones del nivel de significancia, y de declarar de antemano el número de contrastes a efectuar (en lugar de lejarlo al libre albedrío). Este es un tema que cre no tiene aún una solución. Saludos.