Buen vídeo. En el ejemplo de OLS/MCO, podría sumar 1 a la variable independiente y=(y+1), de forma que sería posible estimar el log de y en todas las observaciones. Eso podría ser una solución?
Hola Javier. Me alegro que te guste el video. Usar log(y+1) en vez de log(y) ha sido sugerido por algunos autores en el pasado, pero hoy en día no se utiliza puesto que es un poco extraño. Básicamente se está cambiando la variable de y, la que realmente interesa, a y+1, que no estamos seguros de qué significa. Además, log(0+1)=log(1)=0, por lo que igual tendríamos muchas observaciones con ceros. En realidad, tratar de explotar el hecho de tener muchas observaciones con y=0 es clave, sin tener que cambiar la variable dependiente y.
Como se explica en el video, es usual que la variable esté muy acumulada en cero. Yo sugeriría probar con diferentes modelos (MCO, Poisson o incluyo Logit y Probit transformando la variable en binaria) e investigar con cuál se obtienen las conclusiones más interesantes.
Se podría pero resulta un poco arbitrario. ¿Porqué elegir 0.001 y no 0.1 o 0.02 o cualquier otro valor? Resulta bastante extraño. Es la misma razón por la que hoy en día tampoco se usa log(x+1) en caso de que x tome muchas veces el valor 0 (¿por qué no usar log(x+2) o log(x+0.0005)?). Hoy en día es mejor buscar modelos específicamente diseñados para estos escenarios que tomar decisiones de investigación arbitrarias.
Tengo una variable dependiente binaria con muchisímos 0. Si deseo ajustar un modelo de Poisson necesito convertirla en una variable de conteo ¿Correcto? No puedo ajustar un modelo de Poisson con una dependiente binaria ¿Cierto?
Hola Carolina. Efectivamente, si tienes una variable de conteo lo más apropiado es usar un modelo de Poisson. Para una variable dependiente binaria lo mejor es usar otros métodos de estimación como Mínimos Cuadrados Ordinarios, Logit o Probit. Tengo algunos videos sobre estos últimos métodos: th-cam.com/video/Ost9Dv9yaN8/w-d-xo.html y th-cam.com/video/wMAsHwI30yU/w-d-xo.html . Saludos!
Clase ilustrativa muy didáctica. Muchas gracias por su aporte.
Excelente video, muy claro y preciso. Saludos!
Me hizo falta un ejemplo de predicción, ¿dado un conjunto de condiciones cuál sería el número de arrestos...?
Buen vídeo. En el ejemplo de OLS/MCO, podría sumar 1 a la variable independiente y=(y+1), de forma que sería posible estimar el log de y en todas las observaciones. Eso podría ser una solución?
Hola Javier. Me alegro que te guste el video. Usar log(y+1) en vez de log(y) ha sido sugerido por algunos autores en el pasado, pero hoy en día no se utiliza puesto que es un poco extraño. Básicamente se está cambiando la variable de y, la que realmente interesa, a y+1, que no estamos seguros de qué significa. Además, log(0+1)=log(1)=0, por lo que igual tendríamos muchas observaciones con ceros. En realidad, tratar de explotar el hecho de tener muchas observaciones con y=0 es clave, sin tener que cambiar la variable dependiente y.
Gracias por la respuesta.
Tengo una base en la que el porcentaje de ceros en mi variable de conteo asiciende a cerca del 93%. En ese caso, que es lo que se recomendaría?.
Como se explica en el video, es usual que la variable esté muy acumulada en cero. Yo sugeriría probar con diferentes modelos (MCO, Poisson o incluyo Logit y Probit transformando la variable en binaria) e investigar con cuál se obtienen las conclusiones más interesantes.
¿no podríamos hacer una transformación de la variable repuesta para que sea , 0.001 ;1;2;3;4... para no perder la información del 0 ?
Se podría pero resulta un poco arbitrario. ¿Porqué elegir 0.001 y no 0.1 o 0.02 o cualquier otro valor? Resulta bastante extraño. Es la misma razón por la que hoy en día tampoco se usa log(x+1) en caso de que x tome muchas veces el valor 0 (¿por qué no usar log(x+2) o log(x+0.0005)?). Hoy en día es mejor buscar modelos específicamente diseñados para estos escenarios que tomar decisiones de investigación arbitrarias.
Tengo una variable dependiente binaria con muchisímos 0. Si deseo ajustar un modelo de Poisson necesito convertirla en una variable de conteo ¿Correcto? No puedo ajustar un modelo de Poisson con una dependiente binaria ¿Cierto?
Hola Carolina. Efectivamente, si tienes una variable de conteo lo más apropiado es usar un modelo de Poisson. Para una variable dependiente binaria lo mejor es usar otros métodos de estimación como Mínimos Cuadrados Ordinarios, Logit o Probit. Tengo algunos videos sobre estos últimos métodos: th-cam.com/video/Ost9Dv9yaN8/w-d-xo.html y th-cam.com/video/wMAsHwI30yU/w-d-xo.html . Saludos!
@@adriangarlati muchísimas gracias.