Saludos, para K Means las variables deben ser continuas y dado que el algoritmo es a base de distancia entre los valores, las variables se deben estandarizar. Esto es importante sobre todo si las unidades de medición son diferentes en cada variable.
Muchas gracias y en el caso de tener variables binarias no habría problema en trabajarlas como 1 y 0 en el algoritmo de K Means, o se tendría que usar otro método de clasificación; dado que tengo variables binarias y continuas.
Hola, de comento que estoy trabajando con una base de datos que tiene $fecha(tipo factor) y $valor (tipo factor), pero al realizar la limpieza de datos en fecha hay dos separadores de formatos "25-02-2011" y "23/08/2017", en este caso no puedo transformarlos a Date si estan en dos formatos? y de la variable valor tengo datos con punto y otro con coma, como puedo estandarizar que los puntos se reemplazen a comas? Gracias de antemano.
Sí la base cabe en Excel lo más fácil es modificarla primero en Excel o OpenOffice con un simple find/replace para modificar la variable de interés y luego importar las variables unificadas a R.
tengo una variable fecha y quiero que digamos las que tengan el mes de enero quiero que sean 1, las del mes de febrero 2 y asi sucesivamente hasta diciembre=12 como puedo hacerlo? help me please.
@@marcovidal2810 Te recomiendo utilices el paquete lubridate. Si la fecha está en el formato correcto con ese paquete puedes usar la función month para extraer el número del mes. Por ejemplo, si tienes una fecha "2019-01-01" te va a dar 1. Si la fecha fuese por ejemplo "2018-10-20" te va a dar 10.
Hola!! estoy trabajando en una base de datos que contiene fechas de fuga de clientes de una compañía. Existe una variable que se denomina "fecha de fuga" y en ella se registra la fecha de salida de la compañía y en caso de que el cliente siga, la variable toma en valor NA. Si quisiera clasificar como Fugado=(presenta fecha de fuga)=1 y No Fugado=(NA)=0, como debería hacerlo?? Saludos!!
Saludos, hay varias formas de hacerlo. Por ejemplo, asumiendo que tu base de datos tenga de nombre df y tu variable fecha. # Crea una variable nueva por ejemplo llamada salida y la inicias con todos NA df$salida
Más videos sobre como manejar datos en R: th-cam.com/play/PLOwg8rmU5eyaGBy6Fko0pOz8nI3nCIacc.html
Gracias
Ya disponible el curso Introducción a la visualización de datos en R con ggplot2 www.rparatodos.com/
no me deja instalar la librería forcats, actualmente tiene otro nombre?Gracias
Gracias!
gracias me ayudo mucho
Muchas gracias por tu interesante vídeo. Asi se aprende R
Como hago el cambio de caracter a factor de varias variables?
Gracias!! Muy claro el video y la explicacion.
Super bien, me sirvio mucho, GRacias!
Gracias, tenia una variable parecida.
El curso completo de Introducción de R con
RStudio ya esta disponible. th-cam.com/play/PLOwg8rmU5eyZzFvKaGJF_XTVCOVN.html
En R como se trabajaría con variables mixtas, en el caso de K Means como se trataría las variables primero antes de trabajarlas.
Saludos, para K Means las variables deben ser continuas y dado que el algoritmo es a base de distancia entre los valores, las variables se deben estandarizar. Esto es importante sobre todo si las unidades de medición son diferentes en cada variable.
Muchas gracias y en el caso de tener variables binarias no habría problema en trabajarlas como 1 y 0 en el algoritmo de K Means, o se tendría que usar otro método de clasificación; dado que tengo variables binarias y continuas.
Muchas gracias también quería saber si para KMeans las variables tienen que seguir un comportamiento normal
No es necesario.
Hola, de comento que estoy trabajando con una base de datos que tiene $fecha(tipo factor) y $valor (tipo factor), pero al realizar la limpieza de datos en fecha hay dos separadores de formatos "25-02-2011" y "23/08/2017", en este caso no puedo transformarlos a Date si estan en dos formatos? y de la variable valor tengo datos con punto y otro con coma, como puedo estandarizar que los puntos se reemplazen a comas? Gracias de antemano.
Sí la base cabe en Excel lo más fácil es modificarla primero en Excel o OpenOffice con un simple find/replace para modificar la variable de interés y luego importar las variables unificadas a R.
tengo una variable fecha y quiero que digamos las que tengan el mes de enero quiero que sean 1, las del mes de febrero 2 y asi sucesivamente hasta diciembre=12 como puedo hacerlo? help me please.
Saludos, ¿La fecha está completa? ¿O sea en formato mes-día-año?
@@RParaTodos si, esta completa y la importe de excel y use el comando detectdata para que lo reconozca.
@@marcovidal2810 Te recomiendo utilices el paquete lubridate. Si la fecha está en el formato correcto con ese paquete puedes usar la función month para extraer el número del mes. Por ejemplo, si tienes una fecha "2019-01-01" te va a dar 1. Si la fecha fuese por ejemplo "2018-10-20" te va a dar 10.
@@RParaTodos ya la descargue, pero cual es en si el comando?
month
Hola!! estoy trabajando en una base de datos que contiene fechas de fuga de clientes de una compañía. Existe una variable que se denomina "fecha de fuga" y en ella se registra la fecha de salida de la compañía y en caso de que el cliente siga, la variable toma en valor NA. Si quisiera clasificar como Fugado=(presenta fecha de fuga)=1 y No Fugado=(NA)=0, como debería hacerlo?? Saludos!!
Saludos, hay varias formas de hacerlo. Por ejemplo, asumiendo que tu base de datos tenga de nombre df y tu variable fecha.
# Crea una variable nueva por ejemplo llamada salida y la inicias con todos NA
df$salida
genial!!! muchisimas gracias!!