Hola ! Brutal las explicaciones ! mini pregunta, al hacer un clustering con kmeans, Tambien debería calcular las distancias luego de aplicar PCA al df resultante ?
Hola Juan. Pues es lo contrario, aplicamos PCA al primer dataframe y luego a las columnas (nuevas dimensiones) que nos ofrecen mayor varianza aplicamos entonces kmeans. Por ejemplo, seleccionamos 5 columnas que nos dan 95% de varianza de los datos, entonces a estas son las que aplicamos kmeans. Igualmente, podriamos aplicar estandarizacion (normalizacion).
Tutorial PCA en R | Como funciona el Analisis de Componentes Principales: th-cam.com/video/9S_JYYEOz2c/w-d-xo.html
Hola ! Brutal las explicaciones !
mini pregunta, al hacer un clustering con kmeans, Tambien debería calcular las distancias luego de aplicar PCA al df resultante ?
Hola Juan. Pues es lo contrario, aplicamos PCA al primer dataframe y luego a las columnas (nuevas dimensiones) que nos ofrecen mayor varianza aplicamos entonces kmeans. Por ejemplo, seleccionamos 5 columnas que nos dan 95% de varianza de los datos, entonces a estas son las que aplicamos kmeans. Igualmente, podriamos aplicar estandarizacion (normalizacion).
genial ! muchas gracias!@@rvstats_ES