Análisis de Componentes Principales (PCA) en R y Rstudio [Chupito de R] pca

แชร์
ฝัง
  • เผยแพร่เมื่อ 1 ธ.ค. 2024

ความคิดเห็น • 90

  • @nicolastovar8121
    @nicolastovar8121 3 ปีที่แล้ว +2

    Muchas gracias Pablo ayudas a mucha gente muy noble de tu parte :3

  • @jeisonbarrazamendez
    @jeisonbarrazamendez 8 หลายเดือนก่อน

    Excelente video y script!

  • @williamswill3229
    @williamswill3229 2 ปีที่แล้ว

    gracias justo lo que necesitaba, me salia ese mismo error por las identidades de los encuestados, mil gracias

  • @blackcloud7201
    @blackcloud7201 3 ปีที่แล้ว

    Mi hermano eres el mejor, gracias por tu tiempo.

  • @carloss8235
    @carloss8235 3 ปีที่แล้ว

    Ey! Eres muy bueno eh?? Vas al grano y se entiende muy bien. gracias

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      Para nada, este es un mundo inmenso y yo solo sé un poco de una parte pequeña ;)

  • @leneko0034
    @leneko0034 3 ปีที่แล้ว +2

    Muy bueno el video y el script. Gracias!

  • @fiorellaalcpiz5067
    @fiorellaalcpiz5067 2 ปีที่แล้ว

    Gracias por este chupito! me licenciaré por tí jaja

  • @yotu3234
    @yotu3234 3 ปีที่แล้ว

    Gracias por los chupitos de R. Sigue asi!

  • @alejobecat
    @alejobecat 3 ปีที่แล้ว

    Impecable como siempre, Pablo. ¡Muchísimas gracias!

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      De nada, un placer ;)

    • @glairisasanchez1507
      @glairisasanchez1507 11 หลายเดือนก่อน

      @@PabloVallejoMedinanecesito un correo electrónico para contactarlo por favor 🙏

    • @PabloVallejoMedina
      @PabloVallejoMedina  11 หลายเดือนก่อน

      @@glairisasanchez1507 pableres@gmail.com

  • @saioaparis3348
    @saioaparis3348 2 ปีที่แล้ว

    Gracias por solucionarme el TFG jeje :)

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      El TFG te lo has solucionado tú misma buscando recursos, encontrando el que necesitabas y teniendo la destreza para aplicarlo a otro contexto. Seguro que sin mi video también lo hubieras logrado ;).

  • @teresalucilaaraujomoreno4654
    @teresalucilaaraujomoreno4654 2 ปีที่แล้ว

    Hola tengo una consulta con mi base de datos, en el video indica que hay que eliminar los names repetidos en mi caso seria familias que tienen 5 repeticiones cada una, al eliminar no afectaria el analisis de PCA?

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      Hola Teresa, no sé muy bien para qué quieres el PCA. La inmensa mayoría de bases de datos -quizá menos Excel- no te van a dejar tener variables repetidas. El PCA tampoco te va a funcionar con nombres idénticos. Simplemente haz que no tengan los mismos nombres.
      Saludos!

  • @LausEtJubilatio
    @LausEtJubilatio 3 ปีที่แล้ว

    EXCELENTE

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      Muchas gracias por el comentario y por el café ;)

  • @carlosauc
    @carlosauc 2 ปีที่แล้ว

    Hola buen dia. He generado un grafico indv-PCA con elipses. Sin embargo para cada punto se muestra un numero. Megustaria cambiar ese numero por el texto correspondiente para cada punto. Como lo puedo hacer? gracias

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว +1

      mhhh...teniendo los nombres de las variables en la columna en vez de los números. Lo hago en el otro video de PCA que tengo ;)

    • @carlosauc
      @carlosauc 2 ปีที่แล้ว

      @@PabloVallejoMedina perfecto, lo ví. Gracias por el tip.

  • @joseperezcastillo9382
    @joseperezcastillo9382 2 ปีที่แล้ว +1

    muy buen videos, pero tengo una duda cuando hago correr el comando "ggbiplot(respca2,ellipse=TRUE, labels=rownames(df), groups=grupo)" me aparece el mensaje "Error in chol.default(sigma) :
    the leading minor of order 2 is not positive definite", y no me agrupan los datos, quisiera consultar como reparar este error porfavor.

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      Parece que tienes pocos datos o son un poco caóticos. Pero podría ser otra cosa... échale un ojo: stackoverflow.com/questions/51064686/error-in-chol-defaultcxx-the-leading-minor-of-order-is-not-positive-definite

  • @jeanpierrerodriguezmirano5317
    @jeanpierrerodriguezmirano5317 3 ปีที่แล้ว

    Hola ¿Es decir que no se puede trabajar con variables con letras en este análisis? ¿ Tengo dos variables categóricas que no me gustaría dejar fuera, ¿qué puedo hacer?

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว +1

      Pasarlas a factores y a ver que pasa. También tienes lo análisis de correspondencia ;)

  • @irenebernabeu517
    @irenebernabeu517 2 ปีที่แล้ว

    Buenas, ahí va mi pregunta:
    Yo tengo que hacer un PCA y tengo muestras en la que se han medido las variables pero no de forma completa, es decir, hay espacios en blanco, es posible hacer la PCA de todos modos o debo extrapolar/inferir los valores que me faltan de las variables?

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      Hola, en R cada paquete y cada función puede manejarse de forma diferente con los casos perdidos. Puede que no te deje hacerlo, puede que implemente un método de estimación por defecto... Tendrías que revisar la documentación del paquete. Lo otro es que tú, personalmente, manejes esos datos de antemano. Esa sería mi recomendación.

  • @ameribaetis
    @ameribaetis 2 ปีที่แล้ว

    Hola Pablo, he podido notar que la base de datos del ejemplo tiene valores de "0" (minuto 1:27) y el comando "respca

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      Hola, Sandy. Parece ser que tienes una constante, es decir una variable donde todos los datos son el mismo. Si esto es así el PCA peta. elimínala y reintenta.

  • @patriciagomez2739
    @patriciagomez2739 3 ปีที่แล้ว

    trato de poner una variable de un archivo csv a nom,bre de columna pero no me deja...esporque tu comando es solo para archivos de excel????

  • @lauramontagut5690
    @lauramontagut5690 ปีที่แล้ว

    Holaa ! Excelente video me ayudaste mucho a mejorar mis graficas. Me podrías ayudar con algo. ¿ Como podría obtener un convex hulls de los grupos en lugar de los ellipses? Gracias nuevamente !

  • @rociodelpilargalindolujan550
    @rociodelpilargalindolujan550 3 ปีที่แล้ว

    Hola Mario. Están muy interesantes tus vídeos. Ya pagué tu café para que no te duermas☺ jejejeje... Podrías hacer un para PLSDA y consultarte si das clases en R con certificado. Gracias. ❤

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว +3

      Hola Rocío, gracias por el Ko-fi. Yo no doy clases particulares, pero Renzo Caceres Rossi (búscalo por Facebook) sí lo hace. También te recomiendo los cursos de DataCamp. Lo del PLSDA aprendo y hago el chupito.

  • @jaimeisaacpena8341
    @jaimeisaacpena8341 3 ปีที่แล้ว

    Excelente video muchas gracias!!
    Puedes compartir la base de datos o dataset

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      Hola Jaime, la base de datos la tienes en los comentarios.

  • @marlonedy55
    @marlonedy55 2 ปีที่แล้ว

    Podrías realizar un vídeo de RDA en R. Saludos desde Ecuador

  • @marianaossayepes2357
    @marianaossayepes2357 3 ปีที่แล้ว +1

    Muchísimas gracias por el video, me sirvió mucho. Tengo una duda: ¿Cuál fue el motivo de insertar los componentes PCA1 y PCA2 en la base de datos original si los gráficos los realizas con los resultados del PCA (respca2)?

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      Hola, no entiendo muy bien tu pregunta. Pongo los dos componentes primeros, no sé si los saqué con la misma sintaxis o con otra, pero esos son los dos componentes que decidí aislar. Luego las visualizaciones pueden ser las mismas u otras.

  • @albertocanomoreno5880
    @albertocanomoreno5880 3 ปีที่แล้ว

    buen video, solo una pregunta: en que se basa para caracterizar a los personajes en bueno y malos?

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      La propia base de datos te lo dice. Batman, spiderman, superman = buenos. El jocker, rhino y thanos = malos

  • @Gamamarc92
    @Gamamarc92 3 ปีที่แล้ว

    Hola buen video. Una duda, porque salen diferentes los componentes en R que cuando lo hago con otro Software ??

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      Los algoritmos pueden variar un poco de un programa a otro ;)

  • @camilomiranda2027
    @camilomiranda2027 3 ปีที่แล้ว

    Hola Pablo, muy chevere tu tutorial, podrías hacer un ejemplo para datos categoricos?

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว +1

      Hola, yo nunca utilizaría un PCA para datos categóricos. Se me ocurre mejor un AFE con la matriz policórica. De esto último ya hay chupito.

    • @raulcardenasful
      @raulcardenasful 3 ปีที่แล้ว

      Análisis de correspondencia

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      @@raulcardenasful Totalmente ;)

  • @luishernandezhernandez1640
    @luishernandezhernandez1640 3 ปีที่แล้ว +1

    Donde descargo la base de datos?

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      En la primera línea de sintaxis está la url de la descarga ;)

    • @winedj8466
      @winedj8466 3 ปีที่แล้ว

      @@PabloVallejoMedina gracias Pablo :D

  • @franciscogalvez8426
    @franciscogalvez8426 3 ปีที่แล้ว

    Muy bueno como siempre Pablo. Veremos algún Chupito de SEM?

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว +2

      Hay algunos de afc, pero como modelos aún no he hecho ninguno. A ver si lo apunto a la hoja de pendientes.

  • @luciasoler1442
    @luciasoler1442 3 ปีที่แล้ว

    Hola Pablo, saludos desde Argentina. Me encanta cómo explicas todo con tanta claridad y utilizando ejemplos que contienen obstáculos porque en la realidad pasa eso todo el tiempo con RStudio. Quería consultarte en el caso de un ACP se pueden utilizar como atributos ó categorías, datos que son "dependientes" entre sí. Por ejemplo, atributos que llevan porcentajes y cuya suma total da 100.

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว +1

      Hola, la idea es que los datos sean dependientes, sino no tendría mucho sentido buscar categorías de agrupación (con base a qué se iban a agrupar). Lo de los porcentajes es una buena pregunta. A priori no hay contraindicación matemática, pero depende de cómo estén los datos estructurados. HAz una prueba a ver si te da algo cohertente y me cuentas. Todo lo que te puede pasar es que te salga un solo componente muy vectorizado, entonces no tendría mucho sentido.

    • @luciasoler1442
      @luciasoler1442 2 ปีที่แล้ว

      @@PabloVallejoMedina Muchas gracias por tu respuesta. Estuve pensando en agregar un par de variables más, además de estas que te comenté que suman 100. Ya te cuento, en cuanto tenga algo resuelto con el biplot.
      En breve te invito un café virtual :)

  • @joseorlandoramossanchez7474
    @joseorlandoramossanchez7474 3 ปีที่แล้ว

    Hola Pablo me gustó mucho tu forma de explicar este tema, la verdad quede muy entuciasmado con lo que aprendí, me gustaría saber si puedes realizar un Klustering pero con datos nominales, en mi caso tengo una base de datos con clientes de diferentes regiones y pertenecientes a diferentes mercados y me gustaría realizar este proceso convinando los tipos de datos que tengo.

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      mira a ver si el kluster de kamedioids (del que tengo un chupito) te sirve ;)

  • @alejandrocastrocegri2645
    @alejandrocastrocegri2645 2 ปีที่แล้ว

    Buenas muchas gracias por el video es muy claro pero tengo una duda, podría quitar los títulos de cada individuo en la gráfica mostrada por fviz_pca_biplot y quedarme solamente con los símbolos y color correspondiente a cada grupo?

  • @ezequielsaavedra6152
    @ezequielsaavedra6152 3 ปีที่แล้ว

    muy bueno! solo una duda, como hago para descargar los datos? entre en el link de la primera fila pero no puedo descargarlo

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว +1

      qué raro, prueba en: github.com/cosmoduende/r-marvel-vs-dc/tree/main/dataset_shdb

  • @drsalvadormanrique3118
    @drsalvadormanrique3118 2 ปีที่แล้ว

    jaja, yo creo que OnlyFan es mejor negocio que la ciencia! Gracias por el video. Muy útil.

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      No te creas, me abro un OnlyFans y salgo a pagar ;)

  • @winedj8466
    @winedj8466 3 ปีที่แล้ว

    graciaaaas

  • @AdlerDiaz
    @AdlerDiaz 2 ปีที่แล้ว

    Puedes compartir tu excel por favor, Gracias

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      En la descripción está. O si no en el video digo de donde lo saco.

  • @LuisSuarez-pt3rw
    @LuisSuarez-pt3rw 3 ปีที่แล้ว

    Me gustaría quee ayude sobre una acs en r me puede ayudar

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว

      qué necesitas?

    • @LuisSuarez-pt3rw
      @LuisSuarez-pt3rw 3 ปีที่แล้ว

      Te mandaría el algoritmo de R studio y la base de datos para ver dónde estoy equivocado muchas

    • @PabloVallejoMedina
      @PabloVallejoMedina  3 ปีที่แล้ว +1

      @@LuisSuarez-pt3rw mándamela a mi correo: pableres@gmail.com y le echo un vistazo y te digo cuanto costaría el servicio según como esté.

    • @LuisSuarez-pt3rw
      @LuisSuarez-pt3rw 3 ปีที่แล้ว

      Ok

  • @EXXNmmmm
    @EXXNmmmm 3 ปีที่แล้ว

    Lo del ko-fi es una buena idea. Ya el de hoy te lo he pagado.

  • @tziraatmolina9979
    @tziraatmolina9979 2 ปีที่แล้ว

    ¿Alguien sabe si la variable de "bueno, malo o neutral" se puede visualizar?

    • @PabloVallejoMedina
      @PabloVallejoMedina  2 ปีที่แล้ว

      Hola crack, sí si se puede. Pero... qué tipo de visualización?

  • @CesarMolinaMora
    @CesarMolinaMora ปีที่แล้ว

    l base de datos no esta git

    • @PabloVallejoMedina
      @PabloVallejoMedina  ปีที่แล้ว

      Sí, ahí está: github.com/cosmoduende/r-marvel-vs-dc

  • @Zamihyalina
    @Zamihyalina ปีที่แล้ว

    No me funcionó tu video :( pero explicas muy bien

  • @josereyeslovato
    @josereyeslovato 2 ปีที่แล้ว

    library(devtools)
    install_github("vqv/ggbiplot", force = TRUE) Use este comando para instalar el ggbiplot SALUDOS