[Ranking 10 al 1] Machine Learning - Top Algoritmos IMPRESCINDIBLES para Data Science en 2024

แชร์
ฝัง
  • เผยแพร่เมื่อ 19 มิ.ย. 2023
  • 👉 Descarga el notebook con el código aquí: datascience4business.com/f/lm...
    En este vídeo te voy a enseñar el ranking de los 10 algoritmos de machine learning más importantes para analizar datos tabulares.
    Además te voy a hacer una breve explicación de cómo funciona cada uno.
    Te voy a decir los casos de uso en los que ese algoritmo concreto es especialmente útil.
    Y por si fuera poco te voy a dar una plantilla de código en Python con el esqueleto para implementar ese algoritmo.
    Machine Learning, Análisis de Datos, Algoritmos, Python, Regresión, KNN, Naive Bayes, K-medias, Árbol de Decisión, ARIMA, Suavizado Exponencial, Random Forest, XGBoost, LightGBM.
  • วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 43

  • @miguelsalas634
    @miguelsalas634 ปีที่แล้ว +1

    Excelete Video Profe gracias

  • @sebasnolascop
    @sebasnolascop ปีที่แล้ว +16

    Falta un video sobre métricas para evaluar los modelos, qué métrica conviene para cada modelo y por qué?

    • @JohnLocke-ld6tj
      @JohnLocke-ld6tj 9 หลายเดือนก่อน +2

      Siiiiiiiii y también los de la hiperparametrización. Gracias, DataScience ForBusiness.

  • @VictorHugoAngel
    @VictorHugoAngel ปีที่แล้ว +1

    Excelente video. Gracias

  • @oscar2h
    @oscar2h หลายเดือนก่อน +1

    Excelente video, gracias!

  • @josevicente632
    @josevicente632 ปีที่แล้ว +2

    Excelente video

  • @alejandrosellesperez1810
    @alejandrosellesperez1810 4 หลายเดือนก่อน

    Estaria muy top que recomendaras recursos o hicieras videos para informarse mas de lo que hay matemáticamente detras de cada algoritmo que comentas

  • @yuniorbatista2416
    @yuniorbatista2416 ปีที่แล้ว +9

    Sería interesante hacer una segunda parte para aprender cómo se evalúan los modelos, y sus principales métricas. por ejemplo, poniendo a competir el Top 3 del modelo y explicar porque escoger uno de ellos segun las métricas analizadas, AUC, Matriz de confusión, etc

    • @victoralejandroregueirarom2051
      @victoralejandroregueirarom2051 ปีที่แล้ว +1

      Y de igual manera considerar si se debe de tomar en cuenta el accuracy, f1-score, precision y recall.

  • @dionisiofernandez5832
    @dionisiofernandez5832 หลายเดือนก่อน

    Hola que tal ? me gusto mucho tu video y logre implementar alguno de los algoritmos en mi proyecto y le fue muy bien, tengo un par de preguntas sobre un proyecto nose si tengas un correo donde te la pueda hacer? por otro lado estaba mirando tu pagina web y esta muy interesante hacer el reto de una semana como data science, pero yo hice el curso de certificacion profesional en Data Science EDX de harvard y es todo en R, asi que phyton un no lo manejo (aunque supongo que la curva de aprendizaje debe ser corta) puedo hacer el reto usando R como lenguaje?, muchas gracias y felicitaciones por tus videos

  • @yvankovkafka8158
    @yvankovkafka8158 27 วันที่ผ่านมา +1

    esta vez ya le sigo la pista y aunque no he tenido la oportunidad de poner en practica todos los modelos, el K-Means me funciona perfecto, ahora estoy viendo las BitNets, esto está volando y yo recién estoy gateando 🤔

  • @monicaoc5235
    @monicaoc5235 2 หลายเดือนก่อน +1

    Un genio

  • @ESPjump
    @ESPjump ปีที่แล้ว +2

    Has omitido los Support Vector Machine por algun motivo? En algunos proyectos de clasificacion en medicina, era el algoritmo que obtenia mejores resultados, similares a algunas redes neuronales. El principal problema es que el entrenamiento tardaba muchisimo.

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว +2

      Ningún motivo especial. El objetivo era repasar los algoritmos que más se usan en la empresa en datos tabulares. Y es cierto que SVM se usa más en la academia-investigación que en la empresa. Pero tb podría ser perfectamente válido.

  • @jorge1869
    @jorge1869 ปีที่แล้ว

    Estoy en el rublo académico, trabajo mucho con datos tabulares, y me he percatado que para problemas de clasificación en la mayoría de los casos el algoritmo random forest es imbatible. OJO en problemas de regresión también es excelente, pero donde más brilla es en problemas de clasificación con datos tabulares.

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว +2

      ha sido mi algoritmo por defecto muchos años. el principal problema es como digo en el vídeo si ya estás en casos de mucho volumen de datos, por el tiempo de entrenamiento (que se puede resolver muestreando), pero últimamente tiendo más a xgboost o lightgbm

    • @jorge1869
      @jorge1869 ปีที่แล้ว

      @@DataScienceForBusiness xgboost ha sido uno de los algoritmos que más competencia ha ganado en kaggle. Gradient boosting es también muy bueno, lo malo es que es un demonio que te consume muchos recursos del PC con grandes volúmenes de datos.

  • @JuanSosa-gd8uy
    @JuanSosa-gd8uy ปีที่แล้ว

    Ya no hay Rstudio?

  • @josemag4617
    @josemag4617 หลายเดือนก่อน

    Cuando menciona hiperparametrizacion a qué se refiere puntualmente? Elegir parámetros en vez de los por defecto? Gracias, muy buen material

    • @DataScienceForBusiness
      @DataScienceForBusiness  หลายเดือนก่อน +2

      Los hiperparámetros son aquellos parámetros cuyo valor no lo establece el algoritmo en base a su entrenamiento, si no que se los defines tú como analista: tasa de aprendizaje, regularización, niveles de profundidad, etc. Son diferentes en cada algoritmo. El proceso de hiperparametrización es una manera (realmente hay varias técnicas) para encontrar los mejores valores de esos hiperparámetros también de forma programática y basada en datos, sin tener que decidirlos tú "a dedo".

  • @mientorno.digital
    @mientorno.digital ปีที่แล้ว

    Hola Isaac. En tu último vídeo enviado por correo no sale el botón para pasar al siguiente vídeo, por lo menos a mi no me aparece habilitado. Saludos.

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว

      Se te debería habilitar automáticamente tras unos 20 min. Si te sigue sin funcionar escríbeme a isaac@datascience4business.com

  • @Franzzss
    @Franzzss ปีที่แล้ว

    Hola, he visto que han sacado el Técnico Superior en Administración y Finanzas con Especialidad en Big Data para el Sector Financiero, titulacion oficial, ¿que opinas de este nuevo FP? gracias.

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว +1

      puff, pues no he visto el programa, pero si le han puesto ese título no me da buena espina. yo miraría a ver si han sacado algún otro de big data pero con enfoque más técnico

    • @Franzzss
      @Franzzss ปีที่แล้ว

      @@DataScienceForBusiness UNIDAD 1 Programación en entornos de Big Data
      UNIDAD 2. Procesamiento de datos
      UNIDAD 3. Segmentación de clientes mediante análisis de datos
      UNIDAD 4. Evaluación del nivel de riesgo y prevención del riesgo mediante el análisis de datos
      UNIDAD 5. Análisis de Mercados Bursátiles
      Parece que esta enfocado al business analytic, muchas gracias por responder, de los mejores canales dando informacion sobre el sector.

  • @davidrosenblum4079
    @davidrosenblum4079 ปีที่แล้ว +1

    y es necesario aprenderlos todos porque hay que ser una enciclopedia con patas para trabajar en ML, cierto?

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว +2

      es un ámbito que requiere esfuerzo. pero no es tan complicado como parece. si te fijas al final el proceso es siempre muy similar. lo importante es aprender los fundamentos de ML. luego teniendo y entendiendo esa base aprender un nuevo algoritmo es relativamente fácil

  • @nathaliarecalde4871
    @nathaliarecalde4871 หลายเดือนก่อน +1

    Interesante. Lo tienes bien explicado, una buena estructura de datos.

  • @gjs3409
    @gjs3409 ปีที่แล้ว +1

    Si usamos R?

  • @yuniorbatista2416
    @yuniorbatista2416 ปีที่แล้ว

    se puede afirmar que estos algoritmos ya estan obsoletos con las ventajas que a estas alturas tienen el deep learning y las redes neuronales?, sobre todo en contexto empresariales, noto que ultimamente los reclutadores y ofertas de empleos piden DL

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว

      no, DL es lo mejor para video, texto o imágenes. pero para datos tabulares, además de que no suele compensar por eficiencia, tampoco suele conseguir mejores predicciones que el top de los algoritmos de este vídeo. el algoritmo idóneo depende del caso de uso.

  • @user-wo3hj1wx5e
    @user-wo3hj1wx5e 2 หลายเดือนก่อน

    En arima dices autocorrelaciones?? No querrás decir varianzas?

  • @samuelorellana9923
    @samuelorellana9923 ปีที่แล้ว

    donde esta la base de datos?

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว +1

      debajo del botón para descargar el notebook hay otro para descargar el csv

  • @EmeritoMontilla
    @EmeritoMontilla ปีที่แล้ว

    pero la plantilla nunca llega

    • @CarolinaAvilaCoral
      @CarolinaAvilaCoral ปีที่แล้ว +1

      Cuando te registras te llega el correo para confirmar tu interés en pertenecer a la lista de noticias, cuando le dices que si, te lleva a una página con información de otros servicios gratuitos y al final está el botón de descargar.

    • @DataScienceForBusiness
      @DataScienceForBusiness  ปีที่แล้ว

      correcto, tienes que darle a ese botón y te lo descarga desde google drive

  • @leonardoleonardo4867
    @leonardoleonardo4867 หลายเดือนก่อน

    Muy rapido amigo, como ddocente o capacitador ud. No sirve...

    • @juanhernandez-lq4po
      @juanhernandez-lq4po หลายเดือนก่อน +2

      hay 70.000 personas que creen que si, no llores tanto solo porque a ti no te hace sentido😂

  • @yvankovkafka8158
    @yvankovkafka8158 หลายเดือนก่อน

    desgraciadamente entendí una mierda, ES MI PROBLEMA, que debo estudiar para poder entender los modelos? que lenguaje de programación están usando? hay otro video donde muestren las bases para poder seguirles el paso? muchas gracias, llevo unos meses tratando de aprender y estoy en nada comparado al video que para mi está en conceptos avanzados 🥴

    • @DataScienceForBusiness
      @DataScienceForBusiness  หลายเดือนก่อน

      python. para empezar puedes ver el vídeo de "la mejor ruta para aprender data science"