- 171
- 15 527
Soledad Galli | Data Scientist
Germany
เข้าร่วมเมื่อ 3 ธ.ค. 2017
I’m a biologist turned data scientist. Like many of you, I learned machine learning online through courses and books, practicing my skills in data competitions. Eventually I got my first job as a data scientist in finance. I was over the moon. That was more than 10 years ago.
In that role, I realized that beginner courses are great for starting out but often miss real-world applications. I spent hours online searching for best practices and information for my projects. I figured if I was struggling, others must be too. What if I gather what I learned in an online course? So I did, and Train in Data was born.
Since then, I’ve created more courses with colleagues who shared similar journeys. In our courses, we cover essential aspects of the machine learning workflow, such as model deployment, feature engineering, feature selection, how to work with imbalanced data, forecasting and more.
Subscribe to my channel to learn more about machine learning!
In that role, I realized that beginner courses are great for starting out but often miss real-world applications. I spent hours online searching for best practices and information for my projects. I figured if I was struggling, others must be too. What if I gather what I learned in an online course? So I did, and Train in Data was born.
Since then, I’ve created more courses with colleagues who shared similar journeys. In our courses, we cover essential aspects of the machine learning workflow, such as model deployment, feature engineering, feature selection, how to work with imbalanced data, forecasting and more.
Subscribe to my channel to learn more about machine learning!
Window Features | Feature Engineering for Time Series Forecasting
In this video, we introduce window features, explaining how to create summary statistics from past data to enhance time series analysis. We cover concepts like rolling and expanding windows, choosing window sizes, and implementing methods in Python.
Want to learn more? Check out our course: www.trainindata.com/p/feature-engineering-for-forecasting
Want to learn more? Check out our course: www.trainindata.com/p/feature-engineering-for-forecasting
มุมมอง: 8
วีดีโอ
Introducción a pipelines
มุมมอง 134 ชั่วโมงที่ผ่านมา
Este video continuamos profundizando en técnicas avanzadas para manejar variables de fecha y hora en Python, utilizando la librería Pandas. Nos enfocamos en la creación de pipelines para automatizar y optimizar el proceso de transformación de datos. Las pipelines son herramientas valiosas para automatizar y optimizar el proceso de transformación de datos, especialmente cuando se trabaja con var...
Ingeniería de variables de tiempo y zonas horarias
มุมมอง 1012 ชั่วโมงที่ผ่านมา
El video se centra en la extracción de información valiosa a partir de variables que contienen datos de fecha y hora en Python. Se utilizan técnicas de la librería Pandas para lograr esto. Aprendiendo lo básico: Extraer hora, minuto y segundo: Se enseña cómo aislar estos componentes específicos de variables de fecha y hora utilizando el método dt y .strftime() de Pandas. Crear variables de hora...
Lag Features | Feature Engineering for Time Series Forecasting
มุมมอง 2914 ชั่วโมงที่ผ่านมา
In this video, we introduce lag features for time series analysis, exploring their importance, creation process, and practical application for forecasting. Learn how to use past values to predict future outcomes, including hands-on examples and implementation tips in Python. Want to learn more? Check out our course: www.trainindata.com/p/feature-engineering-for-forecasting
Ingeniería de variables de fecha | Práctico
มุมมอง 2516 ชั่วโมงที่ผ่านมา
En este video nos enfocaremos en técnicas avanzadas para extraer información útil de variables de fecha y hora en Python, utilizando la librería Pandas. Se construye sobre la base del video anterior, profundizando en escenarios más complejos. Aprendiendo lo complejo: Extraer componentes específicos de la fecha: Se demuestra cómo aislar elementos como la semana del año, el mes, el trimestre, el ...
Components of a Time Series | Feature Engineering for Time Series Forecasting
มุมมอง 1919 ชั่วโมงที่ผ่านมา
In this video, we explore the fundamentals of time series decomposition, breaking down time series data into trend, seasonal, and residual components. We also explore how to visually identify these elements and understand their importance in data analysis. Want to learn more? Check out our course: www.trainindata.com/p/feature-engineering-for-forecasting
Ingeniería de variables de fechas y tiempo
มุมมอง 2121 ชั่วโมงที่ผ่านมา
En este video, te enseñaremos a trabajar con variables de fecha y hora, un tipo de variable fundamental en el análisis de datos. Aprenderás a: Extraer información valiosa: Obtener detalles como el día, mes, año, hora, minuto y segundo a partir de variables de fecha y hora. Crear nuevas variables: Generar variables derivadas como la edad de un usuario o el tiempo transcurrido entre dos eventos. ...
Ingeniería de variables combinadas | Práctico
มุมมอง 16วันที่ผ่านมา
En este video, te enseñaremos a trabajar con variables mixtas, un tipo de variable que contiene tanto números como etiquetas. Aprenderás a: Identificar variables mixtas: Distinguirlas de las variables numéricas y categóricas puras. Extraer partes numéricas y categóricas: Transformar variables mixtas en dos variables separadas. Aplicar técnicas de análisis: Utilizar las técnicas aprendidas para ...
Introduction to Error Metrics | Forecasting with Machine Learning
มุมมอง 67วันที่ผ่านมา
In this video, we explore the fundamentals of error metrics in forecasting, discussing key measures such as mean absolute error, mean squared error, and root mean squared error. We illustrate how these metrics impact model evaluation and decision-making, with examples that highlight the importance of choosing the appropriate metric based on your time series properties. Want to learn more? Check...
Ingeniería de variables combinadas
มุมมอง 914 วันที่ผ่านมา
En este video, aprenderás a trabajar con variables mixtas, un tipo de variable que contiene tanto números como etiquetas. Aprenderás a: Identificar variables mixtas: Distinguirlas de las variables numéricas y categóricas puras. Extraer partes numéricas y categóricas: Transformar variables mixtas en dos variables separadas. Aplicar técnicas de análisis: Utilizar las técnicas aprendidas para trab...
Introduction to Backtesting | Forecasting with Machine Learning
มุมมอง 16614 วันที่ผ่านมา
In this video, we introduce the concept of backtesting for time series forecasting. Backtesting refers to the use of cross-validation to examine the performance of the machine learning model that we are using for forecasting. We explain why backtesting is important, and the various ways in which we can implement a backtesting strategy depending on the forecasting data, when is the last availabl...
Normalizando con la norma del vector | Práctico
มุมมอง 1214 วันที่ผ่านมา
En este video, aprenderás a fondo la técnica de normalización a la norma del vector, también conocida como normalización unitaria, utilizando la librería scikit-learn en Python. Aprenderás a: Normalizar tus datos a la norma del vector unitario (distancia L1): Una técnica de escalamiento alternativa a la normalización L2 y al escalado min-max. Implementar la normalización a la norma del vector u...
Normalizando con la norma del vector
มุมมอง 514 วันที่ผ่านมา
En este video, aprenderás a fondo la técnica de normalización a la norma del vector, también conocida como normalización unitaria, utilizando la librería scikit-learn en Python. Esta técnica es una alternativa a las técnicas de escalamiento vistas anteriormente y puede ser útil en algunos casos específicos, como cuando se trabaja con modelos de Machine Learning como regresiones, árboles de deci...
Recursive Forecasting with Machine Learning | Forecasting with Machine Learning
มุมมอง 6814 วันที่ผ่านมา
In this video, you will learn how to implement recursive forecasting using a LASSO regression model and the Python library skforecast. We'll discuss how to set up and fit the ForecasterAutoRegressor, create lag features, and evaluate model performance with an example. Skforecast is a fairly new open source Python library that will make your forecasting life much easier. So check it out, and let...
Normalización con la media y los quantiles | Práctico
มุมมอง 921 วันที่ผ่านมา
En este video, aprenderás paso a paso cómo implementar el escalamiento de variables por mediana y rango intercuartil (escalamiento robusto) utilizando la librería scikit-learn en Python. Esta técnica es una alternativa al escalamiento estándar y puede ser útil en algunos casos específicos, como cuando se tienen valores atípicos o outliers en el set de datos. Aprenderás a: Comprender el concepto...
Introduction to Time Series | Forecasting with Machine Learning
มุมมอง 6021 วันที่ผ่านมา
Introduction to Time Series | Forecasting with Machine Learning
Normalización con la media y los quantiles
มุมมอง 521 วันที่ผ่านมา
Normalización con la media y los quantiles
Interpretability in Machine Learning | Machine Learning Interpretability
มุมมอง 4028 วันที่ผ่านมา
Interpretability in Machine Learning | Machine Learning Interpretability
Re-escalando al valor mínimo y máximo | Práctico
มุมมอง 228 วันที่ผ่านมา
Re-escalando al valor mínimo y máximo | Práctico
Feature Importance in Decision Trees | Machine Learning Interpretability
มุมมอง 26หลายเดือนก่อน
Feature Importance in Decision Trees | Machine Learning Interpretability
Permutation Feature Importance | Machine Learning Interpretability
มุมมอง 56หลายเดือนก่อน
Permutation Feature Importance | Machine Learning Interpretability
Shapley Values and Cooperative Game Theory | Machine Learning Interpretability
มุมมอง 31หลายเดือนก่อน
Shapley Values and Cooperative Game Theory | Machine Learning Interpretability