Semana 1 | Realizar análisis exploratorio de datos (EDA) en un dataset. | Aplicar técnicas de limpieza y visualización de datos. | Uso de Python (pandas, matplotlib, seaborn) para manipulación y visualización de datos básicos. |
Semana 2 | Entrenar un modelo de regresión lineal simple. | Implementar un modelo para predecir valores numéricos. | Conceptos de regresión, uso de scikit-learn, y evaluación del modelo (métricas como RMSE y R²) |
Semana 3 | Implementar un modelo de clasificación supervisada. | Clasificar datos con algoritmos como k-NN o Random Forest. | Aplicación de algoritmos de clasificación, selección de hiperparámetros y manejo de desequilibrio en clases. |
Semana 4 | Crear un pipeline para un flujo de machine learning. | Automatizar preprocesamiento, entrenamiento y evaluación. | Uso de scikit-learn pipelines y herramientas como MLflow para gestión de experimentos. |