Quiero poner a prueba este método durante un mes para aprender los conceptos generales de Data Science y ver sus resultados. Me apoye de ChatGPT para desarrollar la siguiente rutina:
10% Formal (teoría estructurada)
~30 min al día (total: 15 hrs)
Plataformas recomendadas:
Curso “Python for Data Science” (Coursera, DataCamp, freeCodeCamp)
Curso “Data Science Basics” (IBM, edX o YouTube)
Contenidos clave:
¿Qué es Data Science?
Fundamentos de Python
Introducción a estadística
Tipos de modelos de ML (clasificación, regresión)
Flujo de un proyecto de datos (CRISP-DM)
20% Social (interacción y comunidad)
~1 hr cada 2 días (total: 15 hrs)
Actividades:
Unirte a foros (Kaggle, Reddit, Discord)
Seguir canales de YouTube/Twitter/X especializados (ej. Ken Jee, StatQuest)
Ver notebooks de otros en Kaggle
Compartir avances o pedir feedback (LinkedIn, GitHub)
Intercambiar código o soluciones con otros estudiantes
70% Experiencial (práctica directa)
~2–3 hrs/día (total: 70–90 hrs)
Semana 1:
Python: variables, listas, funciones, loops
Pandas: cargar, limpiar y explorar datasets
Ejercicio: Análisis de datos de Titanic o Iris
Semana 2:
Estadística básica en Python (media, desviación, correlación)
Visualización con Matplotlib y Seaborn
Proyecto: análisis visual de algún dataset (ej: Netflix, FIFA, crimen, etc.)
Semana 3:
Machine Learning con Scikit-learn
Regresión lineal
Clasificación (KNN, árbol de decisión)
Validación de modelos (train/test split, métricas)
Proyecto guiado: predicción de precios o churn
Semana 4:
Crear tu propio proyecto:
Buscar un dataset interesante (ej. Kaggle, gobierno abierto, tu propio Excel)
Hacer limpieza, análisis, modelo y visualización
Documentarlo y subirlo a GitHub
Presentarlo (puede ser PDF, notebook, o video breve)