**Específico: **
Construir un modelo de clasificación utilizando Python y Scikit-learn que prediga la probabilidad de que un cliente potencial se convierta en cliente real. El proyecto incluye la recopilación y preparación de datos, la selección de características relevantes, el entrenamiento y evaluación de diferentes algoritmos de clasificación (regresión logística, árboles de decisión, SVM) y la optimización de los hiperparámetros del modelo.
Medible:
Recopilar y preparar un conjunto de datos de al menos 1000 clientes potenciales con información demográfica, historial de compras e interacciones con el sitio web. Evaluar el rendimiento del modelo utilizando métricas como precisión, recall, F1-score y AUC. Alcanzar un valor de AUC superior a 0.75 en un conjunto de datos de prueba independiente. Identificar al menos 50 clientes potenciales con alta probabilidad de conversión utilizando el modelo. ** Alcanzable:**
Dedicar 15 horas semanales al proyecto. Utilizar conjuntos de datos públicos o simulados si no tengo acceso a datos reales de clientes potenciales. Aprovechar los conocimientos adquiridos en los meses anteriores sobre algoritmos de clasificación y técnicas de optimización de modelos. Buscar retroalimentación de otros científicos de datos para mejorar el modelo.
**Relevante: **
Este proyecto me permitirá aplicar los conocimientos adquiridos en los meses anteriores para resolver un problema real de negocio. Además, me ayudará a construir un portafolio sólido que demuestre mis habilidades a posibles empleadores y me permita destacar en el campo de la ciencia de datos. Temporal: Completar este proyecto en el sexto mes del programa de estudio, dedicando 3.75 horas diarias al desarrollo del modelo y la elaboración del informe final.