Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Desafío: hora de la práctica

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

1 respuesta

Hola, Andrés, espero que estés bien

Parece que estás trabajando con un conjunto de datos sobre churn de clientes y necesitas preparar los datos para un modelo de Machine Learning. Vamos a repasar los pasos que has seguido y asegurarnos de que todo esté correcto:

  1. Separación de variables: Has separado correctamente las variables explicativas (X) de la variable objetivo (y). Asegúrate de que las columnas que estás eliminando de X son efectivamente las que no necesitas como variables explicativas.

  2. Transformación de variables categóricas: Estás utilizando OneHotEncoder para convertir variables categóricas en formato numérico. El uso de drop='if_binary' es adecuado para evitar la multicolinealidad en variables con solo dos categorías. Asegúrate de que las columnas categóricas que has especificado (pais, sexo_biologico) son las que realmente necesitan esta transformación.

  3. Transformación de la variable objetivo: Estás utilizando LabelEncoder para transformar la variable objetivo churn. Esto es correcto, ya que LabelEncoder es adecuado para variables categóricas que solo tienen un número limitado de valores distintos.

Si todo esto está en orden, deberías estar listo para continuar con el entrenamiento de tu modelo. Si encuentras algún error o resultado inesperado, revisa los nombres de las columnas y el formato de los datos para asegurarte de que todo esté alineado con lo que esperas.

Espero haber ayudado y buenos estudios!