Desafío: hora de la práctica

import pandas as pd from sklearn.preprocessing import OneHotEncoder, LabelEncoder df = pd.read_csv('/content/churn.csv') if 'id_cliente' in df.columns: df = df.drop(columns=['id_cliente']) # Separación en X (explicativas) e y (objetivo) X = df.drop(columns=['churn']) y = df['churn']

# Transformación de variables explicativas con OneHotEncoder cat_cols = ['pais', 'sexo_biologico'] ohe = OneHotEncoder(drop='if_binary', sparse_output=False) X_cat_transformed = ohe.fit_transform(X[cat_cols]) X_cat_df = pd.DataFrame(X_cat_transformed, columns=ohe.get_feature_names_out(cat_cols)) X_final = pd.concat([X.drop(columns=cat_cols).reset_index(drop=True), X_cat_df], axis=1)

# Transformación de la variable objetivo con LabelEncoder le = LabelEncoder() y_final = le.fit_transform(y) # Verificación de resultados print(f"Dimensiones finales de X: {X_final.shape}") print(f"Ejemplo de etiquetas transformadas en y: {y_final[:5]}") print("\nPrimeras filas del conjunto de características (X):") X_final.head()

Hola César, espero que estés bien

Parece que ya has realizado correctamente la separación de las variables explicativas y la variable objetivo, así como la transformación de las variables categóricas usando OneHotEncoder y LabelEncoder. Aquí tienes un resumen de lo que has hecho y algunos puntos a verificar:

Separación de Variables:
- Has separado correctamente las variables explicativas (X) de la variable objetivo (y).
Transformación de Variables Categóricas:
- Usaste OneHotEncoder para transformar las variables categóricas en X. El uso del parámetro drop='if_binary' es adecuado para evitar la multicolinealidad en variables binarias.
- Creaste un nuevo DataFrame X_final que combina las variables numéricas originales con las transformadas.
Transformación de la Variable Objetivo:
- Usaste LabelEncoder para transformar la variable churn en valores numéricos, lo cual es necesario para muchos algoritmos de Machine Learning.
Verificación:
- Las dimensiones de X_final y los primeros ejemplos de y_final indican que el procesamiento se realizó correctamente.

Si todo esto coincide con lo que esperabas, entonces parece que has completado el desafío con éxito. Si tienes algún problema específico o error, asegúrate de revisar los nombres de las columnas y los datos en el archivo CSV para verificar que todo esté en orden.

Espero haber ayudado y buenos estudios!

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Tópicos relacionados

Contenidos de Alura sobre el tema