# 1) Leer datos para construir el modelo
import pandas as pd
import plotly.express as px
datos_desafio = pd.read_csv('/content/drive/MyDrive/aprendiendo_a_clasificar_datos_con_ml/churn.csv')
datos_desafio.head()
datos_desafio = datos_desafio.drop('id_cliente', axis=1) # Se elimina la columna 'id_cliente'
datos_desafio.head()
datos_desafio.info()
# 2) Variables categóricas (cualitativas):
# pais, sexo_biologico, tiene_tarjeta_de_credito, miembro_activo, churn
# churn:
px.histogram(datos_desafio, x='churn', text_auto=True, color= 'churn', barmode='group')
# pais
px.histogram(datos_desafio, x='pais', text_auto=True, color='churn', barmode='group')
# sexo_biologico
px.histogram(datos_desafio, x='sexo_biologico', text_auto=True, color='churn', barmode='group')
# tiene_tarjeta_credito
px.histogram(datos_desafio, x='tiene_tarjeta_credito', text_auto=True, color='churn', barmode='group')
# miembro_activo
px.histogram(datos_desafio, x='miembro_activo', text_auto=True, color='churn', barmode='group')
# 3) Variables numéricas (cuantitativas):
# score_credito, edad, años_de_cliente, saldo, servicios_adquiridos, salario_estimado
# score_credito
px.box(datos_desafio, x='score_credito', color='churn')
# edad
px.box(datos_desafio, x='edad', color='churn')
# años_de_cliente
px.box(datos_desafio, x='años_de_cliente', color='churn')
# saldo
px.box(datos_desafio, x='saldo', color='churn')
# servicios_adquiridos
px.box(datos_desafio, x='servicios_adquiridos', color='churn')
# salario_estimado
px.box(datos_desafio, x='salario_estimado', color='churn')