Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Desafío: trabajando en otros contextos

En esta etapa avancé con la transformación de los datos. Primero eliminé las listas dentro del DataFrame usando explode, luego verifiqué los tipos de datos con info() y confirmé que la columna numérica era “Valor da compra”. Apliqué limpieza para remover el texto “R$” y cambiar las comas por puntos, y finalmente convertí la columna a tipo float64. Con esto, los valores quedaron listos para análisis más profundos, como sumar el gasto total por cliente o identificar patrones de compra.

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

1 respuesta

¡Hola Estudiante, espero que estés bien!

Parece que has avanzado muy bien en el desafío de transformación de datos. Aquí hay un resumen de lo que has hecho y algunos consejos adicionales:

Resumen de tus pasos:

  1. Eliminación de listas: Usaste explode para eliminar listas dentro del DataFrame.
  2. Verificación de tipos de datos: Utilizaste info() para verificar los tipos de datos.
  3. Limpieza de datos: Removiste el texto "R$" y cambiaste comas por puntos para convertir la columna "Valor da compra" a tipo numérico.
  4. Conversión de tipos: Convertiste la columna a float64 para análisis numéricos.

Consejos adicionales:

  • Verificar valores nulos: Asegúrate de que no haya valores nulos en las columnas que vas a analizar. Puedes usar isnull().sum() para verificar esto.

    print(datos['Valor da compra'].isnull().sum())
    
  • Análisis adicional: Ahora que tienes los datos listos, podrías sumar el gasto total por cliente usando groupby y sum.

    total_por_cliente = datos.groupby('Cliente')['Valor da compra'].sum()
    print(total_por_cliente)
    
  • Visualización: Considera usar bibliotecas como Matplotlib o Seaborn para visualizar patrones de compra.

    import matplotlib.pyplot as plt
    
    total_por_cliente.plot(kind='bar')
    plt.title('Gasto total por cliente')
    plt.xlabel('Cliente')
    plt.ylabel('Valor da compra')
    plt.show()
    

Espero que esto te ayude a continuar con tu análisis. ¡Bons estudios!