Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Desafío: ¡hora de la práctica!

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

1 respuesta

Hola, Andrés, espero que estés bien

Parece que estás trabajando en la limpieza de datos y has realizado varias operaciones para manejar inconsistencias y valores nulos. Aquí tienes un resumen y algunas sugerencias sobre lo que has hecho:

  1. Eliminar filas duplicadas: Has utilizado drop_duplicates() para eliminar duplicados, lo cual es una buena práctica para asegurar que los datos sean únicos.

  2. Eliminar columnas irrelevantes: Decidiste eliminar la columna ventas_por_dia porque no aportaba datos relevantes. Asegúrate de que esta decisión esté alineada con el análisis que planeas realizar.

  3. Rellenar valores nulos:

    • En cliente_por_dia, estás usando la media para rellenar valores nulos. Esto es adecuado si los datos están distribuidos normalmente.
    • Para tamano_tienda, usaste 'Desconocido' para los valores nulos, lo cual es útil para mantener la integridad de los datos categóricos.
  4. Verificar valores ausentes: Has comprobado la presencia de valores nulos en cada columna, lo cual es esencial para asegurar que no haya datos faltantes que puedan afectar el análisis.

  5. Reemplazar valores inconsistentes: Cambiaste valores en tamano_tienda para estandarizar las categorías. Asegúrate de que estas nuevas categorías sean consistentes con el contexto de tu análisis.

Si tienes alguna duda específica sobre alguna de estas operaciones o necesitas más detalles sobre cómo proceder, no dudes en preguntar.

Espero haber ayudado y buenos estudios!