Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Desafío: ¡hora de la práctica!

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad
Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

1 respuesta

Hola, Andrés, espero que estés bien

Parece que estás trabajando en la exploración de un conjunto de datos y buscando inconsistencias. Vamos a analizar lo que has encontrado hasta ahora:

  1. Datos faltantes:

    • En la columna ventas_por_dia, solo hay un valor no nulo, lo que indica que la mayoría de los datos están ausentes.
    • La columna tamano_tienda también tiene algunos valores faltantes (878 de 898 entradas).
  2. Estadísticas descriptivas:

    • La media y los valores de las columnas numéricas (ventas_tienda, cliente_por_dia, items_disponibles) parecen razonables, pero deberías investigar más sobre el único valor de ventas_por_dia.
  3. Tipos de datos:

    • Verifica si los tipos de datos son correctos para el análisis que deseas realizar. Por ejemplo, tamano_tienda está como object, lo cual es correcto si es una categoría.

Recomendaciones:

  • Manejo de datos faltantes: Considera cómo tratar los valores ausentes. Podrías eliminar filas con datos ausentes o imputar valores basados en la media, mediana, etc.

  • Duplicados: Asegúrate de que no haya filas duplicadas con data_final2.duplicated().sum().

  • Análisis de outliers: Revisa si hay valores atípicos que podrían distorsionar el análisis.

Espero que estas sugerencias te ayuden a avanzar en tu análisis. ¡Bons estudios!