Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Solucionado (ver solución)
Solucionado
(ver solución)
1
respuesta

Carga con datos vacios

si no tuviéramos conocimiento de la tabla para visualizar que los datos tienen un espacio vacío, existe alguna otra forma de revisarlo directo de los datos? o en algún ejercicio real os tendrían que proporcionar la tabla con los datos a revisar?

1 respuesta
solución!

¡Hola Edmer!

Entiendo tu preocupación sobre cómo identificar espacios vacíos en un conjunto de datos sin tener una visualización previa de la tabla. Afortunadamente, hay formas de abordar esto directamente desde los datos utilizando Python y NumPy.

Una manera práctica de detectar valores vacíos o faltantes en un archivo CSV es cargar los datos en un formato que te permita inspeccionar cada elemento. Aquí te dejo un ejemplo de cómo podrías hacerlo:

  1. Lectura del archivo CSV: Puedes usar la biblioteca pandas, que es muy útil para este tipo de tareas. Aunque estás trabajando con NumPy, pandas puede ser una herramienta complementaria excelente.

    import pandas as pd
    
    # Cargar el archivo CSV
    df = pd.read_csv('apples-ts.csv')
    
    # Mostrar las primeras filas del dataframe
    print(df.head())
    
  2. Identificación de valores vacíos: Una vez que tienes los datos en un DataFrame, puedes verificar si hay valores vacíos usando el método isnull() de pandas.

    # Verificar valores vacíos
    print(df.isnull().sum())
    

    Esto te dará un conteo de cuántos valores vacíos hay en cada columna.

  3. Uso de NumPy para cargar datos: Si prefieres seguir con NumPy, puedes cargar los datos y luego manejar los errores que surgen de los valores vacíos.

    import numpy as np
    
    # Cargar datos ignorando la primera columna que podría tener espacios vacíos
    data = np.loadtxt('apples-ts.csv', delimiter=',', skiprows=1, usecols=range(1, 88))
    
    print(data)
    

    Aquí, skiprows=1 ignora la primera fila que podría contener encabezados, y usecols=range(1, 88) especifica que quieres cargar las columnas a partir de la segunda, asumiendo que la primera podría tener datos no numéricos.

En ejercicios reales, es común que te proporcionen el conjunto de datos, pero es importante que sepas cómo manejar situaciones donde los datos no están perfectamente limpios. Espero que estas sugerencias te ayuden a avanzar en tu proyecto.

¡Espero haber ayudado y buenos estudios!

Si este post te ayudó, por favor, marca como solucionado ✓. Continúa con tus estudios!