si no tuviéramos conocimiento de la tabla para visualizar que los datos tienen un espacio vacío, existe alguna otra forma de revisarlo directo de los datos? o en algún ejercicio real os tendrían que proporcionar la tabla con los datos a revisar?
si no tuviéramos conocimiento de la tabla para visualizar que los datos tienen un espacio vacío, existe alguna otra forma de revisarlo directo de los datos? o en algún ejercicio real os tendrían que proporcionar la tabla con los datos a revisar?
¡Hola Edmer!
Entiendo tu preocupación sobre cómo identificar espacios vacíos en un conjunto de datos sin tener una visualización previa de la tabla. Afortunadamente, hay formas de abordar esto directamente desde los datos utilizando Python y NumPy.
Una manera práctica de detectar valores vacíos o faltantes en un archivo CSV es cargar los datos en un formato que te permita inspeccionar cada elemento. Aquí te dejo un ejemplo de cómo podrías hacerlo:
Lectura del archivo CSV: Puedes usar la biblioteca pandas, que es muy útil para este tipo de tareas. Aunque estás trabajando con NumPy, pandas puede ser una herramienta complementaria excelente.
import pandas as pd
# Cargar el archivo CSV
df = pd.read_csv('apples-ts.csv')
# Mostrar las primeras filas del dataframe
print(df.head())
Identificación de valores vacíos: Una vez que tienes los datos en un DataFrame, puedes verificar si hay valores vacíos usando el método isnull() de pandas.
# Verificar valores vacíos
print(df.isnull().sum())
Esto te dará un conteo de cuántos valores vacíos hay en cada columna.
Uso de NumPy para cargar datos: Si prefieres seguir con NumPy, puedes cargar los datos y luego manejar los errores que surgen de los valores vacíos.
import numpy as np
# Cargar datos ignorando la primera columna que podría tener espacios vacíos
data = np.loadtxt('apples-ts.csv', delimiter=',', skiprows=1, usecols=range(1, 88))
print(data)
Aquí, skiprows=1 ignora la primera fila que podría contener encabezados, y usecols=range(1, 88) especifica que quieres cargar las columnas a partir de la segunda, asumiendo que la primera podría tener datos no numéricos.
En ejercicios reales, es común que te proporcionen el conjunto de datos, pero es importante que sepas cómo manejar situaciones donde los datos no están perfectamente limpios. Espero que estas sugerencias te ayuden a avanzar en tu proyecto.
¡Espero haber ayudado y buenos estudios!