Su desafío aquí será leer este archivo usando la función read_csv de la biblioteca Pandas. Se deben agregar algunos parámetros para que la lectura se realice correctamente. Entonces, aquí hay algunos consejos:
- Asegúrese de que el archivo CSV esté separado por una coma o punto y coma.
- La codificación del archivo es ISO-8859-1.
- Las primeras tres líneas del archivo se pueden ignorar, ya que el encabezado sólo comienza en la cuarta línea.
- Las últimas 9 líneas también se pueden ignorar, ya que son sólo información sobre dónde se tomaron los datos.
- Para eliminar las últimas líneas es necesario agregar el parámetro engine='python'.
import pandas as pd
ruta = "datos_sus.csv"
df = pd.read_csv(
ruta,
sep=';',
encoding='ISO-8859-1', # Codificación del archivo
skiprows=3, # Ignora las primeras 3 líneas
skipfooter=9, # Ignora las últimas 9 líneas
engine='python'
)
print(df.head())
print(df.shape)