Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
0
respuestas

Lectura correcta del CSV con Pandas

Su desafío aquí será leer este archivo usando la función read_csv de la biblioteca Pandas. Se deben agregar algunos parámetros para que la lectura se realice correctamente. Entonces, aquí hay algunos consejos:

  • Asegúrese de que el archivo CSV esté separado por una coma o punto y coma.
  • La codificación del archivo es ISO-8859-1.
  • Las primeras tres líneas del archivo se pueden ignorar, ya que el encabezado sólo comienza en la cuarta línea.
  • Las últimas 9 líneas también se pueden ignorar, ya que son sólo información sobre dónde se tomaron los datos.
  • Para eliminar las últimas líneas es necesario agregar el parámetro engine='python'.
import pandas as pd

ruta = "datos_sus.csv"

df = pd.read_csv(
    ruta,
    sep=';',                 
    encoding='ISO-8859-1',    # Codificación del archivo
    skiprows=3,               # Ignora las primeras 3 líneas
    skipfooter=9,             # Ignora las últimas 9 líneas
    engine='python'        
)

print(df.head())
print(df.shape)

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad