Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Desafío: leer una tabla de una página web

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

Ingrese aquí la descripción de esta imagen para ayudar con la accesibilidad

1 respuesta

¡Hola Daiana, espero que estés bien!

Para leer una tabla de una página web usando Pandas, puedes usar la función read_html. Parece que ya estás en el camino correcto, pero te daré un ejemplo paso a paso para asegurarnos de que todo esté claro.

Aquí tienes un ejemplo de cómo podrías hacerlo:

import pandas as pd

# URL de la página web con la tabla
url = "https://es.wikipedia.org/wiki/Anexo:Pa%C3%ADses_y_territorios_dependientes_por_poblaci%C3%B3n"

# Leer todas las tablas de la página
tablas = pd.read_html(url)

# Seleccionar la tabla que necesitas (por ejemplo, la primera tabla)
tabla_poblacion = tablas[0]

# Mostrar la tabla
print(tabla_poblacion.head())

Algunas cosas a tener en cuenta:

  1. Índice de la tabla: read_html devuelve una lista de DataFrames, ya que una página puede contener múltiples tablas. Necesitarás seleccionar la tabla correcta usando el índice adecuado.

  2. Revisar el contenido: Usa print(tabla_poblacion.head()) para ver las primeras filas de la tabla y asegurarte de que estás trabajando con la tabla correcta.

  3. Manejo de datos: Una vez que tengas la tabla, puedes limpiarla y manipularla según tus necesidades.

Espero que esto te ayude a completar tu desafío. ¡Bons estudios!