Desafío: leer una tabla de una página web

Paul Vidal Zamora · 2025-06-16 21:43

Vanessa es una científica de datos que está haciendo algunos análisis con datos ambientales. Está desarrollando un proyecto para evaluar el impacto ambiental de las actividades humanas en diferentes

Hola Paul,

¡Qué interesante el desafío que estás enfrentando! Vanessa está en una situación común para quienes trabajan con datos: obtener información de tablas en páginas web. Para resolver este desafío, puedes utilizar la función pd.read_html() de la biblioteca Pandas, que es perfecta para extraer tablas de HTML.

El código que has compartido parece estar en el camino correcto. Aquí te dejo un ejemplo práctico de cómo podrías utilizar esta función para obtener el DataFrame de la tabla de población desde Wikipedia:

import pandas as pd

# URL de la página de Wikipedia con la tabla de población
url = 'https://es.wikipedia.org/wiki/Anexo:Pa%C3%ADses_y_territorios_dependientes_por_poblaci%C3%B3n'

# Usar read_html para obtener todas las tablas de la página
tablas = pd.read_html(url)

# Seleccionar la primera tabla (o la que corresponda a la información que necesitas)
df_poblacion = tablas[0]

# Mostrar las primeras filas del DataFrame
print(df_poblacion.head())

Este código hará lo siguiente:

Importará la biblioteca Pandas.
Definirá la URL de la página de Wikipedia.
Usará pd.read_html() para leer todas las tablas de la página. Esta función devuelve una lista de DataFrames.
Seleccionará la primera tabla de la lista (índice 0), que se espera que sea la que contiene la información de población.
Finalmente, imprimirá las primeras filas del DataFrame para que puedas verificar que los datos se han cargado correctamente.

Espero que esto te ayude a avanzar en tu proyecto y que puedas obtener los datos necesarios para el análisis de Vanessa.

¡Espero haber ayudado y buenos estudios!

Si este post te ayudó, por favor, marca como solucionado ✓. Continúa con tus estudios!

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Tópicos relacionados

Contenidos de Alura sobre el tema