Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
0
respuestas

Desafío: leer una tabla de una página web

import pandas as pd

URL de la página de Wikipedia con estimaciones de población

url = "https://es.wikipedia.org/wiki/Anexo:Pa%C3%ADses_y_dependencias_por_poblaci%C3%B3n"

Leer todas las tablas de la página

tablas = pd.read_html(url)

Generalmente, la primera tabla es la que contiene la población por país

df_poblacion = tablas[0]

Mostrar las primeras filas para verificar

print(df_poblacion.head())

Limpiar nombres de columnas y quitar filas vacías

df_poblacion.columns = [col.strip() for col in df_poblacion.columns]
df_poblacion = df_poblacion.dropna(how="all")

print(df_poblacion.head())