Vanessa es una científica de datos que está haciendo algunos análisis con datos ambientales. Está desarrollando un proyecto para evaluar el impacto ambiental de las actividades humanas en diferentes países del mundo, pero para ello necesita estimaciones de población de esos países. Al buscar en Internet, encontró una tabla de estimaciones de población en un artículo de la página de Wikipedia.
https://es.wikipedia.org/wiki/Anexo:Pa%C3%ADses_y_territorios_dependientes_por_poblaci%C3%B3n
Al igual que Vanessa, tu desafío es obtener un DataFrame de la tabla que contiene la información del número de habitantes de cada país.
from google.colab import files
uploaded = files.upload()
import pandas as pd
tablas = pd.read_html('paises_y_territorios.html')
# Revisamos el número de tablas encontradas en el archivo html
print(f"Número de tablas encontradas: {len(tablas)}")
# Imprimimos la primera tabla
df = tablas[0]
df.head()
# Exportamos a CSV
df.to_csv('paises_y_poblacion.csv', index=False)
files.download('paises_y_poblacion.csv')