import pandas as pd
# Extraer la información de la página web
datos_paises_y_territorios = pd.read_html('https://es.wikipedia.org/wiki/Anexo:Pa%C3%ADses_y_territorios_dependientes_por_poblaci%C3%B3n')
# Cantidad de tablas
len(datos_paises_y_territorios)
# Tabla equivalente a la población para mediados del año 2000
poblacion_paises = datos_paises_y_territorios[0]
poblacion_paises
# Filtrado, para mostrar solo datos relevantes
df_filtrado = poblacion_paises.iloc[:, 1:9]
df_filtrado
# Guardamos el DataFrame en un archivo HTML
df_filtrado.to_html('/content/drive/MyDrive/Pandas_2/archivos_html/poblacion_paises.html',index=False)
# Leemos el archivo HTML -> muestra una lista
pd.read_html('/content/drive/MyDrive/Pandas_2/archivos_html/poblacion_paises.html')
# Guardamos el DataFrame en un archivo CSV
df_filtrado.to_csv('/content/drive/MyDrive/Pandas_2/archivos_html/poblacion_paises_por_coma.csv',index=False)
# Leemos el archivo CSV
pd.read_csv('/content/drive/MyDrive/Pandas_2/archivos_html/poblacion_paises_por_coma.csv')