domingo, 18 de septiembre de 2022

Límites en Geoboundaries


Allá por el 2015 nos presentamos al concurso de Datos Abiertos de Castilla y León con un pequeño juego, que consistía en ir conquistando los diferentes municipios de esa autonomía. Para el desarrollo del juego tuvimos que tratar con datos de diferentes fuentes nacionales para conseguir los polígonos de los pueblos y ciudades, así como los datos del padrón, etc.

Unos años más tarde evolucionamos un poco el juego, y ampliamos el territorio a toda la península Ibérica. Pero lo que yo realmente quería hacer era conseguir llegar a nivel mundial. Pero imaginaros el trabajo que supondría ir territorio a territorio consiguiendo sus limites administrativos...

Y hace unas semanas descubrí esta URL: https://www.geoboundaries.org/

Dentro podemos encontrar todos los polígonos de cada país a nivel mundial, existen en diversos niveles por cada unos de ellos. En España, el más pequeño es el de los municipios. Es lo que queremos.

Podemos descargar los territorios que nos interesan uno por uno, o utilizar su API para realizar una descarga masiva.

Con esta llamada: https://www.geoboundaries.org/api/current/gbOpen/ALL/ALL/ conseguimos el listado en JSON de todos los países con los diferentes formatos y niveles de descarga.

La idea es descargar todo en formato GEOJSON, así que he hecho un pequeño script de Linux para realizar la descarga:

curl https://www.geoboundaries.org/api/current/gbOpen/ALL/ALL/ > allFilesToDownload.json
curl https://www.geoboundaries.org/api/current/gbOpen/ALL/ALL/ | json_pp > allFilesToDownload.json
grep gjDownloadURL allFilesToDownload.json > downloadAll.sh
sed -i 's/      \"gjDownloadURL\" : \"/wget /g' downloadAll.sh
sed -i 's/\",//g' downloadAll.sh


Este script genera otro script que al ejecutarlo descargará todos los ficheros en GEOSJON para poderlos cargar fácilmente (en MongoDB por ejemplo) y poder trabajar con ellos.

En total, han salido 665 descargas, algunos no son muy grandes, pero los que tienen mucha información superan los 100 MB.

Para validar que la información que estamos descargando no interesa, podemos visualizar cualquiera de los ficheros en la siguiente URL: https://geojson.io

Después de pegar el GEOJSON que se corresponde con el nivel 0 de India se puede visualizar así:



Es de las mejores páginas que hay para poder trastear con ficheros GEOJSON.

De momento voy a seguir descargándome todos los datos. Próximamente veremos que hacer con los datos que tenemos descargados.

Recordar que los datos proceden de Geoboundaries y si los usas, hay que mencionarlos:

Administrative boundaries courtesy of geoBoundaries

Nos vemos pronto.