Ir al contenido principal

Evaluador de Portales de Datos Abiertos - Parte III



En esta tercera entrega ya hemos empezado con la programación, el objetivo de hoy es conseguir cargar toda la información del fichero de datos.gob.es para poder evaluarla.

Si miráis el repositorio del Evaluador (https://github.com/tecnificados/evaluador) hay unas cuantas clases nuevas:
  1. OrganoPublicador: es un bean que contiene el nombre del organismo y la lista de conjuntos de datos.
  2. ConjuntoDatos: también un bean que contiene su título y la lista de formatos que tienen sus recursos.
  3. Evaluador: en esta clase está toda la lógica que traduce el contenido del fichero a los dos beans anteriores.
La función "evaluaLinea" me ha llevado más tiempo del que yo pensaba, debido a que hay celdas que son de tipo texto y tienen comas dentro. Como hago un "split" por comas, tengo que volver a juntar las celdas que tienen este comportamiento.

Estos son todos los formatos que me he encontrado, que son bastantes más de los que yo pensaba:
  • API 
  • ASCII 
  • Atom 
  • Calendar 
  • CSV 
  • CSW 
  • DBF 
  • DGN 
  • DjVu 
  • DOC 
  • DOCX 
  • DWG 
  • DXF 
  • ECW 
  • ELP 
  • ePub 
  • GDB 
  • GeoJSON 
  • GeoRSS 
  • GML 
  • GPX 
  • GZIP 
  • HTML 
  • JPG 
  • JSON 
  • JSON-LD 
  • KML 
  • KMZ 
  • LAS
  • MARC 
  • MDB 
  • N3 
  • OCTET-STREAM 
  • ODS 
  • ODT 
  • PC-Axis 
  • PDF 
  • plain 
  • PNG 
  • RDF-N3 
  • RDF-Turtle 
  • RDF-XML 
  • RSS 
  • RTF 
  • SCORM 
  • SHP 
  • SOAP 
  • Solr 
  • SPARQL 
  • SPARQL-JSON 
  • SPARQL-XML 
  • TBX 
  • TIFF 
  • TMX 
  • TSV 
  • TURTLE 
  • vCard-XML 
  • WCS 
  • WFS 
  • WMS 
  • WMS-XML 
  • XBRL 
  • XHTML 
  • XLS 
  • XLSX 
  • XML 
  • XML-APP 
  • ZIP 
En el próximo artículo empezaremos a generar informes interesantes, evaluando los distintos conjuntos de datos.

Entradas populares de este blog

Un bot con Telegram en Termux

En las últimas semanas he retomado un par de ideas que tuve hace algunos años: por un lado la idea de hacer un Bot con el que hacer operaciones a través de comandos específicos. En concreto me gustaría hacer poder realizar comandos de inversión en bolsa (de manera ficticia) por otro lado desplegar la aplicación en un móvil con Termux (emulador de Linux para Android) Así que os cuento los pasos que he hecho para realizar estas tareas. Creación de Bot con Telegram Busca el contacto @BotFather (es el bot oficial de Telegram para crear otros Bots). Pulsa en Iniciar o escribe /start para comenzar. Escribe el comando: /newbot BotFather te pedirá que le pongas un nombre visible a tu Bot. Ejemplo: Nombre: MiBotJava Luego te pedirá un username único que termine en Bot. Ejemplo: Username: MiBotJava_bot Si el nombre de usuario está disponible, te dará un mensaje de éxito. Obtén el token Después de crear el Bot, BotFather te dará un mensaje como este: Done! Congratulations on your new bot. You wil...

Spring Boot: Página inicial con Bootstrap

  Este es el segundo artículo de la serie sobre Spring Boot que comenzamos hace dos semanas, si quieres ver el primero puedes acceder pulsando aquí . En el primer artículo vimos cómo descargar nuestro proyecto configurado para nuestros intereses y listo para ser importado en nuestro IDE (nosotros usaremos Eclipse ). Lo primero que vamos a hacer es importar el proyecto: File -> Import Existing Maven Projects Seleccionamos el fichero pom.xml en la carpeta donde lo hemos descomprimido y esperamos unos segundos Cuando acabe la importación, esta es la estructura que nos aparecerá: Con Spring Boot no necesitamos configurar el servidor, ya se encarga él de facilitarnos la vida. Lo único que tenemos que hacer es arrancar la clase BootApplication.java , que se encargará de arrancar Tomcat y dejar nuestra aplicación funcionando en el puerto 8080.  Y si todo fuera bien, podríamos acceder a través de la URL:  http://localhost:8080/ Pero ahora mismo tenemos un error de conexión c...

Control Parental en Windows: navegadores

  Este año, mis hijos ya han empezado a necesitar trabajar en casa con ordenadores. De momento, solo para navegar, con un par de aplicaciones web que les indican en el colegio. Pero claro, esto ya conlleva una serie de riesgos que estamos intentando paliar: Paso 1: aplicaciones no deseadas Los ordenadores que tenemos son Windows, y para empezar lo que hemos hecho es utilizar cuentas con contraseña: una cuenta con privilegios de administrador para nosotros (los padres), y otra sin privilegios para los niños. Con esto conseguimos que no puedan instalar nada que nosotros no queramos... Sí, se lo pueden saltar, pero todavía no lo saben. Paso 2: control de páginas que visitan Esto ya es más complicado. He estado buscando, incluso programando soluciones, pero al final he descubierto Kurupira : https://www.kurupira.net/en Básicamente, monitoriza todas las URLs que pasan por cualquier navegador (por cualquiera que esté instalado), sin utilizar proxy ni nada parecido. Por defecto, tiene un ...