domingo, 10 de noviembre de 2019

Evaluador de Portales de Datos Abiertos - Parte III



En esta tercera entrega ya hemos empezado con la programación, el objetivo de hoy es conseguir cargar toda la información del fichero de datos.gob.es para poder evaluarla.

Si miráis el repositorio del Evaluador (https://github.com/tecnificados/evaluador) hay unas cuantas clases nuevas:
  1. OrganoPublicador: es un bean que contiene el nombre del organismo y la lista de conjuntos de datos.
  2. ConjuntoDatos: también un bean que contiene su título y la lista de formatos que tienen sus recursos.
  3. Evaluador: en esta clase está toda la lógica que traduce el contenido del fichero a los dos beans anteriores.
La función "evaluaLinea" me ha llevado más tiempo del que yo pensaba, debido a que hay celdas que son de tipo texto y tienen comas dentro. Como hago un "split" por comas, tengo que volver a juntar las celdas que tienen este comportamiento.

Estos son todos los formatos que me he encontrado, que son bastantes más de los que yo pensaba:
  • API 
  • ASCII 
  • Atom 
  • Calendar 
  • CSV 
  • CSW 
  • DBF 
  • DGN 
  • DjVu 
  • DOC 
  • DOCX 
  • DWG 
  • DXF 
  • ECW 
  • ELP 
  • ePub 
  • GDB 
  • GeoJSON 
  • GeoRSS 
  • GML 
  • GPX 
  • GZIP 
  • HTML 
  • JPG 
  • JSON 
  • JSON-LD 
  • KML 
  • KMZ 
  • LAS
  • MARC 
  • MDB 
  • N3 
  • OCTET-STREAM 
  • ODS 
  • ODT 
  • PC-Axis 
  • PDF 
  • plain 
  • PNG 
  • RDF-N3 
  • RDF-Turtle 
  • RDF-XML 
  • RSS 
  • RTF 
  • SCORM 
  • SHP 
  • SOAP 
  • Solr 
  • SPARQL 
  • SPARQL-JSON 
  • SPARQL-XML 
  • TBX 
  • TIFF 
  • TMX 
  • TSV 
  • TURTLE 
  • vCard-XML 
  • WCS 
  • WFS 
  • WMS 
  • WMS-XML 
  • XBRL 
  • XHTML 
  • XLS 
  • XLSX 
  • XML 
  • XML-APP 
  • ZIP 
En el próximo artículo empezaremos a generar informes interesantes, evaluando los distintos conjuntos de datos.