domingo, 1 de marzo de 2020

Ubuntu en Android 2: ahora con JAVA


En el anterior post (https://www.tecnificados.com/2020/02/ubuntu-en-android.html) os comentaba que acaba de descrubrir el emulador "Termux", y todas las cosas que en teoría se podían hacer con él.

Esta semana he estado probándolo, y en este artículo os quiero comentar todo lo que he hecho y el resultado final de las pruebas.

Mi objetivo como os comenté, era poder lanzar tareas programadas, por lo que vendría fenomenal utilizar "cron". Misteriosamente no venía instalado en la imagen que estamos utilizando, pero nada que no se arregle con los comandos: apt install cron y service cron start (arrancamos el servicio).

Una vez hecho ya tenía preparado el "ejecutor" de mis tareas.

Para probarlo bien, necesitaba lanzar una tarea periódica que actualizara datos continuamente, así se me ocurrió utilizar el IBEX 35, programe un pequeño script sh en Linux que descarga el json, y lo subía al repositorio.

Para esto también me instalé "curl" (apt install curl) y "git" (apt install git).

Después de esto, solo necesitaba programar cron con el comando crontab -e.

Añadí esta línea:


1,30 8-18 * * 1-5       /root/termuxTest/ibex35.sh

Y con esta expresión conseguí que el script se ejecutara en el minuto 1 y 30 desde las 8 hasta las 18 de lunes a viernes.

Las pruebas fueron todo un éxito:


Pensar que todos estos commits los hacía mi móvil mientras yo estaba en otra cosa.

Algunos me habéis preguntado por la batería, la verdad es que sí he notado que me gasta un poco más, pero como mucho un 10%.

Os dejo aquí el código del script que utilicé, por si os pudiera servir de algo:

cd "$(dirname "$0")"
date=$(date '+%Y-%m-%d %H:%M:%S')
echo $date
git pull
curl 'urlDondeConseguirLosDatosEnJSON'  > ibex35.json
git add .
git commit -m "Datos actualizados $date"
git push

Una vez que verifiqué esto funcionaba, me instale JAVAapt install openjdk-11-jre

También me instalé maven: apt install maven

Y después cloné mi repositorio evaluador (https://github.com/tecnificados/evaluador), me generé el jar y con este pequeño script:


rm -f datosgobes.csv
wget http://ondemand2.redes.ondemand.flumotion.com/redes/ondemand2/Datosabiertos/datosgobes.csv
java -jar evaluador.jar

Ya consigo ejecutar mi evaluador de Portales de Datos Abiertos desde el móvil. Podéis verlo en este vídeo:


Como conclusión final: puedo ahorrarme el servidor que tenía pensando contratar. Para tareas que no requieren mucha CPU, mi móvil tiene la potencia necesaria para realizar este tipo de tareas.

martes, 18 de febrero de 2020

Ubuntu en Android


Llevaba unos cuantos días dándole vueltas para contratar un servidor on line. Lo necesito para lanzar procesos puntuales y de manera periódica. No necesito mucha CPU ni RAM, y aunque no lo necesito 24 horas encendido, no he encontrado ningún servicio que tenga estas características y que sea económico.

Pero pensando y pensando, se me ocurrió la idea de cargar los procesos en mi móvil (Android), y lanzarlos desde allí. Pero Android no viene con JAVA...

Me puse a buscar, y encontré un programa en la tienda de Google llamado "Termux" (https://play.google.com/store/apps/details?id=com.termux), que es un emulador de la consola de Linux.

Cuando leí la palabra "emulador" se me encendieron los ojos, y empecé a pensar, pues si es un emulador podré instalar JAVA (si, si se puede), y luego dije, si me instalo GIT y MAVEN no me para nadie (si, también se puede), después fui más allá y se me ocurrió instalar Ubuntu, porque claro, si lo tengo, en mi móvil habría una potencia  muy interesante. Pues sí, amigos también es posible.

Y ahora os voy a contar cómo hacerlo:

  1. Nos instalamos Termux como si fuera una aplicación más desde la tienda de Google (enlace de más arriba).
  2. Utilizando el gestor de paquetes de Termux nos instalamos "wget". Escribimos el comando: pkg install wget -y
  3. Ahora nos instalamos proot, para tener disponibles unas cuantas funcionalidades que necesitaremos más adelante. Comando: pkg install proot -y
  4. Ahora vamos a crear un directorio donde descargar Ubuntu: Comando: mkdir ubuntu
  5. Accedemos al directorio que acabamos de crear: cd ubuntu
  6. Ahora nos descargamos un script para instalar la versión de Ubuntu más reciente (se encuentra en el repositorio de Neo-Oli: https://github.com/Neo-Oli/termux-ubuntuComandowget https://raw.githubusercontent.com/Neo-Oli/termux-ubuntu/master/ubuntu.sh
  7. Ahora descargamos la imagen de Ubuntu a traves del script con Bash. Comandobash ./ubuntu.sh
  8. Y para terminar ejecutamos Ubuntu con el comando: bash ./start-ubuntu.sh
Y ya hemos acabado, todo esto solo hay que hacerlo una vez. En el futuro solo tendremos que iniciar Termux y ejecutar los pasos 5 y 8.



En la imagen podéis ver que la versión de Ubuntu que tengo es la 19.04 (Disco Dingo)

Próximamente probaré a lanzar un proceso "complejo" que requiera funcionalidades de Ubuntu y JAVA.

Os mantendré informados.



domingo, 19 de enero de 2020

Algoritmia II: algoritmos voraces


Los algoritmos voraces son muy fáciles de entender y de implementar, por lo que se usan muy a menudo en programación.

Imaginaros un problema como este: en la mesa hay diez fragmentos de tarta de diferente grosor y peso, y un comensal quiere elegir los dos trozos que sean más grandes.

Al utilizar un algoritmo voraz, primero seleccionará el elemento de mayor peso y grosor, una vez seleccionado ya no puede volver a elegirlo, porque el algoritmo se lo ha "comido", de ahí su nombre.

Para solucionar el problema anterior mediante un algoritmo voraz podríamos realizar los siguientes pasos:

  1. recorremos los diez fragmentos de tarta buscando el mas grande
  2. escogemos el más grande
  3. recorremos los nueve fragmentos restantes buscando el más grande
  4. escogemos el más grande

Seguro que se os ocurren un par de formas de optimizarlo (como ordenar previamente los trozos).

Ahora vamos con un problema un poco más complejo:

En Tecnificados hemos organizado un festival de cine de terror. Durante 24 horas se proyectarán N películas diferentes en las 10 salas disponibles de cine de Metro City (cada película solo se proyectará una vez a lo largo del festival). En la programación aparecen todas las películas que se van a proyectar, junto con el título, duración de la película y otros datos, se indica la sala de proyección y la hora de comienzo.

Una persona desea planificar su maratón de cine, teniendo en cuenta que el único objetivo es ver el máximo número posible de películas. 

Debemos realizar un algoritmo voraz para realizar ese maratón.

La solución en nuestro repositorio: https://github.com/tecnificados/algoritmos/tree/master/voraz

(Imagen Principal generada con https://es.cooltext.com/)

miércoles, 8 de enero de 2020

Algoritmia: presentación

Para comenzar el año voy a iniciar una serie de artículos relacionados con los diferentes tipos de algoritmos.

Mi idea es comentar en cada artículo un diferente tipo de algoritmo (el primero será voraz), y mostrar una solución a un problema codificado en JAVA.

Se admiten sugerencias.

Imagen de cabecera obtenida de: https://es.wikipedia.org/wiki/Archivo:Algoritmo_de_Anillo.png

domingo, 15 de diciembre de 2019

31 Ayuntamientos con Portales de Datos Abiertos

(Imagen generada con https://es.cooltext.com/)

Hoy quiero hacer un pequeño chequeo del estado de los Portales de Datos Abiertos Municipales, ahora que estamos a punto de terminar el 2019.

Aprovechando que el evaluador está "terminado", he generado un subinforme: solo con los Ayuntamientos que tienen Portales de Datos Abiertos (31).

Vamos a ordenar por calidad de los datos, empezaremos con cuatro estrellas. Solo tenemos a 17 Ayuntamientos con esta puntuación, ordenamos por el número de conjuntos de datos con cuatro estrellas ordenados de mayor a menor:
  1. Gijón (119)
  2. Cáceres (116)
  3. Santander (82)
  4. Madrid (70)
  5. Santa Cruz de Tenerife (67)
  6. Sant Feliu de Llobregat (37)
  7. Las Palmas de Gran Canaria (27)
  8. Barcelona (21)
  9. Cartagena (20)
  10. Badia del Vallès (11)
  11. Alcobendas (8)
  12. Rivas-Vaciamadrid (8)
  13. Lorca (4)
  14. Valencia (4)
  15. Zaragoza (3)
  16. Bilbao (2)
  17. Donostia/San Sebastián (1)
Ahora vamos a ordenar por aquellos conjuntos de datos con tres estrellas. Aquí ya tenemos a bastantes más, así que nos vamos quedar con un Top 20. Ordenamos por el número de conjuntos de datos con tres estrellas ordenados de mayor a menor:
  1. Gijón (630)
  2. Arganda del Rey (601)
  3. Málaga (596)
  4. Barcelona (382)
  5. Madrid (258)
  6. Alcobendas (191)
  7. Lorca (179)
  8. Bilbao (176)
  9. Torrent (174)
  10. Valencia (106)
  11. Vitoria-Gasteiz (80)
  12. Donostia/San Sebastián (64)
  13. Las Palmas de Gran Canaria (63)
  14. Zaragoza (62)
  15. Rivas-Vaciamadrid (48)
  16. Villanueva de la Serena (44)
  17. Santa Cruz de Tenerife (21)
  18. Alcoy (20)
  19. San Sebastián de los Reyes (15)
  20. Sant Feliu de Llobregat (8)
Por último, ordenamos por cantidad de conjuntos de datos (algo poco relevante, no se trata de cuantos más mejor). También nos quedamos con el top 20. Este es el resultado:
  1. Málaga (875)
  2. Gijón (781)
  3. Arganda del Rey (625)
  4. Barcelona (462)
  5. Madrid (436)
  6. Alcobendas (199)
  7. Bilbao (190)
  8. Lorca (188)
  9. Torrent (175)
  10. Vitoria (Gasteiz (150)
  11. Zaragoza (136)
  12. Cáceres (116)
  13. Valencia (115)
  14. Las Palmas de Gran Canaria (90)
  15. Santa Cruz de Tenerife (90)
  16. Santander (88)
  17. Donostia/San Sebastián (65)
  18. Rivas Vaciamadrid (57)
  19. San Sebastián de los Reyes (51)
  20. Sant Feliu de Llobregat (47)
Los resultados me parecen bastante sorprendentes.

Por supuesto, podéis acceder a los datos que he utilizado en el repositorio de los últimos artículos:
https://github.com/tecnificados/evaluador/tree/master/informes

Recordar que el origen de los datos es el catálogo de datos.gob.es, y todo el proceso de generación de datos está en el repositorio anterior: https://github.com/tecnificados/evaluador.

lunes, 9 de diciembre de 2019

Evaluador de Portales de Datos Abiertos - Parte VI (final)


Y llegamos a la última parte de esta serie de artículos relacionados con el Evaluador de Portales de Datos Abiertos.

Ya están en el repositorio los últimos cambios que permiten generar el informe con la puntuación de los distintos conjuntos de datos.

He llegado sólo a cuatro estrellas, porque como ya os comenté, para la quinta estrella necesitaría consumir los formatos semánticos (4 estrellas) y examinar si hay Linked Data.

También hay que tener en cuenta que no he chequeado todas las URLs, para así verificar si están disponibles, y si de verdad devuelven el formato que se indica.

Todas estas mejoras las quiero ir implementando poco a poco en próximas entregas.

También quiero añadir un par de informes nuevos y una serie de puntuaciones en plan Top Ten de diversas categorías. 

Además quiero automatizar todo el proceso, Tweet incluido.

Aquí tenéis los informes en diferentes formatos: 


En concreto el informe de la puntuación en CSV está aquí.

Y el código en el mismo repositorio, ahí podéis ver cómo he asignado las estrellas, aunque está explicado en el anterior artículo.

Cualquier duda, o pregunta, ya sabéis dónde estoy.

domingo, 24 de noviembre de 2019

Evaluador de Portales de Datos Abiertos - Parte V

                                 Imagen obtenida de: https://5stardata.info/es/

Hoy vamos a hablar de la puntuación de los diferentes formatos. Esta puntuación se estableció por Tim Berners Lee hace unos años. Si lo resumimos rápidamente sería así:
  1. Cualquier formato con licencia abierta: 1 estrella. Es decir, cualquier conjunto de datos que contenga al menos un fichero y esté alojado en un portal de Datos Abiertos, tendrá al menos esta puntuación. Ejemplo: un PDF.
  2. Cualquier formato reutilizable: 2 estrellas. Si puedes descargar un fichero del Portal de Datos Abierto y puedes modificarlo, su conjunto de datos tendrá al menos 2 estrellas. Ejemplo: un fichero Excel.
  3. Formato abierto: 3 estrellas. Si ademas de editarlo, lo puedes hacer sin software propietario, este conjunto de datos tendrá 3 estrellas. Un fichero CSV.
  4. Utilización de URIs: 4 estrellas. Si en el formato se están utilizando URIs (semánticos). Ejemplo: RDF, JSON-LD, Turtle,...
  5. Utilización de Linked Data: 5 estrellas. Ademas de utilizar URIs, utilizar URIs externas a tu fuente para generar Linked Data.
Y ahora vamos a puntuar todos los formatos que aparecen en datos.gob.es, de esta forma podremos dar un paso más en el evaluador.

Los voy a escribir clasificándolos por el número de estrellas que he asignado:

Formatos con 1 estrella:


PDF
PNG
JPG

Formatos con 2 estrellas:


Atom
DBF
DGN
DjVu
DOC
DOCX
DWG
DXF
ECW
ELP
ePub
HTML
MDB
OCTET-TREAM
SHP
SOAP
TIFF
WFS
WMS
WMS-XML
XHTML
XLS
XLSX

Formatos con 3 estrellas:

ASCII
Calendar
CSV
CSW
GDB
GeoJSON
GeoRSS
GML
GPX
JSON
KML
KMZ
LAS
MARC
ODS
ODT
PC-Axis
plain
RSS
RTF
SCORM
TBX
TMX
TSV
vCard-XML
WCS
XBRL
XML

Formatos con 4 estrellas:

JSON-LD
N3
TURTLE
RDF-N3
RDF-Turtle
RDF-XML

Formatos con 5 estrellas:

De momento no voy a tratar con la quinta estrella, tendría que cargar la información y verificar que se usa Linked Data.

Formatos sin estrellas: 

Los he clasificado así, porque no son formatos como tales, la mayoría son clasificaciones inexactas, y otros como API o SOLR, son servicios que complementan el Portal de Datos Abiertos.

API
GZIP
Solr
SPARQL
SPARQL-JSON
SPARQL-XML
XML-APP

Y después de esta clasificación, solo nos falta añadir la programación y generar los informes. Pero esto lo haremos en el próximo artículo.

¿Estáis de acuerdo con esta clasificación?

domingo, 17 de noviembre de 2019

Evaluador de Portales de Datos Abiertos - Parte IV



Y seguimos con la serie del evaluador, lo primero que quiero es dar las gracias a tod@s los que han contactado conmigo por este proyecto. Vamos a seguir poco para poder generar un evaluador gracias los datos que se publican en datos.gob.es

Esta semana he generado el primer informe (aunque todavía no es el definitivo), he generado una tabla con cada organismo publicador, el número de conjuntos de datos que contiene y todos los formatos que utiliza.

El informe está en formato Markdown (como ya os comenté Github lo interpreta automáticamente) y en formato CSV, así podemos trastear con el fácilmente.

Aquí tenéis sus URLs:
Toda la lógica de generación del informe está en la clase "InformeOrganismoFormatos.java", todo sigue en el repositorio que he estado utilizando en las últimas entradas (aquí).

Lo único que hago es iterar por la estructura de datos que definimos la semana pasada e ir construyendo la salida, para al final escribirla.

Los resultados son bastante curiosos, es increíble pero hay portales que solo tienen PDFs...

En el próximo artículo, puntuaremos los diferentes formatos para poder evaluar todos los portales.

domingo, 10 de noviembre de 2019

Evaluador de Portales de Datos Abiertos - Parte III



En esta tercera entrega ya hemos empezado con la programación, el objetivo de hoy es conseguir cargar toda la información del fichero de datos.gob.es para poder evaluarla.

Si miráis el repositorio del Evaluador (https://github.com/tecnificados/evaluador) hay unas cuantas clases nuevas:
  1. OrganoPublicador: es un bean que contiene el nombre del organismo y la lista de conjuntos de datos.
  2. ConjuntoDatos: también un bean que contiene su título y la lista de formatos que tienen sus recursos.
  3. Evaluador: en esta clase está toda la lógica que traduce el contenido del fichero a los dos beans anteriores.
La función "evaluaLinea" me ha llevado más tiempo del que yo pensaba, debido a que hay celdas que son de tipo texto y tienen comas dentro. Como hago un "split" por comas, tengo que volver a juntar las celdas que tienen este comportamiento.

Estos son todos los formatos que me he encontrado, que son bastantes más de los que yo pensaba:
  • API 
  • ASCII 
  • Atom 
  • Calendar 
  • CSV 
  • CSW 
  • DBF 
  • DGN 
  • DjVu 
  • DOC 
  • DOCX 
  • DWG 
  • DXF 
  • ECW 
  • ELP 
  • ePub 
  • GDB 
  • GeoJSON 
  • GeoRSS 
  • GML 
  • GPX 
  • GZIP 
  • HTML 
  • JPG 
  • JSON 
  • JSON-LD 
  • KML 
  • KMZ 
  • LAS
  • MARC 
  • MDB 
  • N3 
  • OCTET-STREAM 
  • ODS 
  • ODT 
  • PC-Axis 
  • PDF 
  • plain 
  • PNG 
  • RDF-N3 
  • RDF-Turtle 
  • RDF-XML 
  • RSS 
  • RTF 
  • SCORM 
  • SHP 
  • SOAP 
  • Solr 
  • SPARQL 
  • SPARQL-JSON 
  • SPARQL-XML 
  • TBX 
  • TIFF 
  • TMX 
  • TSV 
  • TURTLE 
  • vCard-XML 
  • WCS 
  • WFS 
  • WMS 
  • WMS-XML 
  • XBRL 
  • XHTML 
  • XLS 
  • XLSX 
  • XML 
  • XML-APP 
  • ZIP 
En el próximo artículo empezaremos a generar informes interesantes, evaluando los distintos conjuntos de datos.

domingo, 3 de noviembre de 2019

Evaluador de Portales de Datos Abiertos - Parte II


Hoy vamos a continuar con el análisis para nuestro evaluador de Portales de Datos Abiertos.

Lo primero que necesitamos conocer son las direcciones de los distintos portales. Para esto nos vamos a ir a la URL de nuestro Portal Nacional de Datos Abiertos: https://datos.gob.es/es/catalogo, allí vamos a localizar el icono para descargar en formato CSV todos los recursos de todos los portales. Os lo señalo en rojo en la siguiente imagen:
Ahora debemos descargarlo en nuestro PC. Ahora mismo ocupa casi 58 megas, y contiene 24.951 líneas.

Para abrirlo y trastear con el fichero, os recomiendo utilizar OpenOffice, su programa de hojas de cálculo (OpenOffice Calc) es la mejor opción para trabajar con ficheros CSVs enormes.

El fichero está compuesto por diferentes columnas, para conseguir hacer nuestro evaluador, necesitamos las siguientes:

  • TÍTULO: nombre del conjunto de datos, soporta multidioma. Ejemplo: 
    [ca]Port de Barcelona - Arees Geogràfiques[en]Port of Barcelona -Geograhic Regions[es]Puerto de Barcelona - Areas Geográficas
  • ÓRGANO PUBLICADOR: el nombre del órgano al que pertenece el portal. Ejemplo: Ayuntamiento de Alcobendas
  • DISTRIBUCIONES: contiene todos los recursos que tiene el conjunto de datos. Tiene una estructura de datos que debemos tratar, ya que contiene todas las URLs de cada recurso, y también soporta multidioma. Ejemplo: [TITLE_eu]Partzelen eta eraikin unitateen datuak[TITLE_es]Datos de parcelas y unidades constructivas[ACCESS_URL]http://api.gipuzkoairekia.eus/dataset/recurso/435e47ac-8f08-40f3-9935-e3aa09783779/descargar[MEDIA_TYPE]CSV[BYTE_SIZE]76360//[TITLE_eu]Lokalen datuak[TITLE_es]Datos de los locales[ACCESS_URL]http://api.gipuzkoairekia.eus/dataset/recurso/1ddf5167-6159-4f7a-b43f-c6e7e92225ba/descargar[MEDIA_TYPE]CSV[BYTE_SIZE]3428844

La idea final es consumir las URLs de cada recurso para verificar que está disponible, si lo está, leeremos el formato del recurso y dependiendo de cada uno de ellos puntuaremos (o profundizaremos más).

Pero en lugar de ir directamente hacia esa dirección, me voy a decantar por realizar un producto mínimo viable, evaluaré los conjuntos de datos sin consumir la URL, confiando en que estén funcionando. Debido a esto, inicialmente solo podré puntuar de 1 a 4 estrellas, ya que para puntuar con 5 debería tener acceso al contenido de la información, procesarla y verificar que se están utilizando URIs externas (linked data).

Nuestro siguiente paso es generar un programa de consola que lea este fichero línea a línea, para evaluar todos los recursos y asignar la puntuación a su respectivo portal.

Para hacer esto voy a copiar el repositorio "lector" que creamos hace unas semanas (https://github.com/tecnificados/lector), y en un nuevo repositorio "evaluador",  voy a renombrarlo y a lanzarlo contra el fichero que he descargado de datos.gob.es para ver si cuenta correctamente el número de líneas y las procesa correctamente. Este es el primer commit del repositorio "evaluador" (https://github.com/tecnificados/evaluador).

Y por hoy lo dejo aquí, en el próximo artículo empezaremos la programación.

Continuará...

lunes, 14 de octubre de 2019

Evaluador de Portales de Datos Abiertos - Parte I

Durante los últimos artículos, he ido sentando la bases para llegar a la creación de una pequeña aplicación de consola que nos sirva para evaluar los distintos portales de Datos Abiertos que están censados en nuestro Portal Nacional de Datos Abiertos: https://datos.gob.es/es/catalogo

Mi idea es leer todas los recursos (ficheros y URLs) que existen todos los portales de Datos Abiertos, agrupándolos por cada por cada conjunto de datos.  Después evaluaremos las siguientes características:
  1. ¿Los recursos están accesibles?
  2. ¿Qué tipo de ficheros contiene (CSV, PDF, HTML,...)?
  3. ¿Utiliza algún formato basado en URIs (RDF, TTL, N3, JSONLD,...)?
  4. ¿Las URIs enlazan con URIs externas a su portal (Linked Data)?
Dependiendo de estas preguntas podremos puntuar cada conjunto de datos basándonos en el siguiente gráfico:




Y para terminar generaremos un informe en formato Markdown con todos los portales de datos y su puntuación.

Todo esto lo haremos en una aplicación de consola con JAVA y la base de nuestra aplicación será la la que desarrollamos la semana pasada (https://github.com/tecnificados/lector).

Y lo iremos desarrollando paso a paso a partir de la semana que viene.

Continuara...

domingo, 6 de octubre de 2019

Procesando ficheros en JAVA



Con los últimos artículos que estoy escribiendo estoy sentando las bases de dos proyectos en JAVA.

El primero es más pequeño y se basa en una aplicación de consola, y de eso vamos a hablar hoy.

Voy a ir creando una pequeña aplicación de consola que lee todas las líneas de un fichero de texto.

Es bastante simple, pero lo que quiero hacer es crear un proyecto con todas las necesidades que puede tener una aplicación de consola:
  • Librerías externas
  • Sistema de log
  • Fichero externo de configuración
  • Multidioma
  • Generación de un ejecutable (jar) para su posterior uso
Todo el código y los pasos están en el siguiente repositorio: https://github.com/tecnificados/lector

El entorno de trabajo con el que estoy trabajando es el siguiente:
  • Sistema operativo: Windows 10
  • Openjdk version "12.0.2" 2019-07-16
  • IDE: Eclipse 2019-06 (4.12.0)
El primer paso es crear con Maven un proyecto "quickstart" dentro de Eclipse (File -> New -> Maven Project) :



Con esto ya tendremos nuestra estructura lista. Y éste va ser el segundo commit del proyecto: c04808759483432e185fae554a215e682b981af8

Por defecto Maven nos deja el compilador de JAVA con la versión 5.



Ya que estamos utilizando el Openjdk 12, vamos a subirla a esta versión añadiendo estas líneas en el fichero pom.xml:


<maven.compiler.target>1.12</maven.compiler.target>
<maven.compiler.source>1.12</maven.compiler.source>

Podéis ver el detalle del cambio en este commit: 6c483c4abc3f46c0aea1b5679605ac3db27d251a

Si hacemos un "Maven Update", nos debe aparecer la versión correcta en el proyecto.

Ahora vamos a buscar una librería que nos ayude a leer ficheros. Mi favorita es "commons-io" del proyecto Apache. La incluimos en el fichero pom.xml para que sus objetos estén disponibles. Otro commit: 5fa357852024488ab5a43080ee51c446ea7a3c1c

Ahora vamos a hacer una pequeña prueba, vamos crear un pequeño archivo "fichero.txt" que va a tener 10 líneas. Y vamos a escribir unas líneas de código para contar las líneas del fichero utilizando el objeto FileUtils de "commons-io".

El código que escribimos es el siguiente:


List<String> readedLines = new ArrayList<String>();
try {
     readedLines = FileUtils.readLines(new File("fichero.txt"),"utf-8");
     System.out.println("Lineas: "+readedLines.size());
  } catch (IOException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }

Tenemos que meter un try/catch por si el método "readLines" lanza una excepción.

Si ejecutamos este código, nos debería aparecer esta salida:

Lineas: 10


Hago un commit con todos estos cambios: 1287bbeaaf2c21021ce5432b4fd094ea0426554d

Hasta ahora no hemos hecho nada con el contenido del fichero, pero tenemos una lista en la variable readedLines donde está el contenido de cada línea.

Vamos a añadir más información al fichero de prueba, y vamos hacer que el programa nos escriba en pantalla cada una de ellas.

Sé que es muy simple, pero me sirve para demostrar que estamos leyendo el fichero.

Añadiendo estas líneas podremos ver el contenido de cada línea leída:


for (String actual:readedLines)
{
     System.out.println("\t"+actual);
}

Las podéis ver en el commit: d65b491461ba90ed8a1cdef121a1b043985fc733

El funcionamiento básico ya no va a evolucionar más.

Ahora vamos a mejorar el programa para que tenga unas características más profesionales.

Sistema de log

Voy a añadir la librería "logback", antes era más de log4j, pero como muchos sabéis ha quedado sin mantenimiento.

Añadimos la librería al fichero "pom.xml", y en la aplicación nos creamos una variable estática con esta línea:


private static final Logger log = LoggerFactory.getLogger(App.class);

Ya tenemos el log a nuestra disposición.

A partir de ahora todo lo que sale por pantalla, en lugar de usar "system.out" lo hago con el sistema de log que acabamos de añadir.

En la excepción en lugar de usar "log.info" utilizo "log.error".

Todos los cambios del sistema de log están disponibles en este commit: 94d2d8ee44347ede47e67cef3a92ccedd48e9583

Fichero de configuración externo

Ahora mismo se está leyendo el fichero "fichero.txt" y el nombre del fichero está a nivel de código, una práctica que no es muy recomendable.

Vamos a crear un fichero "conf.properties" donde se va a configurar este parámetro.

A continuación voy a crear un método "configuration()" que será el que realice la lógica de leer el fichero de configuración y asignar su valor.

En este commit están todos estos cambios: e33d60eea78b23eca3e07229e856a5fd5d09a6c7

Multidioma

En aplicaciones de consola, es raro que nos soliciten multidioma, pero todo es posible.

Aquí eclipse nos echa un cable, con su asistente en botón derecho -> source -> externalize strings.

Este asistente nos crea una clase "Message" para realizar la sustitución dinámica de las cadenas que seleccionemos.

Antes de lanzar el asistente he generado unas cuantas constantes, para evitar problemas.

He creado tres ficheros con traducciones:
  • messages.properties: es la configuración por defecto (inglés)
  • messages_en_EN.properties: inglés de Inglaterra
  • messages_es_ES.properties: español de España

Voy a dejar fijado este último con la siguiente línea:


Locale.setDefault(new Locale("es_ES"));


Si fijáramos otro como "fr_FR", al no existir, cargaría el contenido del messages.properties.

El un con todos los cambios que acabamos de generar es: a6033bf9c31cbacae035ae69432b85919714c88b

Antes de continuar voy a refactorizar un poco, no me gusta mucho la estructura que me ha generado el asistente.

Voy a generar una clase Constant con todas las constantes, y un paquete Util con las clases y los ficheros nuevos.



Todos los cambios los tenemos en este commit: 80aa109d65ddfadda75e20228e84ce585afb2ed6

Ejecutable Jar Completo

Y para terminar vamos a decirle a Maven que cuando genere un empaquetado lo haga con todas las librerías que utiliza, y especificarle cuál es la clase principal.

Todo esto lo conseguimos gracias al plugin Shade de Maven, sólo hay que retocar unas cuantas líneas en el pom.xml, y añadir un par de plugins. Podéis ver en detalle estos cambios aquí: 86369ce3d028b405eed691a556a5e7fcf90148ef

Después de esto si lanzamos un mvn package tendremos un jar con todas las librerías que necesita, y está listo para ser invocado con el comando: "java -jar lector.jar"

Espero que os sea de utilidad, ha sido una entrada muy larga, pero he conseguido hacer todo lo que quería en sólo 11 commits.