Cuando nos enteramos de estas cosas, nos gustaría saber si se han filtrado nuestros datos, pero para eso hay que tener los datos (algo que a veces es difícil de encontrar) y después tener las herramientas para abrir esos ficheros.
En los dos casos que he comentado, los ficheros eran texto plano, en formato CSV.
El primero ocupaba 800 MB y el segundo 5,36 GB
Yo no he conseguido abrir ninguno con las herramientas habituales.
Así que he escrito un pequeño programa que lee línea a línea cualquier fichero, busca en cada línea la cadena que nos interese, y las coincidencias que encuentra las escribe en otro fichero.
Podéis acceder a ese desarrollo desde aquí: https://github.com/tecnificados/bigFileOpps
Espero que os sea útil.
Nos vemos pronto.
Muchas gracias a Hugo y a Valandil por su ayuda consiguiendo los datos.