Fundado para exponer las irregularidades y desencadenar un cambio positivo, el consorcio internacional de periodistas de investigación (ICIJ) reúne a cientos de reporteros y organizaciones de medios de investigación en todo el mundo para desenredar las redes complejas de corrupción.
Las herramientas de investigación de ICIJ y los periodistas expertos trabajan a través de las fronteras para permitir a las organizaciones de noticias combatir una avalancha de información errónea y romper algunas de las historias más grandes del mundo. Ya sea que se asocie para descubrir información oculta sobre los sistemas financieros de la sombra que sirven a los ricos, las empresas que se benefician al destruir los ecosistemas o exponiendo otros abusos, ICIJ se mantiene fiel a su misión de fomentar un cambio positivo al garantizar que las personas sepan lo que está sucediendo.
La tecnología desempeña un papel fundamental en el apoyo al equipo consumado de la organización de casi 300 periodistas mientras se asocian con organizaciones de medios. “Uno de los principales desafíos que enfrenta cualquier periodista es examinar cantidades masivas de información para descubrir la verdad y exponer mentiras”, dice Pierre Romera Zhang, director de tecnología de ICIJ. “Incluso una historia que al principio parece local puede llegar a través de las fronteras e involucrar a miles de interacciones complejas. Ahí es donde Neo4J es crítico”.
ICIJ se ha hecho un nombre al ayudar a la superficie de la verdad. La organización ha recibido muchos de los premios más prestigiosos del periodismo, incluido un premio Pulitzer por informes explicativos de los Papeles de Panamá, que reveló una gran corrupción financiera a través de compañías en alta mar, utilizando una base de datos de gráficos Neo4J para identificar patrones ocultos y hacer avances en los datos.
“La mayoría de los periodistas no están capacitados para ser científicos de datos y las organizaciones de noticias no están configuradas para gestionar los torobos de información desconectada, pero eso es exactamente lo que se necesita hoy para encontrar y contar historias vitales originales”, dice Romera Zhang.
Transformando el periodismo con la tecnología
DataShare, una plataforma de análisis de documentos segura basada en herramientas de código abierto, incluido Neo4J, está en el corazón de las principales investigaciones globales de ICIJ. Ahora depende de la tecnología de base de datos de gráficos NEO4J, DataShare está optimizado para escalar horizontalmente y rápidamente acceder a datos de múltiples sistemas para descubrir relaciones previamente difíciles o incluso imposibles de ver con tecnologías comunes como bases de datos relacionales.
La solución reúne una década de experiencia de investigación de ICIJ para que los periodistas puedan extraer información de conjuntos de datos masivos. “La plataforma nivela el campo de juego para los periodistas, que ahora tienen acceso a potentes datos y herramientas de análisis que se utilizan tradicionalmente en otras industrias”, explica Romera Zhang.
Una sola investigación puede involucrar decenas de millones de documentos, lo que hace que sea prácticamente imposible que los periodistas hagan conexiones manualmente. Antes de DataShare, los periodistas podían pasar meses, o a veces años, examinando las complicadas redes de información para conectar a las personas y entidades en todos los países.
El trabajo de ICIJ en los Papeles de Panamá implicó superar 2.9 terabytes de información en 11.9 millones de registros. “Con la tecnología gráfica Neo4J, hicimos conexiones entre actividades y entidades que de otro modo se habrían perdido”, dice Romera Zhang. “Fue entonces cuando tuvimos nuestra idea para que DataShare brinde a los periodistas una herramienta poderosa para exponer la corrupción”.

Al colaborar con otros periodistas en los Papeles de Panamá, el equipo de ICIJ mapeó con éxito las conexiones entre personas, gobiernos y corporaciones extrayendo metadatos de documentos utilizando Apache Solr y Tika y exportando los datos a una base de datos de gráficos NEO4J.
Como base para DataShare, Neo4J hace que atraviese las conexiones entre los nodos rápidamente al incrustar las relaciones en la estructura de la base de datos. Con las bases de datos relacionales tradicionales, los periodistas y los analistas de datos tienen que inferir conexiones de datos utilizando claves extranjeras ineficientes.

“Las bases de datos relacionales no pueden analizar de manera eficiente las relaciones dentro de los conjuntos de datos grandes e interconectados que encuentran los periodistas”, dice Romera Zhang. “Con Neo4J, crear un mapa de relaciones, la ontología, es fácil, independientemente del tema. El gráfico ofrece a los periodistas una visión clara de la realidad, para que puedan verificar la información y mantener las investigaciones en el camino”.

DataShare se convirtió en la plataforma interna de ICIJ para analizar grandes volúmenes de datos en 2019, comenzando con las filtraciones de Luanda. Ese informe sacó a la luz cómo décadas de codicia sin control dejó un país africano rico en aceite y diamantes empobrecidos. Los reporteros utilizaron DataShare para analizar mensajes de texto, correos electrónicos, PDF y otros registros para reconstruir los plazos de reuniones y conversaciones significativas entre figuras clave para revelar la verdad detrás de “qué sabían y cuándo lo sabían”.

DataShare es una de las pocas herramientas de datos en el mercado que puede ingerir archivos .pst grandes y complejos que representan buzones completos de Microsoft Outlook, que a veces alcanzan varios gigabytes, y instantáneamente producen resultados de búsqueda.
Concentrándose en 'pistolas de fumar'
ICIJ continúa utilizando DataShare con tecnología gráfica Neo4J para cortar la información errónea y la verdad de la superficie donde se necesita desesperadamente.
Las investigaciones de la organización sobre arte y antigüedades obtenidas ilegalmente llevaron a acuerdos con destacados museos y coleccionistas para repatriar estatuas y esculturas antiguas a Nepal, Camboya y Tailandia. “Deforestation Inc.” de ICIJ La investigación iluminó la destrucción forestal y las violaciones de los derechos humanos que tienen lugar bajo la apariencia de sostenibilidad certificada.
La investigación de “archivos de implantes” del consorcio reveló cómo las autoridades de salud en todo el mundo no pudieron proteger a millones de pacientes de dispositivos médicos mal evaluados. Desde entonces, más de 2.6 millones de personas han aprovechado la base de datos de fugas offshore de ICIJ para explorar las conexiones entre los líderes mundiales, los políticos, los miembros de su familia y otros asociados.
En 2020, ICIJ trabajó con más de 100 socios de medios para publicar los archivos FinCen. El trabajo destacó cómo los bancos globales con sede en Estados Unidos iniciaron transacciones para mover más de $ 2 billones y evadir las reglas de lavado de dinero. Los legisladores estadounidenses tomaron medidas y aprobaron la Ley de Transparencia Corporativa para detener el movimiento del dinero sucio y hacer que los propietarios de la compañía sean más responsables.
Expandir el acceso, opciones para informes contundentes
Romera Zhang y su equipo están implementando DataShare como un servicio para que los socios de los medios puedan indexar grandes volúmenes de archivos sin exigir recursos informáticos internos. El equipo también está desarrollando un entorno de Sandbox para permitir a los periodistas ejecutar sus algoritmos de IA preferidos en conjuntos de datos directamente dentro de la plataforma DataShare, lo que hace que el análisis sea aún más accesible.

ICIJ creó un nuevo complemento Neo4J para DataShare para que la herramienta sea aún más fácil de usar para los periodistas. Diseñado con las investigaciones de ICIJ en mente, las optimizaciones complementarias que crean bases de datos de gráficos para que los periodistas no técnicos no necesiten dominar el lenguaje de consulta de gráficos de Cypher, Neo4J. El complemento permite a los usuarios acceder a estadísticas de gráficos y explorar conexiones entre nodos utilizando la herramienta de visualización de Neo4J, Neo4J Bloom.
“Neo4J es la base de datos gráficas más importante en el mercado, y confiamos en la empresa y su tecnología”, dice Romera Zhang. “Esa es una gran ventaja ya que democratizamos el acceso y el análisis de datos para que los periodistas de investigación puedan contar más historias que cambien el mundo”.
Ponerse en contacto
¿Curioso sobre qué ideas podría desbloquear para su negocio con soluciones con alimentación de gráficos? Hablemos, comuníquese y nos pondremos en contacto.