La Fibre

Télécom => Réseau => reseau Attaques informatiques => Discussion démarrée par: Marco POLO le 07 avril 2016 à 00:10:54

Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: Marco POLO le 07 avril 2016 à 00:10:54
Selon les déclarations de l'un des dirigeants de la société Mossack Fonseca, l'origine des documents fuités dans le cadre de l'affaire Panama Papers pourrait être une attaque informatique ayant visé l'un des serveurs mail de la société.

Dans l'affaire Panama Leak, le lanceur d'alerte pour l'instant inconnu à l'origine de la fuite de données pourrait être un pirate informatique. C'est en tout cas la thèse avancée par l'un des co-fondateur, Ramon Fonseca, qui a expliqué sur la chaine d'information panaméenne Channel 2 que les documents étaient authentiques et que leur fuite résultait d'une attaque informatique ayant visé la société.

Le site d'information El Espanol cite également un communiqué de la société Mossack Fonseca faisant état d'une attaque informatique ayant visé ses serveurs mails. La société précise avoir averti ses clients de cette brèche de sécurité et a également initié un audit de sécurité afin de combler cette faille dans leurs systèmes. L'audit sera effectué par des consultants en sécurité externe.

Le lanceur d'alerte pourrait donc être un pirate informatique si l'on se fie aux explications données par la société Mossack Fonseca et ses représentants. Au total, le volume de données transmis aux journalistes représente un peu plus de 11 millions de documents, ou 2,5 To de données. Une voie d'eau plus qu'une fuite, mais les précédentes affaires The Hacking Team et Finfisher, où une attaque informatique a suffi à exposer l'ensemble des données de ces entreprises controversées, rappelle que le scenario n'a rien de fantaisiste.

L'affaire Panama Papers cause néanmoins beaucoup plus de vagues : plusieurs chefs d’état et proches de chefs d’état sont ainsi impliqués dans ce scandale, mêlant blanchiment d'argent et évasion fiscale. Mossack Fonseca clame sur son site sa bonne foi, mais les publications qui sont parvenues à mettre la main sur ces documents multiplient depuis dimanche soir les révélations tirées de ces informations. Si la piste du piratage du serveur mail est confirmée, le RSSI de la société a du souci à se faire.

Par La rédaction de ZDNet.fr (http://www.zdnet.fr/actualites/panama-papers-un-piratage-a-l-origine-de-la-fuite-39835106.htm) | Mardi 05 Avril 2016 (https://lafibre.info/images/smileys/@GregLand/by.gif)
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: Marco POLO le 07 avril 2016 à 00:29:12
Big Data/Panama Papers: déduplication et OCR pour donner du sens à l'énorme masse de données

Indexer et analyser 2,6 To de données non structurées n'a pas été une mince affaire. C'était pourtant le sous-jacent technique des révélations du Panama Papers. Le point sur les techniques utilisées.

Mise à jour le 05/04/2016 à 17h30: La liste complète des entreprises et des personnes qui sont recensées dans les données seront publiées « début mai » selon l'ICIJ, et depuis la fin de la semaine dernière un grand nombre de noms et d'informations ont déjà été révélés. Reste que 11,5 millions de fichiers ne se passent pas au crible si facilement. Comment ont donc été déjà analysé les données rendues publiques, et ce dans un temps relativement restreint ?

(https://lafibre.info/images/presse/201604_panama-papers.jpg)
Les 2,6 To de données des Panama Papers contiennent les transactions enregistrées pendant 40 ans par l'entreprise Mossack Fonseca à propos de 210 000 sociétés. Un vrai projet de Big Data en soit. (Source : ICIJ)

Les enquêteurs du Süddeutsche Zeitung et de l'ICIJ ont utilisé un programme appelé Nuix. Nuix est définit comme une plate-forme d'investigation construite pour le Big Data. C'est cet outil qui semble t-il a permis de creuser les données en un temps record. « Le travail d'exploitation des données a commencé en Septembre » a déclaré à Tech Radar le consultant logiciel de Nuix Carl Barron, qui a travaillé avec l'ICIJ et Zeitung pour mener l'enquête.

Les Panama Papers sont donc le fruit de 8 mois d'enquête, et de la plus grande fuite de données de l'histoire à ce jour : 2,6 To de données ont du être indexées et analysées. A titre de comparaison, le volume des Offshore leaks révélés en 2013 étaient de 260 Go. L'accès aux données serait le fuit d'un piratage informatique.

Déduplication pour réduire les données

Nuix a justement commencé à travailler avec l'ICIJ à l'époque des Offshore leaks. Pour les Panama Papers, le volume d'informations était bien plus important. Mais l'indexation aurait duré seulement un jour et demi, mentionne Carl Barron. Dans le détail, la taille des données a analyser à été réduite grâce à la déduplication. « La déduplication est utilisé pour identifier le même document qui aurait pu être sauvegardé un certain nombre de fois sur le système » explique Carl Barron. De cette manière, les enquêteurs n'ont pas eu à regarder les mêmes données plus d'une fois.

Mais une fois la première phase d'indexation effectuée, l'équipe a pu alors passer à l'identification d'éléments qui n'avaient pas été indexés du fait de leur nature. Ce sont alors les outils d'OCR (Optical Character Recognition pour reconnaissance optique de caractères) qui ont pris le relais pour analyser les très nombreux fichiers tels que les PDF, les scans et les images. Cela a permis de transposer dans des formats de fichier lisibles par les outils de recherche les données jusqu'alors illisibles.

Nuix a ensuite été utilisé pour classer et extraire des informations en fonction du type de fichier, ou si les fichiers contenaient le nom d'une personne ou un numéro de carte de crédit.

Les gens de Nuix, tout en travaillant sur les données, n'en connaissaient pas réellement le sens. « En raison de la confidentialité et leur nature top secret, nous n'avons pas réellement vu les données » explique Carl Barron. « Et pour être honnête, nous ne réalisions pas le scoop que ça allait donner ». Nuix insiste aussi sur le fait que le traitement des Panama Papers n'a pas été quelque chose d'extraordinaire. « Nous avons des clients qui traitent 300 To de données sur un mois » assure Carl Barron.

Toutes les données lisibles sur la plateforme

Les premiers temps il y a eu beaucoup d'allers-retours entre l'ICIJ, le Süddeutsche Zeitung et Nuix. Une étape nécessaire pour déterminer les besoins matériels et de gestion de charge de travail. Une fois que cela a été mis en place, le projet a été assez rapide à mettre en place. Ensuite, Nuix a fournit des prestations de conseil, surtout sur les questions techniques et de workflow.

Carl Barron explique que désormais toutes les informations indexées sont disponibles sur la plate-forme de Nuix, de sorte que les enquêteurs peuvent effectuer sans problème des allers-retours pour compléter leurs articles si nécessaire. Ainsi, si une enquête met en lumière le rôle d'un individu en particulier, les enquêteurs peuvent commencer à connecter les données depuis la BDD initiale via Nuix.

Théorie des graphes et visualisation

Par ailleurs l'ICIJ a utilisé la technologie de base de données de graphes Neo4j annonce la société Neo Technology par communiqué. « Au lieu d'utiliser des « tables » comme le font les bases de données relationnelles, les bases de données comme Neo4j s'appuient sur la théorie des graphes et fonctionnent avec des structures spéciales comprenant des nœuds, des relations et des propriétés permettant de définir, d'identifier et de stocker les données » détaille la société.

« C'est un outil (...) qui transforme le processus d'investigation des journalistes car dans ce cas, les relations sont extrêmement importantes puisque ce sont elles qui nous montrent où sont les criminels, qui travaille avec qui, et bien plus encore. Comprendre ces relations à une très grande échelle est précisèment là où les bases de données graphes excellent », explique Mar Cabra, Data and Research Unit Editor de l'ICIJ.

Enfin, côté visualisation, l'ICIJ a utilisé la solution Linkurious Enterprise. « Nous avions également besoin d'une solution intuitive et simple à utiliser qui ne requiert pas l'intervention de data scientists ou de développeurs tiers, afin que tous les journalistes (...)  puissent travailler sur ces données, peu importe leur niveau de maîtrise technique. Linkurious Enterprise était sans doute la meilleure plateforme pour explorer ces données et pour partager des informations de manière sécurisée » ajoute Mar Cabra.

Plus de 500 banques et leurs filiales sont également mentionnées

Dans le détail, les fichiers contiennent des données collectées sur une période de 40 ans mentionne l'ICIJ (https://panamapapers.icij.org/blog/20160403-key-findings.html). 214 000 sociétés offshores y sont référencées dans plus de 200 pays. Ces sociétés sont reliées à des particuliers soupçonnés de fraude fiscale, dont 140 hommes politiques et personnages publics. Plus de 500 banques et leurs filiales sont également mentionnées, dont HSBC, UBS et la Société Générale.

Ces données ont fuité de la base de données du cabinet d'avocats offshore Mossack Fonseca et ont été transmises au journal allemand Süddeutsche Zeitung. Elles ont été partagés avec le Consortium International des Journalistes d'investigation (https://panamapapers.icij.org/) (ICIJ pour International Consortium of Investigative Journalists). Ces informations révèlent comment Fonseca a aidé ses clients à éviter le paiement des impôts, et à blanchir de l'argent.

Pour aller plus loin sur ce sujet: Big Data: les journalistes doivent apprivoiser les données (http://www.zdnet.fr/actualites/big-data-les-journalistes-doivent-apprivoiser-les-donnees-39829880.htm)

Source: ZDNet.fr (http://www.zdnet.fr/actualites/big-data-panama-papers-deduplication-et-ocr-pour-donner-du-sens-a-l-enorme-masse-de-donnees-39835136.htm) Par Guillaume Serries | Mardi 05 Avril 2016 (https://lafibre.info/images/smileys/@GregLand/ca.gif)
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: mirtouf le 07 avril 2016 à 11:21:48
Il y avait quand même du haut niveau en termes de sécurité:
https://reflets.info/panamapapers-how-shit-happens/

Prenez un site vitrine en Wordpress sur un Apache mal configuré
(https://lafibre.info/images/presse/201604_panama-papers_1.png)

De préférence un Apache exotique
(https://lafibre.info/images/presse/201604_panama-papers_2.png)

Un Apache exotique qui sert aussi à faire tourner un Drupal non mis à jour depuis 2013 et gavé de failles
(https://lafibre.info/images/presse/201604_panama-papers_3.png)
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: tom pouce le 07 avril 2016 à 11:27:20
Il y avait quand même du haut niveau en termes de sécurité:
https://reflets.info/panamapapers-how-shit-happens/
Ben oui... :))
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: vivien le 07 avril 2016 à 12:54:54
Cash investigation : Paradis fiscaux : le casse du siècle - Affaire "Panama Papers"

Vidéo complète :
https://www.youtube.com/watch?v=L3ZIO-mBxfE

Les équipes de «Cash investigation» se sont lancées dans une enquête de grande ampleur sur les paradis fiscaux. Benoît Bringer et Edouard Perrin ont enquêté avec plus de 380 journalistes du monde entier, dans la plus grande discrétion. Le Consortium International des journalistes d'Investigation (ICIJ) a, en effet, mis en place un dispositif inédit pour révéler, en même temps, dans plus de cent médias, les informations confidentielles de ces investigations mondiales. Le résultat tombe : des personnalités ont créé ou utilisé des sociétés-écrans basées dans les paradis fiscaux. Après la diffusion de cette enquête, Elise Lucet reçoit des experts et des responsables politiques pour commenter et analyser ce phénomène.

Présenté par Elise Lucet
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: PacOrly le 07 avril 2016 à 13:14:55
Tiens, le nom de drahi est prononcé...
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: alegui le 07 avril 2016 à 13:19:28
Cash investigation : Paradis fiscaux : le casse du siècle - Affaire "Panama Papers"
Ils n'ont pas tardé !
(J'espère que la qualité est à la hauteur de la précipitation à sortir l'émission avant que le buzz retombe)
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: vivien le 07 avril 2016 à 13:21:24
Cash investigation est sortie le jour J, après de nombreux mois de travail avec de nombreux médias internationaux qui ont décider de tout révéler le jour J.
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: mirtouf le 07 avril 2016 à 13:52:00
Tiens, le nom de drahi est prononcé...
Petit rappel, tout en haut:
(http://www.universfreebox.com/UserFiles/image/empire_drahi.png)
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: PacOrly le 07 avril 2016 à 14:45:20
Petit rappel, tout en haut:
(http://www.universfreebox.com/UserFiles/image/empire_drahi.png)

Çà, c'est la partie déclarée. Pourquoi en parler dans cette affaire si cela ne concerne que cette partie?
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: PacOrly le 07 avril 2016 à 14:47:09
Ils n'ont pas tardé !
(J'espère que la qualité est à la hauteur de la précipitation à sortir l'émission avant que le buzz retombe)

Ils ont eu 18 mois pour préparer l'émission.
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: mirtouf le 07 avril 2016 à 14:56:43
Çà, c'est la partie déclarée. Pourquoi en parler dans cette affaire si cela ne concerne que cette partie?
Cela n'apporte rien d'en parler maintenant puisqu'il n'y a rien de nouveau à dire d'autant plus que cette structure panaméenne n'a plus de lien avec Altice, l'histoire est résumé sur le site de Le Monde:
http://www.lemonde.fr/panama-papers/article/2016/04/05/ce-que-les-panama-papers-nous-apprennent-sur-patrick-drahi-et-le-groupe-altice_4896487_4890278.html
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: PacOrly le 07 avril 2016 à 17:52:52
Merci pour le lien, c'est plus clair maintenant.
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: Marco POLO le 08 avril 2016 à 22:09:48
Panama Papers : comment a eu lieu le vol massif de données ?

Le piratage du serveur de messagerie du cabinet panaméen Mossack Fonseca a permis à des hackers inconnus d'extraire 2,6 To de données, dont 4,8 millions de messages électroniques et 2,2 millions de fichiers PDF.

Selon certains, en termes de volume d'informations volées, la fuite massive dont a été victime le cabinet d'avocats panaméen Mossack Fonseca atteint un record. Les documents divulgués comporteraient de nombreux détails sur l’usage, par des dizaines de politiciens de haut rang, leurs proches ou leurs proches collaborateurs de plus de 40 pays, dont le Royaume-Uni, la France, la Russie, la Chine et l'Inde, de sociétés offshore à des fins d’évasion fiscale, autrement dit pour cacher leurs revenus et éviter de payer des impôts. Depuis dimanche, plus d’une centaine de journaux dans le monde publient des articles basés sur ces documents. Les chiffres : 11,5 millions de documents confidentiels couvrant une période qui s’étale des années 1970 jusqu'à la fin de l’année 2015 ont été volés. Dans ces 2,6 To de données, on trouve 4,8 millions de courriels, 3 millions de pages de tableurs, 2,2 millions de fichiers PDF, 1,1 million d'images (scans de passeports par exemple), et 320 000 documents au format texte (*).

Que s’est-il passé ? Les détails sont sommaires, mais un représentant de Mossack Fonseca a confirmé les informations selon lesquelles le piratage a été mené à partir de la messagerie. On ne sait pas comment il s’est produit, mais les tests réalisés par des chercheurs en sécurité externes suggèrent que le cabinet Mossack Fonseca n'a pas activé les protocoles de sécurité TLS pour chiffrer ses e-mails. « Il y a plusieurs façons de mener une attaque sur un serveur de mail », a expliqué Zak Maples, consultant en sécurité pour le cabinet-conseil en cybersécurité MWR InfoSecurité. D’après le consultant, il semble que le serveur lui-même a été compromis, et non les boîtes mail individuelles.

Pas d'attaque en force brute

« Compte tenu du volume de données volées, les pirates n’ont pas essayé d’entrer dans les boîtes mail du cabinet d’avocats panaméen en menant des attaques par force brute », a-t-il déclaré par courriel. « Pour parvenir à compromettre autant de ressources, ils ont probablement réussi à s’introduire plus largement dans les systèmes de l’entreprise », a ajouté le consultant en sécurité. « Par exemple, ils ont peut-être réussi à entrer dans le réseau de Mossack Fonseca et à s’octroyer des privilèges élevés d’administrateur de domaine ou d’administrateur de messagerie. Ensuite, ils ont utilisé ces privilèges pour accéder et télécharger toutes les données conservées sur le serveur de messagerie ».

Qui est le pirate ? La source est inconnue. Et les journaux qui publient des articles sur les documents fuités ne connaissent probablement pas son identité. La source aurait communiqué par tchat crypté et par email. Le cabinet Mossack Fonseca nie toutes malversations. Il se défend en disant qu'il a seulement conseillé des clients pour créer des entreprises légales. Selon Mossack Fonseca, « même si notre cabinet a été victime d’un vol de données, rien ne permet de dire, dans ces documents obtenus illégalement, que nous avons fait quelque chose de mal ou d’illégal. Notre réputation mondiale construite au cours des 40 dernières années témoigne que nous faisons des affaires en respectant les règles, », a indiqué le cabinet panaméen dans un communiqué. « De toute évidence, personne n’est très heureux de subir un vol, et nous avons l'intention de faire tout ce qui est en notre pouvoir pour que les coupables soient traduits en justice ».

(*) Par la suite, pour organiser et pouvoir accéder à cette énorme base, récupérée par le quotidien allemand Süddeutsche Zeitung et partagée avec le consortium de journalistes ICIJ, une technologie open source a été mise à profit, celle de la base de données orientée graphe Neo4j, utilisée ici avec la plateforme de visualisation Linkurious. Ce type de base s’appuie sur la théorie des graphes pour stocker et représenter les structures et les interconnexions entre les données, ce qui permet de répondre à des requêtes complexes.

Source: LeMondeInformatique.fr (http://www.lemondeinformatique.fr/actualites/lire-panama-papers%C3%82%C2%A0-comment-a-eu-lieu-le-vol-massif-de-donnees%C3%82%C2%A0-64426.html?utm_source=mail&utm_medium=email&utm_campaign=Newsletter) par Grant Gross, IDG NS (adaptation Jean Elyan) le 06 Avril 2016. (https://lafibre.info/images/smileys/@GregLand/ca.gif)
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: vivien le 08 avril 2016 à 22:32:12
Combien de semaines avant que Mossack Fonseca change de nom ?

Aujourd'hui ils tentent de se défendre : "Panama Papers' firm co-founder: We didn't know" mais je pense qu'il est impossible de continuer avec ce nom, vu que les révélations vont continuer pendant plusieurs mois (pus de 11 millions de documents à analyser)

Leur site web est toujours en ligne : http://www.mossfon.com/

Ils annoncent fièrement que "Paraguay Removes Panama from Discriminatory Tax List. The Ministry of Foreign Affairs of Panama announced that the Republic of Paraguay has removed Panamá from its list of countries and regimes of low or no taxation." en date du 22 mars 2016. Cela ne vas pas durer...
Titre: Panama Papers: un piratage à l'origine de la fuite ?
Posté par: Marco POLO le 09 avril 2016 à 00:19:19
(https://lafibre.info/images/smileys/@GregLand/ep.gif) (https://lafibre.info/images/smileys/@GregLand/ep.gif) (https://lafibre.info/images/smileys/@GregLand/ep.gif)