Parcourir la catégorie

Gestion de données

Cloud Computing Entrepôts de données Gestion de données Identité numérique LeWebParis Web politique

La guerre des données, dix ans plus tard : de Google à Cambridge Analytica en passant par Nicholas

24 mai 2018

C’est en lisant un statut (ci-dessous) sur le mur Facebook de l’amie et blogueuse fort connue Anne Lataillade que l’idée de ce billet m’a littéralement explosé au visage…  Écrire sur le «scraping» de données sur ce blogue, dix ans après l’avoir fait une première fois le 9 janvier 2008. Et pourquoi revenir sur le sujet? Tout simplement parce que personne ou presque ne s’est soucié du phénomène jusqu’au «scandale» de Cambridge Analytica sur l’utilisation des données personnelles de plus de 800 millions d’abonné.e.s Facebook.


Notre petit échange sur Facebook au sujet du «scraping»

À la sortie des premières infos sur cette affaire, j’ai réagi avec une certaine indifférence mais je ne peux rester insensible au fait que tout le monde s’y mette et se scandalise sans savoir que tout le monde le fait en même en cuisine comme le souligne Anne.

Et voilà qu’en plus, «Zuckie» en agneau sacrificiel emblématique de la Silicon Valley, est forcé d’aller témoigner devant les deux chambres du Congrès. Alors là,  je me suis dit: mais voyons donc, pourquoi ils en font tout un plat ? Tout le monde le sait depuis au moins dix ans. Et malheureusement,  on a vu l’ignorance de ces pauvres sénateurs qui représentent bien leurs électeurs ( voir l’image de couverture). Il n’y a rien de nouveau là et ces politiciens devraient le savoir…

Tous les partis politiques ont, depuis la campagne Obama en 2008, leur propre système avec un nom particulier pour faire du ciblage à partir des réseaux sociaux. De là à passer à la manipulation, le pas est très court mais le monsieur ou la madame qui nous représente choisit de ne rien voir ou mieux de ne rien savoir. Jusque là….

Faut croire que pour beaucoup de monde, hors de la sphère du Web et la techno, c’était de l’inédit, comme s’ils se réveillaient tous d’un coup en 2018 en se disant «Au secours, on tripote dans mes données personnelles !» Désolé groupe mais c’est pratique courante et pas juste avec Facebook. Voici reproduit ci-dessous, le billet que j’ai commis en 2008. Oui, oui, vous lisez bien.

Et en passant, je n’ai pas eu un coup subit de science infuse pour l’écrire. C’était pour… Mais voyez par vous-mêmes:

«Un billet pour partager avec vous mes réflexions à la suite de la lecture du dernier numéro du magazine Wired. Tout d’abord sur le reportage  «The Data Wars», écrit par Josh Mchugh et dont j’ai parlé cette semaine en faisant référence au phénomène du «scraping» des données, phénomène courant pour les plates-formes de mise en relation sociale ou professionnelle ( ex: LinkedIn ou Viadeo qui vous proposent de récupérer les adresses de vos contacts dans Outlook ou Gmail)

Dans cette guerre des données, que se livrent, entre autres, Google et Microsoft, l’auteur note que lorsque Microsoft a investi dans Facebook, toutes les plates-formes rivales, dont LinkedIn, se sont vues interdire l’accès au service webmail de Microsoft, ne pouvant plus ainsi «scraper» les noms et adresses email des membres. De plus, plusieurs compagnies, dont Google ont commencé à mettre en place des API pour contrôler et même canaliser le «raclage» de leurs données par d’autres sites ou plates-formes.

Le reportage se termine par une répartie de Reid Hoffman, (le fondateur de LinkedIn) :

«It’s not the place of companies like Yahoo, Microsoft, Facebook or LinkedIn to decide who gets access to their user’s data. It should be up to the users themselves. It’s simple, the individual owns the data, even if it sits in some company’s server farm».

(Google pour ne pas la nommer…) Et on en revient au débat qui a fait rage à la fin de la conférence LeWeb3 à Paris. La propriété des données, leur utilisation à des fins autres entre autres et débattu lors d’un panel sur l’Open Social Initiative, avec sur scène Eric Tholomé, de Google, Marc Mayor, de MySpace (NDLR: oui, oui, ça existait encore) et Éric Didier de Viadeo et dans la salle, rien de moins que Marc Canter.

On en revient aussi à un autre article, toujours paru dans le dernier Wired mais qui est passé presque inaperçu. Il s’agit d’une courte entrevue avec Nicholas Carr, auteur du livre «The Big Switch- Rewiring the world, from Edison to Google». Ce titre dit tout… Sur les intentions de la firme du Mountain View. Dans cette entrevue, il parle des méga-entrepôts de données, des ordinateurs personnels qui vont devenir des terminaux, que Eric Schmidt et Google vont finalement réaliser le rêve de Sun Microsystems : «The network IS the computer». Un seul ordinateur mondial relié aux méga-centres de données et qui créent un «data cloud».

Le méga-entrepôt de serveurs de Google à The Dalles en Orégon

Et Carr y va de cette tirade terrifiante:

«But as systems become more centralized — as personal data becomes more exposed and data-mining software grows in sophistication — the interests of control will gain the upper hand. If you’re looking to monitor and manipulate people, you couldn’t design a better machine.»

Nous ne sommes plus très loin de «Big Brother»… Son livre demeure un must en 2008, en cette année où l’identité numérique et le propriété des données seront, à mon avis, l’enjeu crucial…»

Je ne croyais pas si bien dire mais je me suis quand même trompé de dix ans…

NDLR: Parlant de dix ans, il en aura fallu douze pour que j’atteigne finalement le cap des 1 000 billets. CE BILLET EST LE 1 000e !!! Faut dire que j’ai été occupé à d’autres choses depuis la fin de 2013…

MAJ:

On me fait remarquer de ne pas oublier de parler du RGPD qui entre en vigueur le 25 mai (Règlement général sur le protection des données), qui vise la protection des renseignements personnels pour la zone Euro mais qui nous touchera surtout les entreprises et agences et leurs bases de données mais aussi les individus. Cliquez sur le lien ci-haut pour en savoir plus.