Data War Archives - Émergenceweb

Cloud Computing Entrepôts de données Gestion de données Identité numérique LeWebParis Web politique

La guerre des données, dix ans plus tard : de Google à Cambridge Analytica en passant par Nicholas

24 mai 2018

C’est en lisant un statut (ci-dessous) sur le mur Facebook de l’amie et blogueuse fort connue Anne Lataillade que l’idée de ce billet m’a littéralement explosé au visage… Écrire sur le «scraping» de données sur ce blogue, dix ans après l’avoir fait une première fois le 9 janvier 2008. Et pourquoi revenir sur le sujet? Tout simplement parce que personne ou presque ne s’est soucié du phénomène jusqu’au «scandale» de Cambridge Analytica sur l’utilisation des données personnelles de plus de 800 millions d’abonné.e.s Facebook.

Notre petit échange sur Facebook au sujet du «scraping»

À la sortie des premières infos sur cette affaire, j’ai réagi avec une certaine indifférence mais je ne peux rester insensible au fait que tout le monde s’y mette et se scandalise sans savoir que tout le monde le fait en même en cuisine comme le souligne Anne.

Et voilà qu’en plus, «Zuckie» en agneau sacrificiel emblématique de la Silicon Valley, est forcé d’aller témoigner devant les deux chambres du Congrès. Alors là, je me suis dit: mais voyons donc, pourquoi ils en font tout un plat ? Tout le monde le sait depuis au moins dix ans. Et malheureusement, on a vu l’ignorance de ces pauvres sénateurs qui représentent bien leurs électeurs ( voir l’image de couverture). Il n’y a rien de nouveau là et ces politiciens devraient le savoir…

Tous les partis politiques ont, depuis la campagne Obama en 2008, leur propre système avec un nom particulier pour faire du ciblage à partir des réseaux sociaux. De là à passer à la manipulation, le pas est très court mais le monsieur ou la madame qui nous représente choisit de ne rien voir ou mieux de ne rien savoir. Jusque là….

Faut croire que pour beaucoup de monde, hors de la sphère du Web et la techno, c’était de l’inédit, comme s’ils se réveillaient tous d’un coup en 2018 en se disant «Au secours, on tripote dans mes données personnelles !» Désolé groupe mais c’est pratique courante et pas juste avec Facebook. Voici reproduit ci-dessous, le billet que j’ai commis en 2008. Oui, oui, vous lisez bien.

Et en passant, je n’ai pas eu un coup subit de science infuse pour l’écrire. C’était pour… Mais voyez par vous-mêmes:

«Un billet pour partager avec vous mes réflexions à la suite de la lecture du dernier numéro du magazine Wired. Tout d’abord sur le reportage «The Data Wars», écrit par Josh Mchugh et dont j’ai parlé cette semaine en faisant référence au phénomène du «scraping» des données, phénomène courant pour les plates-formes de mise en relation sociale ou professionnelle ( ex: LinkedIn ou Viadeo qui vous proposent de récupérer les adresses de vos contacts dans Outlook ou Gmail)

Dans cette guerre des données, que se livrent, entre autres, Google et Microsoft, l’auteur note que lorsque Microsoft a investi dans Facebook, toutes les plates-formes rivales, dont LinkedIn, se sont vues interdire l’accès au service webmail de Microsoft, ne pouvant plus ainsi «scraper» les noms et adresses email des membres. De plus, plusieurs compagnies, dont Google ont commencé à mettre en place des API pour contrôler et même canaliser le «raclage» de leurs données par d’autres sites ou plates-formes.

Le reportage se termine par une répartie de Reid Hoffman, (le fondateur de LinkedIn) :

«It’s not the place of companies like Yahoo, Microsoft, Facebook or LinkedIn to decide who gets access to their user’s data. It should be up to the users themselves. It’s simple, the individual owns the data, even if it sits in some company’s server farm».

(Google pour ne pas la nommer…) Et on en revient au débat qui a fait rage à la fin de la conférence LeWeb3 à Paris. La propriété des données, leur utilisation à des fins autres entre autres et débattu lors d’un panel sur l’Open Social Initiative, avec sur scène Eric Tholomé, de Google, Marc Mayor, de MySpace (NDLR: oui, oui, ça existait encore) et Éric Didier de Viadeo et dans la salle, rien de moins que Marc Canter.

On en revient aussi à un autre article, toujours paru dans le dernier Wired mais qui est passé presque inaperçu. Il s’agit d’une courte entrevue avec Nicholas Carr, auteur du livre «The Big Switch- Rewiring the world, from Edison to Google». Ce titre dit tout… Sur les intentions de la firme du Mountain View. Dans cette entrevue, il parle des méga-entrepôts de données, des ordinateurs personnels qui vont devenir des terminaux, que Eric Schmidt et Google vont finalement réaliser le rêve de Sun Microsystems : «The network IS the computer». Un seul ordinateur mondial relié aux méga-centres de données et qui créent un «data cloud».

Le méga-entrepôt de serveurs de Google à The Dalles en Orégon

Et Carr y va de cette tirade terrifiante:

«But as systems become more centralized — as personal data becomes more exposed and data-mining software grows in sophistication — the interests of control will gain the upper hand. If you’re looking to monitor and manipulate people, you couldn’t design a better machine.»

Nous ne sommes plus très loin de «Big Brother»… Son livre demeure un must en 2008, en cette année où l’identité numérique et le propriété des données seront, à mon avis, l’enjeu crucial…»

Je ne croyais pas si bien dire mais je me suis quand même trompé de dix ans…

NDLR: Parlant de dix ans, il en aura fallu douze pour que j’atteigne finalement le cap des 1 000 billets. CE BILLET EST LE 1 000e !!! Faut dire que j’ai été occupé à d’autres choses depuis la fin de 2013…

MAJ:

On me fait remarquer de ne pas oublier de parler du RGPD qui entre en vigueur le 25 mai (Règlement général sur le protection des données), qui vise la protection des renseignements personnels pour la zone Euro mais qui nous touchera surtout les entreprises et agences et leurs bases de données mais aussi les individus. Cliquez sur le lien ci-haut pour en savoir plus.

Big Data Événements Identité numérique Internet2 Sécurité des données

MAJ : Nous sommes en guerre et les USA ne tolèrent pas les «espions des données» ni les hackers blancs…

24 juillet 2013

NDLR: Je re-publie ce matin un billet qui est passé un peu sous le radar car ayant été publié en plein congé de la Fête Nationale. Le sujet est encore d’actualité et fait même la UNE de plusieurs publications ce matin. Ce ne pourrait être qu’une autre de ces histoires d’espionnage international et de géopolitique, bref un sujet qui captive sur le moment mais qui finit par lasser un monde avide d’actualité et de sensationnel. Mais ici, la question est beaucoup plus importante et nous touche tous et toutes dans ce que nous avons de plus cher, soit notre INTIMITÉ et notre INTÉGRITÉ. Donc, sans plus tarder : Lire la suite

Big Data Cloud Computing Entrepôts de données Sécurité des données

MAJ: Nous sommes en guerre et la NSA ne tolère pas les «espions des données»…

24 juin 2013

C’est une toute petite phrase écrite sur le «LiveBlog» du journal Le Guardian qui a attiré mon attention et déclenché ce billet. Au début, je ne voulais pas écrire sur la saga actuelle qui concerne le scandale déclenché par la mise à jour du programme PRISM et les tribulations internationales du «lanceur d’alerte» Edward Snowdon. Mais cette phrase et les événements qui ont suivi m’ont forcé la main… Lire la suite

Cloud Computing Entrepôts de données Entreprise 2.0 Gestion des organisations Ideagoras Internet2 Mémoire d'entreprise

Plan numérique: viser l’exploitation du savoir et non plus seulement de l’avoir

28 octobre 2012

Comme c’est le cas pour l’ami Mario Asselin, notre démarche qui permet de réactiver un processus qui pourrait permettre l’émergence d’un Plan numérique pour le Québec ma plaît beaucoup. Mais il n’y aura pas de plan ni même de future société québécoise basée sur le numérique si on ne relève pas à mon avis deux grands défis auxquels font face les entreprises et ensuite leurs employés.

D’une part, il faut que nous cessions de penser que le développement économique du Québec passe nécessairement par l’exploitation de ses ressources naturelles. Nous ferions beaucoup mieux collectivement si on alignait ce développement vers les nouvelles technologies et entreprises numériques, vers l’exploitation du savoir et non plus seulement de l’avoir.

Cloud Computing Événements

Boule de cristal, Maps et Internet des données…

12 mars 2012

Certains le savent et les autres l’apprendront: je travaille, entre autres, sur la programmation non pas seulement de la conférence webcom-Montréal mais aussi sur un tout nouveau concept de semaine internationale des affaires numériques qui va s’appeler Connect 2012 et va regrouper, en plus de webcom, la Boule de cristal du CRIM ainsi que plusieurs autres événements (ateliers, conférences, diffusions LIVE, galas, soirées, etc.). Lire la suite

Cloud Computing Internet of Things Internet2 LifeLogs Social Business Web sémantique

Bienvenue dans le monde post Web 2.0 !

20 février 2012

Je tiens, en ce début de semaine, à republier un billet que j’ai commis en juillet dernier et qui vise dans le mille sur ce qui est en train de se passer dans le merveilleux monde des nouvelles technologies de l’information et des communications (NTIC). Car nous sommes en train de vivre une transition majeure. Lire la suite

Cloud Computing Identité numérique Sécurité des données Web 3.0 Web sémantique

Web 3.0. O’Reilly réplique avec le Web Squared…

25 juillet 2009

C’est Tim Berners-Lee qui a mis le feu aux poudres… Depuis le temps que je vous écris que le Web en 2009-2010 fleurira de vos données «It’s all about Data» et que j’écris sur la guerre des données (Data War) qui se joue entre les grands comme Google, Microsoft, Amazon et autres, une guerre qui a pour armes d’accumulation massive le Cloud Computing, le scraping et la portabilité, je croyais donc le sujet entendu. Eh bien, non… Sir Thimoty, qui se présente toujours comme l’inventeur du World Wide Web (www ou encore W3) est venu en rajouter une couche avec une sortie publique fort remarquée, à la conférence TED, en février dernier.

Il est venu parler du futur Web, donc du Web 3.0 où tout n’est que données liées (Linked Data). Il est surtout venu faire la promotion du W3C SWEO Linking Open Data community project. La simple existence de ce projet et ses possibilités a excité les neurones de plusieurs et valu un super billet de vulgarisation dans ReadWriteWeb, édition française. Mais aussi une réplique de Tim O’Reilly et John Batelle, quelques mois plus tard, dans un webcast préparatoire à la conférence Web 2.0 Summit qui aura lieu en octobre à San Francisco. En effet, on ne détrône pas si facilement O’Reilly de sa paternité chiffresque…

Le SlideShare du webcast de Tim O’Reilly le 25 juin dernier

Il est donc revenu à la charge lors de ce webcast en proposant, comme le mentionne l’ami Fred Cavazza dans un excellent billet d’analyse, un Web intermédiaire, soit de Web Squared ou si vous préférez le Web². Comme l’écrit Fred: «Les explications autour de ce Web² sont résumées dans l’article fondateur suivant : Web Squared: Web 2.0 Five Years On ». C’est un article sur le site de Web 2.0 Summit qui appuie leurs prétentions mais les deux compères ont aussi pris le soin de rédiger un «White Paper» pour officialiser leur paternité sur le thème et l’idée.

Ce qui n’a pas empêché une autre grosse pointure, soit Dion Hinchcliffe de venir rajouter son propre grain de sel avec le billet: The Evolving Web In 2009: Web Squared Emerges To Refine Web 2.0. Hinchcliffe, qui écrit aussi pour ZDNet, donne des ateliers sur l’entreprise 2.0 à la conférence bostonienne Enterprise 2.0 et est, pour le bonheur de ceux et celles qui assistent à ses «workshops», un fervent adepte des schémas. Il a donc pondu le schéma suivant:

Hinchcliffe présente donc le Web² comme une suite logique et naturelle du Web 2.0, une forme d’évolution ou comme le dit Fred de «maturation qui va nous amener vers la prochaine itération majeure», soit le Web 3.0, le Web sémantique où les données et les liens fusionnent, là où se crée finalement une interrelation entre toutes les données afin de finalement donner un sens au Data Cloud, un sens généré au départ par les usagers eux-mêmes comme dans le projet original de Linked Data de Berners-lee.

Sa croissance est exponentielle. Ce nuage va devenir immense et pas seulement avec les données personnelles et tout ce que cela implique au niveau de leur entreposage et de leur portabilité mais aussi de leur protection et sécurité mais aussi celles des entreprises, à l’externe aussi bien qu’à l’interne… Un immense Cloud planétaire! Certains se réfèrent déjà au concept de Neural Net développé en science fiction et en référence aux travaux sur les Artificial Neural Networks, associés à l’intelligence artificielle. D’autres, comme Thierry Hubert, avec son projet Darwin, parlent de Virtual Cortex, issu directement de la «Théorie du Chaos»…

Bref un SupraNet où des agents intelligents se chargent de faire les corrélations pour récupérer de cet immense et chaotique nuage de données et de liens, les informations pertinentes, requises par les utilisateurs.

Et dire que Gene Roddenberry, il y a bien des années, a décidé de donner un nom très particulier au premier robot à cerveau positronique doté d’intelligence artificielle à apparaître dans sa série Star Trek. Ce nom, vous l’avez deviné, c’est : Data…

Cloud Computing Communication interactive Entrepôts de données

Cloud computing, guerre de données et un faible pour Gina…

3 mars 2009

Depuis quelques jours, je ne fais que lire des articles ou billets relatifs au «Cloud Computing». Je ne sais pas pourquoi mais il semble que blogueurs et journalistes technos se soient donné le mot. Et tout ce beau monde n’est pas unanime, loin de là, sur les bénéfices de cette nouvelle offre, faite aussi bien aux individus qu’aux entreprises. Il y a les pour et les contre et ces derniers y vont de charges assez bien senties comme cette série d’articles parus dans le E-Commerce Times et intitulés «The Dark Side of the Cloud».

Cette image accompagnant le texte vaut ses mille mots…

ll y a eu aussi ce billet, paru récemment sur cnet news, intitulé «Can you Trust your Enterprise to Google Cloud?» et qui fait suite aux problèmes vécus chez Google, avec la perte de gMail pendant quelques heures, semant un vent de panique sur le Web ainsi que «l’erreur humaine» qui a provoqué l’apparition de «This site may harm your computer» dans tous les résultats de recherche de Google et qui a nécessité une sérieuse mise-au-point de Marissa Mayer.

Ceux qui me lisent régulièrement savent que j’ai beaucoup écrit sur ce sujet et aussi sur son corolaire que constituent les entrepôts de données, nécessaires à toute compagnie voulant offrir le stockage de données et le SaaS, créant ainsi le phénomène du «cloud».

Je vous fais donc grâce d’un autre long et fastidieux billet sur le sujets er surtout sur ses avantages car je crois sincèrement qu’il s’agit là d’une option sérieuse pour les entreprises afin d’économiser des millions de $$$, ce qui n’est pas négligeable en temps de crise.

Il en est à mon avis de même pour les individus, permettant ainsi la miniaturisation de nos ordinateurs et l’émergence (J’aime bien ce mot) du Web comme utilité publique, un Web rapide, sûr et accessible à tous, moyennant un abonnement mensuel à divers forfaits, ce que Nicholas Carr a appelé «The Big Switch».

Non, pas de long billet. Je tiens simplement à vous faire part, d’un côté de cette vague de scepticisme mais aussi de l’autre de trois autres articles/billets parus aussi au cours des derniers jours et d’une table ronde fort intéressante, organisée par TechCrunch, il y a peu de temps et mettant en vedette tout le gratin du Cloud. Juste pour vous dire qu’il y avait autour de la table, Rackspace, Google, Microsoft, Amazon, SalesForce, Sun Microsystems, Yahoo, Facebook, Ning et Friendfeed. Bizarrement, pas de IBM...

Pourtant, Big Blue a fait la manchette à la suite d’une autre table ronde relevée par Dana Gardner de ZDNet qui a enregistré le tout en audio et retranscrit une partie de la conversation dans un billet intitulé :«Cloud computing aligns with enterprise architecture to make each more useful, says experts». et surtout un autre billet, celui-là dans LeMondeInformatique.fr où on annonce qu’IBM se donne officiellement une division pour le cloud, division qui porte le nom de… Blue Cloud.

Et finalement, un dernier billet, à mon avis le plus significatif, paru sur TechCrunch, où on relate que : «Salesforce is now officially the first enterprise cloud computing company to hit $1 billion in annual revenues.». Imaginez, un milliard $ de profits en pleine récession… Et ce n’est que la pointe d’un immense iceberg. Amazon, Google, Microsoft, IBM et tous les autres veulent ce gros morceau de données glacées dans LEUR cour arrière, d’où la «Data War»…

Free live streaming by Ustream

Je vous suggère donc de vous installer confortablement et d’écouter ce qu’avaient à dire tous les gros canons réunis autour de cette table ronde, entre autres les propos de Werner Vogels, le CTO d’Amazon, dont je vous avais parlé à la suite de son apparition sur le podium à LeWeb08 en décembre dernier.

p.s. J’ai aussi un faible pour Gina Bianchini, la co-fondatrice et CEO de Ning mais cela, c’est une autre histoire…

Cloud Computing Communication interactive Entreprise 2.0 Événements Identité numérique Médias sociaux OpenSocialWeb

Sondage spontané #LeWeb08 : Le Web 2009 en deux mots…

23 décembre 2008

Hier en faisant ma promenade quotidienne dans les méandres de Twitter, je suis tombé par hasard sur un «Re-Tweet» de Philippe Martin de l’ami Philippe Jeudy. Sur son blogue, le second Phil a reproduit une vidéo tournée à la fin de la conférence LeWeb08, où l’on demande aux participants de décrire «en deux mots», ce que sera le Web en 2009. Il a ensuite Twitté l’URL de son billet.

Première remarque : Les commentaires reflètent les propos tenus par les principaux conférenciers et ténors lors de la conférence de notre ami Loïc LeMeur.. Seconde remarque : Bien peu de répondants parlent des trois tendances lourdes que j’ai évoquées dans mon billet-fleuve du 18 décembre et intitulé :«L’entreprise 2.0 en 2009 : Je me méfie des prédictions…». Ces trois tendances sont : la dématérialisation, la mobilité et l’innovation. Dématérialisation des données, mobilité des outils et innovation des organisations.

Comme vous le verrez dans la vidéo, la synthèse faite en sept points est la suivante :

Le ROI
Réseaux sociaux en live
Contenus 3D
Le mobile
le eCommerce
2008 en mieux
Je ne sais pas…

J’ai donc répondu à l’ami Philippe Martin :

Emergent007 RT @PhilippeMartin: Les tendances du web en 2009 http://philj.wordpress.com/… Tous tort, m’ont pas demandé 😉 environ 13 heures ago from TweetDeck

Cette réponse un peu «baveuse» a immédiatement soulevé l’intérêt de Phil Jeudy mais aussi de Sandrine Plasseraud, une des blogueuses officielles à la conférence et elle aussi interviewée dans cette vidéo. Elle m’a demandé :« Mais t’aurais dit quoi toi en deux mots ?». Facile… Des trois tendances mentionnées plus tôt, je choisis en priorité la première, soit la dématérialisation. Et dématérialisation égale données. J’ai donc répondu : Data War… J’ai déjà publié plusieurs billets sur le sujet, regroupés ICI.

MAJ :

Et pour encore mieux illustrer mon propos, je vous laisse avec deux messages que vous avez probablement vus ou reçus récemment. Le premier émane de Yahoo et vise, selon eux à «améliorer les performances du service».

Le second vient de Facebook et s’affiche lorsque quelqu’un vous envoie une invitation à partager une mini-application, dans ce cas-ci, se nommant Papa Noël…

En langage «geek» on appelle ce procédé du «scraping de données», vos données… Je vous renvoie donc au reportage sur «The Data Wars», écrit par Josh Mchugh dans le magazine Wired et qui traite de ce phénomène, courant pour les plates-formes de mise en relation sociale ou professionnelle ( ex: LinkedIn ou Viadeo qui vous proposent de récupérer les adresses de vos contacts dans Outlook ou Gmail).

Dans cette guerre des données, que se livrent, entre autres, Yahoo, Google et Microsoft, l’auteur note que lorsque Microsoft a investi dans Facebook, toutes les plates-formes rivales, dont LinkedIn, se sont vues interdire l’accès au service webmail de Microsoft, ne pouvant plus ainsi «scraper» les noms et adresses email des membres . De plus, plusieurs compagnies, dont Google ont commencé à mettre en place des API pour contrôler et même canaliser le «raclage» de leurs données par d’autres sites ou plates-formes.

Le reportage se termine par une répartie de Reid Hoffman de LinkedIn :

«It’s not the place of companies like Yahoo, Microsoft, Facebook or LinkedIn to decide who gets access to thier user’s data. It should be up to the users themselves. It’s simple, the individual owns the data, even if it sits in some company’s server farm».

(Google pour ne pas la nommer…) Et on en revient au débat qui a fait rage à la fin de la conférence LeWeb3, la conférence de Loïc Le Meur à Paris en décembre 2007 et non celle de cette année. La propriété des données, leur utilisation à des fins autres, la gestion de l’identité numérique, d’ailleurs relevée comme un enjeu majeur des prochaines années par Patrick Barrabé dans son livre blanc «Business Social Networking».

Ce n’est pas pour rien qu’en mai prochain, à webcom-Montréal, qu’un des deux thèmes sera l’identité numérique (nos données sur le Web). En passant, un des signataires du «Bill of Rights for Users of the Social Web», membre du Gillmor Gang et fervent défenseur de notre droit à la propriété de nos données, Marc Canter, a confirmé sa présence à Montréal le 13 mai prochain.