Surveillance du web

Sujet : Mécanisme de la donnée, Préparation : au pire !,
Remarques : Sujet très dense

Auparavant, les ordinateurs nous appartenaient et utilisaient du logiciel que nous pouvions auditer et modifier et nos données étaient stockées localement (sur nos ordinateurs).

Le temps où l’ordinateur était une affaire de spécialiste est maintenant bien loin, car l’informatique et internet nous touchent, nous qui sommes équipés, au quotidien. Nos smartphones laissent fuiter des données (par exemple de géolocalisation*) et nos ordinateurs font de même avec la liste/l'historique des pages web que nous visitons.

*géolocalisation : une base de données de localisation permet de déduire des informations détaillées sur les habitudes et modes de vie des personnes : lieux de vie et de travail, sorties, loisirs, mobilités, mais aussi éventuellement fréquentation d’établissements de soins ou de lieux de culte.

Tous tracés ! - mars 2020

Nos informations sont de moins en moins bien protégées : perte de confidentialité dans la collecte des données de nos terminaux et de navigation sur le web, lecture du contenu de nos messages (mails, SMS…), divulgation de nos informations (images-photos, tél...) personnelles (voir les affaires qui ont fait grand bruit des stars américaines Jennifer Lawrence et Kirsten Dunst en 2014).

La collecte de nos données est inquiétante dans la mesure où elle est souvent à notre insu, nous ne nous en connaissons pas réellement la teneur et nous ne connaissons encore moins leur usage.

Essayer le module Lightbeam pour Firefox
Lightbeam propose une visualisation interactive permettant de voir les relations entre les sites visités et les sites tiers.

Les BIG DATA ... ou mégadonnées, grosses données ou encore données massives

Ces données ont été obtenues par des cookies, par l’analyse des achats sur des sites de e-commerce, par l’historique de nos navigations, par l’analyse aussi des profils, posts et commentaires laissés sur les réseaux sociaux, les applications mobiles, signaux GPS, connexion wifi, mais aussi par les données des objets connectés (frigo, bracelet, brosse à dent, compteur électrique...) et bien d’autres encore.
La masse est telle que tout est traité par des algorithmes (machine et deep learning, mais c'est là un autre sujet !).

L'agrégation et le croisement de ces données permet d'analyser et de construire des profils utilisateurs (profilage).
A terme, définir des profils utilisateurs/consommateurs aux comportements prédictifs, comme prédire des intentions et habitudes de consommation.
Même beaucoup mieux encore !

Big Data: que fait-on de nos données ? - Reportage de la Radio Télévision Suisse de 2015, ancien mais qui a le mérite d'être limpide pour les non-spécialistes !

Les outils du Big Data, et des analyses qui en sont issues, peuvent être utilisés dans presque tous les domaines. Pour l’usage de statistiques dans le sport de haut niveau, le programme de surveillance PRISM de la NSA, la médecine analytique, le recrutement, les analyses financières, les flux routiers, le marketing (du genre, recommandation de produits chez Amazon ! ).

Il y a quelques années, la chaîne ARTE TV a proposé un sujet bien fait et très abordable, comment comprendre en 14 mn Les enjeux du big data - FUTUREMAG