MAPAO

Automattic : Wordpress et Tumblr

Automattic, propriétaire de Wordpress, Trimblr mais aussi des plugins Jetpack, WooCommerce… se prépare à vendre les données utilisateurs à Open AI et Midjourney.
Cette information a été révélé par 404 media, article de Samantha Cole, le 27 février 2024.
> Tumblr et WordPress vont vendre les données des utilisateurs pour former des outils d'IA

En fait on y apprend qu’Automattic vend l’accès aux publications à cette « lance à incendie » (WordPress Firehose) depuis des années, à diverses fins.
Cela inclut la vente d'accès à des blogs et à des sites web auto-hébergés qui utilisent des plugins populaires appelés Jetpack.

Jim Winstead (traduction)
« Le projet de WordPress.org ne vend pas de données, il vous encourage simplement à installer le plugin Jetpack, qui possède une fonctionnalité appelée « distribution améliorée » (activée par défaut), qui alimente en données le firehose de WordPress.com, qui a des conditions d'utilisation selon lesquelles vous ne pouvez pas utiliser les données « d'une manière biaisée, trompeuse ou malhonnête, par exemple, pour promouvoir ou faire connaître un point de vue politique biaisé ».

. La « Distribution amélioré » de Jetpack
. Firehose : Flux en temps réel de tout ce qui se passe en ligne.


Si jusqu’à ce jours ces flux de données étaient destinés aux entreprises pour de l’analyse marketing, moteurs de recherche… depuis septembre 2023 ces flux peuvent aussi être exploités par des entreprises d’IA.
D’où le prochain accord d’Automattic avec Open AI et Midjourney !
(ou dit autrement, comment ces 2 entreprises vont utiliser les données de votre site web Wordpress pour améliorer leurs outils d’IA generative).

Je doute que les utilisateurs, développeurs et créateurs de site web Worpress soient au courant.

Worpress.com tout comme Trimblr ont leur propre « firehorse » avec chacun leur API - permettant l’accès aux millions de publication des utilisateurs.

L’opacité du système ne permets pas de savoir pour les propriétaires de site Wordpress quelles entreprises ont un accès direct à leurs publications et à quoi elles sont utilisées.

Ce genre de partage de données est permis grâce à des clauses incluses dans les contrats de service que la plupart des gens négligent de lire, et qui peuvent par ailleurs être désactivées dans les paramètres de compte rarement consultés.
Ces clauses autorisent ensuite la vente de données d'utilisateurs à des sociétés spécialisées dans la collecte et l'analyse de données issues de divers supports.
Comme on peut le voir avec l’affaire Automattic, il peut arriver que, même après avoir lu attentivement les mentions légales relatives à la vie privée, les plateformes sont habilitées à modifier les termes de leurs clauses quand bon leur semble, et même à exiger une procédure de désabonnement au lieu de souscription (contraire au RGPD), et qualifier ceci de "protéger le choix de l’utilisateur" !

Quel rôle joue la plateforme Socialgist ?

Socialgist est une plateforme qui sert de couche intermédiaire d'accès aux données (issues des médias sociaux, forum de discussion, blogs, de microblogues, d’actualités, de commentaires de consommateurs…) à leurs clients (grandes entreprises tech).
La plateforme Socialgist donne accès à des données structurées et simples d'utilisation.
En connectant leurs clients (grâce à des API tierces) à des fournisseurs de contenu de premier plan, Socialgist permet aux entreprises d'analyser les tendances du marché, de protéger la réputation de la marque, de comprendre leurs audiences, de surveiller les médias sociaux...

Socialgist a établi des partenariats de données exclusifs avec des plateformes comme Quora et Reddit, permettant à leurs clients d'accéder à des sources de données et à des informations uniques.
Elle est considérée comme un des leader dans le domaine de l'agrégation de contenu.


En 2019, Socialgist intégre, en sources de données, les contenus « WordPress Blog & Comment ».
> Socialgist annonce l'intégration du contenu du blog et des commentaires WordPress

Les publications concernées sont non seulement celles de WordPress.com, mais également de «  sites populaires alimentés par WP sur le web », par le biais des plugins Jetpack.

Socialgist capture ecrancapture d'écran du site de Socialgist


SocialGist devient un intermédiaire qui permet d’acheter des accès aux publications WordPress et Tumblr.

Chaque site web WordPress devient donc une source de données disponible pour de grandes entreprises technologiques en quête « informations fraîches » pour leurs analyses et développements.

Conformer les données Wordpress aux entreprises d’IA

En mai 2023, Socialgist se dit prête pour présenter des « données propres et conformes » pour la formation en IA et en LLM, et s’associe en décembre 2023 avec la société Datastreamer.
> Socialgist et Datastreamer s'associent pour faire de l'intégration de données conversationnelles une expérience transparente

Dans la documentation d’Automattic il est impossible de savoir à qui Socialgist vends les données et à quels fins.
Il serait en pourparler que les sites WP auto-hébergés avec les plugins Jetpack ne contribueraient pas au formation LLM et aux futurs IA… en permettant aux utilisateurs / propriétaires de sites WP de refuser que leur contenu soit utilisé pour la formation en IA, mais ça reste difficile de savoir si cette fonctionnalité sera activée par défaut.
> Un « Firehose » WordPress permet aux entreprises d'IA d'acheter l'accès à un million de publications par jour – mars 2024


La décision de monétiser les données de cette manière a suscité une controverse au sein d'Automattic, car certains employés ont fait part de leurs inquiétudes quant à l'accès potentiel à des contenus sensibles et privés sans consentement.

Cette annonce fait suite à une tendance parmi les grandes entreprises technologiques cherchant à capitaliser sur la demande croissante de ressources de développement de l’IA.
Le constructeur de sites web concurrent Squarespace a introduit une fonctionnalité similaire qui permetterait aux utilisateurs de refuser que leur contenu soit utilisé pour la recherche sur l'IA.

Malgré les assurances de ces derniers jours d'Automattic concernant les contrôles des utilisateurs et la protection de la vie privée, nombreux sont ceux qui restent sceptiques quant aux motivations de ces sociétés.
Alors que l’IA continue de remodeler divers aspects de la vie moderne, les experts avertissent qu’il faut accorder une attention particulière aux implications éthiques et aux conséquences potentielles.

 

MAPAO mini site web
MAPAO création site vitrine mensualisé
MAPAO création site ecommerce mensualisé
MAPAO création mono site web