Nl

TECH

Meta et la collecte de données

Lundi 26 Août 2024

Meta et la collecte de données

Bien que lancé discrètement, Meta External Agent, le nouveau crawler de Meta, a vite été repéré. L’objectif est de collecter le plus de contenu possible sur le Web pour alimenter les modèles d’intelligence artificielle. Le crawler de Meta s’inscrit dans la course effrénée que se livrent les géants de l’IA et la place que Mark Zuckerberg entend s’y faire. Il s’ajoute aux nombreux outils déjà actifs sur l’Internet, dont le GPTbot d’OpenAI, ceux d’Anthropic ou de Perplexity qui ont tous le même objectif.

La discrétion de Meta s’explique par le fait que de plus en plus de sites, particulièrement les sites d’info, bloquent ces crawlers de peur d’être littéralement pillés. Pour ce faire, ces sites doivent inscrire le nom du crawler dans un petit fichier (robot.txt) placé sur leurs serveurs. Un "opt-out" en quelque sorte qui nécessite cependant de connaître le nom du crawler en question.

La firme de Menlo Park n’a pas non plus fait trop de publicité sur la collecte des informations partagées par les utilisateurs sur ses plateformes avec le même objectif d’alimenter ses IA. Meta avait adapté ses conditions générales en juin dernier pour la cause en déclenchant une vague de plaintes, notamment celle de Test-Achat auprès de l’Autorité de Protection des Données (APD).

Archive / TECH