Les défis du consentement à l’ère de l’IA
Ce document présente un audit approfondi des protocoles de consentement concernant l’utilisation des données web pour l’intelligence artificielle. En analysant 14 000 domaines web, il met en lumière une augmentation rapide des restrictions et des incohérences dans les pratiques de consentement. Les résultats soulignent une crise émergente qui pourrait affecter la diversité et la qualité des données utilisées pour l’IA.
Points clés
- L’audit a examiné 14 000 domaines web pour évaluer les préférences de consentement.
- Plus de 5 % des jetons dans C4 sont désormais restreints à l’utilisation.
- 45 % de C4 est soumis à des restrictions dans les conditions d’utilisation.
- Les robots d’OpenAI sont restreints pour 25,9 % des jetons dans HEAD C4.
- En un an, environ 25 % des jetons des domaines critiques sont devenus restreints.
- Les prévisions suggèrent que 2-4 % supplémentaires de jetons seront restreints d’ici avril 2025.
- Les restrictions concernent principalement les sites d’actualités, les forums et les réseaux sociaux.
- Les données d’entraînement d’IA sont souvent mal alignées avec les tâches réelles des modèles.
- Les inquiétudes économiques pourraient pousser les petits fournisseurs de contenu à quitter le web.
- Les utilisations réelles de l’IA incluent des compositions créatives et des demandes d’informations générales, plutôt que des actualités.
À retenir
Alors, si vous pensiez que le web était un endroit où tout le monde pouvait se servir librement, détrompez-vous ! Avec toutes ces restrictions, il semblerait que l’IA doive bientôt apprendre à se débrouiller avec un menu très limité. Peut-être qu’il est temps de réinventer la roue, ou mieux encore, de demander poliment la permission avant de prendre une bouchée des données du web !
Sources
Quiz sur le document: 10 questions


