Une start-up française pour une IA générative éthique

Pleias, une jeune start-up française, se lance dans le défi de créer un modèle d’IA générative qui respecte le droit d’auteur et la diversité linguistique. La société propose un corpus de textes en open source pour entraîner des grands modèles de langage, tout en respectant les droits d’auteur et en offrant une plus grande pluralité linguistique.

Points clés

  • Pleias est une start-up française créée en décembre 2023, qui se concentre sur l’IA générative éthique.
  • La société propose un corpus de textes en open source, appelé Common Corpus, contenant 500 milliards de mots dans plusieurs langues, libres de droit.
  • Pleias travaille en collaboration avec plusieurs projets de recherche sur l’IA générative open source, tels qu’Occiglot, EleutherAI et AllenAI.
  • La start-up est également soutenue par Langu:IA, un projet porté par la délégation générale à la langue française et aux langues de France (DGLFLF).
  • Pleias a également développé un corpus open data de 300 milliards de mots reprenant des textes administratifs et législatifs français et européens.
  • La société travaille également sur un projet de données synthétiques pour créer des jeux de données suffisamment conséquents pour entraîner les grands modèles de langage dans des langues pour lesquelles il en manque.

A retenir

Il est temps de repenser l’IA générative et de se concentrer sur des modèles éthiques qui respectent les droits d’auteur et la diversité linguistique. Pleias, une jeune start-up française, relève le défi en proposant un corpus de textes en open source pour entraîner des grands modèles de langage. En travaillant en collaboration avec d’autres projets de recherche et en étant soutenue par des organisations publiques, Pleias montre que l’innovation peut être éthique et respectueuse des droits d’auteur.

Sources :