Molmo : Une Révolution dans les Modèles Multimodaux d’IA

ApplicationsCRANews

Découvrez la puissance de Molmo en IA multimodale

Molmo est une nouvelle famille de modèles d’IA multimodaux open-source qui surpasse les systèmes propriétaires sur divers benchmarks académiques. Grâce à des données de haute qualité collectées par des annotateurs humains, Molmo propose des interactions riches avec les mondes physique et virtuel. Ce projet vise à démocratiser l’accès à des modèles performants tout en ouvrant de nouvelles avenues pour les applications d’IA.

Points clés

  • Molmo est une famille de modèles d’IA multimodaux open-source.
  • Le modèle Molmo-72B surpasse des systèmes comme GPT-4o et Claude 3.5.
  • Les données d’entraînement de Molmo sont basées sur des descriptions audio détaillées fournies par des annotateurs humains.
  • Plus de 712 000 images ont été utilisées pour créer des légendes détaillées dans le dataset PixMo-Cap.
  • Molmo a été évalué par plus de 870 annotateurs humains, réalisant plus de 325 231 comparaisons de préférences.

À retenir

Alors, si vous pensiez que les modèles d’IA étaient tous fermés et ennuyeux, Molmo vient prouver le contraire ! Avec sa capacité à rivaliser avec les géants tout en étant open-source, il pourrait bien devenir votre nouvel ami dans le monde de l’IA. Qui aurait cru qu’un modèle pouvait être à la fois intelligent et accessible ?

Sources