Découvrez la puissance de Molmo en IA multimodale
Molmo est une nouvelle famille de modèles d’IA multimodaux open-source qui surpasse les systèmes propriétaires sur divers benchmarks académiques. Grâce à des données de haute qualité collectées par des annotateurs humains, Molmo propose des interactions riches avec les mondes physique et virtuel. Ce projet vise à démocratiser l’accès à des modèles performants tout en ouvrant de nouvelles avenues pour les applications d’IA.
Points clés
- Molmo est une famille de modèles d’IA multimodaux open-source.
- Le modèle Molmo-72B surpasse des systèmes comme GPT-4o et Claude 3.5.
- Les données d’entraînement de Molmo sont basées sur des descriptions audio détaillées fournies par des annotateurs humains.
- Plus de 712 000 images ont été utilisées pour créer des légendes détaillées dans le dataset PixMo-Cap.
- Molmo a été évalué par plus de 870 annotateurs humains, réalisant plus de 325 231 comparaisons de préférences.
À retenir
Alors, si vous pensiez que les modèles d’IA étaient tous fermés et ennuyeux, Molmo vient prouver le contraire ! Avec sa capacité à rivaliser avec les géants tout en étant open-source, il pourrait bien devenir votre nouvel ami dans le monde de l’IA. Qui aurait cru qu’un modèle pouvait être à la fois intelligent et accessible ?
Sources