surpasse le GPT-4o d'OpenAI sous plusieurs aspects

Meta vient de lancer son modèle d'intelligence artificielle (IA) le plus vaste et le plus avancé. On parle de Appel 3.1une proposition « open source » qui rivalise directement avec GPT-4o d'OpenAI et Claude 3.5 Sonnet d'Anthropic, les surpassant sur plusieurs benchmarks couramment utilisés par l'industrie pour évaluer les performances et l'efficacité de ces technologies.

Le nouveau modèle phare de l'entreprise de médias sociaux débarque sur Meta AI, l'assistant IA présent sur WhatsApp, Facebook et Instagram sur certains marchés, mais qui n'a toujours pas de date d'arrivée dans les pays qui composent l'Union européenne ( UE). Cependant, ceux qui disposent d’un matériel compatible peuvent le télécharger depuis n’importe où dans le monde pour l’utiliser localement.

Excellent en mathématiques, traduction et plus

On le sait, tous les modèles ne sont pas parfaits pour tout. Dans ce cas, nous trouvons une alternative qui, selon Meta, se démarque en matière de culture générale, de mathématiques, d'utilisation d'outils et de traduction multilingue. Comme nous pouvons le voir sur l'image ci-dessous, Appelez le 3.1 405B (405 000 millions de paramètres) se démarque sur plusieurs aspects par rapport à ses principaux concurrents.

But

Mais Llama 3.1 n’est pas seulement cet énorme modèle de langage. La société a également lancé des versions plus petites qui peuvent être très utiles pour un éventail de tâches plus spécifiques. Llama 3.1 70B cible la création de contenu, l'IA conversationnelle, la compréhension du langage et les applications d'entreprise. Cela peut aller du résumé de texte à la génération de code de programmation.

Llama 3.1 8B est la plus petite des alternatives. Avec 8 milliards de paramètres, il peut fonctionner sur des ordinateurs moins puissants. De son côté, il promet également d'être très utile dans le analyse et classification de textes. Ici, la rapidité des réponses se démarque. Nous ne savons pas combien de paramètres possède le nouveau GPT-4o mini d'OpenAI, mais ils pourraient probablement rivaliser dans la même catégorie de solutions.

L’approche ouverte de Llama 3.1

L'entreprise dirigée par Mark Zuckerberg travaille depuis un certain temps sur des modèles « open source », même si tout le monde n'est pas d'accord avec l'utilisation de ce terme. Certains soulignent que leur licence comporte des limitations qui ne permettent pas de la cataloguer de cette manière. Llama 3.1, justement, fait à nouveau appel à « l'open source », avec de nouvelles fonctionnalités au niveau de la licence.

Le dernier modèle de la société est disponible pour une utilisation gratuite, même à des fins commerciales, à moins que vous ne soyez exposé à des centaines de millions d'utilisateurs. Zuckerberg, en effet, a publié une lettre dans laquelle il souligne que « l’IA open source est la voie à suivre » et que les modèles open source s’améliorent de plus en plus et finiront par dépasser les modèles fermés à un moment donné.

Avoir la possibilité de télécharger un modèle présentant ces caractéristiques pour l’utiliser avec une certaine liberté n’est pas une mince affaire. La préparation de Llama 3.1 405B a nécessité plusieurs mois d'entraînement avec 16 000 cartes graphiques NVIDIA GPU H100. Meta a également publié les pondérations du modèle afin que les entreprises puissent l'entraîner avec des données personnalisées et l'ajuster à leurs propres besoins.

Au-delà du fait que des variantes de ce modèle peuvent fonctionner localement, nous vivons dans un monde où le cloud computing est une réalité. Déplacer un colosse de 405 milliards de paramètres Ce n’est pas quelque chose qui peut être fait avec n’importe quel matériel. Ici précisément, les clients professionnels pourront contracter divers services, tels qu'AWS, Google Cloud, Databricks ou Microsoft Azure.

Que se passe-t-il avec Meta dans l’UE ?

Nous assistons à l’intention de l’UE d’imposer des réglementations strictes à l’industrie de l’IA. Ce qui se passe, c’est que de nombreuses entreprises retardent leur lancement. Meta, protagoniste de cet article, a annoncé il y a quelques jours qu'elle ne lancerait pas son prochain modèle multimodal sur le territoire communautaire en raison du caractère imprévisible de l'environnement réglementaire européen.

Sam Altman a secrètement distribué des millions de dollars. Son objectif : la plus grande étude sur le revenu de base universel

Llama 3.1 est disponible dans le monde entier, donc les utilisateurs du Les pays membres de l'UE pourront l'utiliser, comme indiqué par l'entreprise. Ils ne pourront pas y accéder via certains outils qui, comme nous l’avons noté plus haut, n’ont pas encore officiellement débarqué dans l’UE, comme Meta AI. Nous devons attendre de voir comment évolueront les lancements de produits d’IA dans l’UE.

Images | But

À Simseo | Elon Musk alimente le « cluster d'IA le plus puissant au monde ». Un avec 100 000 GPU NVIDIA H100