Comparer l’IA d’Apple à ChatGPT ou Claude est une erreur. Apple ne joue pas à ce jeu
À ceux qui excluent Apple dans la course à l’IA, soyez prudent. L’entreprise est peut-être arrivée tardivement et n’a certainement pas grand-chose à montrer aujourd’hui, mais son évolution au cours des trois dernières années révèle trois choses intéressantes. La première, c’est qu’Apple dispose de ses propres modèles d’IA. La seconde, qu’ils sont très loin en performances des meilleurs d’OpenAI et de Claude. Troisièmement, cela n’a peut-être aucune importance.
Trois ans d’évolution. La trajectoire des documents techniques partagés par Apple ces dernières années révèle une série de changements plus que pertinents. En 2024, sa proposition initiale se limitait à de petits modèles avec environ 3 milliards de paramètres (3B) spécialisés dans la résolution de tâches de base telles que la génération de Genmojis ou de résumés de texte. En 2025, l’entreprise a lancé son framework MLX à la communauté des développeurs pour faciliter l’intégration et l’utilisation de modèles locaux. Désormais, en 2026, ils proposent une infrastructure hybride basée sur un principe de base :
- Requêtes simples : elles s’exécutent en petits modèles locaux sur l’appareil, vous n’avez même pas besoin d’une connexion Internet
- Requêtes complexes : le système délègue la tâche à traiter dans le cloud en privé via Private Cloud Compute
Une (peut-être) bonne idée : la NAND peut vous aider. L’étape la plus importante de la nouvelle approche d’Apple réside dans la conception de son modèle AFM 3 Core Advanced. Dans les téléphones mobiles d’aujourd’hui, nous avons un gros goulot d’étranglement avec l’exécution de (grands) modèles d’IA performants, car ces appareils ont une quantité de mémoire très limitée (12 Go sur certains iPhones). Pour pouvoir adapter un modèle comportant 20 milliards de paramètres (20B), Apple a décidé de stocker ce modèle dans l’unité SSD interne, et non en mémoire.

Dans le modèle AFM 3 Core Advanced, les « experts » sont dans le SSD du mobile. Ils sont présélectionnés et chargés dans la RAM pour être utilisés dynamiquement, optimisant ainsi l’exécution du modèle.
Experts par invite, pas par jeton. Il active ensuite une série de techniques d’élagage (Instruction-Following Pruning, ou IFP) pour activer seulement entre 1 000 et 4 000 millions de paramètres de manière éparse (), un peu similaire à ce qui se fait dans les modèles à architecture Mixture-of-Experts. Mais Apple sélectionne ces experts au début de chaque invite, et non jeton par jeton, ce qui lui permet d’éviter la lenteur de la bande passante du stockage NAND du mobile par rapport à sa mémoire RAM.
Confidentialité par drapeau. Si l’approche d’Apple s’est démarquée dès le début par quelque chose, c’est par sa confidentialité, implicite lors de l’utilisation de modèles locaux. Mais si la requête est complexe, le système la redirige vers les modèles d’IA du cloud d’Apple, le Private Cloud Compute (PCC). Contrairement à d’autres plateformes et infrastructures comme celles d’OpenAI ou d’Anthropic, les conversations avec l’IA d’Apple sont cryptées et sont totalement privées selon l’entreprise : ces données ne sont pas partagées avec des tiers (car même Apple ne peut pas les voir) et elles ne sont pas utilisées pour entraîner ses modèles.

Cinq modèles avec l’aide de Gemini. Bien qu’Apple soit obsédée par le contrôle total de ses produits, elle a dû cette fois céder et s’allier à Google pour que ses modèles Gemini puissent « montrer » à Apple la voie. Le résultat est une troisième génération de modèles développés en collaboration avec la firme de Mountain View. Nous avons cinq modèles au total :
- AFM 3 Core : modèle de paramètres 3B dense
- AFM 3 Core Advanced : modèle clairsemé en paramètres 20B avec activation des paramètres 1B à 4B selon la tâche
- AFM 3 Cloud : un modèle puissant mais aussi efficace et rapide qui fonctionne sur le cloud d’Apple.
- ADM 3 Cloud (Image) : pour générer et éditer des images, le cœur de ces deux options et du nouveau Image Playground
- AFM 3 Cloud Pro : le modèle cloud le plus puissant d’Apple est destiné aux agents autonomes. Il a été formé avec les TPU Google et fonctionne sur les GPU Nvidia au sein de l’infrastructure Google Cloud.
La performance, un mystère. Contrairement à ce que font habituellement d’autres entreprises lorsqu’elles présentent leurs modèles, Apple n’a pas publié de métriques sur des benchmarks connus. Au lieu de cela, il affiche des mesures de « préférence humaine » dans lesquelles il compare la satisfaction des utilisateurs lors de l’utilisation de ses modèles par rapport aux modèles concurrents. Les comparaisons portent également sur les versions précédentes de ces modèles, ce qui ne précise pas grand-chose de ce que l’on peut en attendre.
Mais ils ne sont pas dans la course au meilleur modèle. En 2025, il y a eu une comparaison avec les modèles à poids ouvert de l’époque (Qwen-3-4B localement, GPT-4o ou Llama 4 Scout dans le cloud) et ils semblaient alors être à un bon niveau par rapport à ces options. Attendez-vous à ce qu’ils soient à l’origine des modèles les plus récents d’OpenAI, d’Anthropic ou de Google lui-même, et on ne sait pas exactement comment ils se comparent aux nouveaux modèles chinois de pondération ouverte. Une chose semble claire : Apple n’est pas très intéressé à avoir son propre Mythe, du moins pour le moment. Votre objectif est différent.

Les modèles Apple de 2026 sont plus « préférés » que ceux de 2025. Logique, mais également inutile pour comprendre à quel point ces modèles sont bons par rapport à la concurrence.
Mais l’intégration est importante. Le grand atout d’Apple pour compenser cette différence de capacité est que ses modèles ont un accès complet au système d’exploitation, aux applications et au matériel de l’utilisateur. Les modèles AFM sont intégrés aux capteurs de caméra iPhone, à l’historique des notifications ou aux autorisations des applications locales. Cela permet d’effectuer des tâches utiles qu’un LLM « déconnecté » du matériel pourra difficilement reproduire. Ici, l’intégration des modèles avec le matériel et le logiciel de l’appareil est (ou veut être) fondamentale.

Attention à la médiocrité. Cette approche axée sur l’intégration et la confidentialité est particulièrement frappante et différenciante par rapport à ses concurrents, mais elle comporte des risques. Entre autres, le produit est limité par ses capacités fonctionnelles par rapport à la concurrence. Si les modèles locaux ne résolvent pas le problème et que les modèles cloud ne se comportent pas non plus de manière fiable, Apple court le risque d’avoir une IA sécurisée et privée mais techniquement médiocre dans ses réponses. Siri a déjà été critiqué pour sa stupidité : Siri AI doit précisément éradiquer cette perception.
À Simseo | Apple a conçu Siri AI pour que nous puissions utiliser l’iPhone sans le toucher. Je fais la même chose sur mon téléphone Android depuis des mois.
