Nvidia GTC 2025 Huang

GTC 2025: Nvidia révèle une nouvelle puce à la vraie architecture Rubin et Blackwell

Nvidia révéler La prochaine génération de puces pour l’intelligence artificielleen se concentrant sur la demande croissante de pouvoir de calcul. Pendant la conférence annuelle GTC À San Jose, le PDG Jensen Huang a présenté la puce Vera Rubinconçu pour répondre à l’appétit croissant pour des puces et des logiciels de plus en plus rapides.

Ici, en résumé, Huang a parlé de quoi d’autre dans son discours:

  • Blackwellla nouvelle architecture GPU qui promet des performances considérablement plus élevées pour l’intelligence artificielle, en particulier pour le raisonnement et les charges de travail d’inférence.
  • L’infrastructure AIy compris les centres de données et les réseaux, a été discuté comme un élément crucial, avec l’introduction de Dynamo Pour la gestion efficace des ressources e Spectre x pour l’évolutivité.
  • Nvidia étend ses solutions à l’Al Secteur des entreprises avec de nouvelles postes de travail DGX et des systèmes de stockage accélérés, et dans le domaine de robotique avec le modèle de fondation Groot N1outils de simulation Omniversé et cosmoset le moteur physique Newton développé en collaboration.

La présentation de Huang a mis en évidence l’engagement de Nvidia dans l’avancement de l’IA via le matériel, les logiciels et les plateformes pour différents secteurs.

Vera Rubin: une puce pour l’avenir

La puce Vera Rubin, nommée d’aprèsAstronomie américaine qui a découvert la matière noirepeut être développé dans les grappes de millions d’unités. Cela vous permettra de former des modèles à beaucoup plus grand et d’offrir des réponses plus sophistiquées à un plus grand nombre d’utilisateurs.

Huang a déclaré que Nvidia travaille sur les « limites de la physique » avec la nouvelle puce, que Il sera disponible dans la seconde moitié de 2026suivi d’une version « ultra » l’année suivante. Rubin sera équipé de la mémoire avancée et des capacités de réseautage, ainsi qu’un nouveau processeur conçu personnalisé.

Les points saillants concernant Vera Rubin

  • Composants renouvelés. La véritable architecture Rubin présente de nombreux composants complètement nouveaux:
    • Nouveau processeur avec double performance par rapport à Grâceplus grande mémoire et haut débit, avec une consommation de seulement 50 watts
    • GPU de nouvelle génération appel CX9
    • Nouveau réseau Smart Nic
    • Nouveau Mvlink
    • Nouveaux souvenirs HBM4
  • Mvlink 144: Le système Vera Rubin utilisera Mvlink 144ce qui signifie qu’il sera connecté à 144 GPU.
  • Évolutivité et performances: Vera Rubin promet une augmentation significative des performances par rapport aux générations précédentes:
    • le Flops de mise à l’échelle Ils sont estimés pour être 900 fois plus élevé à ceux de Hopper.
    • un est attendu Réduction remarquable du TCO (coût total de possession) Merci à Vera Rubin.
  • Stratégie de développement: L’exception du cadre (qui reste la même) vous permet de concentrer le risque de développement sur les nouveaux composants internes.
  • Feuille de route: Vera Rubin est comme la génération suivante de Blackwell et Blackwell Ultra dans la feuille de route annuelle de Nvidia pour l’architecture AI.

En résumé, Vera Rubin représente Un saut générationnel significatif dans l’architecture de calcul Nvidiaavec des composants renouvelés qui visent à augmenter considérablement les performances et l’efficacité des besoins futurs de l’intelligence artificielle à grande échelle.

La vision de Jensen Huang

Au cours de son discours, Huang a rassuré les investisseurs sur le fait que la poussée des investissements dans les infrastructures continuera de croître. « Presque partout dans le monde était faux », a déclaré Huang, soulignant que La demande de calcul et la loi sur l’échelle de l’IA sont plus résistantes et en fait hyper-accélérées.

Les infrastructures de calcul et de réseau évolueront considérablement pour répondre aux besoins futurs de l’intelligence artificielle à grande échelle. Le PDG de Nvidia, Jensen Huang, lors du GTC mars 2025, a décrit différentes tendances et développements clés:

  • Transition vers le calcul génératif: Il passe d’un modèle de calcul basé sur la récupération des données préexistantes à un modèle génératif, dans lequel l’IA comprend le contexte et génère des réponses. Cela nécessite une puissance de calcul beaucoup plus grande.
  • Avent de l’agent et de la physique: La prochaine vague d’IA sera caractérisée par des agents capables de percevoir, de raisonner, de planifier et d’agir, ainsi que par un agent physique qui comprend le monde à trois dimensions et les lois de la physique. Ces compétences augmenteront encore la demande de calcul.
  • Besoin de résoudre les problèmes de données, de formation et d’évolutivité: Pour faire progresser l’IA, il est essentiel de faire face aux défis liés à la disponibilité et à la génération de données, la formation efficace des modèles sans intervention humaine limite et l’évolutivité des ressources informatiques afin que davantage de ressources se traduisent par les plus intelligentes.
  • Augmentation exponentielle des exigences de calcul pour l’inférence: L’inférence, ou la génération de jeton par des « usines de jetons », est un processus fondamental qui nécessite une efficacité et des performances extrêmes. Les modèles d’agence et de raisonnement IA génèrent une quantité beaucoup plus importante de jeton que les modèles précédents, demandant une puissance de calcul radicalement plus élevée.
  • Architecture de calcul accélérée et évolutive: NVIDIA développe des architectures telles que Blackwell, qui offre une augmentation significative des performances par rapport à la génération précédente (Hopper) avec la même puissance. La transition de MVLink intégrée à MVLink désagrégé et refroidissement liquide vous permettent de créer des ordinateurs avec une énorme puissance de calcul dans un seul rack (un excimop). La future feuille de route fournit Blackwell Ultra, Vera Rubin et Rubin Ultraavec une augmentation continue des performances, de la mémoire et du haut débit.
  • Logiciel pour la gestion des « usines d’IA »: Des logiciels sophistiqués sont nécessaires comme Nvidia Dynamo, un « système d’exploitation » pour les usines d’IA, capable d’orchestrer et d’optimiser l’utilisation des ressources de calcul pour l’inférence, la gestion du parallélisme, du lot et du cache KV.
  • Réseaux à haut niveau et à faible latence: Pour l’évolutivité horizontale (échelle) sur de grands centres de données, l’utilisation de réseaux haute performance tels que Infiniband et spectre x. Nvidia investit également dans Silicon Photonics a été co-emballé pour surmonter les limites de puissance et d’évolutivité du transcneiver traditionnel, permettant la connexion de centaines de milliers ou même de millions de GPU.
  • Infrastructures pour différents secteurs: Nvidia développe une infrastructure selon les spécifications du cloud, de l’entreprise et de la robotique. Pour l’entreprise, de nouvelles postes de travail personnels (station DJX) et des plateformes de développement (DJX Spark) ont été annoncés sur la base d’architectures accélérées. Le stockage de données évoluera également vers des systèmes basés sur la sémantique et accélérés par le GPU.
  • Twins numériques pour la conception et l’optimisation du centre de données à: La complexité des usines d’IA nécessite l’utilisation de jumeaux numériques, tels que Nvidia Omniverse Blueprint, pour concevoir, simuler et optimiser l’efficacité énergétique et la mise en œuvre de ces grandes infrastructures à l’échelle.

En résumé, l’évolution des infrastructures de calcul et de réseau pour l’IA à grande échelle sera caractérisée par un Augmentation massive de la puissance de calcul du nœud, des réseaux à très grande vitesse et de faible latence pour l’évolutivité horizontale, à partir du logiciel de gestion des ressources intelligents et de l’adoption de jumeaux numériques pour la conception et l’optimisation des infrastructures.

NVIDIA prévoit un avenir dans lequel l’IA sera omniprésent et les infrastructures de calcul évolueront chaque année pour soutenir cette croissance.

Les trois défis de l’évolution de l’IA

Selon Jensen Huang dans son Keynote au GTC 2025, il y a Trois défis fondamentaux qui guide l’évolution de l’intelligence artificielle:

  • Comment résoudre le problème des données: L’IA est une approche informatique basée sur les données. Nécessite des données à partir desquelles apprendre, de l’expérience numérique pour acquérir des connaissances. Le défi consiste à trouver et à générer la quantité et la qualité des données nécessaires à la formation efficace des modèles d’IA.
  • Comment résoudre le problème de l’entraînement sans intervention humaine: L’intervention humaine dans le cycle de formation est limite en raison du temps disponible. L’objectif est de permettre à l’IA d’apprendre à des vitesses surhumaines et dans les escaliers qu’aucun humain ne peut correspondre. Par conséquent, il est crucial de développer des méthodes de formation qui réduisent ou éliminent la dépendance à l’intervention humaine directe. L’utilisation de Apprentissage du renforcement Avec des récompenses vérifiables, sur la base des problèmes résolus dans l’histoire humaine et la génération d’énormes quantités de données synthétiques, elles représentent des approches pour surmonter ce défi.
  • Comment grimper: Il est nécessaire de trouver un algorithme dans lequel, comme les ressources ont été fournies, l’IA devient plus intelligente. Cette «loi d’échelle» est fondamentale pour les progrès de l’IA. Récemment, il a été entendu que l’exigence de calcul de l’IA est nettement plus élevée que prévu, en particulier avec l’avènement deÀ l’agent et raisonnement. L’évolutivité nécessite donc non seulement plus de ressources de calcul, mais aussi des algorithmes et des architectures qui savent comment les exploiter efficacement.

Ces Trois défis interconnectés sont au centre du développement de l’IA Et ils guident la recherche et l’innovation dans les infrastructures de calcul, dans les méthodologies de formation et dans les architectures des modèles.

Conclusions

Malgré les défis, Nvidia continue de montrer une croissance impressionnante, Avec une augmentation du chiffre d’affaires de près de 80% sur un an à son quatrième trimestre. Avec l’introduction de puces innovantes et de technologies avancées, Nvidia est bien positionnée pour guider la prochaine vague d’innovation dans l’industrie de l’intelligence artificielle.