Science

Dans les tests d’infrence de l’IA, les GPU NVIDIA H100 ont tabli des records, les GPU A100 ont montr leur leadership en termes de performances et les Jetson AGX Orin ont domin l’informatique priphrique.

Pour leurs dbuts dans les tests d’IA standard MLPerf, les GPU NVIDIA H100 Tensor Core ont tabli des records mondiaux dans l’infrence sur toutes les charges de travail, fournissant jusqu’ 4,5 fois plus de performances que les GPU de la gnration prcdente.

Ces rsultats dmontrent que Hopper est le meilleur choix pour les utilisateurs qui exigent des performances maximales sur des modles d’IA avancs.

De plus, les GPU NVIDIA A100 Tensor Core et le module NVIDIA Jetson AGX Orin pour la robotique alimente par l’IA ont continu fournir des performances d’infrence de premier plan dans tous les tests MLPerf : reconnaissance d’image et de parole, traitement du langage naturel et systmes de recommandation.

Le H100, alias Hopper, a relev la barre des performances par acclrateur dans les six rseaux neuronaux du cycle. Il a dmontr sa supriorit en termes de dbit et de vitesse dans des scnarios distincts sur serveur et hors ligne.

L’architecture Hopper de NVIDIA a apport jusqu’ 4,5 fois plus de performances que les GPU de l’architecture Ampere de NVIDIA, qui continuent fournir le leadership global dans les rsultats MLPerf.

Grce en partie son Transformer Engine, Hopper a excell sur le modle populaire BERT pour le traitement du langage naturel. Il s’agit de l’un des modles d’IA MLPerf les plus importants et les plus gourmands en performances.

Ces benchmarks d’infrence marquent la premire dmonstration publique des GPU H100, qui seront disponibles plus tard cette anne. Les GPU H100 participeront aux prochains cycles de MLPerf pour l’entranement.

Les GPU A100 montrent leur leadership

Les GPU NVIDIA A100, disponibles ds prsent auprs des principaux fournisseurs de services de cloud computing et des fabricants de systmes, ont continu montrer leur leadership global en matire de performances sur l’infrence d’IA dans les derniers tests.

Les GPU A100 ont remport plus de tests que n’importe quelle autre solution dans les catgories et scnarios de centres de donnes et d’informatique priphrique. En juin, l’A100 a galement pris la tte des tests d’entranement MLPerf, dmontrant ainsi ses capacits dans l’ensemble du flux de travail de l’IA.

Depuis leurs dbuts en juillet 2020 sur MLPerf, les GPU A100 ont multipli leurs performances par 6, grce aux amliorations continues du logiciel NVIDIA AI.

NVIDIA AI est la seule plateforme permettant d’excuter toutes les charges de travail et tous les scnarios d’infrence MLPerf dans les centres de donnes et l’informatique priphrique.

Les utilisateurs ont besoin de performances polyvalentes

La capacit des GPU NVIDIA fournir des performances sur tous les principaux modles d’IA fait des utilisateurs les vritables gagnants. Leurs applications relles utilisent gnralement de nombreux rseaux neuronaux de diffrents types.

Par exemple, une application d’IA peut avoir besoin de comprendre la demande orale d’un utilisateur, de classer une image, de formuler une recommandation, puis de fournir une rponse sous forme de message oral avec une voix humaine. Chaque tape ncessite un type de modle d’IA diffrent.

Les benchmarks MLPerf couvrent ces charges de travail et scnarios d’IA populaires – vision par ordinateur, traitement du langage naturel, systmes de recommandation, reconnaissance vocale, etc. Ces tests garantissent aux utilisateurs des performances fiables et flexibles dployer.

Les utilisateurs se fient aux rsultats de MLPerf pour prendre des dcisions d’achat claires, car les tests sont transparents et objectifs. Les critres d’valuation bnficient du soutien d’un large groupe comprenant Amazon, Arm, Baidu, Google, Harvard, Intel, Meta, Microsoft, Stanford et l’Universit de Toronto.

Orin mne la danse la priphrie

Dans le domaine du Edge Computing, NVIDIA Orin a ralis tous les benchmarks MLPerf, remportant plus de tests que n’importe quel autre systme sur puce basse consommation. Et il a montr un gain de 50% en efficacit nergtique par rapport ses dbuts sur MLPerf en avril.

Lors du tour prcdent, Orin a t jusqu’ 5 fois plus rapide que le module Jetson AGX Xavier de la gnration prcdente, tout en offrant une efficacit nergtique moyenne 2 fois suprieure.

Orin intgre dans une seule puce un GPU d’architecture NVIDIA Ampere et un cluster de puissants curs de CPU Arm. Il est disponible ds aujourd’hui dans le kit de dveloppement NVIDIA Jetson AGX Orin et les modules de production pour la robotique et les systmes autonomes, et prend en charge l’ensemble de la pile logicielle NVIDIA AI, y compris les plates-formes pour les vhicules autonomes (NVIDIA Hyperion), les appareils mdicaux (Clara Holoscan) et la robotique (Isaac).

Large cosystme NVIDIA AI

Les rsultats de MLPerf montrent que NVIDIA AI est soutenu par l’cosystme le plus large du secteur de l’apprentissage automatique.

Plus de 70 soumissions dans ce tour ont fonctionn sur la plate-forme NVIDIA. Par exemple, Microsoft Azure a soumis des rsultats faisant tourner NVIDIA AI sur ses services cloud.

En outre, 19 systmes certifis NVIDIA ont t prsents par 10 fabricants de systmes, dont ASUS, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo et Supermicro.

Leur travail montre que les utilisateurs peuvent obtenir d’excellentes performances avec NVIDIA AI la fois dans le cloud et dans les serveurs fonctionnant dans leurs propres centres de donnes.

Source : NVIDIA

Et vous ?

Qu’en pensez-vous ?

Voir aussi :

Le limiteur Nvidia LHR officiellement craqu, apportant la pleine vitesse aux oprations de minage sur Windows et Linux

Les hackers derrire le piratage de Nvidia menacent de divulguer des informations plus confidentielles, moins que l’entreprise ne s’engage publier en open source ses pilotes

Le passage de Nvidia l’open source est officiel, la socit publie des modules du noyau GPU de Linux en open source avec une double licence GPL/MIT, pour amliorer le support des GPU sous Linux

Back to top button

Adblock Detected

Please consider supporting us by disabling your ad blocker.