Article
4 min

Choisir la bonne infrastructure pour l’IA générative : 3 clés du succès

Pour tirer profit de l’intelligence artificielle, les organisations doivent éviter les pièges courants associés au choix de l’infrastructure qui soutiendra leur développement.

Personne se connectant à un ordinateur portable avec une projection aérienne de l’écran de verrouillage sous forme abrégée.

L’intelligence artificielle générative en est arrivée à ce que Jensen Huang, PDG de NVIDIA, a récemment appelé le « moment iPhone » pour l'IA. 

Il existe des applications utiles, parfois révolutionnaires, dans presque tous les secteurs, et les chefs de file de chaque entreprise réfléchissent à la façon de mettre en œuvre l’IA générative au sein de leurs entreprises. Pourtant, de nombreuses entreprises ont du mal à développer efficacement leurs initiatives en matière d’IA. L’infrastructure est l’un des principaux obstacles : trop souvent, les organisations informatiques tentent de bâtir l’IA sur la même infrastructure qui prend en charge les charges de travail courantes de l’entreprise.

Ce que beaucoup ne réalisent pas, c’est que l’IA générative impose des exigences uniques aux ressources informatiques et que le fait d’avoir une infrastructure qui n’est pas optimisée pour la formation et la personnalisation des modèles d’IA peut étouffer l’innovation en science des données et retarder la mise sur le marché. Pour éviter ces pièges, les responsables des TI et les dirigeants d’entreprises doivent tenir compte de trois facteurs clés. 

1. L’inefficacité du développeur vous coûte cher

Pour tirer le meilleur parti de leur temps, les développeurs d’IA et les scientifiques des données doivent bénéficier d’une expérience utilisateur aussi simple que d’appuyer sur un bouton. Ces utilisateurs n’ont pas besoin de connaître l’infrastructure (ni même de s’en soucier); ils veulent simplement construire des prototypes, expérimenter et obtenir des modèles prêts pour la production à plus brève échéance. Ils ont besoin d’une interface utilisateur simplifiée et d’outils qui facilitent le démarrage grâce à des modèles préformés et prêts à personnaliser, offrant une base solide permettant d’assurer un démarrage plus rapide. Une telle plateforme informatique devrait aider à rationaliser le développement de modèles, permettant ainsi aux développeurs d’accéder aux ressources sans avoir à se soucier de l’infrastructure. 

Pourquoi leur productivité est-elle essentielle? Pourquoi ne peuvent-ils pas utiliser les mêmes ressources informatiques qu’ils utilisent aujourd’hui? Les talents en science des données ne sont pas bon marché et il peut être difficile de les conserver. Lorsqu’ils attendent des ressources, l’entreprise brûle essentiellement de l’argent. Les charges de travail qui ne devraient prendre que quelques heures à exécuter peuvent prendre des jours. Beaucoup dépensent jusqu’à un mois de travail de « bricolage » sur leur pile de logiciels pour être en mesure de fonctionner sur l’infrastructure qui leur est fournie. Un dollar dépensé sur une infrastructure classique et non optimale pourrait en fait vous en coûter trois, si cette infrastructure fait travailler vos développeurs au ralenti ou les oblige à fournir des efforts qui n’ajoutent aucune valeur, par exemple la réingénierie de la pile de logiciels visant à rendre cette infrastructure utilisable.

2. Infrastructure-service (IaaS) c. plateforme-service (PaaS)

Lors de l’approvisionnement en ressources d’IA, de nombreux responsables informatiques se tournent instinctivement vers les offres d’infrastructure-service (IaaS), accédant aux instances d’un serveur sans système d'exploitation dans le nuage, au prix le plus bas possible par heure d’unités centrales graphiques (Graphics processing unit, GPU) Cela est compréhensible, étant donné la façon dont les organisations se sont habituées à approvisionner des ressources destinées aux charges de travail d’entreprise plus classiques. Cependant, lorsqu’il s’agit d’IA, il est souvent plus logique de remonter la pile et d’adopter une plateforme d’IA à pile complète.

Les plateformes optimisées pour l’IA comprennent l’infrastructure adéquate, comme des grappes multinœuds de ressources d’unités centrales graphiques (Graphics processing unit, GPU) interconnectées dotées d’une bande passante ultra-élevée et un réseau à faible latence. Elles comprennent également un centre de flux de travail de développeur qui isole les équipes de la complexité de l’infrastructure, tout en leur permettant de collaborer, de partager leur travail et d’affecter dynamiquement des ressources à plusieurs projets à la fois. De plus, pour lancer des projets, elles comprennent également des bibliothèques de science des données accélérées, des cadres d’IA optimisés et même des modèles préformés qui favorisent la productivité.

3. Combler les lacunes d’expertise en IA

Les experts en IA peuvent être extrêmement difficiles à trouver et coûteux à retenir. Pour certaines organisations, les experts en IA ne sont essentiellement pas disponibles à n’importe quel prix. Comme l’IA d’entreprise constitue un domaine émergent caractérisé par une technologie non prise en charge et non éprouvée, les entreprises d’aujourd’hui doivent pouvoir compter sur un soutien et un accès de qualité offerts 24 heures sur 24, 7 jours sur 7, par des praticiens qui maîtrisent l’IA et qui savent comment résoudre les problèmes.

Il s’agissait d’une considération importante alors que NVIDIA développait la plateforme DGX™ et c’est pourquoi NVIDIA met son expertise en IA à la disposition de chaque client DGX, sur demande, pour les aider à obtenir de meilleurs résultats, plus rapidement. Cette expertise peut aller de la résolution des problèmes liés à l’optimisation des modèles afin de favoriser des cycles de formation plus rapides à la recherche de la source des incompatibilités logicielles qui causent une panne des tâches de formation. Une plateforme à pile complète qui comprend un accès intégré à l’expertise en IA peut aider à garantir que les applications sont livrées sur le marché rapidement et de manière rentable.

Article de Tony Paikeday, directeur principal des systèmes d’IA chez NVIDIA et responsable de la mise en marché de la plateforme DGX de NVIDIA. Dans le cadre de ses fonctions, Tony aide les entreprises à infuser leurs entreprises de la puissance de l’IA grâce à des solutions d’infrastructure qui leur permettent de bénéficier de perspectives plus rapides à partir des données. Tony travaillait auparavant chez VMware, où il occupait le poste de responsable de la mise sur le marché de solutions de virtualisation des ordinateurs de bureau et des applications, ainsi que des technologies habilitantes clés, y compris la virtualisation d’unités centrales graphiques (Graphics processing unit, GPU) et le centre de données défini par logiciel.

Tony Paikeday

Directeur principal des systèmes d’IA chez NVIDIA
Responsable de la mise en marché de la plateforme DGX de NVIDIA. Dans le cadre de ses fonctions, Tony aide les entreprises à infuser leurs entreprises de la puissance de l’IA grâce à des solutions d’infrastructure qui leur permettent de bénéficier de perspectives plus rapides à partir des données. Tony travaillait auparavant chez VMware, où il occupait le poste de responsable de la mise sur le marché de solutions de virtualisation des ordinateurs de bureau et des applications, ainsi que