7 juillet 2022

Article
7 min

Comment déployer l’intelligence artificielle dans le nuage public, le centre de données et la périphérie

Le premier défi consiste à comprendre où se trouvent vos données et la quantité de données dont vous disposez. Pour être efficace, votre débit informatique doit être à proximité de l’endroit où se trouvent vos données.

Expert CDW

Contenu
Conférencier principal lors de l’événement BTEX discutant de l’intelligence artificielle dans l’analyse des données

« Les dernières années ont donné lieu à une explosion des données », explique Michael Traves, architecte de solutions principal, CDW Canada, à l'Exposition sur les technologies d'affaires (BTEX) 2022 de CDW. « Il y a tellement plus de données dans de nombreux endroits différents, surtout si l’on compte sur l’Internet des objets (IdO) et les appareils mobiles. »

« Le pouvoir de calcul a également augmenté considérablement, en particulier avec les unités centrales graphiques. De plus, de nombreuses techniques ont vraiment évolué au point où elles peuvent tirer parti du matériel sous-jacent et des volumes de données que les gens peuvent maintenant analyser, corréler et en obtenir de l’information. »

Utilisations les plus courantes des unités centrales graphiques en intelligence artificielle

Calculs haute performance : « Nous constatons beaucoup d’adoption des unités centrales graphiques dans l’espace informatique haute performance (HPC) », explique M. Traves. « Cela peut signifier la mise en place des unités centrales graphiques dans les nœuds HPC existants pour permettre des capacités de calcul supplémentaires. Il peut s’agir d’ajouter des nœuds d’unités centrales graphiques dédiés à une grappe HPC existante pour exécuter ces types de charges de travail. »

Science des données : Dans la science des données et l’apprentissage automatique, il y a quelque chose appelé RAPIDS, que NVIDIA a mis sur le marché. Cet outil aide à accélérer les flux de travail de la science des données et de l’apprentissage automatique d’une manière qui n’était pas possible il y a quelques années.

Informatique virtuelle : Vous pouvez obtenir des instances avec des unités centrales graphiques sur demande dans le nuage (sous réserve de disponibilité). « Si elles sont disponibles, vous pouvez exécuter vos charges de travail sur elles au besoin et libérer cet actif coûteux lorsque vous n’en avez pas besoin », explique M. Traves. « Vous n’avez pas à consacrer de l’argent à l’infrastructure; vous pouvez simplement la rendre disponible sur demande dans l’un des nuages publics, en supposant que vos données puissent s'y trouver. »

Analyses de données : L’analyse accélérée par unités centrales graphiques et la visualisation interactive fournissent des perspectives plus approfondies, une corrélation dynamique et des résultats prédictifs beaucoup plus rapidement.

Défis liés au déploiement de l’intelligence artificielle

« Le premier défi consiste à comprendre où se trouvent vos données et la quantité de données dont vous disposez. », explique M. Traves. « Les données tendent à être parfois un point d’ancrage. Pour être efficace, votre débit informatique doit être à proximité de l’endroit où se trouvent vos données. »

« Lorsque vous traitez des données et que vous essayez de fournir un aperçu de celles-ci, nous devons également examiner les problèmes de sécurité qui les entourent. Dans de nombreux cas, les clients peuvent ne pas être en mesure de transférer des données vers un nuage public ou choisir de ne pas les déplacer parce qu’ils sont préoccupés par les risques qui pourraient en résulter. Comprendre ce qui doit changer dans les données devient une préoccupation. »

La haute disponibilité des données représente également une préoccupation. « Si le système tombe en panne, cela ne nuit pas vraiment à quoi que ce soit du point de vue de la production, mais ce que cela signifie pour des dizaines de chercheurs et de scientifiques des données, c’est qu’ils ne disposent pas de l’infrastructure dont ils ont besoin pour exécuter des charges de travail et il est possible que les tâches qui étaient en cours d’exécution devront être réexécutées, ce qui entraîne potentiellement des jours de travail perdus », explique M. Traves. Le fait que vos charges de travail couvrent plusieurs emplacements et centres de données représente une considération importante dans la conception, tandis que tirer parti du nuage public pour les applications destinées aux clients serait également une bonne idée.

N’oubliez pas l’aspect de l’alimentation et le refroidissement. « Au fur et à mesure que ces systèmes s’agrandissent encore et encore, et que vos besoins augmentent, vous constatez rapidement qu’il y a des défis à relever avec l’alimentation et le refroidissement des serveurs d’unités centrales graphiques, des salles de données classiques ou même des centres de données », explique M. Traves. Même de nombreuses grandes entreprises ne peuvent pas faire face à la quantité d’énergie requise pour l’alimentation et le refroidissement de ces systèmes et cherchent des installations de colocation spécialement conçues.

Il est 10 h de l’après-midi, savez-vous où se trouvent vos données?

Combien de données avez-vous? Pouvez-vous les mettre sur une clé USB ou un disque dur? Sont-elles dans un mini-entrepôt de données ou un entrepôt de données sur place, ou sont-elles stockées de façon sécuritaire dans le nuage?

« Si vous allez continuer à faire de la formation, alors à mesure que vos données changent, vous devrez rafraichir vos connaissances pour obtenir un meilleur modèle », explique M. Traves. « Donc, plus souvent les données changent, plus ce processus doit être continu. »

Partagez-vous des données brutes dans l’ensemble de l’organisation, ainsi que les résultats? Vous devez également accéder à ces ensembles de données dans un délai réaliste. « D’où allons-nous traiter ces données, d’où proviennent-elles? Est-ce dans un centre de données, dans le nuage public? Est-ce que je les génère hors d’un véhicule dans un appareil IdO? À quel point dois-je traiter mes données en périphérie, plutôt que de les expédier vers un emplacement central? », demande M. Traves.

Avec les véhicules autonomes, « Je pourrais devoir prendre une décision maintenant ou sinon la voiture tombe en panne. Il est donc beaucoup plus logique d’avoir un contexte de cette capacité à recueillir de nouvelles données et à communiquer avec les pairs, puis à être en mesure de les transférer vers un emplacement central. »

Gestion de vos charges de travail d’IA dans le nuage public, le centre de données ou la périphérie

« La capacité de tirer parti des outils de votre fournisseur de services en nuage public est très importante », explique M. Traves. « Les données doivent être là pour que cela se produise. Une fois qu’elles sont là et que vous êtes satisfait de la sécurité, être en mesure d’augmenter et de réduire vos besoins selon la demande est très puissant. Vous n’avez pas besoin d’investir dans l’équipement; vous pouvez investir dans des instances lorsque vous en avez besoin. »

« Cela est vraiment puissant pour l’inférence. C’est un peu moins puissant dans le cas de la formation, car vous voulez généralement que ces actifs fonctionnent à 100 pour cent pendant des jours. En outre, toute personne qui utilise 100 pour cent d’une instance de nuage sait que cela coûte beaucoup d’argent. C’est là que nous cherchons à faire des affaires dans les centres de données. »

Les centres de données représentent également un bon endroit pour les données que vous devez protéger s’il s’agit de répondre aux exigences de gouvernance. Toutefois, si vous utilisez des pétaoctets de données, il pourrait être justifié de construire des centres de données.

« Il est encore plus sensé d’examiner la possibilité d’utiliser un centre de colocation comme une extension de votre centre de données », explique M. Traves. « Une colocation que vous pouvez traiter comme votre propre centre de données, mais elle contourne le problème de l’alimentation et du refroidissement, car ce problème est le leur. Cela vous donne un accès rapide vers le nuage public, ce qui signifie que vous pouvez tirer parti de leurs outils et services pour exécuter vos données, mais vous pouvez gérer vos charges de travail localement sur ces systèmes à une utilisation de 100 pour cent et ne pas avoir à vous soucier de devoir traiter avec le fournisseur de nuage public. »

« À la périphérie, la prise de décision en temps réel est très importante », explique M. Traves. « Vous pourriez être dans un état déconnecté, alors vous devez gérer un modèle que vous avez, ainsi que les données contextuelles que vous recueillez. Vous gérez généralement celles-ci comme vous le faites avec une flotte et vous voulez que chaque élément de la flotte puisse communiquer entre eux, échanger des données et tirer parti de ce qui se passe près des capteurs eux-mêmes, sans avoir à retourner au siège social, quelque part. »

Dans tous les cas, la plupart des mises en œuvre d’IA fourniront des données à travers ces trois emplacements, de sorte que vos données ne résideront pas à un seul endroit.