Qu’est-ce que le grid computing ?
Qu’est-ce que le grid computing ?
Le grid computing est une infrastructure de calcul qui combine des ressources de calcul réparties sur différents sites géographiques pour atteindre un objectif commun. Toutes les ressources inutilisées sur plusieurs ordinateurs sont regroupées et mises à disposition pour une seule tâche. Les organisations utilisent le grid computing pour effectuer des tâches de grande envergure ou résoudre des problèmes complexes qui sont difficiles à résoudre sur un seul ordinateur.
Par exemple, les météorologues utilisent le grid computing pour la modélisation météorologique. La modélisation météorologique est un problème exigeant en termes de calcul qui nécessite une gestion et une analyse complexes des données. Le traitement de quantités massives de données météorologiques sur un seul ordinateur est lent et prend du temps. C’est pourquoi les météorologues effectuent l’analyse sur une infrastructure de grid computing géographiquement dispersée et combinent les résultats.
Pourquoi le grid computing est-il important ?
Les organisations utilisent le grid computing pour plusieurs raisons.
Efficacité
Grâce au grid computing, vous pouvez décomposer une tâche énorme et complexe en plusieurs sous-tâches. Plusieurs ordinateurs peuvent travailler simultanément sur les sous-tâches, ce qui fait du grid computing une solution de calcul efficace.
Coût
Le grid computing fonctionne avec le matériel existant, ce qui signifie que vous pouvez réutiliser les ordinateurs existants. Vous pouvez faire des économies de coûts tout en accédant à vos ressources de calcul excédentaires. Vous pouvez également accéder de manière rentable aux ressources du cloud.
Flexibilité
Le grid computing n’est pas limitée à un bâtiment ou à un emplacement spécifique. Vous pouvez mettre en place un réseau de grid computing qui couvre plusieurs régions. Les chercheurs de différents pays peuvent ainsi travailler en collaboration avec la même puissance de supercalcul.
Quels sont les cas d’utilisation du grid computing ?
Voici quelques applications courantes de grid computing.
Services financiers
Les institutions financières utilisent le grid computing principalement pour résoudre des problèmes de gestion des risques. En exploitant les puissances de calcul combinées dans la grille, elles peuvent réduire la durée de la prévision des changements de portefeuille sur des marchés volatils.
Jeu
L’industrie du jeu utilise le grid computing pour fournir des ressources de calcul supplémentaires aux développeurs de jeux. Le système de grid computing divise les tâches importantes, notamment la création de modèles de jeu, et les répartit entre plusieurs machines. Ce système permet aux développeurs de jeux d'accélérer leur travail.
Divertissement
Certains films présentent des effets spéciaux complexes dont la création nécessite un ordinateur puissant. Les concepteurs d’effets spéciaux utilisent le grid computing pour accélérer le calendrier de production. Ils disposent d'un logiciel pris en charge par la grille qui partage les ressources de calcul pour rendre les graphiques des effets spéciaux.
Ingénierie
Les ingénieurs utilisent le grid computing pour effectuer des simulations, créer des modèles et analyser des conceptions. Ils exécutent des applications spécialisées simultanément sur plusieurs machines pour traiter des quantités massives de données. Par exemple, les ingénieurs utilisent le grid computing pour réduire la durée d’une simulation de Monte Carlo, un processus logiciel qui utilise des données passées pour faire des prédictions futures.
Quels sont les composants du grid computing ?
Dans le grid computing, un réseau d’ordinateurs travaille simultanément pour effectuer la même tâche. Les éléments suivants sont les composants d’un système de grid computing.
Nœuds
Les ordinateurs ou serveurs d’un système de grid computing sont appelés nœuds. Chaque nœud offre au réseau en grille des ressources informatiques inutilisées telles que le CPU, la mémoire et le stockage. Parallèlement, vous pouvez également utiliser les nœuds pour effectuer d'autres tâches non liées. Il n’y a pas de limite au nombre de nœuds dans le grid computing Il existe trois principaux types de nœuds : les nœuds de contrôle, de fournisseur et d'utilisateur.
L'intergiciel de grille
L'intergiciel de grille est une application logicielle spécialisée qui relie les ressources de calcul dans les opérations de réseau aux applications de haut niveau. Par exemple, il traite votre demande de puissance de traitement supplémentaire provenant du système de grid computing.
Il contrôle le partage par utilisateur des ressources disponibles pour éviter de submerger les ordinateurs de la grille. L’intergiciel de grid assure également la sécurité pour empêcher l’utilisation abusive des ressources dans le grid computing.
Architecture de grid computing
L'architecture de grille représente la structure interne des ordinateurs de grille. Les couches suivantes sont généralement présentes dans un nœud de grille :
- La couche supérieure est constituée d'applications de haut niveau comme une application permettant d'effectuer une modélisation prédictive.
- La deuxième couche, également appelée intergiciel, gère et alloue les ressources demandées par les applications.
- La troisième couche est constituée des ressources informatiques disponibles : CPU, mémoire et stockage.
- La couche inférieure permet à l’ordinateur de se connecter à un réseau de grid computing.
Comment fonctionne le grid computing ?
Les nœuds de grid et les intergiciels collaborent pour exécuter la tâche de grid computing. Dans les opérations de réseau, les trois principaux types de nœuds de réseau jouent trois rôles différents.
Nœud utilisateur
Un nœud utilisateur est un ordinateur qui demande des ressources partagées par d’autres ordinateurs dans le grid computing Lorsque le nœud utilisateur a besoin de ressources supplémentaires, la demande passe par l’intergiciel et est transmise aux autres nœuds du réseau de grid computing.
Nœud fournisseur
Dans le grid computing, les nœuds peuvent souvent passer du rôle d’utilisateur à celui de fournisseur.
Un nœud fournisseur est un ordinateur qui partage ses ressources pour le grid computing. Lorsque les machines fournisseurs reçoivent des demandes de ressources, elles exécutent des sous-tâches pour les nœuds utilisateurs, comme la prévision des prix des actions pour différents marchés. À la fin du processus, l'intergiciel recueille et compile tous les résultats pour obtenir une prévision globale.
Nœud de contrôle
Un nœud de contrôle administre le réseau et gère l’allocation des ressources de grid computing. L'intergiciel s'exécute sur le nœud de contrôle. Lorsque le nœud utilisateur demande une ressource, l'intergiciel vérifie les ressources disponibles et attribue la tâche à un nœud fournisseur spécifique.
Quels sont les types de grid computing ?
Le grid computing est généralement classé comme suit.
Calcul en réseau
L'informatique en grille rassemble des ordinateurs hautement performants. Elle permet aux chercheurs d'utiliser la puissance de calcul combinée des ordinateurs. Les chercheurs utilisent le grid computing pour effectuer des tâches gourmandes en ressources comme des simulations mathématiques.
Grille de récupération
Bien qu'elles soient similaires grilles de calcul, les grilles de récupération de CPU comportent de nombreux ordinateurs ordinaires. Le terme récupération décrit le processus de recherche de ressources informatiques disponibles dans un réseau d'ordinateurs réguliers. Tandis que les autres utilisateurs du réseau accèdent aux ordinateurs pour des tâches non liées à la grille, le logiciel de la grille utilise ces nœuds lorsqu'ils sont libres. La grille de récupération est également connue sous le nom de « CPU scavenging »ou « cycle scavenging ».
Grille de données
Une grille de données est un réseau de grid computing qui se connecte à plusieurs ordinateurs pour fournir une grande capacité de stockage de données. Vous pouvez accéder aux données stockées comme si elles étaient sur votre machine locale sans avoir à vous soucier de l'emplacement physique de vos données sur la grille.
Qu’est-ce que l’informatique distribuée ?
L’informatique distribuée désigne un système informatique dans lequel les composants logiciels sont partagés entre un groupe d’ordinateurs en réseau. Toutefois, les utilisateurs qui se servent du logiciel visualisent une seule interface cohérente. Par exemple, un moteur de recherche web est un système informatique distribué. Il vous permet de rechercher un site web spécifique en envoyant la requête à plusieurs serveurs.
Informatique distribuée comparée au grid computing
L'informatique distribuée vise à atteindre un seul objectif à la fois. En revanche, le grid computing n’agit pas de manière cohérente mais alloue des ressources sur son réseau pour de multiples sous-tâches connexes. Un système de grid computing peut être constitué de plusieurs systèmes informatiques distribués.
Qu’est-ce que le cluster computing ?
Le cluster computing écrit un système de réseau composé d’ordinateurs homogènes. Les ordinateurs homogènes possèdent le même matériel et les mêmes logiciels. Vous pouvez les connecter à un réseau local à haut débit pour créer un cluster d'ordinateurs qui exécute des tâches similaires. Un serveur centralisé contrôle et coordonne les machines.
Comparaison entre le cluster computing et le grid computing
Le cluster de calcul possède un matériel, des tâches et une structure de contrôle rigides et spécifiques. En revanche, le grid computing est flexible en termes de partage des ressources. Les ordinateurs d'un système de calcul en réseau travaillent de manière indépendante et ne sont pas obligés de partager les ressources. Ils disposent d'un gestionnaire de ressources qui partage les ressources inutilisées pendant l'exécution.
Comment AWS HPC fonctionne-t-il par rapport au grid computing ?
Le calcul haute performance (HPC) sur AWS est une pile de produits et de services que vous pouvez utiliser pour dépasser les limites du calcul conventionnel, notamment en termes de puissance de traitement, de mise en réseau et de gestion des systèmes de fichiers. Par exemple, vous pouvez réduire le temps de traitement des données et effectuer des recherches approfondies en utilisant les services suivants :
- Amazon Elastic Compute Cloud (Amazon EC2) stocke les charges de travail sur des environnements cloud sécurisés, évolutifs et très performants.
- AWS Batch programme et met à l’échelle des milliers de charges de travail informatiques sur les services AWS.
- Amazon FSx pour Lustre traite des jeux de données massifs à la demande et à grande échelle avec un système de fichiers hautement performant dont les latences sont inférieures à la milliseconde.
Lancez-vous dans le grid computing sur AWS en créant un compte gratuit dès aujourd’hui.