Atelier #3 : Grid'5000 - Prise en main et expérimentations Big-Data

Programme

Ce tutoriel propose de présenter l'utilisation de la plateforme Grid'5000 pour la réalisation d'expérimentations scientifiques, en particulier celles liées au Big-Data.

Grid'5000 est un instrument scientifique dédié à la recherche en Informatique dans les domaines des systèmes parallèles, larges échelles ou distribués, du calcul haute performance et du réseau. Cette plateforme met à la disposition de la communauté scientifique un ensemble de matériel et d'outils pour la réalisation d'expériences à large échelle. Grid'5000 donne la possibilité à ses utilisateurs de réserver des ressources matérielles abondantes et variées (une grande variété de CPU, GPU, et d'équipements réseau est disponible), tout en leur laissant la possibilité de les configurer selon leur besoin.

Nous proposons deux parties distinctes pour ce tutoriel. La première sera consacrée à la prise en main de Grid'5000, et offrira un panorama des outils et des possibilités de la plateforme. La seconde partie décrira les outils de Grid'5000 liés au stockage de grands volumes de données et à la réalisation d'expériences liées au domaine du Big Data.

Grid'5000 est financé par les acteurs majeurs de la recherche en Informatique française (Inria, CNRS, Conférence des Présidents d’Université , Renater, etc.).

Le site officiel de Grid'5000 est : https://www.grid5000.fr

Première Partie : Prise en Main de Grid'5000

Cette première partie sera consacrée à la prise en main de Grid'5000. Après une courte présentation de la plateforme, les utilisateurs apprendront comment créer un compte Grid'5000, et y accéder en configurant leur environnement SSH. Ils apprendront comment se connecter aux différents sites Grid'5000 et à découvrir, visualiser et réserver les ressources disponibles dans Grid'5000.

Le tutoriel présentera ensuite comment déployer un environnement personnalisé sur les noeuds Grid'5000, et devenir root Les utilisateurs pourront ainsi créer leur propre environnement d'expérimentation.

Pour participer à cette partie du tutoriel, les participants doivent connaître les bases de l'utilisation de Linux en ligne de commande et de SSH. Un ordinateur muni d'une connexion réseau est également nécessaire.

Deuxième Partie : Expérimentations Big Data dans Grid'5000

La deuxième partie du tutoriel est consacrée à la présentation des outils Big Data disponibles dans Grid'5000. Tout d'abord, les utilisateurs apprendront à réserver de larges volumes de stockage et à y transférer leur données. Ils apprendront ensuite à accéder à ces données depuis leur environnement d'expérimentation. Ensuite, les outils permettant le déploiement d'un Système de Fichier Distribués sur les noeuds Grid'5000 seront présentés.

Les participants n'ayant pas assistés à la première partie auront besoin d'un compte Grid'5000 et d'une connaissance minimale de l'utilisation de la plateforme.

Organisateurs