Calcul

Soumettre un job

Vous pouvez soumettre un job de manière interactive ou via l’ordonnanceur (batch). Veuillez trouver ci-dessous les liens vers la documentation dédiée :

Queues à accès restreint

Pour certains types de job, il est prévu des queues à accès restreints. Leurs accès nécessitent donc la validation par le czar pour gérer les ressources du groupe. Pour plus de détails, veuillez consulter la documentation des queues.

Mon job reste en attente

  1. Vérifier d’abord si les ressources demandées ne dépassent pas les limites fixées pour la queue demandée (voir ici)

  2. Vérifier que vous avez les droits de soumettre des jobs dans la queue demandée

    • Par exemple, si vous voulez lancer des jobs huge :

      % qconf -sq huge | grep user_lists
      
    • Repérer le nom de user_lists (ici : hugequeue), puis tapez :

      % qconf -su hugequeue
      
    • Si votre login_name n’est pas dans la liste, vous n’êtes pas autorisé.

  3. Vérifier que vous appartenez au projet demandé

    • Vérifier la liste d’utilisateurs ayant accès au project demandé :

      % qconf -sprj P_<projectname> | grep acl
      acl <liste d'utilisateurs>
      xacl NONE
      
    • Vérifier que vous appartenez bien à cette liste d’utilisateurs :

      % qconf -su <liste d'utilisateurs>
      name <liste d'utilisateurs>
      type ACL
      fshare 0
      oticket 0
      entries <utilisateur1>,<utilisateur2>
      
  4. Parfois il faut juste attendre que les ressources soient à nouveau disponibles (voir l’utilisation des ressources).

  5. Il est enfin possible que vous avez été bloqué ou que vos ressources soient limitées : demander de l’aide au Support Utilisateur.

Informations sur les ressources de calcul

Les informations sur les ressources de la plateforme de calcul sont disponibles sur cette page.

Appartenance à plusieurs groupes

Il se peut qu’un utilisateur travaille dans deux expériences en même temps. Dans ce cas, il sera inscrit dans les groupes Unix correspondants aux deux expériences. Il appartient toujours à ces groupes Unix en même temps, mais son affiliation primaire détermine les accès aux différentes ressources de calcul et stockage.

Pour connaitre les affiliations de son propre compte, utilisez l’une des deux commandes :

% id
% newgroup --query

Pour modifier son affiliation primaire :

% newgroup <groupname>
% newgroup --temp <groupname>

Le gid Unix est aussi modifié, mais ce changement ne prendra effet que lors de la prochaine connexion. En général il faut attendre un peu pour que cette modification soit visible sur la totalité des stations.

L’option -–temp ajoutée à la commande permet de ne changer de groupe que temporairement et uniquement dans la session où la commande a été exécutée, tant que cette dernière est valide. Lors de la fermeture de cette session, le changement de groupe est annulé. Si l’on ouvre une autre session, alors que la première est toujours active, l’utilisateur se retrouvera dans son groupe d’origine et non le second groupe défini lors de l’exécution de la commande dans la première session.

L’option -–login est utilisée pour charger l’environnement de login du groupe considéré :

% newgroup --login <groupname>

Compiler du code CUDA

Pour compiler votre code CUDA, vous devrez vous connecter sur un serveur GPU interactive et executer ce qui suit :

% qlogin -l GPU=1 -q mc_gpu_interactive -pe multicores_gpu 4

Vous serez connecté en SSH sur le serveur, d’où vous pourrez compiler votre code avec le compilateur nvcc :

% /opt/cuda-9.2/bin/nvcc

Une fois le code compilé, nous vous conseillons de quitter le serveur interactif et soumettre vos jobs à partir d’une cca avec qsub.