Skip to Content

Foire Aux Questions - batch

Version imprimable
Pour soumettre votre script.
qsub script.sh
Soumettre un job 10 fois.
qsub -t 1-10 job.sh
Soumettre des jobs sur la file par défaut. A charge pour SGE de soumettre le job sur un noeud de calcul disponible.
qsub -q long.q sge_blast.sh
Soumission sur un noeud particulier d'une file connue
qsub -q long.q@n46 sge_blast.sh
Soumettre un job sur un noeud particulier.
qsub -l hostname=n55 sge_clustal.sh
Dans un groupe de machines.
qsub -q "*@@allhosts" sge_blast.sh
Soumettre un job sur la file long.q mais sur les noeuds disposant du plus de mémoire. On utilise la ressource big_mem (ciblant les noeuds ayant plus de 8Go de mémoire RAM).
qsub -l big_mem -q long.q sge_blast.sh
Version imprimable
Afficher les noeuds de calcul disponibles et leurs ressources.
qhost



Afficher les groupes de noeuds de calcul

qconf -shgrpl



Afficher l'état des files d'attente.

qstat
qstat -u "*"
qstat -f
qstat -g c


Afficher les jobs en attente pour l'utilisateur martin
qstat -u martin -s p



Afficher les jobs en cours de traitement pour l'utilisateur martin

qstat -u martin -s r


Afficher l'état d'un job en erreur (la ligne error peut indiquer la raison de non soumission si le job est en mode Eqw)
qstat -j 165432


Signification des flags sur l'état de la file issu de qstat -f.

a(larm), A(larm), C(alendar suspended), s(uspended), S(ubordinate), d(isabled), D(isabled), E(rror)
Version imprimable
Supprimer le job numéro 12.
qdel 12
Supprimer tous les jobs de l'utilisateur dont le login est "martin".
qdel -u martin
Forcer la suppression du job numéro 12.
qdel -f 12
Version imprimable

Par défaut tous les jobs ont la même priorité (0) dans une file. La
politique actuelle repose une modèle de partage (Fair Share Scheduling) qui équilibre la charge sur une fenêtre glissante de 7 jours.

Pour basculer les jobs d'un utilisateur de la file courante vers une nouvelle file (newshort.q)
qalter -u martin -q newshort.q 
Version imprimable

Cannot execute binary file.

Vérifier que l'on a bien 
#! /bin/bash en première ligne du shell



Job XXXX (xxxx.sh) Aborted:
failed assumedly after job because:
job XXXX died through signal USR1 (10)
Vous avez soumis votre job à la queue short.q dont le temps d'execution est limitée à 4h. Celui-ci étant dépassé, le job a été tué par le gestionnaire de queue. 
Vous pouvez soumettre à nouveau votre job sur la queue long.q
Version imprimable

Il y a 4 files principales sont : short.q, long.q, infinit.q, web.q


short.q
c'est la file par défaut si aucune option n'est demandée
elle doit être utilisée pour les jobs dont la durée d'exécution est inférieure à 12 h
limites : 43% des ressources totales soit 214 slots (coeurs, sur 496 actuels), 100 slots max par utilisateur.


long.q
elle est demandée par l'option -q long.q
elle doit être utilisée pour les jobs dont la durée d'exécution est inférieure à 5 jours
limites : 77% des ressources totales soit 362 slots, 150 slots max par utilisateur.


infinit.q
elle est demandée par l'option -q infinit.q
elle doit être utilisée pour les jobs dont la durée d'exécution est supérieure à 5 jours
limites : 23% des ressources totales soit 112 slots, 50 slots max par utilisateur.


web.q
elle est utilisée par les applications web demandant des ressources de calculs
limites : 7% des ressources totales soit 32 slots, elle est accessible uniquement à l'utilisateur apache