Cluster de calculs

NODE	CPUs	Nb GPU	GPU	GPU Memory (GB)	RAM (GB)	Type de noeud
CAFE	28	1	A6000	48	50	Service
COCO	48	1	A5000	24	124	Calcul
ARABICA	64	1	A5500	24	124	Calcul
ROBUSTA	32	1	A6000	48	60	Calcul
CACAO	96	1	A100	80	288	Calcul
ITALIE	32	0			160	Calcul

PARTITION	LIMITE DE TEMPS	NOEUDS ACCESSIBLES	USAGE
RISTRETTO	12:00:00	cafe, coco, arabica, robusta	Mixte
ESPRESSO*	1-00:00:00	cafe, coco, arabica, robusta	Mixte
LUNGO	7-00:00:00	cafe, coco, arabica, robusta	Mixte
DEEP_LEARNING	7-00:00:00	cacao, cafe, robusta	Deep learning, haute utilisation de mémoire GPU
SEARCH_DATABASES	1-00:00:00	coco	Recherche dans des bases de données (partition SSD)
HIGH_MEMORY	1-00:00:00	italie	Besoin de beaucoup de mémoire RAM, calcul CPU

User commands		Environment		Job Specification
Job submission	sbatch [script_file]	Job ID	$SLURM_JOBID	Script directive	#SBATCH
Job deletion	scancel [job_id]	Submit Directory	$SLURM_SUBMIT_DIR	Queue	-p [queue]
Job status (by job)	squeue [job_id]	Submit Host	$SLURM_SUBMIT_HOST	Node Count	-N [min[-max]]
Job status (by user)	squeue -u [user_name]	Node List	$SLURM_JOB_NODELIST	CPU Count	-n [count]
Job hold	scontrol hold [job_id]	Job Array Index	$SLURM_ARRAY_TASK_ID	Wall Clock Limit	-t [min] OR -t [days-hh:mm:ss]
Job release	scontrol release [job_id]			Standard Output FIle	-o [file_name]
Queue list	squeue	Standard Error File	e [file_name]
Node list	sinfo -N OR scontrol show nodes	Combine stdout/err	(use -o without -e)
Cluster status	sinfo	Copy Environment	–export=[ALL \| NONE \| variables]
GUI	sview	Event Notification	–mail-type=[events]
				Email Address	–mail-user=[address]
Job Name	–job-name=[name]
Job Restart	–requeue OR --no-requeue (NOTE:configurable default)
Working Directory	–workdir=[dir_name]
Resource Sharing	–exclusive OR–shared
Memory Size	–mem=[mem][M\|G\|T] OR --mem-per-cpu=[mem][M\|G\|T]
Account to charge	–account=[account]
Tasks Per Node	–tasks-per-node=[count]
CPUs Per Task	–cpus-per-task=[count]
Job Dependency	–depend=[state:job_id]
Job Project	–wckey=[name]
Job host preference	–nodelist=[nodes] AND/OR --exclude=[nodes]
Quality Of Service	–qos=[name]
Job Arrays	–array=[array_spec] (Slurm version 2.6+)
Generic Resources	–gres=[resource_spec]
Licenses	–licenses=[license_spec]
Begin Time	–begin=YYYY-MM-DD[THH:MM[:SS]]

¶ Cluster de calculs CPU & GPU

¶ Comment accéder au noeud service du cluster ?

¶ Caractéristiques techniques

¶ Programmes

¶ Lancer un job

¶ Stockage

¶ Avec SBATCH

¶ Example pour lancer un script python.

¶ Utiliser un environnement conda

¶ AlphaFold

¶ job_script.sh

¶ GROMACS

¶ Colabfold

¶ RoseTTAFold

¶ For monomer structure prediction

¶ For complex modeling

¶ For PPI screening using faster 2-track version (example input and output are at example/complex_2track)

¶ SLURM example job

¶ Demander des GPUs spécifiques

¶ Nvidia A100 80 Go (PCIe)

¶ Commande interactive SRUN

¶ Efficacité des jobs

¶ seff

¶ reportseff

¶ jobstats

¶ Efficacité des jobs GPU

¶ Quand est-ce que mon job va se lancer ?

¶ Rappel des principales commandes utiles de SLURM

¶ FAQ

¶ Cluster de calculs CPU & GPU

¶ Comment accéder au noeud service du cluster ?

¶ Caractéristiques techniques

¶ Programmes

¶ Lancer un job

¶ Stockage

¶ Avec SBATCH

¶ Example pour lancer un script python.

¶ Utiliser un environnement conda

¶ AlphaFold

¶ job_script.sh

¶ GROMACS

¶ Colabfold

¶ RoseTTAFold

¶ For monomer structure prediction

¶ For complex modeling

¶ For PPI screening using faster 2-track version (example input and output are at example/complex_2track)

¶ SLURM example job

¶ Demander des GPUs spécifiques

¶ Nvidia A100 80 Go (PCIe)

¶ Commande interactive SRUN

¶ Efficacité des jobs

¶ seff

¶ reportseff

¶ jobstats

¶ Efficacité des jobs GPU

¶ Priorité des jobs (FAIR Share)

¶ Quand est-ce que mon job va se lancer ?

¶ Rappel des principales commandes utiles de SLURM

¶ FAQ