slurm作业调度系统分为srun 、sbatch 、salloc 3种作业提交方式
作业提交方式 | 使用方式 | 优点 | 缺点 | 试用场景 |
---|---|---|---|---|
srun交互式提交 | srun+资源申请+程序运行命令 | 快捷简单 | 终端与集群断开连接,作业将会中断 | 前期作业调试 |
srun -J test -p q_cn -c 1 python hello.py | 程序输出直接打印到屏幕,便于观察程序的运行日志和错误信息 | |||
sbatch批处理式提交 | 作业提交参数写在脚本run.slurm,执行sbatch run.slurm提交作业 | 计算稳定,作业交由计算节点控制,与终端状态无关 | 需要写几行脚本,略繁琐 | 正式计算 |
批量式提交 | ||||
salloc分配式提交 | salloc+资源申请 | 持续占用节点,不用重复排队(不退出会一直计费) | 终端与集群断开连接,作业将会中断 | 大量同规模的作业要提交但不想重复排队 |
sallloc -J test -p q_cn -c 1 | 实时从屏幕看到程序的输出 | |||
备注:任务默认期限为2天,如果想延长更长的时间 可联系管理员申请 |
© 2023 by Personal Life Coach. Proudly created with Wix.com ICP备案号:京ICP备18029179号