Políticas
1. Segurança dos dados
Backups (cópias de arquivos) dos usuários não são efetuadas. Assim, cada usuário deve tomar suas próprias precauções para a segurança de seus dados com relação a perdas acidentais.
Deve-se excluir os arquivos assim que obtiver os resultados necessários, afim de liberar espaço em disco.
Obs.: A critério da administração do cluster, os arquivos dos usuários com a conta expirada podem ser excluídos a qualquer momento.
2. Uso do ambiente
O acesso remoto somente poderá ser feito por meio de equipamentos internos ao campus da UFV, de Florestal ou de Rio Paranaíba com a utilização do protocolo ssh (Secure Shell).
O ambiente Cluster deve ser utilizado, preferencialmente, no modo lote (batch) e, preferencialmente, para processamento paralelo por conexão remota (ssh).
Não é permitido acesso interativo aos nós de cálculo, estando reservados para o processamento batch ou em lote.
3. Limites e filas
Atualmente temos duas filas para submissão de jobs: as filas ‘roteamento’ e ‘qtime’. Se nenhuma fila for especificada no script .pbs os jobs serão automaticamente submetidos para a fila ‘roteamento’. Os jobs submetidos para a fila ‘roteamento’ irão para a fila de execução ‘work’ e os jobs submetidos para a fila ‘qtime’ irão para a fila de execução ‘workt’.
Os jobs que vão para a fila ‘work’ devem executam em no máximo 3 meses (walltime máximo de 2160:00:00) enquanto os jobs que vão para ‘workt’ devem ser executados em até 3 dias (walltime máximo 72:00:00).
Ficam assim, definidas as demais políticas de recursos estabelecidas:
- Limite global:
- Cada usuário pode conter até 304 jobs em todas as filas do cluster, cumulativamente
- Cada job poderá solicitar somente 1 nó de cálculo
- Limites fila ‘roteamento’:
- Fila de roteamento de jobs
- Fila padrão que aloca jobs para a fila work
- Cada usuário pode conter até 96 jobs nesta fila
- Limites fila ‘work’:
- Cada usuário pode conter até 48 jobs nesta fila
- Nenhum job submetido à fila “work” possa solicitar mais de 24024 MB de memória
- Os jobs (em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 96 cpus
- Os jobs (em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 96Gb de RAM
- Não aceita submissão direta
- Walltime máximo: 2160:00:00
- Limites fila ‘qtime’:
- Fila de roteamento de jobs
- Fila que aloca jobs para a fila workt
- Cada usuário pode conter até 48 jobs nesta fila
- Limites fila ‘workt’:
- Cada usuário pode conter até 96 jobs nesta fila
- Nenhum job submetido à fila “work” possa solicitar mais de 24024 MB de memória
- Os jobs (em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 96 cpus
- Os jobs(em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 96Gb de RAM
- Não aceita submissão direta. Jobs devem ser submetidos para ‘qtime’
- Walltime mínimo: 00:00:01
- Walltime máximo: 72:00:00
- Limites da fila ‘high_mem’:
- Jobs requisitando no mínimo 25GB de memória RAM
- Os jobs (em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 64 cpus
- Os jobs (em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 512Gb de RAM
- Cada usuário pode conter até 2 jobs executando nesta fila
- Walltime máximo: 2160:00:00
4. Alocação e utilização de recursos no cluster
É extremamente importante a correta alocação e utilização do recursos do cluster. Por alocação de recursos entende-se o recurso (memória ou processador, por exemplo) que foi pedido no seu script PBS. Utilização é o recurso efetivamente utilizado quando o trabalho está em execução no cluster.
Apesar de ser salutar e aconselhável alocar “um pouco a mais” de recursos, evite alocar recursos “muito além” do necessário: isso causa fila desnecessariamente. E, principalmente, não utilize mais recursos que o alocado no PBS: isso causa problemas nos outros trabalhos que estão executando no mesmo nó, causando problema aos outros usuários. Neste último caso, quando identificados trabalhos que excedam os recursos alocados os mesmos serão deletados e o usuário notificado. Caso não seja possível notificar o usuário por e-mail ou via o próprio terminal, o acesso do usuário ao cluster será bloqueado por 10 minutos.
Veja os scripts ‘jinfo’, ‘sinfo’ e ‘hinfo’ na seção USO DO AMBIENTE que foram elaborados no intuito de auxiliar na especificação e monitoramento dos recursos utilizados.
5. Execução de processos no HeadNode (jupiter)
Não é permitido executar trabalhos diretamente no jupiter (todos os trabalhos devem ser submetidos em fila utilizando o PBS). Caso o usuário execute algum trabalho fora da fila o jupiter mata o processo e o acesso do usuário ao cluster será bloqueado por 10 minutos.
6. Compartilhamento de credenciais de acesso
O compartilhamento de credenciais de usuário é estritamente proibido.
Não daremos, em nenhuma hipótese, suporte para pessoas que não tenham conta ativa no cluster. O suporte somente será dado ao titular da conta. Todo usuário do cluster deve ter sua própria conta de utilizador.
Além disso, no mesmo sentido, fica proibido logins ativos em hosts diferentes. Múltiplos logins no mesmo host são permitidos.
7. Agradecimentos
Solicita-se aos autores de trabalhos desenvolvidos com o uso do Cluster da UFV que em suas publicações, na parte relativa aos “Agradecimentos” colocar:
Pesquisa desenvolvida com o auxílio do Cluster da UFV (Universidade Federal de Viçosa).
8. Contato
Críticas e sugestões para o aprimoramento desse texto são muito bem vindas.
Envie um e-mail para dti@ufv.br