Políticas

1. Segurança dos dados

Backups de Dados de Usuário: A DTI não realiza backups dos arquivos dos usuários. O usuário juntamente com o líder são responsáveis pela segurança e backup de dados do projeto, enquanto a conta estiver ativa, adotando medidas contra perdas acidentais.

Exclusão Periódica de Arquivos: Os usuários devem revisar e excluir periodicamente arquivos desnecessários ou obsoletos no diretório home e estruturas de compartilhamento. A exclusão periódica promove a eficiência do Cluster/UFV e dos recursos disponíveis e conformidade com a LGPD ao minimizar o armazenamento de dados sensíveis.

Obs.: A critério da administração do cluster, arquivos vinculados a contas expiradas poderão ser excluídos a qualquer momento, sem aviso prévio. Recomenda-se que os usuários realizem a migração ou salvamento de dados antes do encerramento da conta.

2. Uso do ambiente

O ambiente de processamento de alto desempenho é acessível exclusivamente por usuários autorizados, conectados a partir de redes institucionais da UFV. O acesso remoto está disponível por meio de canais internos protegidos, com autenticação e controle de permissões.

Para garantir a segurança e a integridade dos recursos computacionais, o uso do cluster deve ocorrer preferencialmente por meio de submissão de tarefas (jobs) em modo não interativo (batch), especialmente para aplicações paralelas. O acesso direto aos nós de cálculo é proibido, sendo reservado exclusivamente para execução de tarefas em lote.

3. Limites e filas

O ambiente conta com três filas de execução principais: work, workt e high_mem, cada uma com características específicas. Se nenhuma fila for especificada no script .pbs os jobs serão automaticamente submetidos para a fila ‘roteamento’.

A submissão de jobs quando ocorre por meio de filas de roteamento, encaminham as tarefas conforme o perfil de uso:

  • jobs submetidos para a fila ‘roteamento’ irão para a fila de execução ‘work’
  • jobs submetidos para a fila ‘qtime’ irão para a fila de execução ‘workt’.
  • a fila ‘high_mem’ aceita submissão direta mas é mais restrita quando aos recursos disponíveis

Os jobs que vão para a fila ‘work’ devem executam em no máximo 3 meses (walltime máximo de 2160:00:00) enquanto os jobs que vão para ‘workt’ devem ser executados em até 3 dias (walltime máximo 72:00:00).

Tipo de Fila Nome Submissão Direta Walltime Máximo Perfil de Uso
Roteamento roteamento Sim 2160:00:00 Encaminha para work
Roteamento qtime Sim 72:00:00 Encaminha para workt
Execução work Não 2160:00:00 Jobs de longa duração
Execução workt Não 72:00:00 Jobs curtos ou testes
Execução high_mem Sim 2160:00:00 Jobs com alto consumo de memória RAM

Ficam assim, definidas as demais políticas de recursos estabelecidas:

Limite global:

  • Cada usuário pode conter até 304 jobs em todas as filas do cluster (em todas as filas, somados)
  • Cada job poderá solicitar apenas 1 nó de cálculo

Fila de Submissão: roteamento

  • Fila padrão para encaminhamento à fila work.
  • Cada usuário pode manter até 96 jobs nesta fila.

Fila de Execução: work

  • Submissão direta não permitida.
  • Cada usuário pode manter até 48 jobs nesta fila.
  • Cada job pode requisitar até 24024 MB de memória RAM.
  • Limites cumulativos por usuário:
    • Até 96 CPUs alocados (em fila + execução).
    • Até 96Gb de RAM (em fila + execução).
  • Walltime máximo: 2160:00:00 (3 meses).

Fila de Submissão: qtime

  • Fila de roteamento para jobs de curta duração.
  • Encaminha os jobs para a fila workt.
  • Cada usuário pode manter até 48 jobs nesta fila.

Fila de Execução: workt

  • Submissão direta não permitida.
  • Cada usuário pode manter até 96 jobs nesta fila.
  • Cada job pode requisitar até 24024 MB de memória RAM.
  • Limites cumulativos por usuário:
    • Até 96 CPUs (em fila + execução).
    • Até 96Gb de RAM (em fila + execução).
  • Não aceita submissão direta. Jobs devem ser submetidos para ‘qtime’.
  • Walltime obrigatório.
  • Walltime máximo: 72:00:00 (3 dias).

Fila de Execução: high_mem

  • Jobs requisitando no mínimo 25GB de memória RAM
  • Os jobs (em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 64 cpus
  • Os jobs (em fila e execução) de cada usuário podem, cumulativamente, alocar no máximo 512Gb de RAM
  • Cada usuário pode conter até 2 jobs executando nesta fila
  • Walltime máximo: 2160:00:00

4. Alocação e Utilização de Recursos no Cluster

É extremamente importante a correta reserva e utilização dos recursos computacionais nos jobs submetidos ao cluster de modo a garantir o desempenho, a estabilidade e a equidade no uso do ambiente de alto desempenho.

  • Reserva de recursos refere-se aos parâmetros definidos no script de submissão (.pbs), como quantidade de memória, número de CPUs e tempo de execução (walltime).
  • Utilização de recursos corresponde ao consumo real durante a execução do job no cluster.

Embora seja recomendável reservar uma margem de segurança ao alocar recursos – especialmente RAM para evitar falhas por insuficiência – é importante evitar excessos. A superalocação injustificada contribui para o aumento das filas e compromete a eficiência do sistema. É estritamente proibido que um job utilize mais recursos do que os especificados no script de submissão. Essa prática afeta diretamente os demais usuários, podendo causar instabilidade nos nós compartilhados. Jobs que excederem os recursos alocados serão imediatamente finalizados.

Para auxiliar na correta especificação e acompanhamento dos recursos utilizados, recomenda-se o monitoramento regular do andamento do job, conforme detalhado na Seção Uso do Ambiente.

5. Execução de processos no Head Node

O nó principal do cluster é reservado exclusivamente para tarefas administrativas, transferência de arquivos, submissão de jobs e monitoramento do ambiente. Não é permitido executar aplicações ou trabalhos diretamente neste nó, sob nenhuma circunstância.

Todos os processos devem ser submetidos por meio do sistema de filas utilizando scripts compatíveis com o gerenciador PBS. A execução direta de aplicações no head node compromete a estabilidade do ambiente e prejudica o desempenho global do cluster.

Caso seja detectada a execução de processos fora das filas no nó principal:

  • O sistema encerrará automaticamente o processo indevido.
  • O acesso do usuário ao cluster será temporariamente bloqueado como medida preventiva.
  • Os administradores serão notificados e o evento será tratado como um incidente de segurança.

Essa política visa preservar a integridade dos recursos compartilhados, garantir a disponibilidade do ambiente e promover o uso responsável da infraestrutura de alto desempenho.

6. Compartilhamento de Credenciais de Acesso

O uso responsável e seguro da infraestrutura de processamento da UFV exige o cumprimento rigoroso das políticas de autenticação e identidade digital.

  • Sigilo das credenciais: Manter o sigilo de suas credenciais de acesso, que são pessoais e intransferíveis, destinadas exclusivamente ao uso pelo titular da conta vinculada. O compartilhamento de credenciais é proibido e qualquer uso indevido decorrente de violação desta norma será de responsabilidade exclusiva do solicitante.
  • Contas Individuais: Cada usuário deve possuir uma conta individual no Cluster/UFV. O compartilhamento de credenciais é estritamente proibido, até mesmo entre membros do mesmo projeto.
  • Suporte Restrito ao Titular da Conta: O suporte prestado pela DTI, como dúvidas de utilização ou instalações de softwares é fornecido exclusivamente ao titular da conta. Não haverá suporte de uso do ambiente para pessoas sem conta ativa no Cluster/UFV.

7. Citação ao Cluster/UFV

Solicita-se que os autores de trabalhos ou publicações acadêmicas (artigos, teses, relatórios e outros) desenvolvidas direta ou indiretamente com o uso do Cluster/UFV incluam, na seção de “Agradecimentos” ou equivalente de suas publicações, a seguinte menção:

Pesquisa desenvolvida com o apoio do Cluster da UFV (Universidade Federal de Viçosa).

A citação deve ser feita em português e, se necessário, traduzida para o idioma da publicação.

8. Contato

Críticas construtivas e sugestões para o aprimoramento deste material são sempre bem-vindas. Para isso, solicitamos que seja aberto um chamado no Sistema de Abertura e Acompanhamento de Chamados da DTI, onde sua contribuição será devidamente registrada e avaliada pela equipe responsável.

© 2020 Universidade Federal de Viçosa - Todos os Direitos Reservados