Politiche di Utilizzo del Sistema¶
Qui definiamo le politiche per il corretto utilizzo dei sistemi del SSC. Questa non è affatto un elenco esaustivo, ma copre punti critici di interesse per gli utenti, come l'utilizzo dei sistemi condivisi, l'utilizzo dello spazio temporaneo e la politica del programma batch.
Utilizzo Consentito¶
Il Sapienza Supercomputer Center mantiene server, cluster e siti web progettati per i ricercatori, il personale della facoltà, i loro studenti e collaboratori esterni. Tutti gli utenti dei sistemi SSC sono tenuti a conformarsi a TUTTE le politiche di Sapienza, nonché a tutte le politiche di SSC esplicitamente indicate qui e implicitamente. In altre parole, solo perché puoi fare qualcosa, non significa che dovresti farlo.
Il SSC applica le politiche UBIT
Ti preghiamo di consultare la Politica di Utilizzo dei Computer e della Rete di Sapienza, poiché le politiche dell'Università si applicano anche a tutte le risorse SSC.
Uso Improprio dei Sistemi e Abuso dell'Account¶
Ci riserviamo il diritto di disabilitare qualsiasi account, senza preavviso, che stia causando problemi internamente, esternamente o che stia violando le politiche di Sapienza, le politiche del SSC e/o le leggi Italiane. Gli utenti che commettono tali infrazioni possono essere segnalati all'ufficiale della sicurezza informatica di Sapienza o alle autorità competenti.
NON Condividere gli Account!
Gli account Sapienza e SSC NON DEVONO ESSERE CONDIVISI con nessuno. Non c'è motivo di condividere la tua password, credenziali di autenticazione o chiavi SSH con nessuno. Farlo comporterà la disattivazione del tuo account SSC e la segnalazione delle tue azioni all'ufficio di sicurezza informatica dell'Università.
Sapevi che? Il SSC offre spazio di archiviazione per progetti di gruppo per condividere dati in modo sicuro e può lavorare con il tuo gruppo per supportare questa collaborazione. NON condividere il tuo account con nessuno.
Tentativi di eludere le politiche
Sistema Fairshare per la pianificazione dei lavori batch:
Il sistema di accodamento batch dei cluster è progettato per dare a tutti una possibilità equa di ottenere il massimo livello di throughput per i propri lavori. Tentare di eludere la coda o il sistema fairshare (cioè saltare in testa alla fila) è severamente vietato e comporterà la disattivazione del tuo account e possibili azioni disciplinari da parte dell'ufficio di sicurezza informatica di Sapienza. Vedi di seguito per ulteriori informazioni su questa politica.
Politica della cartella di Scratch
Il SSC fornisce spazio di archiviazione temporanea gratuito e ad alta capacità per l'uso durante l'esecuzione dei tuoi lavori. Tuttavia, questo è spazio di archiviazione TEMPORANEA destinato all'archiviazione transitoria mentre i lavori sono in esecuzione. Gli utenti sono tenuti a spostare i loro dati da /local
nella loro home directory o nella directory del progetto al termine del loro lavoro. Qualsiasi dato più vecchio di 60 giorni viene eliminato automaticamente ogni notte. Qualsiasi tentativo di modificare le date dei file per eludere intenzionalmente questa politica è vietato. Abbiamo script sofisticati che monitorano i tentativi di eludere il sistema. Gli utenti che violano questa politica rischiano che TUTTI i loro dati in /local
vengano eliminati senza preavviso e la disattivazione dell'account. Vedi di seguito per ulteriori informazioni su questa politica.
Avviso
La violazione delle politiche del SSC è una violazione delle politiche di utilizzo e informatica di Sapienza. Gli autori possono essere segnalati all'ufficio di sicurezza informatica dell'Università per procedure disciplinari.
Politiche di Utilizzo di Scratch¶
Archiviazione Temporanea sui Server SSC
Lo spazio di scratch è un'archiviazione temporanea e volatile per i file.
Scratch Locale (/scratch)
Cosa devi sapere sullo spazio di scratch locale:
- Lo spazio di scratch locale è fisicamente sul nodo su cui il tuo lavoro è in esecuzione.
- NON utilizzare /tmp
o /temp
su nessun nodo di calcolo poiché riempirà l'unità root e farà bloccare il nodo, interrompendo il tuo lavoro e qualsiasi altro lavoro in esecuzione sul nodo!
- I file memorizzati nelle directory di scratch locale vengono eliminati automaticamente al termine del tuo lavoro.
Suggerimento
SSC RACCOMANDA VIVAMENTE di utilizzare la variabile di ambiente Slurm $SLURMTMPDIR
per gestire lo scratch locale. Utilizzando questa variabile nel tuo script di lavoro, i dati temporanei del lavoro verranno posizionati in /local/<jobid>
sul nodo che esegue il lavoro. Questi dati vengono rimossi automaticamente al completamento del tuo lavoro.
Politica del Programma Batch¶
Il programma batch (Slurm) è configurato con un certo numero di politiche di programmazione da tenere a mente. Le politiche cercano di bilanciare gli obiettivi concorrenti di tempi di attesa ragionevoli in coda e utilizzo efficiente del sistema. I dettagli di queste politiche differiscono leggermente da un sistema all'altro.
Le eccezioni ai limiti del programma non possono essere concesse poiché le modifiche possono influire negativamente sui lavori di altri utenti e sul programma stesso
Limiti di Tempo di Esecuzione per Lavoro
I limiti di tempo di esecuzione variano da un sistema all'altro. Il cluster Zeus ha un tempo massimo di esecuzione di 72 ore, ad eccezione della partizione debug che ha un massimo di 10 minuti. Le partizioni del cluster della facoltà variano in un tempo massimo di esecuzione fino a un massimo di 30 giorni. Se i tuoi lavori richiedono tempi di esecuzione più lunghi, dovrai utilizzare una forma di checkpointing in cui il tuo lavoro può essere ripreso da dove si era interrotto e continuare i suoi calcoli.
Job Brevi per Debugging
La partizione di debug del cluster Zeus ha un limite un limite di tempo di esecuzione di 10 minuti. Gli utenti possono inviare fino a 4 lavori alla partizione di debug alla volta. Questa coda è dedicata per testare il codice e impostare i parametri del job da eseguire su una scala più ampia. Non sono destinati a un uso a lungo termine. Se riteniamo che ci sia un abuso, verrà dato un avviso all'utente e, se l'uso eccessivo continua, l'accesso alla partizione di debug verrà bloccato.
Limiti Fairshare
Per evitare che un singolo utente o gruppo monopolizzi il sistema quando altri necessitano delle stesse risorse, il programma impone quelli che sono conosciuti come limiti fairshare. Se un utente o gruppo utilizza grandi quantità di risorse di calcolo nel corso di un mese, tutti i nuovi job che inviano durante quel periodo avranno una priorità ridotta. Maggiori dettagli sui calcoli fairshare possono essere trovati qui.
Priorità
La priorità di un job è influenzata da molti fattori, inclusi il numero di processori richiesti, il tempo che il lavoro ha trascorso in attesa, quante altre elaborazioni sono state effettuate dall'utente e dal loro gruppo nell'ultimo mese (fairshare), e se il gruppo ha accesso a un QOS che fornisce un aumento di priorità. Tuttavia, avere la priorità più alta non significa necessariamente che un lavoro verrà eseguito immediatamente, poiché devono essere disponibili anche sufficienti risorse per eseguirlo. Vedi la nostra documentazione su slurm per ulteriori informazioni su come viene calcolata la priorità e come controllare la priorità dei tuoi lavori in attesa.