Domande Frequenti¶
Come posso ottenere l'accesso?¶
Le risorse dell'SSC sono disponibili per: - Docenti e ricercatori Sapienza - I loro studenti e collaboratori - Clienti in conto terzi - Piccole classi che richiedono calcolo ad alte prestazioni per il corso di studi
Per informazioni dettagliate sui requisiti e sulle restrizioni di accesso, consultare la nostra pagina di accesso. Se hai domande sulla nostra politica o procedure di accesso, ti preghiamo di contattare SSC Help.
Qual è il mio nome utente SSC?¶
Il tuo nome utente ti viene fornito dal personale SSC. Il tuo nome utente SSC di solito consiste nella prima lettera del tuo nome seguita dal tuo cognome. Se non sei sicuro, ti preghiamo di contattare SSC Help.
Perché non riesco a effettuare il login?¶
Questa domanda è piuttosto generica, quindi ti consigliamo di controllare i seguenti collegamenti per i servizi specifici a cui potresti provare ad accedere:
Errori comuni:
- Home directory mancante: Vedi qui per ulteriori informazioni
- Credenziali non valide: Questo significa che la password e stata inserita in modo errato.
- Quando provi ad accedere a OnDemand e vedi un errore come: Richiesta non valida, Server non disponibile o Qualcosa è andato storto. Si prega di contattare l'amministratore del sito: Questi errori sono spesso causati da file di cache corrotti nel tuo browser. Pulisci la cache e i dati dei cookie del tuo browser e riavvialo, oppure prova un browser diverso. Le finestre in incognito spesso non risolvono questo problema.
Perché l'allocazione di ColdFront mostra attiva ma non riesco a effettuare il login?¶
Questo è lo stesso motivo di questo - il tuo account non è ancora stato creato.
Perché vedo un errore di home directory mancante durante il login?¶
La prima volta che accedi a un server SSC, la tua home directory deve essere creata. Se, dopo aver effettuato il primo login, il pannello di controllo di OnDemand non si ricarica, esci e accedi di nuovo.
Perché vedo una finestra vuota quando avvio un desktop OnDemand? Perché le icone del desktop non funzionano?¶
Occasionalmente, quando gli utenti tentano di avviare una sessione interattiva in OnDemand, il desktop si presenta come una finestra blu o grigia vuota senza menu delle applicazioni o modo per aprire una finestra del terminale. A volte il desktop si avvia, ma le icone non funzionano. I file vengono memorizzati nella cache quando si aprono le sessioni e possono essere corrotti o non utilizzabili. Per risolvere questo problema, elimina le seguenti sottodirectory nascoste nella tua home directory e avvia una nuova sessione desktop OnDemand:
rm -rf ~/.vnc rm -rf ~/.cache rm -rf ~/.config/xfce4
Come posso risolvere l'errore XFCE PolicyKit Agent
nelle sessioni desktop OnDemand?¶
Se vedi una finestra di errore che dice XFCE PolicyKit Agent
, puoi cliccare sul pulsante Chiudi
e continuare a utilizzare il desktop OnDemand.
Perché il mio desktop o app OnDemand mostra che sta avviando ma poi termina immediatamente?¶
Ci sono tre motivi comuni per cui potresti non riuscire ad avviare sessioni OnDemand, inclusi desktop interattivi e app come Jupyter Notebook e Matlab.
- Sei oltre quota nella tua home directory. Maggiori informazioni sulla gestione dei dati delle sessioni OnDemand.
- Hai un ambiente Anaconda che si carica nel tuo file di ambiente .bashrc o stai caricando un modulo Python nel tuo file .bashrc che interferisce con la configurazione del desktop OnDemand. Vedi anche.
- L'applicazione cerca di caricare un modulo software e non riesce a trovarlo. Vedi qui per ulteriori informazioni.
Come posso controllare quanto sono piene le mie directory?¶
Il tool showquota
di SSC fornirà la quota e l'uso per la tua home directory e per eventuali directory di progetto condivisea cui potresti avere accesso.
[test@localhost ~]$ showquota
Home folder:
--------------------------------------------------
User quota on /home (/dev/mapper/rl_nfs--srv-home)
Blocks
User ID Used Soft Hard Warn/Grace
---------- ---------------------------------
userA 3.8M 9.8G 9.8G 00 [------]
--------------------------------------------------
Project(s) folder:
------------------------------------------------------------------------
Group: projectA
Quota information for storage pool Default (ID: 1):
user/group || size || chunk files
name | id || used | hard || used | hard
--------------|------||------------|------------||---------|---------
projectA | 1010 || 0 Byte| 4.88 GiB|| 0|unlimited
------------------------------------------------------------------------
In alternativa, puoi visualizzare queste informazioni sul ColdFront dashboard. Maggiori dettagli su archiviazione e quote possono essere trovati qui hpc/storage.md.
Perché ricevo errori "spazio insufficiente sul dispositivo"?¶
Se sei sicuro di non essere oltre quota in termini di dimensione dei file o numero di file, potrebbe essere un problema con i permessi dei file. Nelle directory di progetto condivise, verifica le autorizzazioni di scrittura utilizzando ls -l
. Maggiori dettagli sulla gestione della quota.
Perché ricevo errori "modulo non trovato"?¶
Questi errori sono comuni e possono essere dovuti a una delle seguenti ragioni:
- Stai cercando di caricare un modulo di un pacchetto software che non è installato nel sistema. Utilizza
module avail
per elencare i moduli disponibili. Se il pacchetto che cerchi non è presente, potrebbe non essere installato su SSC. - Stai cercando di caricare un modulo di un pacchetto software che non è stato caricato nel tuo ambiente attuale. Le installazioni di alcuni moduli software richiedono una sequenza specifica di caricamento di altri moduli. Consulta la documentazione di installazione per l'applicazione o il pacchetto che stai tentando di utilizzare per ulteriori indicazioni.
- Se hai recentemente rimosso o disinstallato un modulo o una versione specifica di un pacchetto, controlla il tuo file
.bashrc
per assicurarti che le righe non siano rimaste.
Dove posso trovare più informazioni?¶
Per maggiori informazioni su questioni specifiche riguardanti il login, l'accesso, l'uso delle risorse, e altri aspetti, controlla le altre sezioni delle FAQ, le nostre pagine di documentazione o contatta il nostro personale per assistenza.
Come posso vedere quali sono i permessi del file?¶
Il comando getfacl
è un modo semplice per vedere i permessi di un file o di una directory. Mostrerà il nome del file/directory, il proprietario del file/directory, il nome del gruppo che possiede il file/directory e i permessi dettagliati del file/directory. Vedi anche: man getfacl
o getfacl --help
Perché ricevo errori di modulo non trovato?¶
Ci sono alcuni tipi di errori di modulo che potresti vedere:
-
module command not found
significa che il sistema non sa nulla sui moduli software. Assicurati che la prima riga del tuo script batch sia:#!/bin/bash -l
-
module not found
significa che il sistema non riesce a trovare il modulo specifico che stai cercando di caricare. -
Non hai caricato le dipendenze del modulo prima di caricare il modulo che vuoi usare. Vedi qui per ulteriori informazioni sul sistema di moduli gerarchici.
-
Stai cercando di caricare moduli da una versione software diversa. SSC imposta una versione software predefinita su tutti i sistemi. Se desideri utilizzare un modulo da una versione diversa da quella predefinita, devi prima caricare la versione della release software. Vedi qui per ulteriori dettagli.
Quando inizierà il mio job?¶
Puoi elencare informazioni sul tempo di inizio del tuo job utilizzando il comando squeue:
squeue --user=[SSCusername] --start
Nota che il tempo di inizio stimato di Slurm può essere un po' impreciso. Questo perché Slurm calcola questa stima in base ai job attualmente in esecuzione o in coda nel sistema. Qualsiasi job che viene inviato dopo il tuo con una priorità più alta potrebbe ritardare il tuo job. In alternativa, se i job completano in meno tempo di quanto richiesto, più job possono iniziare prima del previsto.
Per ulteriori informazioni sul comando squeue
, dai un'occhiata alla nostra pagina su Comandi Slurm Utili o visita la pagina Slurm su squeue
Come posso sapere qual è la priorità del mio job?¶
Per ulteriori informazioni sulla priorità del job vedi qui.
Perché il mio job è in attesa con la ragione 'ReqNodeNotAvail'?¶
Il messaggio ReqNodeNotAvail
di solito significa che il tuo nodo è stato riservato per manutenzione durante il periodo che hai richiesto nel tuo script job. Puoi confermare se il nodo richiesto è in maintenance digitando scontrol show reservation
per elencare tutte le riserve attive.
Se ricevi questo messaggio, le seguenti soluzioni sono disponibili:
-
Invia un job richiedendo meno tempo in modo che non intersechi con la finestra di manutenzione.
-
Aspetta fino a dopo che la finestra di manutenzione è terminata e il tuo job riprenderà automaticamente quando ci saranno risorse disponibili.
Se questo messaggio non è dovuto a una prossima inattività di manutenzione, significa che il tipo di nodo o funzione che hai richiesto non è disponibile nella partizione a cui hai inviato il tuo job per l'esecuzione.
Perché ricevo un errore ‘Invalid Account, Partition, or QOS Specification’ quando provo a eseguire un job?¶
Se stai ricevendo errori come questi, non stai specificando la giusta combinazione di cluster, account, partizione e qos in base a ciò a cui il tuo account ha accesso:
salloc: error: Job submit/allocate failed: Invalid qos specification
salloc: error: Job submit/allocate failed: Invalid account or account/partition combination specified
sbatch: error: Batch job submission failed: Invalid partition or qos specification
Slurm utilizzerà il tuo account predefinito, a meno che non specifichi diversamente nel tuo script job o quando avvii un'app OnDemand. Usa il comando slimits
per vedere quali account e impostazioni QOS hai accesso. Questo è gestito in ColdFront sotto allocazioni. Maggiori dettagli sui limiti QOS e delle partizioni possono essere trovati qui
Come faccio a effettuare il login nel nodo di calcolo su cui il mio job sta girando?¶
Potrai accedere solo ai nodi di calcolo su cui i tuoi job stanno girando. Tuttavia, rsh/ssh ai nodi di calcolo non è consentito. Puoi utilizzare il comando Slurm srun
per accedere al nodo. Se il job sta girando su un nodo, usa:
srun --jobid=jobid --pty /bin/bash
Se il job sta girando su più nodi, specifica il nodo a cui vuoi accedere:
srun --jobid=jobid --nodelist=node_name -N1 --pty /bin/bash
-
Se il tuo job ha allocato tutte le risorse sul nodo, dovrai includere l'opzione
--overlap
. -
Se il tuo job sta girando sul cluster per il personale, dovrai specificare l'opzione
--clusters=faculty
.
Come risolvo "sbatch: error: Batch script contains DOS line breaks"?¶
Se ricevi un messaggio di errore del genere quando provi a inviare un job, è perché il tuo script batch è stato modificato in un editor di testo che ha creato interruzioni di riga DOS. Ciò può verificarsi se stai utilizzando un editor di testo in Windows o un editor di testo che non supporta i file Unix.
Puoi risolverlo convertendo il file in un formato Unix. Puoi utilizzare il comando dos2unix
se è installato nel tuo sistema. Per farlo, utilizza il seguente comando:
dos2unix filename
Altrimenti, puoi modificare il file su un sistema Linux o Unix e risalvarlo.
Come posso vedere la mia allocazione di risorse e i job attivi?¶
Usa il comando sacct
per controllare gli stati dei tuoi job. Puoi usare anche l'opzione -u
per specificare l'username. Puoi ottenere il tuo job id utilizzando squeue --user=[username]
.
Puoi ottenere informazioni più dettagliate sulle allocazioni usando scontrol show job <jobid>
, il quale mostrerà il tempo di esecuzione e le allocazioni di risorse.
Come posso monitorare il mio job?¶
Puoi monitorare lo stato del tuo job utilizzando il comando squeue
. Puoi anche ottenere informazioni più dettagliate usando scontrol show job <jobid>
per controllare lo stato del tuo job.
Puoi anche controllare l'output della tua esecuzione in tempo reale usando il comando tail -f slurm-<jobid>.out
. Il nome del file di output può essere personalizzato utilizzando le direttive del tuo script batch.
Come posso ottenere l'output di un job che è stato terminato?¶
Se il tuo job è terminato, puoi accedere all'output attraverso il file di output specificato nel tuo script batch. In genere, il file di output si trova nella stessa directory da cui hai inviato il job e sarà nominato slurm-<jobid>.out
.
Se il tuo job non ha specificato un file di output, Slurm genererà un file predefinito per il tuo job.
Puoi utilizzare il comando cat slurm-<jobid>.out
per visualizzare l'output.
Come posso utilizzare gli script?¶
Per inviare uno script, usa il comando sbatch, ad esempio:
sbatch myscript.sh
squeue
.
Come posso cancellare un job?¶
Puoi cancellare un job usando il comando scancel
seguito dall'ID del job. Ad esempio:
scancel <jobid>
Puoi anche cancellare tutti i tuoi job usando:
scancel -u <username>