Durante il monitoraggio dei server, è estremamente importante valutare correttamente il carico del sistema. Comprendendo il livello di carico, è possibile valutare sobriamente le prestazioni e la disponibilità del sistema. A questo scopo, gli esperti sono soliti valutare l'indicatore Load Average. Cosa mostra e come misurarlo correttamente - più avanti nel nostro articolo.
Il Load Average (LA, carico medio) è una misura media del carico, visualizzata nel numero di processi in stato di esecuzione o in stato di attesa di risorse per un intervallo di tempo di 1, 5 e 15 minuti. Per valutare al meglio le prestazioni del sistema, è meglio considerare il carico medio, poiché il carico fluttua rapidamente a causa dei processi di breve durata.
Esistono diversi modi semplici per misurare il carico medio. Il più semplice è scrivere ed eseguire un comando. Ad esempio, in Linux è sufficiente eseguire il comando uptime nel terminale. L'output mostrerà l'ora corrente, la durata del funzionamento del sistema, il numero di utenti e, soprattutto, il carico medio nell'intervallo di 1, 5 e 15 minuti. Il carico sul server viene rilevato eseguendo il comando w attraverso la console SSH.
Il risultato appare come segue:
Il valore del carico medio è calcolato in base ai processi in esecuzione e in coda per l'esecuzione (CPU, RAM, I/O). LA è influenzato soprattutto dall'utilizzo della CPU, che è in realtà l'unico fattore chiave per aumentare il carico del server.
Ecco un semplice esempio: c'è un VPS con due core. I valori di carico medio nell'immagine precedente: 1.03, 1.11, 1.20 sono valori di carico normali per un VPS con 2 core.
1 (unità) LA = 100% di carico su 1 core della CPU. Se il VPS ha due core, il carico medio può arrivare a 2 LA:
- LA mostra i valori 3.21, 4.22, 5.23 - il carico sta scendendo, ma negli ultimi 15 minuti la media è stata di 4.22, ovvero un carico del 422% = 4 core su 2 non è la norma;
- LA mostra 7.15, 5.24, 1.18 - il carico sta aumentando e negli ultimi 15 minuti è stato di 1.18, entro i limiti normali, il che equivale al 118% di carico = 1 core su 2 - entro i limiti normali (il picco di carico dura fino a 30 minuti, diciamo).
Con tre valori a disposizione, è possibile analizzare lo stato del sistema e valutarne le prestazioni. Se tutti e tre i valori sono pari a 0, il sistema è in modalità standby. Se i valori aumentano, significa che il carico sta aumentando, mentre se diminuiscono, significa che il carico sta diminuendo.
Occorre tenere presente che il sistema può subire un gran numero di picchi in caso di connessione simultanea di un gran numero di utenti. Ciò significa che, insieme ai comandi, è necessario utilizzare vari strumenti di monitoraggio: Zabbix, Nagios, Monit. Questi strumenti registrano l'attività della CPU e della memoria a lungo termine.
Per l'hosting è estremamente importante monitorare il valore di LA. Le azioni dell'hoster in caso di aumento del carico dipenderanno dalla causa dell'aumento. Ad esempio, se il carico cresce, supera il numero di core e continua per un lungo periodo di tempo, il LA aumenterà la coda di richieste da eseguire. In presenza di virtualizzazione KVM/OpenVZ, il carico risultante è negativo per il server fisico.
Quando un utente esegue un backup o uno scarico di merci in 1C, con conseguenti raffiche di carico per l'hoster, non è motivo di preoccupazione. Ma se il LA sul server fisico supera significativamente la norma e questo fenomeno persiste per lungo tempo, è spesso necessario adottare alcune misure, perché il LA elevato ha un effetto negativo sui clienti che hanno collocato i loro progetti su un determinato server fisico.