Lors de la surveillance d'un serveur, il est extrêmement important d'évaluer correctement la charge du système. En comprenant le niveau de charge, vous pouvez évaluer sobrement les performances et la disponibilité du système. À cette fin, les experts évaluent généralement l'indicateur Load Average. Ce qu'il indique et comment le mesurer correctement - plus d'informations dans notre article.
Load Average (LA, charge moyenne) est une mesure moyenne de la charge, elle est affichée dans le nombre de processus qui sont dans l'état d'exécution ou dans l'état d'attente de ressources pour l'intervalle de temps de 1, 5 et 15 minutes. Pour évaluer au mieux les performances du système, il est préférable d'examiner la charge moyenne, car la charge fluctue rapidement en raison des processus de courte durée.
Il existe plusieurs façons simples de mesurer la charge moyenne. La plus simple consiste à écrire et à exécuter une commande. Par exemple, sous Linux, il suffit d'exécuter la commande uptime dans le terminal. La sortie indiquera l'heure actuelle, la durée de fonctionnement du système, le nombre d'utilisateurs et, surtout, la charge moyenne dans l'intervalle de 1, 5 et 15 minutes. La charge du serveur est connue en exécutant la commande w dans la console SSH.
Le résultat ressemble à ceci :
La valeur de la charge moyenne est calculée sur la base des processus en cours d'exécution et en attente d'exécution (CPU, RAM, I/O). LA est principalement affecté par l'utilisation du CPU, qui est en fait le seul et principal facteur d'augmentation de la charge sur le serveur.
Voici un exemple simple : il y a un VPS avec deux cœurs. Les valeurs moyennes de charge dans l'image ci-dessus : 1,03, 1,11, 1,20 sont des valeurs de charge normales pour un SPV avec 2 cœurs.
1 (unité) LA = 100% de charge sur 1 cœur de CPU. Si le SPV a deux cœurs, la charge moyenne peut atteindre 2 LA :
- LA affiche les valeurs 3.21, 4.22, 5.23 - la charge diminue, mais au cours des 15 dernières minutes, la moyenne était de 4.22, soit une charge de 422 % = 4 cœurs sur 2 n'est pas la norme ;
- LA affiche 7,15, 5,24, 1,18 - la charge augmente, et au cours des 15 dernières minutes, elle était de 1,18, dans les limites normales, ce qui équivaut à 118 % de charge = 1 cœur sur 2 - dans les limites normales (le pic de charge pouvant durer jusqu'à 30 minutes, disons).
Avec ces trois valeurs à votre disposition, vous pouvez analyser l'état du système et évaluer ses performances. Si les trois valeurs sont égales à 0, le système est en mode veille. Si les valeurs augmentent, cela signifie que la charge augmente, et si elles diminuent, cela signifie que la charge diminue.
Il faut tenir compte du fait que le système peut connaître un grand nombre de pics en cas de connexion simultanée d'un grand nombre d'utilisateurs. Cela signifie qu'en combinaison avec les commandes, vous devez utiliser divers outils de surveillance - Zabbix, Nagios, Monit. Ils enregistrent l'activité du processeur et de la mémoire sur le long terme.
Pour l'hébergement, il est extrêmement important de surveiller la valeur de LA. Les actions de l'hébergeur en cas d'augmentation de la charge dépendront de la cause de cette augmentation. Par exemple, si la charge augmente, dépasse le nombre de cœurs et se poursuit pendant une longue période, le LA augmentera la file d'attente des demandes à exécuter. En présence d'une virtualisation KVM/OpenVZ, la charge résultante est néfaste pour le serveur physique.
Lorsqu'un utilisateur effectue une sauvegarde ou un déchargement de marchandises dans 1C et qu'il en résulte des pointes de charge pour l'hébergeur, il n'y a pas lieu de s'inquiéter. Mais si le LA du serveur physique dépasse largement la norme et que ce phénomène persiste pendant une longue période, il est souvent nécessaire de prendre certaines mesures, car le LA élevé a un effet négatif sur les clients qui ont placé leurs projets sur un serveur physique particulier.