Vid serverövervakning är det oerhört viktigt att korrekt bedöma systembelastningen. Genom att förstå belastningsnivån kan du på ett nyktert sätt bedöma systemets prestanda och tillgänglighet. För detta ändamål uppskattar experter vanligtvis Load Average-indikatorn. Vad det visar och hur man mäter det korrekt - vidare i vår artikel.
Load Average (LA, genomsnittlig belastning) är ett genomsnittligt mått på belastning, det visas i antalet processer som är i körningstillstånd eller i väntan på resurser för tidsintervallet 1, 5 och 15 minuter. För att bäst bedöma systemets prestanda är det bäst att titta på den genomsnittliga belastningen, eftersom belastningen fluktuerar snabbt på grund av kortlivade processer.
Det finns flera enkla sätt att mäta den genomsnittliga belastningen. Det enklaste är att skriva och köra ett kommando. I Linux är det till exempel bara att köra kommandot uptime i terminalen. Utdata visar aktuell tid, hur länge systemet har varit i drift, antalet användare och framför allt den genomsnittliga belastningen i intervallet 1, 5 och 15 minuter. Belastningen på servern får man reda på genom att köra kommandot w via SSH-konsolen.
Resultatet ser ut så här:
Det genomsnittliga belastningsvärdet beräknas utifrån de processer som körs och står i kö för körning (CPU, RAM, I/O). LA påverkas mest av CPU-användningen, som faktiskt är den enda och viktigaste faktorn när det gäller att öka belastningen på servern.
Här är ett enkelt exempel: det finns en VPS med två kärnor. Det genomsnittliga belastningsvärdet i bilden ovan: 1,03, 1,11, 1,20 är normala belastningsvärden för en VPS med 2 kärnor.
1 (enhet) LA = 100% belastning på 1 CPU-kärna. Om VPS:en har två kärnor kan den genomsnittliga belastningen vara så hög som 2 LA:
- LA visar värdena 3,21, 4,22, 5,23 - belastningen sjunker, men under de senaste 15 minuterna var den i genomsnitt 4,22, vilket är 422% belastning = 4 av 2 kärnor är inte normen;
- LA visar 7,15, 5,24, 1,18 - belastningen ökar, och under de senaste 15 minuterna var den 1,18, inom normala gränser, vilket motsvarar 118% belastning = 1 av 2 kärnor - inom normala gränser (toppbelastning som varar upp till 30 minuter, låt oss säga).
Med tre värden till ditt förfogande kan du analysera systemets tillstånd och utvärdera dess prestanda. Om alla tre värdena är 0 är systemet i standby-läge. Om värdena ökar betyder det att belastningen ökar, och om de minskar betyder det att belastningen minskar.
Det bör beaktas att systemet kan uppleva ett stort antal spikar vid samtidig anslutning av ett stort antal användare. Detta innebär att du i kombination med kommandon bör använda olika övervakningsverktyg - Zabbix, Nagios, Monit. De registrerar CPU- och minnesaktivitet på lång sikt.
För värd är det oerhört viktigt att övervaka värdet på LA. Värdens åtgärder vid belastningsökning beror på orsaken till ökningen. Om belastningen till exempel växer, överstiger antalet kärnor och fortsätter under en lång tidsperiod, kommer LA att öka kön av förfrågningar som ska utföras. Om KVM/OpenVZ-virtualisering används är den resulterande belastningen skadlig för den fysiska servern.
När en användare utför en säkerhetskopiering eller lossning av varor i 1C, vilket resulterar i att det blir en kraftig belastning för värden, är det inte någon allvarlig anledning till oro. Men om LA på den fysiska servern avsevärt överstiger normen och detta fenomen kvarstår under lång tid, är det ofta nödvändigt att vidta vissa åtgärder, eftersom den höga LA har en negativ effekt på kunder som har placerat sina projekt på en viss fysisk server.