Leistungskennzahlen und Berechnungen in Site24x7-Berichten

Erklärungen zu den verschiedenen Leistungsvariablen und -berechnungen, die in Site24x7-Berichten verwendet werden

Site24x7 überwacht Ihre kritischen Ressourcen rund um die Uhr und stellt Ihnen diese Statistiken und Trends in umfassenden Berichten ganzheitlich dar. Dieser Artikel soll einen tieferen Einblick in die verschiedenen Verfügbarkeits- und Leistungsparameter geben, die von Site24x7 während der Überwachung erfasst werden. Es werden außerdem die Berechnungen gezeigt, die von unserem Monitoring-System verwendet werden, um die verschiedenen Endwerte abzuleiten, die für Ihr Unternehmen am wichtigsten sind. 

Leistungsvariablen

In der folgenden Tabelle sind alle Variablen aufgeführt, die bei der Berechnung verschiedener Leistungskennzahlen verwendet werden.  

In den Berechnungen verwendete Variablen

Definition

Überwachungszeitraum

Gesamtzeitraum, für den die Überwachung aktiviert ist

Wartungszeitraum

Gesamtzeitraum innerhalb des Überwachungszeitraums, für den der Monitor als „UNDER MAINTENANCE“ gekennzeichnet ist

UpTime

Die Gesamtzeit, während der sich der Monitor im Status „UP“ befindet

DownTime

Die Gesamtzeit, während der sich der Monitor im Status „DOWN“ befindet

Reaktionszeit

Die Zeit, die für die Durchführung einer einzelnen Abfrage benötigt wird

Anzahl der Ausfälle

Die Anzahl der fehlgeschlagenen Abfragen

Ausfallprozentsatz

Der Prozentsatz an Zeit, in der der Monitor außerhalb der Wartungsperiode ausfällt

Wartungsprozentsatz

Der Prozentsatz an Zeit, in der der Monitor gewartet wird

Verfügbarkeit

Der Prozentsatz an Zeit, in der der Monitor außerhalb der Wartungsperiode in Betrieb ist

API-Zeit

Der Zeitpunkt, zu dem der API-Aufruf vom Monitor erfolgt

DNS-Zeit

Der Zeitpunkt, zu dem die DNS-Anfrage vollständig aufgelöst ist

ConnStartTime

Der Zeitpunkt, zu dem die API eine Verbindung mit der Website herstellt

ConnEndTime

Der Zeitpunkt, zu dem die Verbindung zum Website-Socket erfolgreich hergestellt wurde

Antwort-Startzeit

Der Zeitpunkt, zu dem die ersten Antworten für die Basisseite eingehen

Antwort-Ende

Der Zeitpunkt, zu dem die Antwort vollständig gelesen wurde


Wartungszeitraum

Wenn ein Monitor aktualisiert oder repariert werden muss, kann er als „Under maintenance“ definiert werden. Wenn Sie einen Überwachungszeitraum als Wartung kennzeichnen, wird sichergestellt, dass die Monitore in den Abschlussberichten nicht als „DOWN“ angezeigt werden, sodass Sie einen genauen Überblick über die tatsächliche Ausfallzeit erhalten. Sie können jedoch jederzeit den Wartungszeitraum als Betriebszeit in Ihre Betriebszeitberechnung einbeziehen, indem Sie die Schaltfläche „MAINTENANCE AS UPTIME“ in Ihrem Verfügbarkeitsbericht verwenden. Zur Berechnung der „UPTIME“ verwendet Site24x7 alle in unserer Überwachungsengine protokollierten Ausfälle und leitet daraus den tatsächlichen „DOWN“-Prozentsatz ab. Die „UPTIME“ kann durch Verwendung dieses Ausfallwerts weiter abgeleitet werden.



Betriebszeit und Ausfallzeit

Die Betriebs-/Ausfallzeit eines Monitors liefert eine Annäherung an die Gesamtzeit, in der die Website für die Nutzung durch den Kunden verfügbar war. Die Betriebs-/Ausfallzeit ist die Zeit (in Tagen, Stunden und Minuten), die der Server, das Netzwerk oder die Website in Betrieb („UP“) oder nicht verfügbar war. Die Betriebszeit wird in der Regel als Prozentsatz angegeben, z. B. 99,9 % Betriebszeit für einen bestimmten Zeitraum. Die Verfügbarkeit einer Website kann im Web-Client unter „Availability“ über der „Events Timeline“ eingesehen werden.



Sehen Sie sich das folgende Beispiel an, um zu verstehen, wie die Verfügbarkeitsprozentsätze bestimmt werden.




In diesem Beispiel wurde der Zeitraum „Last one month“ ausgewählt. Daher, wenn in Sekunden umgerechnet:  

Überwachungszeitraum = 30*24*60*60 Sekunden = 2.592.000 Sekunden

Ausfallzeit = (43*60) + 48 Sekunden = 2.628 Sekunden

Daraus folgt:

Ausfallprozentsatz = (2628/2.592.000)*100 = 0,1 %

Im Falle einer Monitorgruppe entspricht die Gesamtbetriebszeit der Summe der Betriebszeiten der einzelnen Monitore. Nehmen wir also an, es sind 10 Monitore in einer Gruppe. Dann ergeben 10 Monitore und 30 Tage Bericht 300 Tage Betriebszeit. Der Gesamtprozentsatz der Betriebszeit ist der Durchschnitt der einzelnen Prozentsätze der Betriebszeiten der Monitore. Zwei Monitore, von denen einer ständig „DOWN“ ist und ein anderer ständig „UP“, ergeben eine Betriebszeit von 50 %.

Verfügbarkeitsberechnung

Die Verfügbarkeit einer Website gibt an, ob die Website derzeit für den Kunden erreichbar ist oder nicht. Sie wird für den aktuellen Fall entweder als „UP“ oder „DOWN“ und für einen ausgewählten Zeitraum in Prozent dargestellt. Zur Berechnung der Betriebszeit muss die Überwachungsengine von Site24x7 die tatsächliche Ausfallzeit ermitteln. Die Ausfallzeit kann die Wartungsperiode beinhalten oder auch nicht.



In unserem obigen Beispiel wird die Wartung als „UP“ behandelt. Daher lautet die Formel zur Berechnung der Verfügbarkeit:

Verfügbarkeitsprozentsatz = 100 – Ausfallprozentsatz

Verfügbarkeitsprozentsatz = 100 – 0,1 = 99,9 %

Info
Es wird nur ein gerundeter Wert (gerundet auf zwei Dezimalstellen) angezeigt. Bei Monitorgruppen hängt die Verfügbarkeit der Gruppe von der Verfügbarkeit der einzelnen Monitore bzw. der Anzahl der Monitore in der Gruppe ab. 

 

Beispielsweise wurde für den Verfügbarkeitsbericht zum 1. Juli der Zeitraum „Letzte 30 Tage in Millisekunden“ ausgewählt, was 2.592.000.000 ms oder 720 Stunden entspricht. Der Zeitraum vom 1. bis zum 30. Juni wurde bei der Berechnung berücksichtigt. Die Anzahl der aus der Monitorgruppe ausgewählten Monitore beträgt 10.
 
Es ist zu berücksichtigen, dass ein Monitor einen Tag lang ausgefallen war und die Gesamtausfallzeit die Summe aller Ausfallzeiten ist. Die Gesamtausfallzeit beträgt also einen Tag, was 86.400.000 ms entspricht.
 
Außerdem ist zu bedenken, dass der Monitor eine Aussetzungsperiode von 2 Tagen hatte, was 172.800.000 ms entspricht.
 
Nun muss die gesamte Sperrzeit von der Gesamtüberwachungsdauer abgezogen werden.
 
Gesamtüberwachungsdauer = Überwachungszeitraum * Anzahl der aus der Monitorgruppe ausgewählten Monitore – Gesamtzeit der Aussetzung
Daher beträgt die Gesamtüberwachungszeit = 10 * 2.592.000.000 = 25.920.000.000 ms (300 Tage) – 172.800.000 ms (2 Tage) = 25.747.200.000 ms (298 Tage)
 
Gesamtbetriebszeit = Gesamtüberwachungszeitraum – Gesamtausfallzeit
Gesamtbetriebszeit = 25.747.200.000 – 86.400.000 = 25.660.800.000 (297 Tage)
Verfügbarkeitsprozentsatz = (Betriebszeit/Gesamtüberwachungszeitraum)*100
Verfügbarkeitsprozentsatz = (25.660.800.000/25.747.200.000)*100 = 99,66 %

Außerdem können auf der Grundlage der Gesamtausfallzeit/Gesamtbetriebszeit des Monitors MTTR und MTBF berechnet werden.
  • Mean Time To Repair (MTTR)Die Zeit, die benötigt wird, um den Server wieder zum Laufen zu bringen, wenn er einmal ausgefallen ist. Dieser Wert muss so niedrig wie möglich sein. MTTR ist gleich NULL, wenn es keine Ausfälle gibt.
MTTR = Tatsächliche Ausfallzeit/Anzahl der Ausfälle
  • Mean Time Between Failures (MTBF): Die durchschnittliche Zeit, die ein Gerät oder System ohne Ausfall funktioniert, oder die durchschnittliche Zeit, die vergeht, bis ein Ausfall auftritt. Der Begriff kann auch die Zeitspanne bezeichnen, die ein Benutzer angemessenerweise erwarten kann, dass ein Gerät oder System funktioniert, bevor ein schwerwiegender Fehler auftritt. Dieser Wert muss so hoch wie möglich sein. Die mittlere Betriebsdauer zwischen Ausfällen (MTBF) entspricht der Gesamtbetriebszeit, wenn keine Ausfälle auftreten.
MTBF = Tatsächliche Betriebszeit/Anzahl der Ausfälle
In unserem obigen Beispiel wurde ein Zeitraum von einem Monat ausgewählt und die Anzahl der Ausfälle beträgt eins. So ergibt sich: 

MTTR = (43 min 48 sek/1) = 43 min 48 sek 
MTBF = (29 Tage 23 Stunden 16 Minuten/1) = 29 Tage 23 Stunden 16 Minuten 

Reaktionszeit

Die Reaktionszeit setzt sich aus vier Hauptkomponenten zusammen, nämlich DNS-Zeit, Verbindungszeit, Zeit für das erste Byte und Zeit für das letzte Byte. 

Wie wird dies berechnet?

DNSResolveTime = APITime – DNSTime 

ConnTime = ConnEndTime – ConnStartTime 

FirstByteTime = ConnEndTime – ResponseStart 

Download Time = ConnEndTime – ResponseEnd 

ResponseTime = DNSResolveTime + ConnTime + FirstByteTime + Download Time



Die Reaktionszeit der Website, die über alle Überwachungsstandorte für einen ausgewählten Zeitraum überwacht wird, wird berechnet und in einem normalen Liniendiagramm dargestellt. Die maximale, minimale und durchschnittliche Reaktionszeit kann anhand dieses Diagramms ermittelt werden. Die Durchschnittswerte hängen vom gewählten Überwachungszeitraum ab.
Notes
  1. The Summary page displays a graph only for the primary location. 
  2. Clicking the graph icon  redirects you to the View Performance Report, where you can view a graph for any secondary location using the drop-down menu.

Im obigen Beispiel lauten die Werte für die verschiedenen Komponenten der Reaktionszeit zum ausgewählten Zeitpunkt: 

DNSResolveTime = 64 ms
ConnTime = 222 ms
FirstByteTime = 129 ms
Download Time = 11 ms  

So ergibt sich für den ausgewählten Zeitpunkt:  

ResponseTime = 64 + 222 + 129 + 11 = 426 ms 

Min: Mindestwert aller Einträge im ausgewählten Zeitraum
Max.: Höchstwert aller Einträge im ausgewählten Zeitraum
Durchschnittlich: Summe der Reaktionszeit aller Einträge/Gesamtzahl der Einträge