このナレッジで紹介する項目は以下のとおりです。
- パフォーマンス変数
- メンテナンス時間
- アップ時間とダウン時間
- 可用性の計算
- 応答時間
Site24x7は、24時間体制で必要な項目の監視を行い、包括的なレポートを通して統計と傾向を総合的に提示します。このナレッジではSite24x7の監視によって取得された様々な可用性やパフォーマンスパラメーターをさらに詳細に観察できるようになるために、レポートに登場する様々な変数と計算についてまとめました。また、ビジネスで重要なそれら最終的な値が監視エンジンによってどのように計算されているのかその違いを強調して記述します。
パフォーマンス変数
様々なパフォ-マンスメトリクスの計算で用いられている全変数の定義を以下の表にまとめました。
計算に用いられている変数 |
英語表記 |
内容 |
監視時間 |
MonitoringPeriod |
監視が有効化されていた時間の合計 |
メンテナンス時間 |
MaintenancePeriod |
監視期間内でメンテナンスだった時間の合計 |
アップ時間 |
UpTime |
監視のステータスが「アップ」であった時間の合計 |
ダウン時間 |
DownTime |
監視のステータスが「ダウン」であった時間の合計 |
応答時間 |
ResponseTime |
一回のポーリングが終わるのに要した時間 |
停止数 |
Number of Outages |
ポーリングに失敗した回数 |
ダウン率 |
DownPercentage |
停止期間外で監視のステータスが「ダウン」だった時間の割合 |
メンテナンス率 |
MaintenancePercentage |
監視のステータスが「メンテナンス」だった時間の割合 |
可用性 |
Availability |
停止期間外で監視のステータスが「アップ」だった時間の割合 |
API時刻 |
APITime |
監視によってAPI要求が行われた時刻 |
DNS時刻 |
DNSTime |
DNS要求が完全に解決された時刻 |
接続開始時刻 |
ConnStartTime |
APIとウェブサイトの接続が開始した時刻 |
接続完了時刻 |
ConnEndTime |
ウェブサイトソケットへの接続が完全に確立された時刻 |
応答開始時刻 |
ResponseStart |
ウェブページの最初の応答が開始された時刻 |
応答完了時刻 |
ResponseEnd |
応答が完全に読み込まれた時刻 |
メンテナンス期間
監視をアップグレードや編集するときにその監視はメンテナンス状態になります。このメンテナンス状態は最終的なレポートで「ダウン」として認識されないため、正確なダウン時間を把握することができます。また、可用性サマリレポートで”アップタイム計算で考慮するメンテナンス時間”のロッカーボタンを「含める」に設定するとメンテナンス時間を含めてアップ時間が計算されます。このアップ時間を計算するために、Site24x7では監視エンジンでの停止ログや実際にあったダウン率を取得しています。このダウンの値を用いることでより詳細なアップ時間を計算することができます。
アップ時間とダウン時間
アップ時間とダウン時間は、お客様のウェブサイトが可用的であった合計時間との割合とサーバー、ネットワーク、ウェブサイトのアップまたは利用できなかった時間(日、時間、分)の合計から計算されています。アップ時間は設定した期間での中で99.9%といったパーセンテージとして表示されます。また、ウェブサイトのアップ時間では可用性表示欄の上にウェブクライアントのイベントタイムラインが表示されます。
可用性のパーセンテージは以下のように計算されます。
以上のように期間を"先月"に設定した場合、秒数は以下のように計算されます。
監視時間 = 30 * 24 * 60 * 60 = 2592000 seconds
ダウン時間 = (43 * 60) + 48 seconds = 2628 seconds
ゆえに、
ダウン率 = (2628/2592000)* 100 = 0.1%
監視グループの場合、アップ時間は個々の監視の合計で計算されます。つまり、10つの監視で構成されているグループの場合、10つの監視の30日間のレポートは300日分のアップ時間で計算されます。また、監視グループのアップ時間の比率は、個々の監視のアップ時間の比率を平均化することで計算されています。2つの監視のうち、1つが常時ダウンで、もう1つが常時アップしていた場合、そのアップ時間は50%となります。
可用性の計算方法
ウェブサイトの可用性は、ウェブサイトが現在利用可能な状況かどうかを表しています。現在の状況や選択した期間のパーセンテージによって、アップかダウンか提示します。アップ時間の計算の場合、Site24x7の監視エンジンはそのダウン時間を検出する必要があります。ダウン時間にはメンテナンス時間が含まれている場合と含まれていない場合があります。
上記の監視で、メンテナンスがアップとして設定されている場合、可用性の計算は以下のようになります。
可用性の比率 = 100 - ダウン率
可用性の比率 = 100 - 0.1 = 99.9%
小数点第2位を四捨五入した数値で表されます。監視グループの場合の可用性は、個々の監視の可用性 / グループの監視数に基づいて計算されます。
さらに、MTTRとMTBFはダウン・アップ時間に基づいて計算されています。
・Mean Time To Repair(MTTR):ダウンとなったサーバーがアップまでに要した時間。なるべく短いほうが良い。MTTRはダウンがない場合、ゼロとなる。
MTTR = ダウン時間 / 停止数
・Mean Time Between Failures(MTBF):機器やシステムがダウンなくアップした平均の時間、またはダウンの起こっていた時間。加えて、機器やシステムをダウンが起きるまでにどれだけアップさせることができるかを合理的に予想した時間の長さ。なるべく長いほうが良い。MTBFはダウンがない場合、アップ時間と同じ値になる。
MTBF = アップ時間 / 停止数
上記の監視で、1か月間のうちにダウンが1度だけあったとすると、
MTTR = (43 min 48 sec /1) = 43 min 48 seconds
MTBF = (29 days 23 hour 16 min / 1) = 29 days 23 hours 16 min
応答時間
応答時間は「DNS時間、接続時間、先頭バイト到達時間、ダウンロード時間」の4つの要素で構成されています。
どのように計算されているか
DNS解決時間 = API時間 - DNS時間
接続時間 = 接続終了時間 - 接続開始時間
先頭バイト到達時間 = 接続完了時間 - 応答開始時間
ダウンロード時間 = 接続完了時間 - 応答完了時間
応答時間 = DNS解決時間 + 接続時間 + 先頭バイト到達時間 + ダウンロード時間
ウェブサイトの監視は、選択した期間内での全ロケーションからの監視しており、法線のグラフを用いて計算・表示されています。応答時間の最長、最短、平均はこのグラフから取得することができます。なかでも平均値は、その監視で選択している期間に大きく左右されます。
上記の監視例での、4要素「DNS時間、接続時間、先頭バイト到達時間、最終バイト到達時間」は以下のようになります。
DNS解決時間 = 64 ms
接続時間 = 222 ms
先頭バイト到達時間 = 129 ms
ダウンロード時間 = 11 ms
よって、上記監視例で選択した期間内での応答時間は次のようになります。
応答時間 = 64 + 222+ 129 + 11 = 426 ms
最短:選択した期間のなかで、一番短い値
最長:選択した期間のなかで、一番長い値
平均:応答時間の合計 / 応答時間の値の数