O Site24x7 monitora seus recursos críticos 24 horas por dia e apresenta essas estatísticas e tendências de forma holística por meio de relatórios abrangentes. Este artigo pretende fornecer mais informações sobre os vários parâmetros de disponibilidade e desempenho capturados pelo Site24x7 durante o monitoramento. Além disso, destaque os diferentes cálculos usados pelo nosso mecanismo de monitoramento para derivar os vários valores finais que mais importam para o seu negócio.
Variáveis de desempenho
A tabela abaixo define todas as variáveis usadas no cálculo de diferentes métricas de desempenho.
Variáveis usadas em cálculos
| Definição
|
Período de monitoramento
| O período total durante o qual o monitoramento está ativado
|
Período de manutenção
| O período total dentro do Período de monitoramento para o qual o monitor é marcado como UNDER MAINTENANCE (Em manutenção)
|
Tempo de atividade
| O tempo total durante o qual o monitor está no status UP (Inativo)
|
Tempo de inatividade
| O tempo total durante o qual o monitor está no status DOWN (Inativo)
|
Tempo de resposta
| O tempo necessário para concluir uma única pesquisa
|
Número de interrupções
| O número de pesquisas que falharam
|
Porcentagem de inatividade
| A porcentagem de tempo em que o monitor fica inativo fora do período de manutenção
|
Porcentagem de manutenção
| A porcentagem de tempo em que o monitor fica em manutenção
|
Disponibilidade
| A porcentagem de tempo em que o monitor fica ativo fora do período de manutenção
|
Tempo de API
| O momento em que a chamada de API é feita pelo monitor
|
Tempo de DNS
| O momento em que a solicitação de DNS é resolvida completamente
|
ConnStartTime
| O momento em que a API estabelece conexão com o website
|
ConnEndTime
| O momento em que a conexão com o soquete do website é estabelecida com sucesso
|
Tempo de início da resposta
| O momento em que a primeira resposta começa a chegar para a página de base
|
Término da resposta
| O momento em que a resposta foi completamente lida
|
Período de manutenção
Sempre que um monitor precisa ser atualizado ou corrigido, ele pode ser definido como estando em manutenção. Marcar um período de monitoramento como manutenção garante que os monitores não sejam mostrados como DOWN (Inativos) nos relatórios finais, permitindo uma visão precisa do tempo de inatividade real. No entanto, você pode incluir o período de manutenção como UPTIME (Tempo de atividade) no seu cálculo de tempo de atividade usando o botão "MAINTENANCE AS UPTIME" (Manutenção como Tempo de atividade) no seu relatório de resumo de disponibilidade. Para calcular o UPTIME (Tempo de atividade), o Site24x7 usa todas as interrupções registradas em nosso mecanismo de monitoramento e deriva a porcentagem de DOWN (Inatividade) real. O UPTIME (Tempo de atividade) pode ser ainda mais derivado usando esse valor de interrupção.
Tempo de atividade e de inatividade
O tempo de atividade/inatividade de um monitor fornece um valor aproximado do tempo total que seu website ficou disponível para uso dos clientes. Tempo de atividade/inatividade é a quantidade de tempo (em dias, horas e minutos) durante o qual o servidor, rede ou website esteve em execução (ativo) ou indisponível. O tempo de atividade geralmente é listado como uma porcentagem, como 99,9% de tempo de atividade por um determinado período. O tempo de atividade de um website pode ser visualizado em Availability (Disponibilidade), acima da Events Timeline (Linha do tempo de eventos) no cliente Web.
Veja o exemplo abaixo para entender como os valores percentuais de disponibilidade são determinados.
Neste exemplo, o período escolhido é o último mês. Portanto, quando convertido em segundos:
Período de monitoramento = 30*24*60*60 segundos = 2592000 segundos
Tempo de inatividade = (43*60) + 48 segundos = 2628 segundos
Portanto,
Porcentagem de inatividade = (2628/2592000)*100 = 0,1%
No caso de um grupo de monitores, o período de atividade total será a soma do tempo de atividade de cada monitor. Então, digamos que haja 10 monitores em um grupo, logo um relatório de 30 dias para 10 monitores dirá 300 dias de tempo de atividade. A porcentagem total de tempo de atividade é a média da porcentagem de tempo de atividade de monitores individuais. Dois monitores, um inativo o tempo todo e outro ativo o tempo todo, indicarão 50% de tempo de atividade.
Cálculo da disponibilidade
A disponibilidade de um site indica se o website está disponível para uso do cliente ou não. É representado como UP (Ativo) ou DOWN (Inativo) para a instância atual e em porcentagem para um período selecionado. Para calcular o tempo de atividade, o mecanismo de monitoramento do Site24x7 precisa detectar o tempo de inatividade real. O tempo de inatividade pode ou não incluir o período de manutenção.
No exemplo acima, a manutenção é tratada como UP (Ativa). Portanto, a fórmula para calcular a disponibilidade será:
Porcentagem de disponibilidade = 100 - Porcentagem inativa
Porcentagem de disponibilidade = 100 - 0.1 = 99,9%
Somente um valor arredondado (para dois valores decimais) será exibido. Para grupos de monitores, a disponibilidade do grupo será baseada na disponibilidade de cada monitor/contagem de monitores no grupo.
Por exemplo, o período escolhido para o relatório de disponibilidade em 1º de julho são os últimos 30 dias em milissegundos, que é 2592000000 ms, ou 720 horas. O período de 1º de junho a 30 de junho será considerado para o cálculo. O número de monitores selecionados do grupo de monitores é 10.
Considere que um monitor teve um tempo de inatividade de um dia, e o tempo de inatividade total é a soma de todos os tempos de inatividade. Portanto, o tempo de inatividade total é de um dia, o que é 86400000 ms.
Além disso, vamos considerar que o monitor tem um período de suspensão de 2 dias, o que corresponde a 172800000 ms.
Agora, o tempo total suspenso terá que ser deduzido do período total de monitoramento.
Período de monitoramento total = Período de monitoramento * Número de monitores selecionados do grupo de monitores - Tempo total suspenso
Portanto, período de monitoramento total = 10 * 2592000000 = 25920000000 ms (300 dias) - 172800000 ms (2 dias) = 25747200000 ms (298 dias)
Tempo total de atividade = Período de monitoramento total - Tempo total de inatividade
Tempo total de atividade = 25747200000 - 86400000 = 25660800000 (297 dias)
Porcentagem de disponibilidade = (Tempo de atividade/período de monitoramento total) * 100
Porcentagem de disponibilidade = (25660800000/25747200000) * 100 = 99,66%
Além disso, com base no tempo total de inatividade/atividade do monitor, o MTTR e o MTBF podem ser calculados.
- Tempo médio de reparo (MTTR): O tempo necessário para colocar o servidor em atividade depois que ele estiver inativo. Esse valor deve ser o mais baixo possível. MTTR será igual a ZERO caso não haja interrupções.
MTTR = Tempo de inatividade real / Número de interrupções
- Tempo médio entre falhas (MTBF): O tempo médio que um dispositivo ou sistema funcionou sem falhas ou o tempo médio necessário para que uma falha aconteça. O termo também pode significar o período que um usuário pode esperar razoavelmente que um dispositivo ou sistema funcione antes que ocorra uma falha incapacitante. Esse valor deve ser o mais alto possível. MTBF será igual ao tempo total de atividade caso não haja interrupções.
MTBF = Tempo de atividade real / Número de interrupções
No nosso exemplo acima, o período selecionado é de um mês e o número de interrupções é um. Logo,
MTTR = (43 min 48 s / 1) = 43 minutos e 48 segundos
MTBF = (29 dias 23 horas e 16 min / 1) = 29 dias, 23 horas e 16 minutos
Tempo de resposta
O tempo de resposta é composto por quatro componentes principais, a saber: tempo de DNS, tempo de conexão, tempo do primeiro byte e tempo do último byte.
Como é calculado?
Tempo de resolução de DNS = Tempo de API - Tempo de DNS
Tempo de conexão = Hora de término da conexão - Hora de início da conexão
Tempo do primeiro byte = Hora de término da conexão - Início da resposta
Tempo de download = Hora de término da conexão - Término da resposta
Tempo de resposta = Tempo de resolução de DNS + Tempo de conexão + Tempo do primeiro byte + Tempo de download
The response time of the website is calculated across all monitoring locations for a chosen time period. On the website performance Summary page, the values shown are only for the primary location as a normal line graph. This graph also shows the maximum, minimum, 95th percentile, average response time, and throughput. All the metrics are calculated based on the selected time period and for all monitoring locations.
- The Summary page displays a graph only for the primary location.
- Clicking the graph icon
redirects you to the View Performance Report, where you can view a graph for any secondary location using the drop-down menu.
No exemplo acima, para o momento selecionado, os valores para os diferentes componentes do tempo de resposta são:
Tempo de resolução de DNS = 64 ms
Tempo de conexão = 222 ms
Tempo do primeiro byte = 129 ms
Tempo de download = 11 ms
Portanto, para o momento selecionado;
Tempo de resposta = 64 + 222 + 129 + 11 = 426 ms
Mín: Valor mínimo de todas as entradas durante o período selecionado
Max: Valor máximo de todas as entradas durante o período selecionado
Média: Soma do tempo de resposta de todas as entradas / Número total de entradas