Métricas de monitoramento com suporte

Nesta página, listamos as métricas disponíveis para o Memorystore para Redis Cluster e descrevemos o que cada uma mede.

Métricas de backup

Esta seção lista e descreve as métricas de backup e importação.

Métricas no nível do cluster

Esta seção lista e descreve as métricas de backup e importação no nível do cluster.

Nome da métrica Descrição
redis.googleapis.com/cluster/backup/last_backup_start_time Essa métrica mostra o horário de início da última operação de backup.
redis.googleapis.com/cluster/backup/last_backup_status Essa métrica mostra se a tentativa de backup mais recente foi concluída com sucesso ou falhou. Os status são 1 para Success e 0 para Failed.
redis.googleapis.com/cluster/backup/last_backup_duration Essa métrica mostra a duração da última operação de backup (em milissegundos).
redis.googleapis.com/cluster/backup/last_backup_size Essa métrica mostra o tamanho do último backup (em bytes). Essa métrica é um indicador importante para monitorar a eficiência do backup e o planejamento da capacidade de armazenamento.
redis.googleapis.com/cluster/import/last_import_start_time Essa métrica mostra o horário de início da última operação de importação.
redis.googleapis.com/cluster/import/last_import_duration Essa métrica mostra a duração da última operação de importação (em milissegundos).

Métricas da autoridade certificadora (CA)

Esta seção lista as métricas associadas a autoridades de certificação (CAs) gerenciadas pelo cliente.

Métricas no nível do cluster

Essas métricas oferecem uma visão geral de alto nível dos certificados associados às máquinas em um cluster.

Nome da métrica Descrição
redis.googleapis.com/cluster/security/rotate_tls_cert_count

Essa métrica mostra o status da rotação de certificados associados a máquinas em um cluster.

A métrica pode ter os seguintes status:

  • SUCCESS: o Memorystore para Redis Cluster girou o certificado.
  • FAILED: o Memorystore for Redis Cluster não girou o certificado porque ele não está disponível, o Memorystore for Redis Cluster não tem permissões para girar o certificado ou ocorreu um erro interno.
  • SKIPPED: o Memorystore for Redis Cluster não girou o certificado porque não é necessário.

Métricas do Cloud Monitoring

Esta seção lista e descreve as métricas do Cloud Monitoring disponíveis para o Memorystore para Redis Cluster.

Métricas no nível do cluster

Essas métricas fornecem uma visão geral da integridade e do desempenho de um cluster. Você pode usar as métricas para entender a capacidade e a utilização geral de um cluster, além de identificar possíveis gargalos ou áreas de melhoria.

Nome da métrica Descrição
redis.googleapis.com/cluster/clients/average_connected_clients Essa métrica mede o número médio de conexões de cliente ativas com um cluster em um período especificado. É possível usar a métrica para monitorar o escalonamento de conexões, identificar gargalos de aplicativos e garantir a estabilidade do cluster.
redis.googleapis.com/cluster/clients/maximum_connected_clients Essa métrica mostra o número máximo de conexões de clientes ativas em todos os nós de um cluster. É possível usar a métrica para monitorar a maior carga de conexão no cluster a qualquer momento. Isso é fundamental para garantir um alto desempenho do cluster, porque um grande número de conexões pode aumentar os tempos de resposta.
redis.googleapis.com/cluster/clients/total_connected_clients Essa métrica rastreia o número atual de conexões de cliente ativas com um cluster. Use a métrica para monitorar a carga do banco de dados e evitar limites de conexão.
redis.googleapis.com/cluster/stats/total_connections_received_count Essa métrica mostra o número cumulativo de conexões de clientes criadas em um cluster no último minuto. Você pode usar a métrica para analisar a carga de tráfego, garantir que os limites de conexão não sejam excedidos e determinar se é necessário escalonar o cluster.
redis.googleapis.com/cluster/stats/total_rejected_connections_count Essa métrica rastreia o número total de conexões com um cluster que são rejeitadas porque o limite de maxclients foi atingido.
redis.googleapis.com/cluster/commandstats/total_usec_count Essa métrica mede o tempo total de CPU consumido por cada comando. A métrica indica o total de microssegundos usados, o que fornece insights sobre a performance e a latência de um cluster.
redis.googleapis.com/cluster/commandstats/total_calls_count Essa métrica mede o número total de chamadas associadas a um comando específico em um nó de cluster em um minuto. Para identificar gargalos ou tráfego alto em comandos específicos, use a métrica para monitorar a capacidade de processamento de comandos (comandos por minuto) em nós primários e de réplica.
redis.googleapis.com/cluster/cpu/average_utilization Essa métrica mostra o uso médio da CPU de um cluster (de 0,0 a 1,0). É possível usar a métrica para identificar recursos superdimensionados ou subutilizados, gerenciar limites de escalonamento automático e detectar gargalos de desempenho, com uma utilização ideal de 40% a 70%.
redis.googleapis.com/cluster/cpu/maximum_utilization

Essa métrica mostra o pico de uso da CPU em todos os nós de um cluster (de 0,0 a 1,0).

A métrica resume apenas os estados sys_main_thread e user_main_thread. Ele não inclui outros estados da CPU, como sys_children ou user_children, que estão disponíveis na métrica /cluster/node/cpu/utilization .

Verifique se a utilização da CPU não excede 0,8 segundo para o nó principal e 0,5 segundo para cada réplica de leitura. Para mais informações, consulte Práticas recomendadas de uso da CPU.

redis.googleapis.com/cluster/stats/average_expired_keys Essa métrica mede o número médio de eventos de expiração de chave para todos os nós principais de um cluster. Use a métrica para monitorar o número de chaves que estão expirando.
redis.googleapis.com/cluster/stats/maximum_expired_keys Essa métrica mede o número máximo de eventos de expiração de chave que estão ocorrendo em todos os nós principais de um cluster.
redis.googleapis.com/cluster/stats/total_expired_keys_count Essa métrica rastreia o número total de eventos de expiração de chave que estão ocorrendo em todos os nós principais de um cluster. Você pode usar a métrica para monitorar o número de chaves que estão expirando.
redis.googleapis.com/cluster/stats/average_evicted_keys Essa métrica rastreia o número médio de chaves removidas devido a restrições de capacidade de memória nos fragmentos principais de um cluster.
redis.googleapis.com/cluster/stats/maximum_evicted_keys Essa métrica mostra o maior número de chaves removidas de um nó ou fragmento de um cluster primário devido à capacidade de memória.
redis.googleapis.com/cluster/stats/total_evicted_keys_count Essa métrica mostra o número total de chaves removidas por um nó de um cluster primário devido à capacidade de memória.
redis.googleapis.com/cluster/keyspace/total_keys Essa métrica mostra o número de chaves armazenadas em um cluster.
redis.googleapis.com/cluster/stats/average_keyspace_hits Essa métrica mostra o número médio de pesquisas bem-sucedidas de chaves em todos os nós de um cluster.
redis.googleapis.com/cluster/stats/maximum_keyspace_hits Essa métrica mostra o número máximo de pesquisas bem-sucedidas de chaves em um nó de cluster. Você pode usar a métrica para monitorar a performance do cluster e identificar possíveis hotspots nele.
redis.googleapis.com/cluster/stats/total_keyspace_hits_count Essa métrica rastreia o número cumulativo de pesquisas bem-sucedidas de chaves em todos os nós de um cluster.
redis.googleapis.com/cluster/stats/average_keyspace_misses Essa métrica mostra o número médio de buscas com falha de chaves em um cluster. Use a métrica para rastrear a frequência com que as chaves são solicitadas, mas não encontradas no cache.
redis.googleapis.com/cluster/stats/maximum_keyspace_misses Essa métrica mostra o número máximo de pesquisas com falha de chaves em um nó de cluster.
redis.googleapis.com/cluster/stats/total_keyspace_misses_count Essa métrica mostra o número total de pesquisas de chaves com falha em todos os nós do cluster.
redis.googleapis.com/cluster/memory/average_utilization Essa métrica mostra a utilização média da memória em um cluster (de 0,0 a 1,0). É possível usar a métrica para monitorar a capacidade do cluster e definir limites de alerta. Por exemplo, é possível definir um limite de alerta para notificar os usuários quando a memória média exceder uma porcentagem específica (por exemplo, 80%).
redis.googleapis.com/cluster/memory/maximum_utilization Essa métrica mostra a utilização máxima da memória em todos os nós do cluster (de 0,0 a 1,0). É possível usar a métrica para identificar quando escalonar um cluster. Recomendamos que você monitore o uso para garantir que ele permaneça abaixo de 100%. Com cargas de gravação altas, a performance pode diminuir se essa métrica atingir de 65% a 85%.
redis.googleapis.com/cluster/memory/total_used_memory Essa métrica mostra o uso da memória total de um cluster (em bytes). Você pode usar a métrica para monitorar a capacidade do cluster.
redis.googleapis.com/cluster/memory/size Essa métrica mede a RAM total, usada e disponível em todos os nós de um cluster. É possível usar a métrica para monitorar a capacidade do cluster e evitar falhas de nós.
redis.googleapis.com/cluster/replication/average_ack_lag Essa métrica mostra o atraso médio de confirmação (em segundos) das réplicas em um cluster. O

atraso de confirmação é um gargalo no nó principal de um cluster. Esse gargalo é causado pelas réplicas que não conseguem acompanhar as informações enviadas pelo nó principal. Quando isso acontece, o nó principal precisa aguardar o reconhecimento de que as réplicas receberam as informações. Isso pode diminuir a velocidade dos commits de transação e causar um impacto no desempenho do nó principal.
redis.googleapis.com/cluster/replication/maximum_ack_lag Essa métrica mostra o atraso máximo de confirmação (em segundos) de réplicas em um cluster.
redis.googleapis.com/cluster/replication/average_offset_diff Essa métrica mostra a diferença média de deslocamento de confirmação de replicação (em bytes) em um cluster.

A diferença de deslocamento de confirmação da replicação significa o número de bytes que não são replicados entre as réplicas e os clusters principais.
redis.googleapis.com/cluster/replication/maximum_offset_diff Essa métrica mostra a diferença máxima de compensação de replicação (em bytes) em um cluster.

A diferença de deslocamento da replicação significa o número de bytes que não são replicados entre as réplicas e os clusters principais.
redis.googleapis.com/cluster/stats/total_net_input_bytes_count Essa métrica mostra a contagem de bytes de rede recebidos pelos endpoints de um cluster.
redis.googleapis.com/cluster/stats/total_net_output_bytes_count Essa métrica mostra a contagem de bytes de rede de saída enviados pelos endpoints de um cluster.

Métricas no nível do nó

Essas métricas oferecem insights detalhados sobre a integridade e a performance de nós individuais em um cluster. Use as métricas para resolver problemas com os nós e otimizar a performance deles.

Nome da métrica Descrição
redis.googleapis.com/cluster/node/clients/connected_clients Essa métrica indica o número de conexões de cliente ativas com um nó de cluster, exceto conexões de réplica. Use a métrica para monitorar limites de conexão e identificar pontos de acesso em que um fragmento recebe tráfego desproporcional.
redis.googleapis.com/cluster/node/clients/blocked_clients Essa métrica mostra o número de conexões de cliente que um nó de cluster bloqueia. Um número alto ou em rápido aumento de conexões de cliente bloqueadas pode indicar que muitos clientes estão aguardando operações. Isso pode aumentar a latência.
redis.googleapis.com/cluster/node/server/uptime Essa métrica mede o tempo de atividade de um nó de cluster. Use a métrica para acompanhar por quanto tempo um servidor é executado continuamente sem uma reinicialização ou falha.
redis.googleapis.com/cluster/node/stats/connections_received_count Essa métrica rastreia o número total de conexões de cliente criadas em um nó de cluster em um período especificado. Use a métrica para monitorar o tráfego de conexão para nós individuais em um cluster. Como resultado, você pode analisar a distribuição de carga e identificar picos na atividade de conexão.
redis.googleapis.com/cluster/node/stats/rejected_connections_count Essa métrica mostra o número de conexões rejeitadas porque um nó de cluster atingiu o limite de maxclients. Use a métrica para identificar se um nó está sob alta pressão de conexão e recusando novas conexões porque não consegue processar mais.
redis.googleapis.com/cluster/node/commandstats/usec_count Essa métrica mostra o tempo total que cada comando consome em um nó de cluster. É possível usar a métrica para analisar a performance dos comandos, identificar comandos lentos e resolver problemas de latência no nível do nó.
redis.googleapis.com/cluster/node/commandstats/calls_count Essa métrica rastreia o número total de chamadas para um comando em um nó de cluster por minuto. Use a métrica para monitorar a distribuição de tráfego, identificar comandos muito usados e resolver gargalos em nós individuais.
redis.googleapis.com/cluster/node/cpu/utilization Essa métrica mostra a utilização da CPU para um nó de cluster (de 0,0 a 1,0).
redis.googleapis.com/cluster/node/stats/expired_keys_count Essa métrica mostra o número total de eventos de expiração em um nó de cluster. É possível usar a métrica para monitorar a taxa em que as chaves são removidas do cluster porque o time to live (TTL) chega a zero.
redis.googleapis.com/cluster/node/stats/evicted_keys_count Essa métrica conta o número total de chaves que um nó de cluster remove porque o cluster atinge o limite máximo de memória. A métrica pode identificar se um cluster está com pressão de memória. Contagens altas ou crescentes de chaves removidas indicam que um cluster está ficando sem espaço. Como resultado, o cluster remove chaves para abrir espaço para novos dados.
redis.googleapis.com/cluster/node/keyspace/total_keys Essa métrica mede o número total de chaves que um nó de cluster armazena. A métrica oferece visibilidade da distribuição e do fragmentação de dados entre os nós.
redis.googleapis.com/cluster/node/stats/keyspace_hits_count Essa métrica rastreia o número de pesquisas de chaves bem-sucedidas em um nó de cluster. Use a métrica para monitorar a eficiência do nó ao recuperar dados na memória.
redis.googleapis.com/cluster/node/stats/keyspace_misses_count Essa métrica rastreia o número de pesquisas de chaves com falha em um nó de cluster.
redis.googleapis.com/cluster/node/memory/utilization Essa métrica rastreia a utilização da memória em um nó de cluster (de 0,0 a 1,0). É possível usar a métrica para evitar falhas de nós e garantir a estabilidade de um cluster.
redis.googleapis.com/cluster/node/memory/usage Essa métrica mede o uso da memória total de um nó de cluster.
redis.googleapis.com/cluster/node/stats/net_input_bytes_count Essa métrica mede o número total de bytes de rede recebidos por um nó de cluster. Você pode usar a métrica para monitorar a capacidade de processamento da rede, identificar possíveis gargalos e analisar picos de tráfego no nó.
redis.googleapis.com/cluster/node/stats/net_output_bytes_count Essa métrica mede o número total de bytes de rede de saída enviados por um nó de cluster. É possível usar a métrica para monitorar o volume de saída de rede do nó para fins de ajuste de desempenho e planejamento de capacidade.
redis.googleapis.com/cluster/node/replication/offset Essa métrica mede os bytes de compensação de replicação de um nó de cluster. Antes de promover as réplicas de um cluster para clusters principais, use a métrica para verificar se as réplicas processaram todos os dados. Isso evita a perda de dados.
redis.googleapis.com/cluster/node/server/healthy Essa métrica determina se um nó de cluster está disponível e funcionando corretamente.

Métricas de replicação entre regiões

Nesta seção, listamos e descrevemos as métricas de replicação entre regiões.

Nome da métrica Descrição
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links Essa métrica mostra o número de links de fragmento entre os clusters principal e secundário. Em um grupo de replicação entre regiões, um cluster principal informa o número de links de replicação de CRR que ele tem com os clusters secundários no grupo. Para cada cluster secundário, esse número deve ser igual ao número de fragmentos. Se, inesperadamente, o número cair abaixo do número de fragmentos, isso vai identificar o número de fragmentos em que a replicação entre o replicador e o seguidor foi interrompida. Em um estado ideal, essa métrica deve ter o mesmo número que a contagem de shards do cluster principal.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff Essa métrica mede a diferença máxima de deslocamento de replicação (em bytes) entre os shards primários e secundários (réplica) de um cluster em diferentes regiões.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff Essa métrica mede a diferença média de deslocamento de replicação (em bytes) entre os shards primários e de réplica de um cluster em diferentes regiões. Valores altos para a métrica indicam um atraso na replicação, que pode ser resolvido pausando e retomando a replicação.

Métricas JSON

Esta seção lista métricas no nível do nó para documentos JSON.

Métricas no nível do nó

Essas métricas oferecem insights detalhados sobre o número total de documentos JSON e a quantidade de memória que eles consomem.

Nome da métrica Descrição
redis.googleapis.com/cluster/node/json/documents_count Essa métrica mede o número total de documentos JSON localizados em um nó de cluster. É possível usar a métrica para rastrear a distribuição e a capacidade de dados, porque ela mostra quantos documentos são indexados, excluídos ou mesclados no nível do nó.
redis.googleapis.com/cluster/node/json/used_memory Essa métrica mede a quantidade de memória (em bytes ou como uma porcentagem da memória disponível) que os documentos JSON consomem. Use a métrica para monitorar a capacidade, identificar nós vinculados à memória e acionar ações de escalonamento.

Métricas de persistência

Esta seção lista e descreve as métricas de persistência.

Métricas de persistência do RDB

Esta seção lista e descreve as métricas de persistência do banco de dados Redis (RDB).

Métricas no nível do cluster

Esta seção lista e descreve as métricas de persistência de RDB no nível do cluster.

Nome da métrica Descrição
redis.googleapis.com/cluster/persistence/rdb_saves_count

Essa métrica rastreia o número cumulativo de vezes que um snapshot de persistência do RDB (também conhecido como salvamento do RDB) é feito em um nó de cluster. É possível usar a métrica para monitorar a frequência e o sucesso dos snapshots do RDB por nó.

A métrica tem um campo status_code. Para verificar se um snapshot de RDB falhou, filtre o campo status_code pelo status 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/persistence/rdb_save_ages Essa métrica mostra a idade de um snapshot de distribuição para todos os nós em um cluster. Em caso de um incidente de recuperação, use a métrica para conferir o período de defasagem dos dados. O ideal é que a distribuição tenha valores com menos tempo de atraso (ou o mesmo tempo de atraso) que a frequência de snapshots.

Métricas no nível do nó

Nome da métrica Descrição
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress Essa métrica indica se um salvamento em segundo plano de RDB (BGSAVE) está ativo em um nó de cluster. Um status TRUE significa que o BGSAVE está ativo.
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status Essa métrica indica se a operação BGSAVE em um nó de cluster foi concluída ou encontrou um erro. Um status TRUE significa que a operação foi concluída.
redis.googleapis.com/cluster/node/persistence/rdb_saves_count Essa métrica rastreia o número cumulativo de snapshots de RDB criados em um nó de cluster. Use a métrica para monitorar a frequência e o sucesso dos snapshots no nó.
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age Essa métrica mede o tempo, em segundos, decorrido desde o último snapshot do RDB concluído. É possível usar a métrica para monitorar a defasagem dos dados de persistência do RDB em um nó de cluster.
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until Essa métrica mede o tempo restante, em segundos, até que o próximo snapshot do RDB seja programado para ocorrer em um nó de cluster. Use a métrica para monitorar o cronograma de persistência do RDB e acompanhar quando o próximo snapshot automático será criado.
redis.googleapis.com/cluster/node/persistence/current_save_keys_total Essa métrica rastreia o número total de chaves processadas na operação de salvamento do RDB atual em um nó de cluster.

Métricas de persistência de AOF

Esta seção lista e descreve as métricas de persistência de arquivo somente de anexação (AOF, na sigla em inglês).

Métricas no nível do cluster

Esta seção lista e descreve as métricas de persistência de AOF no nível do cluster.

Nome da métrica Descrição
redis.googleapis.com/cluster/persistence/aof_fsync_lags

Essa métrica mede a diferença de tempo (ou atraso) de todos os nós em um cluster que passa entre a gravação de dados no AOF e quando esses dados são sincronizados com sucesso no armazenamento durável.

Quando o parâmetro appendfsync é definido como everysec, é possível usar a métrica para avaliar a integridade da persistência do cluster. O ideal é que a distribuição do atraso tenha valores com menos tempo de atraso (ou o mesmo tempo) que a frequência de sincronização do AOF.

redis.googleapis.com/cluster/persistence/aof_rewrite_count

Essa métrica rastreia o número cumulativo de vezes que um nó de cluster aciona uma operação de reescrita de AOF. É possível usar a métrica para diagnosticar problemas de desempenho, já que uma alta frequência de reescritas de AOF pode causar picos de latência ou pressão de memória no cluster.

A métrica tem um campo status_code. Para verificar se as reescritas de AOF falham, filtre esse campo pelo status 3 - INTERNAL_ERROR.

Métricas no nível do nó

Esta seção lista e descreve as métricas de persistência AOF no nível do nó.

Nome da métrica Descrição
redis.googleapis.com/cluster/node/persistence/aof_last_write_status Essa métrica mostra o status da última operação de gravação no arquivo AOF em um nó do cluster. Se o status for TRUE, a operação de gravação será bem-sucedida. Você pode usar a métrica para verificar se o Memorystore para Redis Cluster persiste os dados com sucesso.
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status Essa métrica mostra o status da última operação de bgrewrite AOF em um nó de cluster. Se o status for TRUE, a operação foi bem-sucedida.
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

Essa métrica mede a diferença de tempo (ou atraso) para um nó de cluster que passa entre a gravação de dados no AOF e quando esses dados são sincronizados com sucesso no armazenamento durável.

Quando o parâmetro appendfsync é definido como everysec, é possível usar a métrica para avaliar a integridade da persistência do nó. Se o processo de sincronização de dados levar mais de um segundo, a persistência vai ficar atrás dos dados recebidos, o que pode levar à degradação do desempenho ou à perda de dados em caso de falha.

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

Essa métrica rastreia o número cumulativo de vezes que um nó de cluster aciona uma operação de reescrita de AOF. Você pode usar a métrica para diagnosticar problemas de performance. Altas frequências de reescritas de AOF podem aumentar a latência ou a pressão de memória no cluster.

A métrica tem um campo status_code. Para verificar se as reescritas de AOF falham, filtre esse campo pelo status 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count Essa métrica rastreia o número cumulativo de vezes que a chamada de sistema fsync() do AOF falha em um nó de cluster. A métrica é aplicável somente a clusters ativados para AOF em que o parâmetro appendfsync está definido como everysec ou always.

Métricas comuns de persistência

Esta seção lista e descreve as métricas aplicáveis à persistência AOF e RDB.

Métricas no nível do nó

Esta seção lista e descreve as métricas de persistência AOF e RDB no nível do nó.

Nome da métrica Descrição
redis.googleapis.com/cluster/node/persistence/auto_restore_count

Essa métrica rastreia o número cumulativo de vezes que um nó de cluster é restaurado automaticamente de um arquivo dump de persistência (AOF ou RDB).

A métrica tem um campo status_code. Para verificar se as restaurações falham, filtre esse campo pelo status 3 - INTERNAL_ERROR.

Exemplos de casos de uso para métricas de persistência

Verificar se as operações de gravação de AOF causam latência e pressão de memória

Suponha que você detecte aumento na latência ou no uso da memória no cluster ou no nó dentro dele. Nesse caso, verifique se o uso extra está relacionado à persistência de AOF.

Como você sabe que as operações de reescrita de AOF podem acionar picos de carga temporários, é possível inspecionar a métrica aof_rewrites_count, que fornece a contagem cumulativa de reescritas de AOF durante o ciclo de vida do cluster ou do nó dentro do cluster. Suponha que essa métrica mostre que os incrementos na contagem de reescritas correspondem a aumentos na latência. Nesse caso, é possível resolver o problema reduzindo a taxa de gravação ou aumentando a contagem de fragmentos para diminuir a frequência de regravações.

Verificar se as operações de salvamento do RDB causam latência e pressão de memória

Suponha que você detecte aumento na latência ou no uso da memória no cluster ou no nó dentro dele. Nesse caso, verifique se o uso extra está relacionado à persistência do RDB.

Como você sabe que as operações de salvamento do RDB podem acionar picos de carga temporários, inspecione a métrica rdb_saves_count, que fornece a contagem cumulativa de salvamentos do RDB durante o ciclo de vida do cluster ou do nó dentro do cluster. Suponha que essa métrica mostre que os incrementos na contagem de salvamentos do RDB correspondem a aumentos na latência. Nesse caso, é possível reduzir o intervalo do snapshot do RDB para diminuir a frequência de reescritas. Também é possível escalonar horizontalmente o cluster para reduzir os níveis de carga de referência.

Interpretar métricas do Memorystore for Redis Cluster

Como visto na lista acima, muitas das métricas compartilham três categorias: média, máximo e total.

Para o Memorystore for Redis Cluster, oferecemos variações média e máxima da mesma métrica para que você possa usar as duas e identificar pontos de acesso para essa família de métricas.

O valor total da métrica é independente e fornece insights separados que não estão relacionados ao propósito das variações média e máxima para pontos de acesso.

Entender as métricas de média e máxima

Suponha que você compare os valores average_keyspace_hits e maximum_keyspace_hits do seu cluster. À medida que a diferença entre as duas métricas aumenta, uma diferença maior indica que há mais pontos de acesso para hits no cluster. Um valor próximo entre average_keyspace_hits e maximum_keyspace_hits indica que os hits estão distribuídos de maneira mais uniforme no cluster.

Esse princípio se aplica a todas as métricas que têm as variações média e máxima da mesma métrica.

Exemplo de ponto de acesso

Se você comparar average_keyspace_hits e maximum_keyspace_hits para todos os fragmentos no cluster, essa comparação vai indicar onde ocorrem os pontos de acesso. Por exemplo, suponha que os fragmentos em um cluster de seis fragmentos tenham o seguinte número de hits:

  • Fragmento 1: 2 hits
  • Fragmento 2: 2 hits
  • Fragmento 3: 2 hits
  • Fragmento 4: 2 hits
  • Fragmento 5: 2 hits
  • Fragmento 6: 8 hits

Neste exemplo, average_keyspace_hits retorna um valor de 3, e maximum_keyspace_hits retorna 8, indicando que o fragmento 6 está quente.

Fornecemos métricas no nível do nó que podem ser usadas para identificar pontos de acesso no cluster.