Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Métricas de monitoramento com suporte

Nesta página, listamos as métricas disponíveis para o Memorystore para Redis Cluster e descrevemos o que cada uma mede.

Métricas de backup

Esta seção lista e descreve as métricas de backup e importação.

Métricas no nível do cluster

Esta seção lista e descreve as métricas de backup e importação no nível do cluster.

Nome da métrica	Descrição
`redis.googleapis.com/cluster/backup/last_backup_start_time`	Essa métrica mostra o horário de início da última operação de backup.
`redis.googleapis.com/cluster/backup/last_backup_status`	Essa métrica mostra se a tentativa de backup mais recente foi concluída com sucesso ou falhou. Os status são `1` para `Success` e `0` para `Failed`.
`redis.googleapis.com/cluster/backup/last_backup_duration`	Essa métrica mostra a duração da última operação de backup (em milissegundos).
`redis.googleapis.com/cluster/backup/last_backup_size`	Essa métrica mostra o tamanho do último backup (em bytes). Essa métrica é um indicador importante para monitorar a eficiência do backup e o planejamento da capacidade de armazenamento.
`redis.googleapis.com/cluster/import/last_import_start_time`	Essa métrica mostra o horário de início da última operação de importação.
`redis.googleapis.com/cluster/import/last_import_duration`	Essa métrica mostra a duração da última operação de importação (em milissegundos).

Métricas da autoridade certificadora (CA)

Esta seção lista as métricas associadas a autoridades de certificação (CAs) gerenciadas pelo cliente.

Métricas no nível do cluster

Essas métricas oferecem uma visão geral de alto nível dos certificados associados às máquinas em um cluster.

Nome da métrica Descrição

Nome da métrica	Descrição
`redis.googleapis.com/cluster/security/rotate_tls_cert_count`	Essa métrica mostra o status da rotação de certificados associados a máquinas em um cluster. A métrica pode ter os seguintes status: `SUCCESS`: o Memorystore para Redis Cluster girou o certificado. `FAILED`: o Memorystore for Redis Cluster não girou o certificado porque ele não está disponível, o Memorystore for Redis Cluster não tem permissões para girar o certificado ou ocorreu um erro interno. `SKIPPED`: o Memorystore for Redis Cluster não girou o certificado porque não é necessário.

redis.googleapis.com/cluster/security/rotate_tls_cert_count

Essa métrica mostra o status da rotação de certificados associados a máquinas em um cluster.

A métrica pode ter os seguintes status:

SUCCESS: o Memorystore para Redis Cluster girou o certificado.
FAILED: o Memorystore for Redis Cluster não girou o certificado porque ele não está disponível, o Memorystore for Redis Cluster não tem permissões para girar o certificado ou ocorreu um erro interno.
SKIPPED: o Memorystore for Redis Cluster não girou o certificado porque não é necessário.

Métricas do Cloud Monitoring

Esta seção lista e descreve as métricas do Cloud Monitoring disponíveis para o Memorystore para Redis Cluster.

Métricas no nível do cluster

Essas métricas fornecem uma visão geral da integridade e do desempenho de um cluster. Você pode usar as métricas para entender a capacidade e a utilização geral de um cluster, além de identificar possíveis gargalos ou áreas de melhoria.

Nome da métrica	Descrição
`redis.googleapis.com/cluster/clients/average_connected_clients`	Essa métrica mede o número médio de conexões de cliente ativas com um cluster em um período especificado. É possível usar a métrica para monitorar o escalonamento de conexões, identificar gargalos de aplicativos e garantir a estabilidade do cluster.
`redis.googleapis.com/cluster/clients/maximum_connected_clients`	Essa métrica mostra o número máximo de conexões de clientes ativas em todos os nós de um cluster. É possível usar a métrica para monitorar a maior carga de conexão no cluster a qualquer momento. Isso é fundamental para garantir um alto desempenho do cluster, porque um grande número de conexões pode aumentar os tempos de resposta.
`redis.googleapis.com/cluster/clients/total_connected_clients`	Essa métrica rastreia o número atual de conexões de cliente ativas com um cluster. Use a métrica para monitorar a carga do banco de dados e evitar limites de conexão.
`redis.googleapis.com/cluster/stats/total_connections_received_count`	Essa métrica mostra o número cumulativo de conexões de clientes criadas em um cluster no último minuto. Você pode usar a métrica para analisar a carga de tráfego, garantir que os limites de conexão não sejam excedidos e determinar se é necessário escalonar o cluster.
`redis.googleapis.com/cluster/stats/total_rejected_connections_count`	Essa métrica rastreia o número total de conexões com um cluster que são rejeitadas porque o limite de `maxclients` foi atingido.
`redis.googleapis.com/cluster/commandstats/total_usec_count`	Essa métrica mede o tempo total de CPU consumido por cada comando. A métrica indica o total de microssegundos usados, o que fornece insights sobre a performance e a latência de um cluster.
`redis.googleapis.com/cluster/commandstats/total_calls_count`	Essa métrica mede o número total de chamadas associadas a um comando específico em um nó de cluster em um minuto. Para identificar gargalos ou tráfego alto em comandos específicos, use a métrica para monitorar a capacidade de processamento de comandos (comandos por minuto) em nós primários e de réplica.
`redis.googleapis.com/cluster/cpu/average_utilization`	Essa métrica mostra o uso médio da CPU de um cluster (de 0,0 a 1,0). É possível usar a métrica para identificar recursos superdimensionados ou subutilizados, gerenciar limites de escalonamento automático e detectar gargalos de desempenho, com uma utilização ideal de 40% a 70%.
`redis.googleapis.com/cluster/cpu/maximum_utilization`	Essa métrica mostra o pico de uso da CPU em todos os nós de um cluster (de 0,0 a 1,0). A métrica resume apenas os estados `sys_main_thread` e `user_main_thread`. Ele não inclui outros estados da CPU, como `sys_children` ou `user_children`, que estão disponíveis na métrica `/cluster/node/cpu/utilization`. Verifique se a utilização da CPU não excede 0,8 segundo para o nó principal e 0,5 segundo para cada réplica de leitura. Para mais informações, consulte Práticas recomendadas de uso da CPU.
`redis.googleapis.com/cluster/stats/average_expired_keys`	Essa métrica mede o número médio de eventos de expiração de chave para todos os nós principais de um cluster. Use a métrica para monitorar o número de chaves que estão expirando.
`redis.googleapis.com/cluster/stats/maximum_expired_keys`	Essa métrica mede o número máximo de eventos de expiração de chave que estão ocorrendo em todos os nós principais de um cluster.
`redis.googleapis.com/cluster/stats/total_expired_keys_count`	Essa métrica rastreia o número total de eventos de expiração de chave que estão ocorrendo em todos os nós principais de um cluster. Você pode usar a métrica para monitorar o número de chaves que estão expirando.
`redis.googleapis.com/cluster/stats/average_evicted_keys`	Essa métrica rastreia o número médio de chaves removidas devido a restrições de capacidade de memória nos fragmentos principais de um cluster.
`redis.googleapis.com/cluster/stats/maximum_evicted_keys`	Essa métrica mostra o maior número de chaves removidas de um nó ou fragmento de um cluster primário devido à capacidade de memória.
`redis.googleapis.com/cluster/stats/total_evicted_keys_count`	Essa métrica mostra o número total de chaves removidas por um nó de um cluster primário devido à capacidade de memória.
`redis.googleapis.com/cluster/keyspace/total_keys`	Essa métrica mostra o número de chaves armazenadas em um cluster.
`redis.googleapis.com/cluster/stats/average_keyspace_hits`	Essa métrica mostra o número médio de pesquisas bem-sucedidas de chaves em todos os nós de um cluster.
`redis.googleapis.com/cluster/stats/maximum_keyspace_hits`	Essa métrica mostra o número máximo de pesquisas bem-sucedidas de chaves em um nó de cluster. Você pode usar a métrica para monitorar a performance do cluster e identificar possíveis hotspots nele.
`redis.googleapis.com/cluster/stats/total_keyspace_hits_count`	Essa métrica rastreia o número cumulativo de pesquisas bem-sucedidas de chaves em todos os nós de um cluster.
`redis.googleapis.com/cluster/stats/average_keyspace_misses`	Essa métrica mostra o número médio de buscas com falha de chaves em um cluster. Use a métrica para rastrear a frequência com que as chaves são solicitadas, mas não encontradas no cache.
`redis.googleapis.com/cluster/stats/maximum_keyspace_misses`	Essa métrica mostra o número máximo de pesquisas com falha de chaves em um nó de cluster.
`redis.googleapis.com/cluster/stats/total_keyspace_misses_count`	Essa métrica mostra o número total de pesquisas de chaves com falha em todos os nós do cluster.
`redis.googleapis.com/cluster/memory/average_utilization`	Essa métrica mostra a utilização média da memória em um cluster (de 0,0 a 1,0). É possível usar a métrica para monitorar a capacidade do cluster e definir limites de alerta. Por exemplo, é possível definir um limite de alerta para notificar os usuários quando a memória média exceder uma porcentagem específica (por exemplo, 80%).
`redis.googleapis.com/cluster/memory/maximum_utilization`	Essa métrica mostra a utilização máxima da memória em todos os nós do cluster (de 0,0 a 1,0). É possível usar a métrica para identificar quando escalonar um cluster. Recomendamos que você monitore o uso para garantir que ele permaneça abaixo de 100%. Com cargas de gravação altas, a performance pode diminuir se essa métrica atingir de 65% a 85%.
`redis.googleapis.com/cluster/memory/total_used_memory`	Essa métrica mostra o uso da memória total de um cluster (em bytes). Você pode usar a métrica para monitorar a capacidade do cluster.
`redis.googleapis.com/cluster/memory/size`	Essa métrica mede a RAM total, usada e disponível em todos os nós de um cluster. É possível usar a métrica para monitorar a capacidade do cluster e evitar falhas de nós.
`redis.googleapis.com/cluster/replication/average_ack_lag`	Essa métrica mostra o atraso médio de confirmação (em segundos) das réplicas em um cluster. O atraso de confirmação é um gargalo no nó principal de um cluster. Esse gargalo é causado pelas réplicas que não conseguem acompanhar as informações enviadas pelo nó principal. Quando isso acontece, o nó principal precisa aguardar o reconhecimento de que as réplicas receberam as informações. Isso pode diminuir a velocidade dos commits de transação e causar um impacto no desempenho do nó principal.
`redis.googleapis.com/cluster/replication/maximum_ack_lag`	Essa métrica mostra o atraso máximo de confirmação (em segundos) de réplicas em um cluster.
`redis.googleapis.com/cluster/replication/average_offset_diff`	Essa métrica mostra a diferença média de deslocamento de confirmação de replicação (em bytes) em um cluster. A diferença de deslocamento de confirmação da replicação significa o número de bytes que não são replicados entre as réplicas e os clusters principais.
`redis.googleapis.com/cluster/replication/maximum_offset_diff`	Essa métrica mostra a diferença máxima de compensação de replicação (em bytes) em um cluster. A diferença de deslocamento da replicação significa o número de bytes que não são replicados entre as réplicas e os clusters principais.
`redis.googleapis.com/cluster/stats/total_net_input_bytes_count`	Essa métrica mostra a contagem de bytes de rede recebidos pelos endpoints de um cluster.
`redis.googleapis.com/cluster/stats/total_net_output_bytes_count`	Essa métrica mostra a contagem de bytes de rede de saída enviados pelos endpoints de um cluster.

Métricas no nível do nó

Essas métricas oferecem insights detalhados sobre a integridade e a performance de nós individuais em um cluster. Use as métricas para resolver problemas com os nós e otimizar a performance deles.

Nome da métrica	Descrição
`redis.googleapis.com/cluster/node/clients/connected_clients`	Essa métrica indica o número de conexões de cliente ativas com um nó de cluster, exceto conexões de réplica. Use a métrica para monitorar limites de conexão e identificar pontos de acesso em que um fragmento recebe tráfego desproporcional.
`redis.googleapis.com/cluster/node/clients/blocked_clients`	Essa métrica mostra o número de conexões de cliente que um nó de cluster bloqueia. Um número alto ou em rápido aumento de conexões de cliente bloqueadas pode indicar que muitos clientes estão aguardando operações. Isso pode aumentar a latência.
`redis.googleapis.com/cluster/node/server/uptime`	Essa métrica mede o tempo de atividade de um nó de cluster. Use a métrica para acompanhar por quanto tempo um servidor é executado continuamente sem uma reinicialização ou falha.
`redis.googleapis.com/cluster/node/stats/connections_received_count`	Essa métrica rastreia o número total de conexões de cliente criadas em um nó de cluster em um período especificado. Use a métrica para monitorar o tráfego de conexão para nós individuais em um cluster. Como resultado, você pode analisar a distribuição de carga e identificar picos na atividade de conexão.
`redis.googleapis.com/cluster/node/stats/rejected_connections_count`	Essa métrica mostra o número de conexões rejeitadas porque um nó de cluster atingiu o limite de `maxclients`. Use a métrica para identificar se um nó está sob alta pressão de conexão e recusando novas conexões porque não consegue processar mais.
`redis.googleapis.com/cluster/node/commandstats/usec_count`	Essa métrica mostra o tempo total que cada comando consome em um nó de cluster. É possível usar a métrica para analisar a performance dos comandos, identificar comandos lentos e resolver problemas de latência no nível do nó.
`redis.googleapis.com/cluster/node/commandstats/calls_count`	Essa métrica rastreia o número total de chamadas para um comando em um nó de cluster por minuto. Use a métrica para monitorar a distribuição de tráfego, identificar comandos muito usados e resolver gargalos em nós individuais.
`redis.googleapis.com/cluster/node/cpu/utilization`	Essa métrica mostra a utilização da CPU para um nó de cluster (de 0,0 a 1,0).
`redis.googleapis.com/cluster/node/stats/expired_keys_count`	Essa métrica mostra o número total de eventos de expiração em um nó de cluster. É possível usar a métrica para monitorar a taxa em que as chaves são removidas do cluster porque o time to live (TTL) chega a zero.
`redis.googleapis.com/cluster/node/stats/evicted_keys_count`	Essa métrica conta o número total de chaves que um nó de cluster remove porque o cluster atinge o limite máximo de memória. A métrica pode identificar se um cluster está com pressão de memória. Contagens altas ou crescentes de chaves removidas indicam que um cluster está ficando sem espaço. Como resultado, o cluster remove chaves para abrir espaço para novos dados.
`redis.googleapis.com/cluster/node/keyspace/total_keys`	Essa métrica mede o número total de chaves que um nó de cluster armazena. A métrica oferece visibilidade da distribuição e do fragmentação de dados entre os nós.
`redis.googleapis.com/cluster/node/stats/keyspace_hits_count`	Essa métrica rastreia o número de pesquisas de chaves bem-sucedidas em um nó de cluster. Use a métrica para monitorar a eficiência do nó ao recuperar dados na memória.
`redis.googleapis.com/cluster/node/stats/keyspace_misses_count`	Essa métrica rastreia o número de pesquisas de chaves com falha em um nó de cluster.
`redis.googleapis.com/cluster/node/memory/utilization`	Essa métrica rastreia a utilização da memória em um nó de cluster (de 0,0 a 1,0). É possível usar a métrica para evitar falhas de nós e garantir a estabilidade de um cluster.
`redis.googleapis.com/cluster/node/memory/usage`	Essa métrica mede o uso da memória total de um nó de cluster.
`redis.googleapis.com/cluster/node/stats/net_input_bytes_count`	Essa métrica mede o número total de bytes de rede recebidos por um nó de cluster. Você pode usar a métrica para monitorar a capacidade de processamento da rede, identificar possíveis gargalos e analisar picos de tráfego no nó.
`redis.googleapis.com/cluster/node/stats/net_output_bytes_count`	Essa métrica mede o número total de bytes de rede de saída enviados por um nó de cluster. É possível usar a métrica para monitorar o volume de saída de rede do nó para fins de ajuste de desempenho e planejamento de capacidade.
`redis.googleapis.com/cluster/node/replication/offset`	Essa métrica mede os bytes de compensação de replicação de um nó de cluster. Antes de promover as réplicas de um cluster para clusters principais, use a métrica para verificar se as réplicas processaram todos os dados. Isso evita a perda de dados.
`redis.googleapis.com/cluster/node/server/healthy`	Essa métrica determina se um nó de cluster está disponível e funcionando corretamente.

Métricas de replicação entre regiões

Nesta seção, listamos e descrevemos as métricas de replicação entre regiões.

Nome da métrica	Descrição
`redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links`	Essa métrica mostra o número de links de fragmento entre os clusters principal e secundário. Em um grupo de replicação entre regiões, um cluster principal informa o número de links de replicação de CRR que ele tem com os clusters secundários no grupo. Para cada cluster secundário, esse número deve ser igual ao número de fragmentos. Se, inesperadamente, o número cair abaixo do número de fragmentos, isso vai identificar o número de fragmentos em que a replicação entre o replicador e o seguidor foi interrompida. Em um estado ideal, essa métrica deve ter o mesmo número que a contagem de shards do cluster principal.
`redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff`	Essa métrica mede a diferença máxima de deslocamento de replicação (em bytes) entre os shards primários e secundários (réplica) de um cluster em diferentes regiões.
`redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff`	Essa métrica mede a diferença média de deslocamento de replicação (em bytes) entre os shards primários e de réplica de um cluster em diferentes regiões. Valores altos para a métrica indicam um atraso na replicação, que pode ser resolvido pausando e retomando a replicação.

Métricas JSON

Esta seção lista métricas no nível do nó para documentos JSON.

Métricas no nível do nó

Essas métricas oferecem insights detalhados sobre o número total de documentos JSON e a quantidade de memória que eles consomem.

Nome da métrica	Descrição
`redis.googleapis.com/cluster/node/json/documents_count`	Essa métrica mede o número total de documentos JSON localizados em um nó de cluster. É possível usar a métrica para rastrear a distribuição e a capacidade de dados, porque ela mostra quantos documentos são indexados, excluídos ou mesclados no nível do nó.
`redis.googleapis.com/cluster/node/json/used_memory`	Essa métrica mede a quantidade de memória (em bytes ou como uma porcentagem da memória disponível) que os documentos JSON consomem. Use a métrica para monitorar a capacidade, identificar nós vinculados à memória e acionar ações de escalonamento.

Métricas de persistência

Esta seção lista e descreve as métricas de persistência.

Métricas de persistência do RDB

Esta seção lista e descreve as métricas de persistência do banco de dados Redis (RDB).

Métricas no nível do cluster

Esta seção lista e descreve as métricas de persistência de RDB no nível do cluster.

Nome da métrica Descrição

Nome da métrica	Descrição
`redis.googleapis.com/cluster/persistence/rdb_saves_count`	Essa métrica rastreia o número cumulativo de vezes que um snapshot de persistência do RDB (também conhecido como salvamento do RDB) é feito em um nó de cluster. É possível usar a métrica para monitorar a frequência e o sucesso dos snapshots do RDB por nó. A métrica tem um campo `status_code`. Para verificar se um snapshot de RDB falhou, filtre o campo `status_code` pelo status `3 - INTERNAL_ERROR`.
`redis.googleapis.com/cluster/persistence/rdb_save_ages`	Essa métrica mostra a idade de um snapshot de distribuição para todos os nós em um cluster. Em caso de um incidente de recuperação, use a métrica para conferir o período de defasagem dos dados. O ideal é que a distribuição tenha valores com menos tempo de atraso (ou o mesmo tempo de atraso) que a frequência de snapshots.

redis.googleapis.com/cluster/persistence/rdb_saves_count

Essa métrica rastreia o número cumulativo de vezes que um snapshot de persistência do RDB (também conhecido como salvamento do RDB) é feito em um nó de cluster. É possível usar a métrica para monitorar a frequência e o sucesso dos snapshots do RDB por nó.

A métrica tem um campo status_code. Para verificar se um snapshot de RDB falhou, filtre o campo status_code pelo status 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/persistence/rdb_save_ages Essa métrica mostra a idade de um snapshot de distribuição para todos os nós em um cluster. Em caso de um incidente de recuperação, use a métrica para conferir o período de defasagem dos dados. O ideal é que a distribuição tenha valores com menos tempo de atraso (ou o mesmo tempo de atraso) que a frequência de snapshots.

Métricas no nível do nó

Nome da métrica	Descrição
`redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress`	Essa métrica indica se um salvamento em segundo plano de RDB (`BGSAVE`) está ativo em um nó de cluster. Um status `TRUE` significa que o `BGSAVE` está ativo.
`redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status`	Essa métrica indica se a operação `BGSAVE` em um nó de cluster foi concluída ou encontrou um erro. Um status `TRUE` significa que a operação foi concluída.
`redis.googleapis.com/cluster/node/persistence/rdb_saves_count`	Essa métrica rastreia o número cumulativo de snapshots de RDB criados em um nó de cluster. Use a métrica para monitorar a frequência e o sucesso dos snapshots no nó.
`redis.googleapis.com/cluster/node/persistence/rdb_last_save_age`	Essa métrica mede o tempo, em segundos, decorrido desde o último snapshot do RDB concluído. É possível usar a métrica para monitorar a defasagem dos dados de persistência do RDB em um nó de cluster.
`redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until`	Essa métrica mede o tempo restante, em segundos, até que o próximo snapshot do RDB seja programado para ocorrer em um nó de cluster. Use a métrica para monitorar o cronograma de persistência do RDB e acompanhar quando o próximo snapshot automático será criado.
`redis.googleapis.com/cluster/node/persistence/current_save_keys_total`	Essa métrica rastreia o número total de chaves processadas na operação de salvamento do RDB atual em um nó de cluster.

Métricas de persistência de AOF

Esta seção lista e descreve as métricas de persistência de arquivo somente de anexação (AOF, na sigla em inglês).

Métricas no nível do cluster

Esta seção lista e descreve as métricas de persistência de AOF no nível do cluster.

Nome da métrica Descrição

Nome da métrica	Descrição
`redis.googleapis.com/cluster/persistence/aof_fsync_lags`	Essa métrica mede a diferença de tempo (ou atraso) de todos os nós em um cluster que passa entre a gravação de dados no AOF e quando esses dados são sincronizados com sucesso no armazenamento durável. Quando o parâmetro `appendfsync` é definido como `everysec`, é possível usar a métrica para avaliar a integridade da persistência do cluster. O ideal é que a distribuição do atraso tenha valores com menos tempo de atraso (ou o mesmo tempo) que a frequência de sincronização do AOF.
`redis.googleapis.com/cluster/persistence/aof_rewrite_count`	Essa métrica rastreia o número cumulativo de vezes que um nó de cluster aciona uma operação de reescrita de AOF. É possível usar a métrica para diagnosticar problemas de desempenho, já que uma alta frequência de reescritas de AOF pode causar picos de latência ou pressão de memória no cluster. A métrica tem um campo `status_code`. Para verificar se as reescritas de AOF falham, filtre esse campo pelo status `3 - INTERNAL_ERROR`.

redis.googleapis.com/cluster/persistence/aof_fsync_lags

Essa métrica mede a diferença de tempo (ou atraso) de todos os nós em um cluster que passa entre a gravação de dados no AOF e quando esses dados são sincronizados com sucesso no armazenamento durável.

Quando o parâmetro appendfsync é definido como everysec, é possível usar a métrica para avaliar a integridade da persistência do cluster. O ideal é que a distribuição do atraso tenha valores com menos tempo de atraso (ou o mesmo tempo) que a frequência de sincronização do AOF.

redis.googleapis.com/cluster/persistence/aof_rewrite_count

Essa métrica rastreia o número cumulativo de vezes que um nó de cluster aciona uma operação de reescrita de AOF. É possível usar a métrica para diagnosticar problemas de desempenho, já que uma alta frequência de reescritas de AOF pode causar picos de latência ou pressão de memória no cluster.

A métrica tem um campo status_code. Para verificar se as reescritas de AOF falham, filtre esse campo pelo status 3 - INTERNAL_ERROR.

Métricas no nível do nó

Esta seção lista e descreve as métricas de persistência AOF no nível do nó.

Nome da métrica	Descrição
`redis.googleapis.com/cluster/node/persistence/aof_last_write_status`	Essa métrica mostra o status da última operação de gravação no arquivo AOF em um nó do cluster. Se o status for `TRUE`, a operação de gravação será bem-sucedida. Você pode usar a métrica para verificar se o Memorystore para Redis Cluster persiste os dados com sucesso.
`redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status`	Essa métrica mostra o status da última operação de `bgrewrite` AOF em um nó de cluster. Se o status for `TRUE`, a operação foi bem-sucedida.
`redis.googleapis.com/cluster/node/persistence/aof_fsync_lag`	Essa métrica mede a diferença de tempo (ou atraso) para um nó de cluster que passa entre a gravação de dados no AOF e quando esses dados são sincronizados com sucesso no armazenamento durável. Quando o parâmetro `appendfsync` é definido como `everysec`, é possível usar a métrica para avaliar a integridade da persistência do nó. Se o processo de sincronização de dados levar mais de um segundo, a persistência vai ficar atrás dos dados recebidos, o que pode levar à degradação do desempenho ou à perda de dados em caso de falha.
`redis.googleapis.com/cluster/node/persistence/aof_rewrites_count`	Essa métrica rastreia o número cumulativo de vezes que um nó de cluster aciona uma operação de reescrita de AOF. Você pode usar a métrica para diagnosticar problemas de performance. Altas frequências de reescritas de AOF podem aumentar a latência ou a pressão de memória no cluster. A métrica tem um campo `status_code`. Para verificar se as reescritas de AOF falham, filtre esse campo pelo status `3 - INTERNAL_ERROR`.
`redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count`	Essa métrica rastreia o número cumulativo de vezes que a chamada de sistema `fsync()` do AOF falha em um nó de cluster. A métrica é aplicável somente a clusters ativados para AOF em que o parâmetro `appendfsync` está definido como `everysec` ou `always`.

Métricas comuns de persistência

Esta seção lista e descreve as métricas aplicáveis à persistência AOF e RDB.

Métricas no nível do nó

Esta seção lista e descreve as métricas de persistência AOF e RDB no nível do nó.

Nome da métrica Descrição

Nome da métrica	Descrição
`redis.googleapis.com/cluster/node/persistence/auto_restore_count`	Essa métrica rastreia o número cumulativo de vezes que um nó de cluster é restaurado automaticamente de um arquivo dump de persistência (AOF ou RDB). A métrica tem um campo `status_code`. Para verificar se as restaurações falham, filtre esse campo pelo status `3 - INTERNAL_ERROR`.

redis.googleapis.com/cluster/node/persistence/auto_restore_count

Essa métrica rastreia o número cumulativo de vezes que um nó de cluster é restaurado automaticamente de um arquivo dump de persistência (AOF ou RDB).

A métrica tem um campo status_code. Para verificar se as restaurações falham, filtre esse campo pelo status 3 - INTERNAL_ERROR.

Exemplos de casos de uso para métricas de persistência

Verificar se as operações de gravação de AOF causam latência e pressão de memória

Suponha que você detecte aumento na latência ou no uso da memória no cluster ou no nó dentro dele. Nesse caso, verifique se o uso extra está relacionado à persistência de AOF.

Como você sabe que as operações de reescrita de AOF podem acionar picos de carga temporários, é possível inspecionar a métrica aof_rewrites_count, que fornece a contagem cumulativa de reescritas de AOF durante o ciclo de vida do cluster ou do nó dentro do cluster. Suponha que essa métrica mostre que os incrementos na contagem de reescritas correspondem a aumentos na latência. Nesse caso, é possível resolver o problema reduzindo a taxa de gravação ou aumentando a contagem de fragmentos para diminuir a frequência de regravações.

Verificar se as operações de salvamento do RDB causam latência e pressão de memória

Suponha que você detecte aumento na latência ou no uso da memória no cluster ou no nó dentro dele. Nesse caso, verifique se o uso extra está relacionado à persistência do RDB.

Como você sabe que as operações de salvamento do RDB podem acionar picos de carga temporários, inspecione a métrica rdb_saves_count, que fornece a contagem cumulativa de salvamentos do RDB durante o ciclo de vida do cluster ou do nó dentro do cluster. Suponha que essa métrica mostre que os incrementos na contagem de salvamentos do RDB correspondem a aumentos na latência. Nesse caso, é possível reduzir o intervalo do snapshot do RDB para diminuir a frequência de reescritas. Também é possível escalonar horizontalmente o cluster para reduzir os níveis de carga de referência.

Interpretar métricas do Memorystore for Redis Cluster

Como visto na lista acima, muitas das métricas compartilham três categorias: média, máximo e total.

Para o Memorystore for Redis Cluster, oferecemos variações média e máxima da mesma métrica para que você possa usar as duas e identificar pontos de acesso para essa família de métricas.

O valor total da métrica é independente e fornece insights separados que não estão relacionados ao propósito das variações média e máxima para pontos de acesso.

Entender as métricas de média e máxima

Suponha que você compare os valores average_keyspace_hits e maximum_keyspace_hits do seu cluster. À medida que a diferença entre as duas métricas aumenta, uma diferença maior indica que há mais pontos de acesso para hits no cluster. Um valor próximo entre average_keyspace_hits e maximum_keyspace_hits indica que os hits estão distribuídos de maneira mais uniforme no cluster.

Esse princípio se aplica a todas as métricas que têm as variações média e máxima da mesma métrica.

Exemplo de ponto de acesso

Se você comparar average_keyspace_hits e maximum_keyspace_hits para todos os fragmentos no cluster, essa comparação vai indicar onde ocorrem os pontos de acesso. Por exemplo, suponha que os fragmentos em um cluster de seis fragmentos tenham o seguinte número de hits:

Fragmento 1: 2 hits
Fragmento 2: 2 hits
Fragmento 3: 2 hits
Fragmento 4: 2 hits
Fragmento 5: 2 hits
Fragmento 6: 8 hits

Neste exemplo, average_keyspace_hits retorna um valor de 3, e maximum_keyspace_hits retorna 8, indicando que o fragmento 6 está quente.

Fornecemos métricas no nível do nó que podem ser usadas para identificar pontos de acesso no cluster.

Métricas de monitoramento com suporte Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Métricas de backup

Métricas no nível do cluster

Métricas da autoridade certificadora (CA)

Métricas no nível do cluster

Métricas do Cloud Monitoring

Métricas no nível do cluster

Métricas no nível do nó

Métricas de replicação entre regiões

Métricas JSON

Métricas no nível do nó

Métricas de persistência

Métricas de persistência do RDB

Métricas no nível do cluster

Métricas no nível do nó

Métricas de persistência de AOF

Métricas no nível do cluster

Métricas no nível do nó

Métricas comuns de persistência

Métricas no nível do nó

Exemplos de casos de uso para métricas de persistência

Verificar se as operações de gravação de AOF causam latência e pressão de memória

Verificar se as operações de salvamento do RDB causam latência e pressão de memória

Interpretar métricas do Memorystore for Redis Cluster

Entender as métricas de média e máxima

Exemplo de ponto de acesso

Métricas de monitoramento com suporte