Prometheus HA в Kubernetes (AKS)

Я запускаю следующую диаграмму руля (https://github.com/helm/charts/tree/master/stable/prometheus) с server.replicaCount = 2 и server.statefulSet.enabled = true.

Для хранения я использую два диска управления (не файлы Azure, не соответствующие POSIX) (2 PV и 2 PVC), которые создаются во время развертывания диаграммы.

Мой вопрос: это решение HA? Метрики записываются на оба экземпляра prometheus (создается сервис с публичным ip и безголовым «сервисом») и реплицируются на оба диска?

Как на самом деле работают эти реплики?

Спасибо,


person Luís Marques    schedule 17.06.2020    source источник


Ответы (2)


К сожалению, как заметил Петр, это не настоящее предложение HA, и Thanos, как правило, является предпочтительным вариантом для такого рода настроек, но не без своих собственных ошибок. Количество кластеров, которые у вас есть, является фактором, и вам может понадобиться какая-то учетная запись инструментов, чтобы иметь возможность отслеживать изменения на всем протяжении.

Что я могу вам предложить, так это отличный доклад, который включает живую демонстрацию и показывает, как это работает на практике.

person tristanvvatson    schedule 18.06.2020

Нет, это не решение HA. Это только масштабирует развертывание, чтобы всегда иметь 2 реплики, обе из которых находятся в statefulsets.

Чтобы обеспечить мониторинг высокой доступности в Kuberetes, необходимо использовать инструменты динамического обнаружения сбоев и маршрутизации.

Есть пара статей о том, как заставить Prometheus работать с HA:

Развертывание HA Prometheus в Kubernetes на AWS — несколько ошибок в зонах доступности

Мониторинг высокой доступности Kubernetes с использованием Prometheus и Thanos

Количество реплик указывает только на то, что при развертывании всегда должно быть не менее 2 запущенных экземпляров модулей развертывания. Дополнительную информацию о репликах можно найти в документации Kubernetes< /а>.

В документации руля диаграммы, кажется, есть другие варианты, такие как server.service.statefulsetReplica.enabled и server.service.statefulsetReplica.replica, но я думаю, что это всего лишь инструменты, которые могут помочь создать HA prometheus. Не готовое решение с самого начала.

Надеюсь, поможет.

person Piotr Malec    schedule 18.06.2020
comment
Привет. Спасибо за ваш уточняющий ответ. Даже мне нужен какой-то механизм динамического обнаружения сбоев (Танос с коляской), одни и те же данные (метрики) будут на обоих экземплярах/дисках? Например метрика на pushgateway идет только на одну реплику? или для обоих? - person Luís Marques; 18.06.2020