Prometheus HA di Kubernetes (AKS)

Saya menjalankan bagan helm berikut (https://github.com/helm/charts/tree/master/stable/prometheus) dengan server.replicaCount =2 dan server.statefulSet.enabled = true.

Untuk penyimpanan saya menggunakan dua Kelola Disk (bukan File Azure yang bukan POSIX) (2 PV dan 2 PVC) yang dibuat selama penerapan bagan.

Pertanyaan saya adalah: Apakah ini solusi HA? Apakah metrik ditulis ke kedua instans prometheus (layanan dengan ip publik dan "layanan" tanpa kepala dibuat) dan direplikasi ke kedua disk?

Bagaimana cara kerja replika ini?

Terima kasih,


person Luís Marques    schedule 17.06.2020    source sumber


Jawaban (2)


Sayangnya, seperti dicatat Piotr, ini bukanlah penawaran HA yang sebenarnya dan Thanos umumnya merupakan cara yang lebih disukai untuk melakukan pengaturan semacam ini, tetapi bukannya tanpa adanya masalah tersendiri. Jumlah cluster yang Anda miliki adalah salah satu faktornya, dan Anda mungkin memerlukan semacam akun alat untuk dapat mengikuti perubahan sepenuhnya.

Yang bisa saya tawarkan kepada Anda adalah pembicaraan luar biasa ini, yang mencakup demo langsung dan menunjukkan caranya ini berhasil dalam praktiknya.

person tristanvvatson    schedule 18.06.2020

Tidak, ini bukan solusi HA. Ini hanya menskalakan penerapan agar memiliki 2 replika setiap saat yang keduanya berada di statefulset.

Untuk mencapai pemantauan HA di Kuberetes, diperlukan deteksi kegagalan dinamis dan alat perutean.

Ada beberapa artikel tentang membuat prometheus berfungsi dengan HA:

Menerapkan HA Prometheus di Kubernetes di AWS — Gotcha Beberapa Availability Zone

Pemantauan HA Kubernetes menggunakan Prometheus dan Thanos

Jumlah replika hanya menginstruksikan penerapan untuk selalu memiliki setidaknya 2 instance pod penerapan yang berjalan. Anda dapat menemukan informasi selengkapnya tentang replika di Kubernetes dokumentasi.

Dalam dokumentasi diagram helm, sepertinya ada opsi lain seperti server.service.statefulsetReplica.enabled dan server.service.statefulsetReplica.replica tapi menurut saya itu hanyalah alat yang dapat membantu membuat HA prometheus. Bukan solusi siap pakai dari awal.

Semoga ini bisa membantu.

person Piotr Malec    schedule 18.06.2020
comment
Halo. Terima kasih atas jawaban klarifikasi Anda. Bahkan saya memerlukan mekanisme deteksi kegagalan dinamis (Thanos dengan mobil samping), data (metrik) yang sama akan ada di kedua instance/disk? Misalnya metrik ke pushgateway hanya berlaku untuk satu replika? atau untuk keduanya? - person Luís Marques; 18.06.2020