moonwalker.id
Event: Soft launch moonwalker.id — Ikutan baca dan kasih feedback!
Baca Blog

Membangun Proxmox Cluster dan High Availability (HA)

13 Aug 2025

Kita bikin Proxmox VE (PVE) cluster tiga node lengkap sama High Availability (HA). Tujuannya simple: kalau satu node rewel, VM/LXC nggak ikutan drama—dia langsung pindah ke node lain. No babysitting, no begadang (semoga).

Disclaimer tipis: ini buat pondasi yang solid. Produksi beneran butuh fencing proper (IPMI/PSU), monitoring, dan SOP. Jangan disalahin kalau server tetangga kebakaran ya bro.

Prasyarat (yang sering disepelekan, padahal penting)

  • 3 node PVE (2 bisa, tapi 3 itu manis—buat quorum)
  • Versi PVE sama semua, jam sinkron (NTP itu bukan kosmetik)
  • Jaringan antar node stabil, latency kecil
  • DNS/hosts saling kenal, jangan LDR
  • Storage shared (NFS/iSCSI/Ceph) biar HA-nya masuk akal

ASCII Topologi (biar retro, tapi jelas)

                 +-------------------+
                 |     NAS / NFS     |
                 |  192.168.10.20    |
                 +---------+---------+
                           |
                           |  (Shared storage: NFS)
+----------------+    +----+----+    +----------------+
|    pve1        |====| corosync|====|     pve2       |
| 192.168.10.11  |    +---------+    | 192.168.10.12  |
|  VM 101 (RBD)  |==============================>      |
+--------+-------+         ^ failover ^        +--------+
         |
         | corosync
         v
+----------------+
|    pve3        |
| 192.168.10.13  |
+----------------+

Keterangan:

  • Corosync untuk cluster quorum/heartbeat
  • Storage NFS shared supaya VM bisa pindah node tanpa drama
  • VM 101 pindah otomatis kalau node asal KO (HA)

Skema jaringan contoh

  • pve1: 192.168.10.11
  • pve2: 192.168.10.12
  • pve3: 192.168.10.13

Kasih tau /etc/hosts di tiap node:

sudo tee -a /etc/hosts << 'EOF'
192.168.10.11 pve1
192.168.10.12 pve2
192.168.10.13 pve3
EOF

1) Install PVE dan update

Udah install? Mantap. Habis login, biasain update dulu:

apt update && apt -y full-upgrade
reboot

2) Bikin cluster di node pertama (CLI)

Di pve1:

pvecm create homelab-cluster

Cek status:

pvecm status

2A) Bikin/Join cluster via GUI (kalau tipe visual learner)

  • Datacenter > Cluster > Create Cluster
    • Cluster Name: homelab-cluster
    • Link 0 Address: 192.168.10.11 (IP pve1)
    • Create
  • Di pve2 & pve3: Datacenter > Cluster > Join Information (copy dari pve1)
    • Tempel token join, Join
  • Verifikasi: Datacenter > Cluster harus tampil 3 node, Quorum OK

3) Join node lain ke cluster (CLI)

Di pve2 dan pve3 (arahkan ke IP pve1):

pvecm add 192.168.10.11

Atau generate lewat GUI dari pve1: Datacenter > Cluster > Join Information.

Pastikan 3 node kebaca:

pvecm status

4) Siapkan storage shared (contoh NFS yang gampang)

Paling cepat: pake NFS dari NAS. Di GUI Proxmox: Datacenter > Storage > Add > NFS.

Atau lewat CLI (ganti server/export sesuai punya lo):

pvesh create /storage --storage nfs-shared \
  --type nfs --server 192.168.10.20 --export /mnt/pve-share \
  --content images,iso,backup,rootdir --options vers=4

Pastikan di kolom Shared = Yes. VM/CT yang mau di-HA wajib tinggal di storage shared. Kalau masih di local-lvm ya nggak bisa pindah rumah dong.

5) Setup HA

  • Bikin HA Group: Datacenter > HA > Groups > Create
    • Contoh: group “core” isi pve1, pve2, pve3 (boleh kasih prioritas)
  • Pindahin VM/CT ke storage shared
  • Tambahkan resource ke HA: Datacenter > HA > Add > pilih VM/CT dan group

Contoh CLI (VMID 101):

ha-manager add vm:101 --group core --state started
ha-manager status

GUI path (HA, step-by-step)

  • Datacenter > HA > Groups > Create (name: core) > pilih nodes
  • Datacenter > HA > Add > pilih VM 101 > group: core > state: started
  • Datacenter > HA > Status untuk live view

6) Uji failover (bagian seru-serem)

  • Jalanin VM 101 di pve1
  • Simulasiin pve1 ngambek: shutdown node atau stop service pve-cluster (buat uji aja)
  • Lihat HA CRM/LRM kerja: VM 101 bakal pindah ke pve2/pve3 setelah timeout yang wajar

Note: buat produksi, wajib pake fencing beneran (IPMI, power fence). Kalau enggak, bisa kejadian split-brain—dan itu bukan band metal.

7) Monitoring biar nggak buta

Cek corosync (latency/ring):

corosync-cfgtool -s

Lihat log HA biar tahu siapa yang lagi lembur:

journalctl -u pve-ha-lrm -u pve-ha-crm -f

Pengen tanpa NAS? Pertimbangkan Ceph untuk hyper‑converged storage (GUI: Datacenter > Ceph). Hiper-konvergen, hemat kabel, tapi siapin RAM/waktu.

Penutup

Dengan 3 node, quorum aman, dan storage shared, HA di Proxmox itu bukan rocket science. Yang ribet biasanya jaringan dan disiplin. Uji berkala, dokumentasi rapi, tidur pun lebih nyenyak. Kalau masih pusing, santai… besok ngopi dulu.

Referensi: dokumentasi resmi Proxmox, plus artikel pengantar clustering & HA dari Linux Handbook.