Bab 30 · Bagian 5

Recovery and Rollback Infrastructure

A focused chapter on recovery and rollback infrastructure, with practical delivery concerns, trade-offs, and the operational questions behind CI/CD work.

30-1

Mengapa Rollback Infrastruktur Tidak Sama dengan Rollback Aplikasi

Rollback aplikasi mudah karena bersifat stateless. Rollback infrastruktur berbeda karena melibatkan state, dependensi, dan perubahan yang tidak selalu reversibel. Pelajari perbedaannya.

5 menit
30-2

Saat Perubahan Infrastruktur Bermasalah: Opsi Pemulihan dari Apply Ulang hingga Failover

Anda baru saja menjalankan terraform apply di infrastruktur produksi. Outputnya bersih. Tidak ada error. Lalu monitoring Anda memberi peringatan: pengguna tidak bisa terhubung ke database.

6 menit
30-3

Blast Radius: Cara Menentukan Strategi Pemulihan yang Benar-Benar Anda Butuhkan

Setiap perubahan infrastruktur memiliki risiko. Pelajari cara memperkirakan dan mengurangi blast radius, lalu pilih strategi pemulihan yang tepat: rollback, restore snapshot, failover, atau rebuild total.

5 menit
30-4

Rencana Pemulihan untuk Perubahan Infrastruktur Berisiko Tinggi

Panduan praktis menyusun rencana pemulihan sebelum menerapkan perubahan infrastruktur berisiko tinggi, termasuk langkah konkret, siapa yang memutuskan, dan kapan harus diaktifkan.

5 menit
30-5

Mengapa Rencana Pemulihan Anda Akan Gagal Tanpa Latihan

Rencana pemulihan yang hanya disimpan di folder bersama tanpa pernah diuji bukanlah rencana, melainkan ilusi keamanan. Pelajari cara menguji rencana pemulihan dengan game day, chaos engineering, dan simulasi proses.

5 menit
30-6

Ketika Perubahan Infrastruktur Gagal: Panduan Pemulihan Langkah demi Langkah

Pipeline berubah merah. Terraform apply yang seharusnya dua menit sudah berjalan lima belas menit. Dashboard monitoring menunjukkan lima resource gagal dibuat. Inilah panduan pemulihan infrastruktur langkah demi langkah untuk engineer DevOps dan SRE.

6 menit
30-7

Apa yang Terjadi Setelah Recovery: Mengubah Kegagalan Infrastruktur Menjadi Perbaikan Proses

Pelajari cara melakukan post-mortem tanpa menyalahkan, mengidentifikasi temuan teknis dan sistemik, serta menerjemahkannya ke dalam perbaikan pipeline dan rencana recovery yang konkret.

5 menit