Recovery and Rollback Infrastructure
A focused chapter on recovery and rollback infrastructure, with practical delivery concerns, trade-offs, and the operational questions behind CI/CD work.
Mengapa Rollback Infrastruktur Tidak Sama dengan Rollback Aplikasi
Rollback aplikasi mudah karena bersifat stateless. Rollback infrastruktur berbeda karena melibatkan state, dependensi, dan perubahan yang tidak selalu reversibel. Pelajari perbedaannya.
Saat Perubahan Infrastruktur Bermasalah: Opsi Pemulihan dari Apply Ulang hingga Failover
Anda baru saja menjalankan terraform apply di infrastruktur produksi. Outputnya bersih. Tidak ada error. Lalu monitoring Anda memberi peringatan: pengguna tidak bisa terhubung ke database.
Blast Radius: Cara Menentukan Strategi Pemulihan yang Benar-Benar Anda Butuhkan
Setiap perubahan infrastruktur memiliki risiko. Pelajari cara memperkirakan dan mengurangi blast radius, lalu pilih strategi pemulihan yang tepat: rollback, restore snapshot, failover, atau rebuild total.
Rencana Pemulihan untuk Perubahan Infrastruktur Berisiko Tinggi
Panduan praktis menyusun rencana pemulihan sebelum menerapkan perubahan infrastruktur berisiko tinggi, termasuk langkah konkret, siapa yang memutuskan, dan kapan harus diaktifkan.
Mengapa Rencana Pemulihan Anda Akan Gagal Tanpa Latihan
Rencana pemulihan yang hanya disimpan di folder bersama tanpa pernah diuji bukanlah rencana, melainkan ilusi keamanan. Pelajari cara menguji rencana pemulihan dengan game day, chaos engineering, dan simulasi proses.
Ketika Perubahan Infrastruktur Gagal: Panduan Pemulihan Langkah demi Langkah
Pipeline berubah merah. Terraform apply yang seharusnya dua menit sudah berjalan lima belas menit. Dashboard monitoring menunjukkan lima resource gagal dibuat. Inilah panduan pemulihan infrastruktur langkah demi langkah untuk engineer DevOps dan SRE.
Apa yang Terjadi Setelah Recovery: Mengubah Kegagalan Infrastruktur Menjadi Perbaikan Proses
Pelajari cara melakukan post-mortem tanpa menyalahkan, mengidentifikasi temuan teknis dan sistemik, serta menerjemahkannya ke dalam perbaikan pipeline dan rencana recovery yang konkret.