45-6 · Bab 45 · 6 menit baca

Bagian Paling Terabaikan dari Deployment: Apa yang Terjadi Setelah Pipeline Berwarna Hijau

Pipeline hijau bukan jaminan aplikasi berjalan benar. Pelajari verifikasi pasca-deployment yang krusial: cek versi, health check, log, metrik, smoke test, dan rollback plan.

Bagian Paling Terabaikan dari Deployment: Apa yang Terjadi Setelah Pipeline Berwarna Hijau

Anda baru saja melihat pipeline berubah menjadi hijau. Setiap tahap berhasil: build, test, deployment ke staging, pemeriksaan integrasi. Rilis sudah live. Seseorang di tim mengetik "deployed" di saluran chat dan menutup tiket. Semua orang beralih ke tugas berikutnya.

Tapi inilah kebenaran yang tidak nyaman: pipeline hijau tidak berarti aplikasi berjalan dengan benar untuk pengguna. Itu hanya berarti pemeriksaan otomatis lolos. Produksi adalah lingkungan yang berbeda dengan lalu lintas nyata, data nyata, dan kasus tepi nyata yang tidak bisa disimulasikan oleh rangkaian pengujian mana pun.

Momen setelah deployment adalah saat verifikasi sesungguhnya dimulai. Dan fase inilah yang paling sering dilewatkan oleh tim.

Mengapa Verifikasi Pasca-Deployment Sering Diabaikan

Ada beberapa alasan mengapa langkah ini terlewat. Pipeline memberikan rasa penyelesaian yang palsu. Ketika setiap gerbang otomatis lolos, rasanya wajar untuk menyatakan sukses. Tekanan untuk beralih ke fitur atau perbaikan berikutnya sangat tinggi. Dan sejujurnya, memverifikasi deployment secara manual terasa lambat dan tidak menarik dibandingkan membangun hal baru.

Tapi melewatkan verifikasi berarti Anda mengetahui masalah dengan cara yang sulit: dari keluhan pengguna, dari alert monitoring berjam-jam kemudian, atau dari tiket dukungan yang mengatakan "aplikasi rusak sejak pembaruan kemarin."

Tujuan verifikasi pasca-deployment sederhana: memastikan bahwa versi baru benar-benar berjalan seperti yang diharapkan di produksi, sebelum pengguna harus memberi tahu Anda sebaliknya.

Mulai dari Dasar: Apakah Versi yang Tepat Sedang Berjalan?

Ini terdengar terlalu jelas untuk disebutkan, namun ini lebih sering terjadi daripada yang diakui tim. Pipeline melaporkan sukses, tetapi server produksi masih menjalankan image lama. Mungkin deployment tidak mencapai semua instance. Mungkin tag yang salah digunakan. Mungkin container orchestrator gagal secara diam-diam.

Diagram alir berikut memetakan urutan pemeriksaan yang direkomendasikan setelah deployment, termasuk titik keputusan yang mungkin memicu rollback:

flowchart TD A[Cek Versi] --> B{Versi benar?} B -- Tidak --> R[Rollback] B -- Ya --> C[Health Check] C --> D{Status 200?} D -- Tidak --> R D -- Ya --> E[Cek Log untuk Error Baru] E --> F{Ada error baru?} F -- Ya --> R F -- Tidak --> G[Cek Metrik: Error Rate & Latensi] G --> H{Dalam rentang normal?} H -- Tidak --> R H -- Ya --> I[Smoke Testing Manual] I --> J{Alur inti berfungsi?} J -- Tidak --> R J -- Ya --> K[Cek Integrasi] K --> L{Semua kritis?} L -- Tidak --> R L -- Ya --> M[Verifikasi Rollback Plan] M --> N[Dokumentasikan Temuan]

Periksa versi yang benar-benar berjalan. Setiap aplikasi harus mengekspos endpoint versi atau metadata yang menunjukkan versi yang di-deploy. Bandingkan dengan apa yang Anda maksudkan untuk di-deploy. Jika Anda menggunakan container, periksa tag image pada instance yang berjalan. Jika Anda menggunakan mesin virtual, periksa log aplikasi atau halaman status.

Berikut cara cepat untuk memeriksa versi menggunakan curl atau kubectl:

# Menggunakan curl untuk memeriksa endpoint versi
curl -s https://your-app.example.com/version | jq '.version'

# Menggunakan kubectl untuk memeriksa tag image dari pod yang berjalan
kubectl get pods -l app=your-app -o jsonpath='{.items[0].spec.containers[0].image}'

Pemeriksaan ini memakan waktu tiga puluh detik. Ini menghemat jam debugging di kemudian hari.

Health Check: Minimal yang Harus Ada

Setiap aplikasi harus memiliki endpoint health check yang tidak memerlukan autentikasi. Endpoint ini mengembalikan status sederhana seperti {"status": "ok"} dengan kode respons 200. Ini memberi tahu Anda bahwa proses aplikasi hidup dan merespons permintaan.

Setelah deployment, akses endpoint tersebut. Jika mengembalikan selain 200, ada yang salah pada level paling dasar. Aplikasi mungkin gagal memulai, dependensi mungkin hilang, atau konfigurasi mungkin tidak valid.

Jika aplikasi Anda belum memiliki endpoint health check, tambahkan sebelum deployment berikutnya. Anda akan menggunakannya setiap saat.

Log: Cari Error Baru, Bukan Semua Error

Setiap aplikasi yang berjalan memiliki beberapa tingkat noise di log-nya. Timeout koneksi, percobaan ulang, peringatan kecil. Ini normal. Yang perlu Anda temukan setelah deployment adalah error baru yang tidak ada sebelumnya.

Bandingkan pola log dari sepuluh menit sebelum deployment dengan sepuluh menit setelahnya. Cari pesan error yang belum pernah Anda lihat. Lonjakan tiba-tiba connection refused ke database, atau permission denied saat mengakses file, atau null pointer exception di jalur kode yang baru saja diubah.

Ini bukan tentang membaca setiap baris log. Ini tentang menemukan anomali. Jika sistem logging Anda mendukungnya, buat tampilan perbandingan cepat. Jika tidak, grep untuk pola error umum dan lihat apakah frekuensinya berubah.

Metrik: Angka Tidak Berbohong

Log memberi tahu Anda apa yang terjadi. Metrik memberi tahu Anda bagaimana sistem berperilaku. Setelah deployment, perhatikan tiga metrik ini dengan saksama:

Request rate: Apakah lalu lintas mengalir normal, atau turun tiba-tiba?
Error rate: Apakah persentase permintaan yang gagal meningkat?
Latensi: Apakah respons memakan waktu lebih lama dari sebelumnya?

Lonjakan error rate atau latensi adalah sinyal paling jelas bahwa ada yang salah. Metrik ini harus terlihat di dashboard real-time, bukan di laporan yang tiba keesokan paginya. Jika Anda belum memiliki dashboard ini, buatlah. Ini adalah alat paling berguna untuk verifikasi pasca-deployment.

Smoke Testing Manual: Otomatisasi Tidak Cukup

Smoke test otomatis sangat berharga. Mereka menangkap regresi dengan cepat dan berjalan konsisten. Tapi mereka tidak bisa menangkap semuanya. Sebuah tombol mungkin berfungsi secara teknis tetapi diposisikan dengan buruk. Sebuah formulir mungkin mengirim data dengan benar tetapi menampilkan pesan error yang membingungkan. Sebuah halaman mungkin dimuat tetapi terasa lambat bagi manusia.

Setelah pemeriksaan otomatis lolos, seseorang di tim harus menjalankan alur pengguna inti secara manual. Login, pencarian, checkout, atau fitur paling kritis lainnya. Ini memakan waktu lima hingga sepuluh menit. Ini menangkap masalah yang tidak terpikirkan oleh pengujian otomatis.

Periksa Integrasi dengan Sistem Eksternal

Aplikasi Anda mungkin bergantung pada sistem lain: database, antrean pesan, API eksternal, layanan email, gateway pembayaran. Deployment dapat memutus koneksi ini dengan cara yang halus. Perubahan konfigurasi mungkin menunjuk ke host database yang salah. Versi baru dari sebuah library mungkin mengubah cara terhubung ke antrean. Kunci API mungkin sudah kedaluwarsa.

Verifikasi bahwa integrasi kritis masih berfungsi. Kirim email uji. Tulis record ke database. Baca dari antrean. Panggil API eksternal dengan payload uji. Jika salah satu gagal, Anda ingin segera tahu, bukan saat pengguna melaporkan bahwa pesanan mereka tidak berhasil.

Verifikasi Rollback Plan Masih Layak

Langkah ini hampir selalu dilupakan. Setelah deployment berhasil, tim menganggap rollback adalah masalah yang sudah terpecahkan. Tapi rencana rollback menurun seiring waktu. Image lama mungkin sudah dibersihkan oleh kebijakan retensi. Skrip rollback mungkin rusak karena perubahan infrastruktur. Migrasi database mungkin tidak bisa dibalikkan lagi.

Sebelum menutup deployment, pastikan bahwa versi sebelumnya masih tersedia dan proses rollback berfungsi. Anda tidak perlu menjalankan rollback. Cukup verifikasi bahwa artefak ada dan prosedurnya terdokumentasi. Jika masalah kritis muncul satu jam kemudian, Anda akan bersyukur sudah memeriksanya.

Dokumentasikan Temuan Anda

Tuliskan hasil verifikasi. Siapa yang memeriksa apa, dan apa yang mereka temukan? Dokumentasi ini memiliki dua tujuan. Pertama, ini menciptakan jejak audit untuk kepatuhan dan analisis insiden. Kedua, ini membantu tim meningkatkan checklist dari waktu ke waktu. Jika suatu masalah terlewat, tambahkan pemeriksaan baru untuk lain kali.

Ini tidak perlu rumit. Cukup entri sederhana di log deployment atau dokumen bersama. Kuncinya adalah konsistensi: lakukan setiap saat, bukan hanya saat Anda ingat.

Checklist Praktis Pasca-Deployment

Berikut adalah checklist minimal yang dapat diadaptasi oleh tim mana pun:

Pastikan versi yang benar berjalan di semua instance
Endpoint health check mengembalikan 200
Tidak ada pola error baru di log dibandingkan sebelum deployment
Error rate dan latensi dalam rentang normal
Alur pengguna inti berfungsi (smoke test manual atau otomatis)
Integrasi kritis berfungsi (database, antrean, API eksternal)
Artefak versi sebelumnya masih tersedia untuk rollback
Hasil verifikasi didokumentasikan

Ini bukan daftar yang kaku. Sesuaikan dengan jenis aplikasi, infrastruktur, dan ukuran tim Anda. Yang penting adalah menjalankannya secara konsisten, bukan hanya saat Anda merasa hati-hati.

Garis Finish yang Sesungguhnya

Deployment tidak selesai ketika pipeline berubah hijau. Deployment selesai ketika Anda telah memverifikasi bahwa versi baru benar-benar berfungsi di produksi, dalam kondisi nyata, untuk pengguna nyata. Verifikasi itu membutuhkan disiplin, tetapi menyelamatkan Anda dari rasa malu karena merusak produksi dan mengetahuinya dari keluhan pelanggan.

Jadikan verifikasi pasca-deployment sebagai bagian yang tidak bisa ditawar dari proses rilis Anda. Perlakukan seperti gerbang terakhir di pipeline Anda, meskipun gerbang itu dioperasikan oleh manusia. Pengguna Anda tidak peduli bahwa pipeline lolos. Mereka peduli bahwa aplikasi berfungsi.