Site Reliability Engineering (SRE) adalah disiplin untuk membuat sistem perangkat lunak yang sangat skalabel dan andal dengan menerapkan praktik rekayasa perangkat lunak pada masalah infrastruktur dan operasi. SRE yang ahli dapat membuat solusi yang berjalan dalam keseimbangan antara tim pengembangan dan operasi.
Site Reliability Engineering (SRE) atau insinyur keandalan situs bekerja antara pengembangan dan operasi. Konsep SRE telah ada sejak tahun 2003, yang berarti lebih tua dari DevOps.
Kedua disiplin ini, DevOps dan SRE, bertujuan untuk meningkatkan siklus rilis dengan membantu dev dan ops melihat sisi proses satu sama lain sepanjang siklus hidup aplikasi. Mereka juga menganjurkan otomatisasi dan pemantauan, mengurangi waktu dari saat pengembang melakukan perubahan hingga saat diterapkan ke produksi. SRE dan DevOps bertujuan untuk hasil ini tanpa mengorbankan kualitas kode atau produk itu sendiri.
Baca Juga: Apa Itu Data Center?
SRE dan DevOps mengerjakan dua hal yang berbeda namun sama berharganya:
DevOps mengerjakan apa yang perlu dilakukan.
SRE mengerjakan bagaimana itu bisa dilakukan.
Reliabilitas adalah kemampuan situs atau aplikasi untuk menerima semua akses dan permintaan dari pengguna yang sangat banyak dan datang terus-menerus.
SRE mengukur indikator tingkat layanan (SLI) dan tujuan tingkat layanan (SLO), sementara tim DevOps mengukur tingkat kegagalan ditambah tingkat keberhasilan dari waktu ke waktu.
SRE menjaga dan menjalankan sistem yang penting dan kritis terhadap pendapatan meskipun ada badai, gangguan bandwidth, dan kesalahan konfigurasi.
Sebagai suatu disiplin, SRE berfokus pada peningkatan keandalan sistem perangkat lunak di seluruh kategori utama termasuk ketersediaan, kinerja, latensi, efisiensi, kapasitas, dan respons insiden. Mereka yang melakukan tugas-tugas yang terlibat dikenal sebagai insinyur keandalan situs.
Tujuan utama dari SRE adalah untuk mengurangi duplikasi atau redundansi usaha sebanyak mungkin. Tim SRE fokus pada otomatisasi tugas manual, seperti menyediakan akses dan infrastruktur, menyiapkan akun, dan membangun alat swalayan.
Sehingga memungkinkan tim pengembangan untuk fokus pada penyampaian fitur, dan tim operasi dapat fokus pada pengelolaan infrastruktur. Metode ini meningkatkan efisiensi dan kecepatan, tetapi juga menuntut proses yang konsisten dan berulang yang mengurangi risiko dan memberikan umpan balik untuk mengukur operasi, sehingga tim dapat mengidentifikasi area untuk perbaikan.
SRE adalah disiplin yang terus berkembang, menghadirkan peluang untuk membangun metode, kebijakan, dan proses ke dalam jalur pengiriman yang memungkinkan aplikasi untuk memperbaiki otomatis atau pengguna untuk memecahkan masalah mereka sendiri.
Tujuan SRE adalah untuk memungkinkan tingkat perubahan yang lebih tinggi sambil mempertahankan ketahanan dan waktu kerja 99,999% yang didambakan. Di lingkungan multicloud, ketahanan diukur di beberapa metrik utama seperti kinerja, pengalaman pengguna, daya tanggap, tingkat konversi, dan sebagainya.
Untuk mencapai tujuan mereka, tim SRE perlu membangun dan menerapkan layanan yang meningkatkan operasi dan memfasilitasi proses rilis di semua area ini. Ini bisa berupa apa saja mulai dari menyesuaikan pemantauan dan peringatan hingga membuat perubahan kode dalam produksi. Insinyur keandalan situs sering kali membuat perkakas khusus dari awal untuk memenuhi kebutuhan spesifik dalam pengiriman perangkat lunak atau alur kerja manajemen insiden.
Mengadopsi pendekatan SRE juga memerlukan standarisasi teknologi dan alat yang digunakan tim. Standardisasi mempermudah pengelolaan operasi dan mengurangi beban pengelolaan teknologi yang tidak kompatibel, yang memberi tim lebih banyak waktu untuk berkolaborasi dan berinovasi.
Untuk mengadopsi budaya SRE yang sukses, organisasi harus mengadopsi pendekatan baru untuk mengelola risiko. Ini juga berarti mereka harus menyesuaikan proses tata kelola, berinvestasi dalam perekrutan, dan mendidik tenaga kerja kolaboratif yang berpengalaman dalam bidang teknik dan operasi serta belajar dan beradaptasi dengan cepat.
Organisasi kemudian dapat mengintegrasikan insinyur terampil ini pada poin-poin penting dalam siklus hidup DevOps. Dalam tim pengembangan dan pengujian, spesialis SRE mengembangkan otomatisasi yang membantu pengembang menguji lebih awal dan sering tanpa menghambat jadwal pengiriman yang gesit.
Pada tingkat sistem, spesialis SRE mengembangkan alat yang mengoordinasikan rilis dan peluncuran, mengevaluasi kesiapan arsitektur sistem, dan memenuhi SLO seluruh sistem. Pada tingkat tata kelola, spesialis SRE membantu mendefinisikan dan mengawasi arsitektur perusahaan, menetapkan praktik terbaik, dan memilih alat dan sumber daya yang mendukung keandalan situs di seluruh perusahaan.
Mau Berita Terbaru Lainnya dari Warta Ekonomi? Yuk Follow Kami di Google News dengan Klik Simbol Bintang.
Penulis: Fajria Anindya Utami
Editor: Fajria Anindya Utami
Tag Terkait: