Telefonunuzdaki AIOps Push Bildirimleri ile Problemleri Daha Hızlı Tanımlayın

Perform Yazılım
3 min readNov 6, 2023

--

Ortalama Çözüm Süresi (MTTR) metriklerini etkilediği için artık SRE-Site Güvenilirlik Mühendisliği Ekibi için her saniye önemlidir! Bildirilen olayın işletme üzerindeki etkisi açısından kritikliğini değerlendirmeleri ve doğru iyileştirme eylemlerini tetiklemek için kök kaynağı hızlı bir şekilde bulmaları gerekir.

Bir SRE olarak yaşam, her zaman sorunlar hakkında uyarılmak anlamına gelir, çünkü altyapınız ve uygulamalarınız asla uyumaz. İster gecenin bir yarısı gelen bir e-posta bildirimi, ister eve giderken arayan bir müşteri olsun, uygulamaların ve altyapının çalışır durumda olduğundan emin olmak için DevOps alanında çalışan SRE’lerin işidir. SRE’ler, müşterilerin mutlu olmasını ve kuruluşların Hizmet Seviyesi Hedefi (SLO) hedeflerine ulaşmasını sağlar.

Dynatrace mobil uygulaması ile sistem bildirimlerinizi ve uyarılarınızı her yerden kontrol edebilirsiniz. Her zaman güncel kalın ve dizüstü bilgisayarınızın önünde oturmanıza gerek kalmadan, gelişmiş ayrıntı işlevleriyle hareket halindeyken sorunları sınıflandırmaya başlayın.

Cep telefonunuzdaki olayları nasıl yönetirsiniz?

Android ve iOS’ta bulunan yeni mobil uygulama Dynatrace 3.0, uyarı bildirimlerini doğrudan telefonunuza iletmek ve olay yanıt sürelerini önemli ölçüde azaltmak için Davis AIOps’u kullanıyor. Gerçek zamanlı bildirimleri, sizin ve operasyonlarınızın ve SRE ekiplerinin hareket halindeyken bile kritik olaylara göz kulak olmanızı kolaylaştırır.

Yazılım ve hizmetlerin kritik kesintileri, modern işletmeler için önemli bir risktir. Uzun vadeli kesintiler de şirketlerin ve markaların itibarına ciddi zararlar verir. Anında tespit ve yanıt, şeffaf kullanıcı iletişimi ile birlikte, tüm şirketlerin zaman zaman karşılaştığı bu tür kritik olayların en kötü etkilerini önlemeye yardımcı olur. Dynatrace, SRE ekiplerinizin sorunları pahalı sorunlara dönüşmeden önce proaktif olarak ele almak için ihtiyaç duyduğu tüm kritik bilgileri kullanıma hazır olarak sağlar.

Olay müdahale yolculuğunun başladığı yer:

Örnek bir ödeme hizmeti yazılımı yığınının tüm temel SLO’larını gösteren tipik bir SRE panosuna bir göz atalım. Pano, birden fazla SLO’nun ve ödeme hizmetinin bağlı olduğu alt hizmetlerin durumunu, sağlık durumunu ve temel teknoloji yığınının önemli metriklerini gösterir.

Dynatrace kritik bir olayı otomatik olarak algıladığında, Davis AIOps motoru devreye girer ve olayın iş etkisinin yanı sıra eyleme geçirilebilir bir kök nedenin yönetici özetini sağlamak için mevcut tüm bağlam bilgilerini otomatik olarak analiz eder. SRE panosunda gösterildiği gibi, kritik SLO’larımızdan ikisi ihlal edildi ve Davis’in tespit ettiği bir sorun hemen açıldı ve aşağıdaki ekran görüntüsünde gösterildiği gibi, sorunu etkileyen SLO’larla ilişkilendirildi:

SRE ekibinin dikkatine:

Ortalama Çözüm Süresi (MTTR) metriklerini etkilediği için Artık Site Güvenilirlik Mühendisliği Ekibi için her saniye önemlidir! Bildirilen olayın işletme üzerindeki etkisi açısından kritikliğini değerlendirmeleri ve doğru iyileştirme eylemlerini tetiklemek için kök kaynağı hızlı bir şekilde bulmaları gerekir.

Davis AI, sorumlu SRE ekibinin cep telefonlarına bir uyarı göndererek SRE ekibini hemen destekliyor. Push bildirimleri, Dynatrace AIOps motorunun, yolda veya bir video görüşmesinde takılıp kalmış olsunlar, sorumlu SRE ekibine saniyeler içinde ulaşması için harika bir kanaldır.

Dynatrace uygulamasını açarak, sorumlu ekip aşağıda gösterildiği gibi şu anda devam eden olayların bir listesini hemen alır:

Olay yanıtlarını hareket halindeyken müdahale etme:

Dynatrace mobil uygulaması, zaten aşina olduğunuz masaüstü deneyimini alır ve cep telefonunuzda kullanılabilir hale getirir. Artık uyarılarınızı her yerden kontrol ederek daha da üretken olabilirsiniz, böylece nerede olursanız olun sorunları sınıflandırabilirsiniz.

Etki, topoloji bağlamı ve yönetim bölgeleri hakkında yalnızca temel bilgileri göstermek, ekibin etkiyi daha iyi anlamasına ve sorunu düzeltecek yanıta karar vermesine hemen yardımcı olur.

SRE’ler sorun görünümündeki tüm ilgili bilgilere erişebilir ve sorunu düzeltmeye başlayabilir. Bu, değerli dakikalardan tasarruf etmek ve hiçbir SLO’nun ihlal edilmesini sağlamak anlamına gelir.

Karmaşık ortamlarda olay müdahalesi

Dynatrace uygulaması, operasyon ekibinin birden fazla ayrı ortamdan sorumlu olması durumunda karışıklığı önlemek için tek bir uygun olay genel bakışı içinde birden fazla izleme ortamını yönetebilir. Ayrıca, operasyon ekiplerinin Dynatrace SaaS (Hizmet Olarak Yazılım) ortamlarını Dynatrace Yönetilen şirket içi izleme ortamlarıyla yan yana görüntülemesine olanak tanır.

Detaylı bilgi İçin lütfen tıklayınız.

--

--

Perform Yazılım
Perform Yazılım

No responses yet