[팀네이버 컨퍼런스 DAN25] 보이지 않는 것을 보다 : Observability(O11y) Platform으로 여는 새로운 가능성 Observability Platform(REO)을 통해 클라우드 서비스의 SLI/SLO 측정 및 구현/적용 방법과 서비스 관점 모니터링에 대한 관찰 가능성의 접근 방법을 설명합니다. 목차 1. SRE Observability(O11y) Platform(REO) A to Z - Overview of Observability Platform Observability & Monitoring 특징 비교 Observability Platform Coverage 및 Architecture Service Quality Signal to Metric/Indicator/Objective Service Level Metric Dashboard & Alarm - Observability Platform Architecture Admin Manager Data Provider Management & Data Store - Key Features & Points of Observability Dashboard 4-Golden Signal Status Dashboard Response Time Dashboard Availability, TPS Dashboard Error Rate Dashboard - CASE Study with REO Key 5 Case & Study with Observability Platform 2. REO와 함께한 Observability 여정: 실전 경험에서 얻은 인사이트 - Exploring VictoriaMetrics VictoriaMetrics Data Processing Architecture and Key Features VictoriaMetrics Cluster Scenario Testing - Data Collection and Analysis in Cloud Services REO (Observability Platform) Architecture Overview How Is Data Collected? Reduce Cardinality! Minimize Data Interference! Validate and Analyze Data Consistency! - Disaster Detection and Reporting System Time-Series Data Analysis for Incident Detection Preview of Observability Reporting System 3. Q&A 대상 - Observability 개발 및 운영에 관심이 있는 개발자/운영자/DevOps 엔지니어 - SRE 업무의 시작 및 활용에 관심이 있는 개발자/운영자/DevOps 엔지니어 - 서비스 신뢰성 지표 표준화를 통해 비즈니스 의사결정 데이터로 활용해보고 싶은 서비스 기획 및 전략 담당자 #DAN #DAN25 #TEAMNAVERCONFERENCE