[팀네이버 컨퍼런스 DAN25] 메신저 속 AI 오퍼레이터: LLM 기반 ChatOps 도구와 함께하는 팀네이버 SRE “AI와 함께 움직이는 팀네이버 SRE” 예상치 못한 재난·사회적 이벤트가 발생하면 네이버 전사 서비스는 단 몇 초 만에 폭증하는 트래픽과 수많은 변수에 직면합니다. 충주 지진, 대통령 선거와 같은 순간에도 팀네이버 SRE는 하나의 유기체처럼 움직이며 신속하고 정교하게 대응해 왔습니다. 그리고 올해, LLM 기반의 AI 오퍼레이터인 SRE 챗봇을 도입하며 장애 대응 패러다임을 한 단계 끌어올렸습니다. 주요 대응 업무는 모바일에서 대화하듯 처리되고 AI가 즉시 상황을 요약·전달하며 의사결정의 속도와 정확도가 향상되었습니다. 이번 세션에서는 팀네이버 SRE가 AI를 기술적으로 어떻게 활용하고 있는지, 그리고 실제 운영 사례와 성과를 확인하실 수 있습니다. 목차 1. 팀네이버 SRE가 걸어온 길 - 사람 중심으로 변경에 따른 장애를 줄이다. - 데이터 폭증, VictoriaMetrics로 극복하다. - 팀네이버 SRE, 유기적으로 움직이다. - 사람과 AI가 함께 대응하다. 2.팀네이버 SRE의 유기적인 대응 체계 - 팀네이버의 장애 대응 체계 - 대형 사회적 이벤트 대응 사례 - 서비스 건강도 성과 3. LLM 기반의 ChatOps 도구 신규 도입 - SRE 챗봇 도입 배경과 비전 - LLM 연계와 기술 적용 사례 - SRE 챗봇 도입 이후 달라진 장애 대응 패러다임 4. 팀네이버 SRE의 방향성 강연 대상 - ChatOps와 LLM을 활용한 장애 대응 자동화 사례가 궁금하신 분들 - 대규모 서비스 환경에서 흔들림 없는 대응 전략이 궁금하신 분들 - 팀네이버 SRE 장애대응에 관심있는 모든 분들 #DAN #DAN25 #TEAMNAVERCONFERENCE