Webinar

시스템 에러 대응의 새 기준! Slack 실시간 모니터링 및 자동화 – CJ온스타일 고객사 세션

Slack은 Agentic OS가 되어 조직의 모든 업무 흐름을 관리하고 AI에이전트와 사람이 협력하며 일하는 중심 환경이 되었습니다. 커뮤니케이션 툴을 너머 사람, 앱, 데이터, 그리고 에이전트를 모두 연결하여 업무를 수행하는 통합 플랫폼으로 진화하고 있습니다.

    CJ 온스타일 아키텍처팀의 전영배 엔지니어는 실시간 모니터링과 긴급 대응 시스템 구축 사례를 발표했습니다.

    도전과제: 미디어 커머스 특성상 라이브 방송 중 장애는 고객 경험과 매출에 직결됩니다. 그러나 기존에는 알림 채널이 메일, 문자, 카카오톡 등으로 분산되어 있어 이슈 인지가 늦어지고, 야간이나 이동 중 대응을 위해 항상 노트북을 들고 다녀야 하는 불편이 있었습니다.

    솔루션: “태룡봇”이라는 Slack 전용 IT 장애 봇을 개발했습니다. 분산된 알림을 Slack으로 통합하고 위험도별 채널을 분리했으며, Datadog 알림 시 자동 점검이 시작되어 에러 발생 지점을 탐색하고 스레드 리포트로 공유합니다. 슬래시 커맨드로 DB CPU 긴급 스케일업, 라이브 상품 체크, 그래프 조회 등을 즉시 실행할 수 있습니다.

    더 자세한 내용은 세션 다시보기를 통해서 확인해주세요. [# /]

    이 웨비나가 유용했습니까?

    0/600

    훌륭해요!

    피드백을 주셔서 감사합니다.

    알겠습니다!

    피드백을 주셔서 감사합니다.

    죄송합니다. 문제가 발생했습니다. 나중에 다시 시도해주세요.