
(왼쪽부터 전영배 님, 전대권 님, 김동민 님)
CJ ENM 커머스부문이 이끄는 CJ온스타일은 변화하는 유통 및 미디어 트렌드에 발맞춰 진화하는 라이프스타일 중심 미디어커머스 큐레이션 플랫폼입니다. TV, 모바일, 라이브커머스, 유튜브, 숏폼 등 다양한 채널을 연계한 ‘원플랫폼’ 체계를 기반으로, 영상과 쇼핑을 하나로 아우르는 차별화된 쇼핑 경험을 제시하고 있습니다.
CJ온스타일의 핵심 경쟁력은 자유롭고 젊은 조직문화에서 비롯됩니다. 조직 구성원들이 각자의 역량을 최대한으로 발휘할 수 있도록 일찍부터 ‘-님’ 호칭을 도입해 수평적인 분위기를 조성했고, 유연근무제, 복지 포인트 등 젊은 세대가 선호하는 근무 제도를 갖춰 ‘일하기 좋은 회사’로 거듭났습니다. 인터뷰에 임한 세 명의 임직원은 이러한 조직문화와 제도 덕분에 구성원의 만족도와 행복감이 높은 편이며, 자연스럽게 조직 전체의 시너지도 커지고 있다고 밝혔습니다.
유연한 분위기 속에서 다양한 혁신을 시도하는 CJ온스타일은 2025년 2월 IT 조직을 중심으로 Slack을 본격 도입했습니다. 사내 Slack 도입 및 확산을 이끈 CJ온스타일 아키텍처팀은 여러 채널로 흩어져 있던 알림을 통합하고, 장애나 이슈에 더 신속하게 대응할 수 있는 자동화 환경을 구축했습니다. 실제로 CJ온스타일은 Slack 도입 이후 장애 대응 속도가 눈에 띄게 빨라졌으며, 예상치 못한 휴먼 에러(Human Error)까지 사전에 방지할 수 있는 시스템을 마련했습니다.
장애 대응의 새 기준, Slack 기반 실시간 모니터링과 자동화
애플리케이션 아키텍트, 클라우드 솔루션 아키텍트, 프레임워크 관리 등을 담당하는 아키텍처팀은 장애에 민감할 수밖에 없는 조직입니다. 아키텍처팀이 운영•관리하는 시스템에서 장애가 발생하면 미디어커머스 큐레이션 플랫폼의 근간이 되는 온라인 서비스의 안정성이 흔들리고, 고객 경험에도 직접적인 영향을 미치기 때문인데요. 하지만 과거에는 장애가 언제, 어디서 발생했는지를 정확히 파악하기까지 적지 않은 시간이 걸렸습니다. 메신저, 메일 등 알림 채널이 여러 곳으로 분산되어 있었고, 알림을 수신하는 담당자도 제각각이어서 장애 상황을 신속하게 공유하고 전파하기기 어려웠죠.
게다가 보안상의 제약으로 인해 장애 대응 속도가 지연되는 일도 잦았습니다. 담당자가 회사 밖에서 장애 발생 사실을 인지하면, VPN 접속을 비롯한 여러 단계의 인증 절차를 거쳐야만 시스템에 접근할 수 있었는데요. 부득이한 경우에는 사내에 있는 동료에게 전화로 도움을 요청하며 해결했으나, 그때는 이미 장애 대응에는 상당한 시간이 소요된 후였죠. 이러한 상황은 장애 대응의 리드타임을 늘리고, 궁극적으로는 서비스 품질 저하로 이어졌습니다.
그렇다면 Slack 도입 이후, CJ온스타일의 장애 대응 프로세스는 어떻게 달라졌을까요? 아키텍처팀은 Slack API를 활용해 사내 보안 정책에 부합하는 정보 보안 체계를 구현했고, Jenkins, Datadog 등 다양한 외부 시스템의 API를 호출할 수 있는 Slack 인터페이스 서버를 직접 구축했습니다. 이 인터페이스 서버 덕분에 CJ온스타일의 구성원들은 Slack 안에서 안전하게 외부 시스템의 데이터를 조회하거나 실시간으로 제어하는 것이 가능해졌습니다.
알림이 모두 Slack으로 통합된 이후로는 장애 발생 사실을 인지하는 속도가 비약적으로 빨라졌습니다. 단순히 장애 알림을 받는 것에서 그치지 않고, 장애를 대응하는 주요 절차도 자동화되어 전반적인 대응 시간도 크게 단축됐습니다. 예를 들어 데이터베이스 CPU에 문제가 있을 경우, /모니터링 명령어를 입력해 데이터베이스 CPU 상태를 확인하고, /긴급대응 명령어로 데이터베이스 CPU를 증설하는 후속 조치를 실행하는 식이죠. Datadog와 연동된 모니터링 시스템은 서비스 상태가 정상에서 벗어날 때마다 장애 시점의 동영상 캡처, 오류 요약, API 응답 시간 등의 핵심 정보를 Slack에 자동으로 공유하기도 합니다. 이러한 기록들은 이후 장애의 원인을 분석하고 개선하는 과정에 큰 도움을 주고 있습니다.

“Slack 알림을 통합한 뒤로, 훨씬 더 빠르고 신속하게 장애를 전파할 수 있게 됐습니다. 이제는 모든 정보가 실시간으로 공유되어 대응 속도도 크게 빨라졌습니다. 앞으로도 연말까지 모든 알림 체계를 Slack 중심으로 완전히 전환할 계획입니다.”
Slack은 ‘미디어커머스 큐레이션 플랫폼’이라는 CJ온스타일만의 독특한 환경에서 발생하는 문제 상황을 해결하는 데에도 큰 역할을 하고 있습니다. 각 방송과 연계되어 판매되는 상품 페이지를 잘못 세팅하는 사례는 미디어커머스 환경에서 종종 발생하는 리스크 상황인데요. 과거에는 이러한 문제에 직면했을 때, 담당자가 여러 시스템을 오가며 상품 코드를 일일이 확인해야만 원인을 파악할 수 있었습니다. 방송이 실시간으로 진행되는 만큼, 문제 해결이 완료될 때까지 실무자는 큰 부담과 압박을 느껴야 했습니다.
CJ온스타일 상품서비스개발팀은 이와 같은 휴먼 에러를 줄이기 위해 Slack을 통한 자동화 점검 기능을 도입했습니다. 이 기능을 활용하면 담당자는 Slack 채널에서 /편성표상품조회 명령어를 입력하는 것만으로 방송 상품 판매 페이지의 모든 주요 속성값을 실시간으로 확인할 수 있습니다. 상품 코드를 비롯해 구매 수량, 가격, 전시 여부 등 상품의 주요 상태가 Slack 메시지로 한눈에 정리되므로, 즉각적으로 문제의 원인을 파악하고 신속히 조치할 수 있죠. 방송 중에 위급 상황을 인지하더라도 /상품체크 명령어를 이용해 빠르고 정확한 실시간 대응이 가능합니다. 문제 진단부터 복구까지 전 과정을 Slack 하나로 처리할 수 있게 되면서, 상품서비스개발팀은 방송 사고로 인한 매출 손실과 업무 스트레스를 크게 줄일 수 있었습니다.

/편성표상품체크

“Slack을 통해 현업의 휴먼 에러를 예방할 수 있어 만족스럽습니다. 방송 중에 오류가 발생하면 심적 부담이 크기 마련인데, 이제는 Slack에서 바로 상품 상태를 확인하고 조치하니까 스트레스가 훨씬 줄었어요.”
Slack이 만드는 CJ온스타일의 새로운 업무 일상
CJ온스타일의 Slack 워크스페이스에서는 ‘태룡이’라는 이름의 Slackbot이 특별한 위트를 더하기도 합니다. 장애 알림 등 외부 시스템에서 Slack으로 수신되는 주요 메시지가 IT 조직의 테크 마스코트 태룡이의 귀엽고 친근한 말투로 전달되는 건데요. ‘장애 대응 메시지를 공유한다용!’과 같은 유쾌한 메시지는 조직 구성원들이 경직되지 않고 재미있고 즐겁게 일할 수 있는 분위기를 만드는 데 이바지합니다.
최근에는 Slack이 알림이나 장애 대응의 도구를 넘어, CJ온스타일 IT 조직의 프로젝트 관리와 일상 커뮤니케이션에도 활용되고 있습니다. Slack 리스트에서 일감을 분배하거나, 스레드로 진행 상황을 실시간으로 공유하는 등 별도의 문서툴이나 메신저 없이도 하나의 플랫폼에서 모든 협업이 이뤄지는 디지털 HQ로서의 Slack을 경험하는 임직원들이 많아졌죠. Slack 도입에 앞장선 아키텍처팀 전영배 님은 “동료들과의 모임 일정을 조정하고, 장소를 투표하고, 준비물 체크리스트를 작성하는 등 업무 외 일상과 관련한 소통에도 Slack을 유용하게 활용하고 있다”고 말합니다.
장애 대응을 위한 맞춤형 프로세스, 상품 속성을 실시간으로 점검하고 휴먼 에러를 예방할 수 있는 기능, 커스터마이징한 Slackbot을 통한 친근한 소통, 구성원 간의 유연하고 따뜻한 커뮤니케이션까지 — Slack은 CJ온스타일의 일하는 방식을 실질적으로 변화시키고 있습니다. 앞으로도 Slack은 CJ온스타일의 혁신적인 조직문화와 함께 성장하며, CJ온스타일만의 또 다른 경쟁력으로 자리 잡을 것입니다.

“현업에 필요한 기능을 Slack 안에서 쉽고 간편하게 개발하고 적용할 수 있다는 점이 큰 강점입니다. Slack을 더 잘 활용하기 위해 팀원들과 아이디어를 리스트업하고 있어요. 앞으로도 필요한 기능을 하나씩 만들면서 실무에 적용해 나갈 계획입니다.”