카카오와 네이버 등 주요 플랫폼의 서비스 장애를 계기로 글로벌 빅테크들이 국내외에서 데이터센터를 철저하게 이중화하고 보안을 유지하는 시스템도 주목받고 있다.

구글과 메타, 마이크로소프트(MS) 등은 국내에서도 재난·재해에 대비해 데이터센터를 여럿 두고 있으며, 위치와 설계를 철저한 보안에 부치는 등 국내 플랫폼들보다 한 차원 높은 시스템을 자랑한다.

이들은 데이터 분산보다 더 상위 개념인 ‘회복 탄력성'(resilience)에도 주목한다.

화재나 정전, 테러, 전쟁 등으로 인한 데이터센터 사고 발생은 불가피할 수 있지만, 디지털 기업의 ‘진짜 역량’은 그 이후 얼마나 빨리 복구하느냐에서 판가름 난다는 뜻이다. 현재 위기를 극복해야 할 카카오가 새겨들을 만한 대목이다.

◇ 복수 센터인 ‘리전’은 필수…설계부터 안전·보안 주력

구글과 마이크로소프트(MS), 메타(옛 페이스북) 등 글로벌 빅테크들은 데이터센터를 ‘0순위’로 둔다.

MS의 경우 국내에도 센터를 2개 이상 갖춘 ‘리전’을 두고 있어 고도의 분산 저장 시스템을 갖췄다. 재난 상황을 가정한 대응 훈련도 연 1회 이상 한다.

구글과 메타 역시 비슷한 시스템을 갖췄고, 화재나 정전, 테러 등이 발생하면 비상 전력을 가동하고 복구하는 매뉴얼이 있다. 관련 시뮬레이션도 최소 연 2회 이상 하는 것으로 알려졌다.

아울러 글로벌 빅테크사들은 데이터센터를 설립할 때부터 안전과 보안을 가장 우선한다. 위치는 비공개이고 센터가 들어설 지반이 지진에도 견딜 정도로 단단한지, 온도와 습도까지 고려해 짓는다. 건축 자재 역시 화재 등에 대비하기 유리한 것들을 쓰며 설계도 당연히 보안사항이다.

한편, 회복 탄력성을 위한 전제 조건인 데이터 분산은 빅테크들만의 일이 아니다. 글로벌 OTT들 역시 유사시에도 이용자들이 끊김 없이 콘텐츠를 재생할 수 있도록 노력하고 있다.

넷플릭스는 아마존웹서비스 클라우드를 기반으로 하는데, 여기에 더해 각 통신사에 오픈커넥트가 분산 설치돼있다.

국내 업체 중에서는 웨이브가 메인 클라우드에서 장애가 발생하더라도 타사에서 백업할 수 있는 이중화 시스템을 갖춰 단기간 복구가 가능하게 한다.

◇ “전쟁시 타깃 1순위” 데이터센터 지키고 투자하는 빅테크들

최초의 대규모 온·오프라인 하이브리드 전쟁으로 불린 러시아와 우크라이나 간 전쟁에서만 봐도 알 수 있듯 최근 전쟁 시 제1 타깃은 다름 아닌 데이터센터다.

“음악 청취부터 수술까지 연결성이 증가함에 따라 모든 일이 데이터센터에 연결하지 않고 수행하기는 이미 어려워졌다”고 한 클라우드사 하이브의 제이크 매더스 디렉터의 말처럼, 데이터센터가 무너지면 일상이 붕괴할 수 있어서다.

MS의 경우 140개국에 데이터센터를 보유하고 있으며, 리전도 60곳이 넘는다.

메타는 데이터센터에 발생하는 열을 자연적으로 관리할 수 있도록 찬 바람이 부는 지역에 센터를 설치하는 실험을 하는 등 투자를 아끼지 않고 있다.

국내 업체들이 데이터센터를 한 곳도 보유하지 못한 경우도 종종 있고, 있다 하더라도 복수로 갖추기 어려운 여건인 것과는 대비된다.

전쟁이나 테러 발생 시 가장 타깃이 되는 장소이지만, 국내 주요 통신사 등은 데이터센터 위치를 노출하고 오히려 홍보에 활용하는 것도 문제가 되는 부분이다.

◇ ‘이중화 의무화’ 법제화 목소리 커져…투자 인식도 필요

이처럼 국내는 하나의 데이터센터, 하나의 클라우드에 의존하는 경향이 심해 이번처럼 화재 등 재해가 발생했을 때 참사를 피하기 어려운 구조다.

국내 데이터센터 규모는 200년 53개에서 매년 5.9%씩 증가해 2020년 기준 156곳으로 급증했고, 매출액도 2조 7천억 원에 이르지만, 글로벌 기준에는 못 미치며 국내 서비스 업체들의 데이터 분산 및 이중화 시급성에 대한 인식도 낮다.

이번 사태뿐 아니라 2018년 11월 쿠팡 등 온라인 쇼핑몰, 배달의민족 등 웹 기반 서비스, 업비트 등 암호화폐 거래소 등이 대거 반나절 접속 장애를 겪은 것도 이번 카카오 사태와 같은 이유였다. 퍼블릭 클라우드인 아마존웹서비스(AWS)의 서울 리전을 단독으로 사용했던 것.

이번 사태에는 카카오의 DR(비상 재해복구·Disaster Recovery) 시스템이 제대로 작동하지 않았던 것이라는 지적도 나온다. DR은 천재지변이나 해킹 등 각종 재난·재해에 대비해 데이터센터 등 기업 IT 인프라에 장애가 발생했을 때 이를 대체·복구할 수 있는 시스템이다.

DR은 복구 준비 수준에 따라 ‘미러사이트’ ‘핫사이트’ ‘웜사이트’ ‘콜드사이트’로 구분되는데, 재난 발생으로 영향을 받는 업무 기능을 몇 시간 내로 복구할 수 있도록 메인 데이터센터와 동일한 수준의 시스템을 대기 상태로 두는 ‘핫사이트’ 정도라도 카카오가 갖췄다면 당일 복구가 가능했을 것으로 업계에서는 본다.

염흥열 순천향대 정보보안학과 교수는 “카카오는 데이터 이원화를 했다고 생각했겠지만 완벽하게 되지 않았던 것 같고, 한 데이터센터 전체에서 장애가 발생했을 때 순조롭게 이전하는 절차가 오래 걸렸다”고 말했다.

카카오 관계자는 카카오 데이터센터의 DR 수준에 대한 질문에 “현재 기술 분야 관계자들이 모두 복구에 투입돼 있어 확인이 어렵다”고 말했다.

이번 사태를 계기로 데이터센터 이중화 장치를 의무화하는 법제화 목소리가 다시 커질 것으로 보인다.

전날 판교 화재 현장을 찾은 이종호 과학기술정보통신부 장관도 데이터 분산과 이중화 입법 필요성을 강조했고, 이날 더불어민주당 조승래 의원은 해당 법안을 다시 발의했다.