갈수록 복잡해지고 방대해진 데이터를 처리하는 데 있어 데이터센터의 역할은 그 어느 때보다도 중요해졌다. 각종 재난·재해에도 안정적인 서비스를 제공해야 하는 정보통신기술(ICT)기업의 숙명과도 직결돼 있다 보니 이들 기업에는 데이터센터를 끊임없이 진화시켜 나가야 한다는 숙제가 있을 정도다.
특히 생성형 인공지능(AI)과 같은 미래 신기술이 발전하는 데 있어 클라우드의 중추적인 역할을 맡고 있는 데이터센터. 국내 인터넷기업 최초로 네이버가 자체 구축한 데이터센터 '각 춘천'을 찾아 약 10년간 '무중단, 무사고, 무재해'로 운영될 수 있었던 노하우에 대해 직접 들여다봤다.
강원도 춘천시 전경이 한눈에 내려다보이는 구봉산 자락에 위치한 '각 춘천'은 축구장 7개 크기인 연면적 4만6850㎡, 약 10만유닛(Unit·서버의 높이 단위 규격)의 서버를 수용할 수 있는 규모로, 2013년 설립됐다.
'각'이라는 이름에서 알 수 있듯이 네이버 데이터센터 '각'은 '사용자가 만든 데이터는 영원히 후대에 전해져야 한다'는 특별한 사명감을 띠고 출발했다. 네이버는 데이터센터가 '기록'을 위한 보존소라는 점에서, 고려시대 팔만대장경을 보관한 합천 해인사의 '장경각' 정신을 계승해 '각(閣)'이란 이름을 붙였다고 했다.
실제로 각 춘천에선 1년에 2회 진행하는 BCP(업무연속성계획) 모의훈련을 비롯해 연 1회 민관합동훈련, 월 1~2회 진행하는 운영 안정성 점검훈련 등 지난 10년간 200회 이상의 모의훈련을 진행했다. 또 네이버는 각 춘천의 서버관을 3개동으로 구분하고, 임대 데이터센터 역시 수도권, 강원, 충북, 경남 등 다양한 지역으로 분산해 운영하는 등 재해 복구에 대비한 네트워크 다중화와 서비스 분산 배치도 놓치지 않았다. 정수환 네이버클라우드 IT서비스본부장은 "네이버는 하나의 IDC가 무너지더라도 서비스 일부가 느려질 순 있으나, 전면 장애가 나지 않게끔 구조를 설계·운영하고 있다"고 전했다.
기본적으로 배터리를 사용하지 않기 때문에 발화 요인이 더 적다는 장점이 있으나 소음과 진동이 발생하는 단점이 있다. UPS 가까이 가면 회전체가 빠르게 돌아가는 소음이 크게 들렸다. 하지만 건물 밖에선 이러한 소음이 전혀 느껴지지 않을 정도로 방음이 잘돼 있어 큰 불편함을 느끼지 못했다.
UPS 동작 구조는 간단했다. 정전이 발생하면 인덕션 커플링의 운동에너지가 전기에너지로 전환되면서 약 7~10초간 서버룸에 전기를 공급하고, 그사이에 UPS 디젤엔진이 가동돼 비상 전력을 본격적으로 생산해 전력을 끊김 없이 공급하는 구조다. 이때 엔진 가동 시 지하에 묻혀있는 경유탱크에서 기름을 UPS에 공급하는데, 각 춘천에서 보관하고 있는 비상 경유 양은 60만ℓ에 달한다. 이는 약 70시간 동안 외부 전력 공급 없이도 버틸 수 있는 양이라고 한다.
특히 다이내믹 UPS 장비 자체에 문제가 발생해도 예비 다이내믹 UPS 장비가 계속 전기를 공급할 수 있도록 구조가 설계된 것도 눈에 띄었다. 네이버는 "장비에 대한 점검 역시 월 및 분기 단위로 정기적으로 진행하고 있다"고 전했다.
또한 클라우드, AI와 같이 최신 기술들이 만들어내는 방대한 데이터에 대응하기 위해서는 GPU 서버 등 전력을 많이 소비하는 IT 장비가 운영돼야 하는데, 이를 위한 고전력 서버실도 별도로 구성된 게 주목할 만했다.
서버실 열기를 효율적으로 식히기 위해 찬바람이 위쪽에서 불어오도록 구조를 설계한 부분이나 서버의 안면, 뒷면을 각각 배치해 찬바람과 뜨거운 바람이 서로 섞이지 않도록 한 것도 전력 사용량을 조금이라도 줄이려는 노력으로 보였다. 이 외에도 자연 바람으로 서버실을 식히는 과정에서 미세먼지 등 오염물을 줄이기 위해 재활용이 가능한 종이 재질의 필터를 사용한 것 역시 자연친화적이었다.
이 가운데 데이터센터 설비와 서비스 운영에 필요한 시스템을 독자적으로 개발하고 있다는 점도 다른 IDC와 차별화되는 지점이라고 했다.
일례로 네이버클라우드가 자체 개발한 서비스 장애 감지 도구 WMS(Web Monitoring System)는 기존 상용 도구에서 감지하지 못했던 장애 전조증상 등을 감지할 수 있다.
종합 장애 분석 툴인 'Weave' 역시 자체 개발 도구로 서비스 장애 감지와 인프라 장애 감지를 한 화면에서 볼 수 있도록 구성됐다. 데이터베이스(DB), 네트워크, 서버 정보들이 함께 연동되어 있어 서비스 장애 시 종합적인 상황 분석과 효과적인 복구 지원이 가능하다. 아울러 각 춘천의 모든 건물은 규모 6.5 이상의 지진을 견딜 수 있도록 내진설계가 돼 있는데, 이는 국내에 건설된 원자력발전소의 내진설계와 동일한 수준이라고 했다.
한편 네이버는 각 춘천에서 쌓은 데이터센터 구축·운영 노하우를 바탕으로 두 번째 자체 데이터센터인 '각 세종'을 올 3분기부터 실가동에 들어갈 계획이다.
미래형 로봇 데이터센터를 표방하는 각 세종은 각 춘천의 6배 규모인 29만3697㎡ 대지 위에 세워지는 하이퍼스케일 데이터센터로, 수전 용량 또한 각 춘천의 6.7배인 270㎿에 달한다. 각 세종은 약 60만유닛 이상의 서버를 수용할 예정으로 빅데이터, AI, 로봇 등 팀 네이버의 기술역량을 모은 세계 최고 수준의 인프라스트럭처로, 클라우드산업의 핵심 동력이 될 것이란 게 네이버의 기대감이었다.
각 세종은 특히 규모가 큰 만큼 로봇과 자율주행 등 첨단 기술이 대거 적용돼 데이터센터 현장 업무의 생산성을 높일 것으로 보인다.
정 본부장은 "향후 클라우드산업의 근간인 미래형 데이터센터를 통해 세계적으로 경쟁력 있는 클라우드 비즈니스를 전개해 나가겠다"며 "각 세종은 최근 주목받고 있는 네이버의 초대규모 AI 하이퍼클로바가 성장하고 전 세계로 뻗어나가는 근간이 될 것"이라고 덧붙였다.
국내외 챗GPT 열풍을 계기로 미국 등 빅테크기업의 생성형 AI 경쟁이 격화되는 가운데 네이버는 올 상반기 하이퍼클로바 기반의 새로운 검색 서비스 '서치GPT'를 시작으로 본격적인 관련 서비스 확장에 나설 방침이다.
[고민서 기자]