뉴스 바로가기

기사 상세

IT·과학

깊은 산속 초거대 AI 전진기지 … 데이터센터의 미래를 담다

고민서 기자
입력 : 
2023-02-20 16:14:52

글자크기 설정

사진설명
네이버의 첫 자체 데이터센터 '각 춘천' 조감도. 【사진 제공=네이버클라우드】
데이터센터(IDC)는 일명 '4차 산업혁명의 꽃'으로 불린다.

갈수록 복잡해지고 방대해진 데이터를 처리하는 데 있어 데이터센터의 역할은 그 어느 때보다도 중요해졌다. 각종 재난·재해에도 안정적인 서비스를 제공해야 하는 정보통신기술(ICT)기업의 숙명과도 직결돼 있다 보니 이들 기업에는 데이터센터를 끊임없이 진화시켜 나가야 한다는 숙제가 있을 정도다.

특히 생성형 인공지능(AI)과 같은 미래 신기술이 발전하는 데 있어 클라우드의 중추적인 역할을 맡고 있는 데이터센터. 국내 인터넷기업 최초로 네이버가 자체 구축한 데이터센터 '각 춘천'을 찾아 약 10년간 '무중단, 무사고, 무재해'로 운영될 수 있었던 노하우에 대해 직접 들여다봤다.

강원도 춘천시 전경이 한눈에 내려다보이는 구봉산 자락에 위치한 '각 춘천'은 축구장 7개 크기인 연면적 4만6850㎡, 약 10만유닛(Unit·서버의 높이 단위 규격)의 서버를 수용할 수 있는 규모로, 2013년 설립됐다.

'각'이라는 이름에서 알 수 있듯이 네이버 데이터센터 '각'은 '사용자가 만든 데이터는 영원히 후대에 전해져야 한다'는 특별한 사명감을 띠고 출발했다. 네이버는 데이터센터가 '기록'을 위한 보존소라는 점에서, 고려시대 팔만대장경을 보관한 합천 해인사의 '장경각' 정신을 계승해 '각(閣)'이란 이름을 붙였다고 했다.



사진설명
노상민 네이버클라우드 데이터센터장은 "어떤 상황에서도 데이터 유실 등 서비스 중단을 100% 막을 수 있다고 장담할 수는 없다"면서도 "그러나 네이버는 화재, 정전, 침수, 침입, 붕괴 등에 대비한 반복적인 훈련과 관련 인력·기술 투자를 지속해 나감으로써 100%에 가까워지기 위한 경험치를 10년째 축적해 나가고 있다"고 강조했다.

실제로 각 춘천에선 1년에 2회 진행하는 BCP(업무연속성계획) 모의훈련을 비롯해 연 1회 민관합동훈련, 월 1~2회 진행하는 운영 안정성 점검훈련 등 지난 10년간 200회 이상의 모의훈련을 진행했다. 또 네이버는 각 춘천의 서버관을 3개동으로 구분하고, 임대 데이터센터 역시 수도권, 강원, 충북, 경남 등 다양한 지역으로 분산해 운영하는 등 재해 복구에 대비한 네트워크 다중화와 서비스 분산 배치도 놓치지 않았다. 정수환 네이버클라우드 IT서비스본부장은 "네이버는 하나의 IDC가 무너지더라도 서비스 일부가 느려질 순 있으나, 전면 장애가 나지 않게끔 구조를 설계·운영하고 있다"고 전했다.



사진설명
네이버 Dynamic UPS(다이내믹 전원공급장치)실 전경. 【사진 제공=네이버클라우드】
각 춘천에서 가장 눈에 띄는 시설은 단연 다이내믹 UPS다. 다이내믹 UPS는 한국전력의 전력 공급에 문제가 생기더라도 전기를 공급할 수 있도록 해주는 무중단전원공급장치로, 인덕션 커플링이라는 발전 회전체가 핵심인 시설이다.

기본적으로 배터리를 사용하지 않기 때문에 발화 요인이 더 적다는 장점이 있으나 소음과 진동이 발생하는 단점이 있다. UPS 가까이 가면 회전체가 빠르게 돌아가는 소음이 크게 들렸다. 하지만 건물 밖에선 이러한 소음이 전혀 느껴지지 않을 정도로 방음이 잘돼 있어 큰 불편함을 느끼지 못했다.

UPS 동작 구조는 간단했다. 정전이 발생하면 인덕션 커플링의 운동에너지가 전기에너지로 전환되면서 약 7~10초간 서버룸에 전기를 공급하고, 그사이에 UPS 디젤엔진이 가동돼 비상 전력을 본격적으로 생산해 전력을 끊김 없이 공급하는 구조다. 이때 엔진 가동 시 지하에 묻혀있는 경유탱크에서 기름을 UPS에 공급하는데, 각 춘천에서 보관하고 있는 비상 경유 양은 60만ℓ에 달한다. 이는 약 70시간 동안 외부 전력 공급 없이도 버틸 수 있는 양이라고 한다.

특히 다이내믹 UPS 장비 자체에 문제가 발생해도 예비 다이내믹 UPS 장비가 계속 전기를 공급할 수 있도록 구조가 설계된 것도 눈에 띄었다. 네이버는 "장비에 대한 점검 역시 월 및 분기 단위로 정기적으로 진행하고 있다"고 전했다.



사진설명
네이버 데이터센터 '각 춘천' 남관 서버룸 전경. 【사진 제공=네이버클라우드】
서버룸은 네이버, 웹툰, 밴드 등 다양한 서비스에 필요한 IT 자원을 지원하고, 네이버의 미래 기술 및 네이버클라우드의 클라우드 플랫폼 사업을 뒷받침하고 있는 전초기지다. AI, 로보틱스, 클라우드 등 네이버가 빠르게 새로운 기술을 혁신해 나가는 상황 속에서 생산되는 데이터의 양과 IT 장비 수요가 빠르게 증가하는 가운데 네이버는 각 춘천의 서버룸을 지속해서 개선해 나가고 있다고 했다. 이 중 각 춘천 남관에 위치한 서버룸은 네트워크 대역폭을 기존의 서버룸에 비해 랙당 8배 이상 확장했고, 서버 인터페이스 속도도 10배 이상 향상시켰다.

또한 클라우드, AI와 같이 최신 기술들이 만들어내는 방대한 데이터에 대응하기 위해서는 GPU 서버 등 전력을 많이 소비하는 IT 장비가 운영돼야 하는데, 이를 위한 고전력 서버실도 별도로 구성된 게 주목할 만했다.

서버실 열기를 효율적으로 식히기 위해 찬바람이 위쪽에서 불어오도록 구조를 설계한 부분이나 서버의 안면, 뒷면을 각각 배치해 찬바람과 뜨거운 바람이 서로 섞이지 않도록 한 것도 전력 사용량을 조금이라도 줄이려는 노력으로 보였다. 이 외에도 자연 바람으로 서버실을 식히는 과정에서 미세먼지 등 오염물을 줄이기 위해 재활용이 가능한 종이 재질의 필터를 사용한 것 역시 자연친화적이었다.



사진설명
노 센터장은 "각 춘천의 설계, 구축, 운영 전 단계에 걸쳐 네이버는 전담 인력 양성과 기술개발(R&D)에 공을 들였다"며 "외부에 의존하지 않고 데이터센터 운영체계를 확보할 수 있도록 전기·기계·제어·통신 분야 등 다양한 직군에서 데이터센터 전문인력을 육성하고 기술역량을 내재화하고 있다"고 강조했다.

이 가운데 데이터센터 설비와 서비스 운영에 필요한 시스템을 독자적으로 개발하고 있다는 점도 다른 IDC와 차별화되는 지점이라고 했다.

일례로 네이버클라우드가 자체 개발한 서비스 장애 감지 도구 WMS(Web Monitoring System)는 기존 상용 도구에서 감지하지 못했던 장애 전조증상 등을 감지할 수 있다.

종합 장애 분석 툴인 'Weave' 역시 자체 개발 도구로 서비스 장애 감지와 인프라 장애 감지를 한 화면에서 볼 수 있도록 구성됐다. 데이터베이스(DB), 네트워크, 서버 정보들이 함께 연동되어 있어 서비스 장애 시 종합적인 상황 분석과 효과적인 복구 지원이 가능하다. 아울러 각 춘천의 모든 건물은 규모 6.5 이상의 지진을 견딜 수 있도록 내진설계가 돼 있는데, 이는 국내에 건설된 원자력발전소의 내진설계와 동일한 수준이라고 했다.

한편 네이버는 각 춘천에서 쌓은 데이터센터 구축·운영 노하우를 바탕으로 두 번째 자체 데이터센터인 '각 세종'을 올 3분기부터 실가동에 들어갈 계획이다.

미래형 로봇 데이터센터를 표방하는 각 세종은 각 춘천의 6배 규모인 29만3697㎡ 대지 위에 세워지는 하이퍼스케일 데이터센터로, 수전 용량 또한 각 춘천의 6.7배인 270㎿에 달한다. 각 세종은 약 60만유닛 이상의 서버를 수용할 예정으로 빅데이터, AI, 로봇 등 팀 네이버의 기술역량을 모은 세계 최고 수준의 인프라스트럭처로, 클라우드산업의 핵심 동력이 될 것이란 게 네이버의 기대감이었다.

각 세종은 특히 규모가 큰 만큼 로봇과 자율주행 등 첨단 기술이 대거 적용돼 데이터센터 현장 업무의 생산성을 높일 것으로 보인다.

정 본부장은 "향후 클라우드산업의 근간인 미래형 데이터센터를 통해 세계적으로 경쟁력 있는 클라우드 비즈니스를 전개해 나가겠다"며 "각 세종은 최근 주목받고 있는 네이버의 초대규모 AI 하이퍼클로바가 성장하고 전 세계로 뻗어나가는 근간이 될 것"이라고 덧붙였다.

국내외 챗GPT 열풍을 계기로 미국 등 빅테크기업의 생성형 AI 경쟁이 격화되는 가운데 네이버는 올 상반기 하이퍼클로바 기반의 새로운 검색 서비스 '서치GPT'를 시작으로 본격적인 관련 서비스 확장에 나설 방침이다.

[고민서 기자]

이 기사가 마음에 들었다면, 좋아요를 눌러주세요.