이동수 네이버클라우드 이피션트 AI팀 이사(왼쪽)와 권세중 리더가 인공지능(AI) 경량화·최적화 기술을 설명하고 있다.  네이버 제공
이동수 네이버클라우드 이피션트 AI팀 이사(왼쪽)와 권세중 리더가 인공지능(AI) 경량화·최적화 기술을 설명하고 있다. 네이버 제공
전 세계 정보기술(IT) 기업이 초거대 인공지능(AI)을 활용한 서비스를 앞다퉈 내놓고 있다. 작년 11월 오픈AI가 AI 챗봇 서비스 ‘챗GPT’를 내놓은 후 마이크로소프트, 구글 등 미국 빅테크는 물론 국내 IT 기업들도 대열에 동참하고 있다. 이 과정에서 새롭게 주목받는 분야가 있다. AI 모델을 경량화·최적화하는 기술이다. 초거대 AI는 이름 그대로 방대한 규모의 데이터를 기반으로 구축한 모델이다. 데이터를 학습시키고 결과물을 만드는 과정에서 컴퓨팅 파워가 필요하다. 비영리 연구기관으로 출발한 오픈AI가 마이크로소프트의 투자를 받은 것도 이 같은 이유에서다. 초거대 AI의 상용화를 위해서는 AI 경량화·최적화가 필수인 것이다.

○AI 최적화로 더 빨라진 클로바노트

이 때문에 구글, 마이크로소프트, 엔비디아 등 글로벌 빅테크는 모두 경량화에 힘을 쏟고 있다. 초거대 AI ‘하이퍼클로바’를 운용하는 네이버도 AI 경량화·최적화 기술 연구를 강화하고 나섰다.

네이버의 AI 경량화를 총괄하는 이동수 네이버클라우드 이피션트 AI팀 이사는 “초거대 AI가 주목받고 있지만 모델을 만들고 유지하는 데 어마어마한 비용과 전력이 투입된다”며 “AI 경량화는 서비스를 위해 필수적인 기술”이라고 설명했다. 같은 팀의 권세중 리더는 “초거대 AI 모델을 만들 때는 성능이 중요하기 때문에 데이터를 일부러 중복해서 학습시키기도 한다”며 “하지만 서비스 단계에 접어들면 시간과 비용 문제가 발생하기 시작한다”고 말했다.

이 이사는 영상 파일을 예로 들었다. 넷플릭스 유튜브 같은 영상 플랫폼은 사용하는 데이터를 줄이기 위해 다양한 압축 기술을 이용한다. 사람이 인식할 수 없는 부분의 화질을 낮춰 이용에 불편을 주지 않으면서 파일의 크기는 줄이는 식이다. 그는 “같은 결과물을 내면서 컴퓨팅 파워를 절감하는 방식과 동일한 컴퓨팅 파워로 더 나은 결과물을 얻을 수 있는 방식으로 크게 구분할 수 있다”며 “서비스의 용도에 따라 각기 다른 방식을 적용한다”고 했다.

네이버는 자체 개발한 AI 경량화 기술을 하이퍼클로바에 적용해 성능을 높이고 있다. 음성을 텍스트로 변환하고 내용을 요약해주는 클로바노트의 경우 최적화를 통해 동시에 처리할 수 있는 데이터의 양이 다섯 배 정도 늘었다. 이 이사는 “같은 서버에서 몇 배 많은 고객이 서비스를 이용할 수 있다”며 “녹음을 변환하는 시간도 전보다 줄어들었다”고 설명했다. 네이버가 오는 7월 공개할 예정인 기업용 초거대 AI ‘하이퍼클로바X’에도 경량화·최적화 기술을 적용할 계획이다.

○“AI 반도체 솔루션 연내 공개”

네이버는 삼성전자와 협력해 AI 반도체 솔루션을 공동 개발하고 있다. 소프트웨어뿐만 아니라 하드웨어 측면에서도 AI 모델에 최적화한 반도체를 활용해 더 낮은 비용으로 나은 성능을 낼 수 있도록 한다는 계획이다. 이를 위해 초거대 AI에서 발생하는 메모리 병목현상을 해결한다는 목표를 잡았다.

이 이사는 “초거대 AI를 효율적으로 운영하려면 소프트웨어, 하드웨어 모든 스택이 다 바뀌어야 한다”며 “네이버는 서비스 측면에서, 삼성전자는 메모리 부문에서 강점을 지닌 만큼 차별화된 결과물을 선보일 수 있을 것”이라고 전망했다. 그는 “기술 검증은 어느 정도 진행됐다”며 “올해 안에 결과물을 소개할 수 있을 것”이라고 덧붙였다.

이승우 기자 leeswoo@hankyung.com