구글이 유일하게 못잡은 나라…여기에 韓 IT산업 강점 있다 [챗GPT AI 전쟁②]

중앙일보

입력

지면보기

종합 04면

대화형 인공지능(AI) 챗GPT 충격에 구글도 놀랐다는데 한국 정보기술(IT) 기업의 설 자리가 있을까. 의외의 강점이 있다. 세계 어디서도 찾아보기 힘든 국산 검색·메신저 플랫폼, 정보통신기술 기업(ICT)과 스타트업 주도의 AI 생태계를 강점으로 비영어권 시장을 노린다. 글로벌 테크에 비해 태부족한 자본·사용자·인프라의 격차를 여기서 메울 수 있을까.

사진 셔터스톡

사진 셔터스톡

플랫폼 독립, 초거대 AI 시장의 동력

한국은 중국과 러시아를 제외하면, 구글이 전 세계에서 검색으로 정복하지 못한 유일한 시장이다. 네이버와 카카오는 각각 검색과 메신저를 중심으로 일반 소비자 대상(B2C) 플랫폼을 성장시키면서 다방면에서 초거대 AI에 필요한 데이터를 모았다.

네이버가 전 세계 세 번째로 초거대 AI ‘하이퍼클로바’를 완성한 비결도 여기에 있다. 지난 2020년 6월 미국 오픈AI가 GPT-3를, 2021년 5월 중국 화웨이가 판구를 선보였고 같은 달 네이버가 하이퍼클로바를 공개했다. 네이버에 따르면 하이퍼클로바는 50년 분량의 네이버 뉴스 콘텐트를 익히는 등, GPT-3보다 6500배 이상 많은 한국어 데이터를 학습했다. 네이버 카페·블로그·지식인을 통해 출처·문맥 같은 메타 정보가 포함한 데이터를 얻어, 학습량뿐 아니라 질도 높다는 평이다.

카카오 자회사 카카오브레인은 지난 2021년 2000억 개 한국어 데이터 학습으로 특화한 AI 언어모델 KoGPT와 1400만장의 텍스트·이미지를 학습한 회화 AI ‘민달리’를 내놓았다. 두 모델은 각각 오픈 AI가 오픈소스(알고리즘·코드를 공개)로 공개한 GPT-3와 달리를 기반으로 했다. 최근 AI 업계는 AI 기술을 깃허브 같은 개발자 커뮤니티를 통해 모두 공개하는 추세다. AI 알고리즘과 코드는 발표한 논문을 보면 구현할 수 있을 정도로 기술 자체의 격차가 크지 않고, 이를 어떻게 학습시키고 상용화하느냐가 관건이기 때문이다. 지난해 말 출시돼 선풍적 인기를 끌었던 AI 초상화 앱 ‘렌사’ 역시 스태빌리티 AI가 개발해 공개한 ‘스테이블 디퓨전’을 자사 서비스에 맞게 적용한 것이었다.

검색·음악·메신저·카페 등에서 대량의 데이터와 서비스 운영 경험을 갖춘 카카오가 발 빠르게 특화된 AI 모델을 내놓는 비결이다. 장병탁 서울대 AI연구원장은 “구글이 초거대 AI ‘람다’를 만들고 대화형 AI 서비스 ‘바드’를 빠르게 내놓을 수 있는 기반은 거대 검색 플랫폼이기 때문”이라며 “네이버와 카카오도 플랫폼의 강점을 발휘할 수 있을 것”이라고 말했다.

AI 생태계 만들고 있는 K-테크

그래픽=김경진 기자 capkim@joongang.co.kr

그래픽=김경진 기자 capkim@joongang.co.kr

그래픽=김경진 기자 capkim@joongang.co.kr

그래픽=김경진 기자 capkim@joongang.co.kr

컴퓨팅·네트워크, 데이터, 알고리즘은 AI의 3대 요소로 꼽힌다. 국내 통신사와 반도체 제조사, 플랫폼 기업이 AI 개발을 위해 합종연횡하는 배경이다.
SK텔레콤은 GPT-3 한국어 버전인 AI ‘에이닷’을 개발해 서비스하는 한편, 그룹사인 SK하이닉스·사피온과 함께 AI 반도체 개발에 주력한다. KT는 투자사인 팹리스 스타트업 리벨리온과 함께 초거대 AI ‘믿음’의 상용화에 나섰다.

네이버는 AI 반도체 회사 퓨리오사 AI에 투자한 동시에 삼성전자와도 손잡았다. 네이버와 삼성전자는 지난해 12월 AI 반도체 협력을 위한 태스크포스(TF)를 출범했다. 네이버의 하이퍼클로바를 빠르고 가볍게 구동하기 위한 AI 반도체 솔루션을 삼성전자와 함께 개발하겠다는 것.

빅테크 기업들이 내놓은 언어모델을 활용해 AI 서비스를 내놓는 스타트업도 속속 등장한다. 뤼튼테크놀로지스는 네이버 하이퍼클로바를 적용한 AI 작문 보조 솔루션 ‘뤼튼트레이닝’을 내놓았고, 스캐터랩은 GPT-2를 이용한 대화형 챗봇을 만들고 있다.

김진형 KAIST 명예교수는 "초거대 AI는 압도적으로 많은 데이터로 학습해야 해 규모의 싸움”이라며 “공개된 소스를 이용해 빨리 B2C 서비스를 만들고 생태계에 참여하는 것이 중요하다”라고 말했다.

‘블루오션’ 비영어권에 도전

한국 기업들이 노리는 시장은 비영어권. 카카오브레인은 KoGPT의 영어·일본어 모델은 물론 베트남어·말레이시아어 등 동남아 시장용으로 확장해 내놓는다는 계획이다. 뤼튼테크놀로지스는 글쓰기 AI의 일본어·프랑스어·스페인어 서비스도 개발할 방침이다.

다양한 IT 서비스를 개발·운영한 경험은 또 하나의 경쟁력이다. 벤처투자사 옐로우독의 유재연 AI 연구원은 “챗GPT 모방보다는 기존 모델의 한계를 극복하는 서비스 아이디어로 경쟁력을 찾아야 한다”라고 말했다. 초거대 AI 모델 경쟁이 미·중 대결 양상으로 벌어지고 데이터·기술의 국경분쟁이 빈번한 것도 한국에는 기회다. 글로벌 매출을 올리는 한 AI 스타트업 창업자는 “한국은 가격으로는 미국보다, 보안으로는 중국보다 경쟁력 있는 ‘제 3의 지대’로 경쟁력이 있다”라고 말했다.

상용화‧고비용‧인력이 과제

기술과 자본, 인프라의 격차는 뚜렷하다. 통상 AI 언어모델의 성능은 인간 뇌의 시냅스처럼 AI에서도 정보 전달 매개 역할을 하는 파라미터(매개변수)로 가늠하는데, 2020년 출시된 GPT-3의 파라미터가 1750억개였고, 2021년 MS-엔비디아가 공개한 MT-NLG의 파라미터가 5300억개였다. 네이버 하이퍼클로바와 LG 엑사원의 파라미터가 각각 2040억개, 3000억 개 수준이다.

초거대 AI를 구동하기 위한 클라우드 인프라와 컴퓨팅 비용도 만만찮다. 네이버는 엔비디아의 슈퍼컴퓨터를 구입해 네이버클라우드가 자체 운영하고 있고, 카카오는 구글 클라우드를 쓴다. 지난 3일 네이버 실적 발표에서 최수연 대표는 “상반기 중 서치 GPT를 내놓겠다”면서도 “아직은 비용 효율화 측면에서 검토 과제가 많다”고 말했다. AI 경쟁력에서는 대량 학습이 관건인데, 네이버 같은 대기업도 비용 부담을 무시하지 못하는 현실이다.

이미 1억 명이 사용한 챗GPT는 이를 기반으로 빠르게 성장하고 있다. 실수를 해도 사용자의 피드백을 받아 반영하는 ‘강화학습’이 지금 이 순간에도 이뤄지고 있는 것. 하정우 네이버클라우드 AI랩 소장은 “초거대 AI는 자본과 인력이 대거 필요한 특성상, 학계보다는 기업이 중심”이라며 “초거대 AI 개발 기업의 연구 투자와 산학 협력이 원활하도록 정책 지원이 절실하다”라고 말했다.

ADVERTISEMENT
ADVERTISEMENT