구광모·이해진·구현모의 도전장 “아이언맨 ‘자비스’ 만든다”

중앙일보

입력

SF영화 아이언맨에 나오는 인공지능 비서 자비스는 주인공의 모든 명령을 알아듣고 실행해주는 복합지능형 인공지능 비서다. [사진 영화 아이언맨]

영화 ‘아이언맨’의 주인공 토니 스타크의 가장 강력한 무기는 인공지능(AI) 비서 ‘자비스’다. 현재의 몸 상태를 점검하고 가장 효율적인 공격 방법을 찾아낸다. 심지어 시간여행 장치까지 만들어낸다. 자료를 처리하는 것에 그치지 않고 스스로 판단을 하며 또 하나의 인격체로 진화한 결과다.

“수 년 내 ‘자비스’ 같은 AI 나온다”

30일 정보통신기술(ICT) 업계에 따르면 국내·외에서 ‘초거대(Hyper scale) AI’ 경쟁이 본격적으로 시작됐다. 영화에나 나올법한 AI를 수 년 안에 내놓는다는 게 목표다. 데이터 분석과 학습을 넘어 사람의 뇌처럼 스스로 추론하고 창작 활동을 하는 초거대 AI가 생태계가 만들어질 것이라는 전망이 나온다.

초거대 AI란 슈퍼컴퓨터 등을 기반으로 대규모 데이터를 학습해 자율적으로 사고하고 판단ㆍ행동하는 AI를 말한다. 기존의 AI보다 인간의 뇌 구조와 가깝다. 뇌 시냅스와 비슷한 역할을 하는 인공신경망의 파라미터(매개변수)를 수천억 개로 대폭 늘렸기 때문이다. 음성ㆍ이미지 등과 같은 데이터를 AI가 학습 가능한 형태로 변환하는 ‘레이블링’ 작업이 필요하지 않기 때문에 효율성이 높다. 레이블링 작업에서 해방되면서 초대용량 원시 데이터를 AI 모델이 학습할 수 있게 됐다.

분야별 추가 학습 과정도 간단해 여러 산업에 적용할 수 있다는 장점도 있다. 특정 업무를 학습한 기존 AI 챗봇은 해당 분야에서만 대화가 가능했지만, 초거대 AI를 활용하면 방대한 데이터를 스스로 학습해 다방면의 지식을 습득할 수 있다.

이제는 창작까지 넘본다

거대한 지각변동이 시작된 건 지난해 6월이었다. 일론 머스크 테슬라 최고경영자(CEO)가 주도한 ‘오픈(Open) AI’가 초거대 모델인 ‘GPT-3’를 공개했다. GPT-3는 현존하는 최고의 초거대 AI 자연어 처리 모델로 꼽힌다.

GPT-3은 인간의 뇌만큼 인공신경망의 크기를 늘려 방대한 데이터와 추가 학습을 필요로 하는 기존 딥러닝 기반 AI의 한계를 극복하려는 시도에서 출발했다. 심지어 창작의 영역까지 도전하고 있다. 지난해에는 GPT-3가 대본을 쓴 단편 영화 ‘상품판매원’이 공개됐다. 약 3분 길이의 영화는 시작한 뒤 20초부터 “여기부터 AI가 쓴 이야기입니다”라는 자막과 함께 GPT-3가 만든 대사를 보여준다. 영국 일간지 가디언도 지난해 9월 ‘로봇이 이 기사를 썼다. 인간, 아직도 무서운가’라는 제목으로 GPT-3가 집필한 칼럼 전문을 게재해 화제가 됐다.

GPT-3의 성과에 놀란 기업들은 차세대 AI 개발 경쟁에 적극적으로 뛰어들었다. 구글은 지난 18일(현지시간) 열린 연례 개발자 콘퍼런스 ‘구글 I/O 2021’에서 사람처럼 대화하는 AI ‘람다’를 선보였다. 페이스북과 마이크로소프트 등도 초대규모 매개변수를 학습해 사람처럼 대화하는 AI를 만드는 연구를 진행하고 있다.

LG·네이버·KT도 개발 나서

국내 기업들도 앞다퉈 개발에 나서고 있다. LG그룹의 싱크탱크인 LG AI 연구원은 초거대 AI 개발에 1억 달러(약 1130억원)를 투자하기로 했다. 올해 하반기까지 GPT-3가 보유한 1750억 개 파라미터의 3배를 넘어선 6000억 개 파라미터를 갖추는 게 1차 목표다.

향후에는 LG의 업무방식을 완전히 바꿀 정도로 고도화하겠다는 구상이다. 예를 들어 초거대 AI를 차세대 배터리 소재 개발에 적용하면, AI가 250년치 화학 분야 논문ㆍ특허를 분석해 종합적인 물질 데이터베이스를 구축, 더 빠르고 효율적으로 신소재를 개발할 수 있게 된다. 전문가들이 수 년간 매달려 발견할 수 있는 솔루션을 AI를 통해 단기간에 찾아낼 수 있는 것이다.

네이버 하이퍼클로바의 대화 모습. [사진 네이버]

네이버가 지난 26일 공개한 ‘하이퍼클로바’는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 게 특징이다. GPT-3의 학습 데이터는 영어가 대부분이라 다른 언어에서는 생성 능력이 제한적이다. 이에 비해 하이퍼클로바는 한국어의 맥락을 읽어 별도의 장치 없이 자연스럽게 대화가 가능하다.

이날 시연에서는 ‘바로크 음악’을 주제로 20회 이상 대화를 이어가는 모습이 공개되기도 했다. “음악의 아버지가 누구야?”라고 물으면 “바흐”라고 대답이 돌아왔다. 다시 “바흐가 왜 음악의 아버지냐”고 물으니 하이퍼클로바는 “바로크 시대를 대표하는 작곡가이기 때문”이라고 답했다. “근데 왜 아버지라고 부르냐”는 질문에도 “바흐의 음악에서 풍기는 분위기가 마치 아버지처럼 온화하면서도 무게감 있고 굳건한 인상을 풍겨서 그렇게 불러왔다”고 자연스럽게 대화를 이어갔다.

KT는 최근 KAIST와 공동으로 AI 연구소를 세우기로 했다고 밝혔다. 사람과 유사한 대화와 추론이 가능하고 음성ㆍ영상ㆍ센싱 등 복합 정보 기반의 정교한 상황 인지와 답변이 가능한 AI 모델 개발에 나선다는 계획이다.

“스스로 개발 못 하면 기술 종속될 수도”

업계에서는 초거대 AI 개발 경쟁이 미래의 AI 생태계 주도권과 맞물려 있다는 분석이 나온다. 자체 AI 모델을 확보하고 있지 않으면 글로벌 기업에 기술 종속이 이뤄질 수 있다는 경고다. 자체적으로 고성능 AI를 개발할 수 없는 스타트업이나 중소기업들은 보통 기존에 학습된 모델을 응용하는 ‘전이학습’(transfer learning) 방식으로 AI 서비스를 개발한다.

이럴 경우 가장 선도적인 AI 모델을 가진 기업을 중심으로 AI 생태계가 재편될 수 있다. 한국지능정보사회지능원(NIA)은 최근 보고서를 통해 “전이학습 등으로 글로벌 기업이 제공하는 모델을 활용하는 것은 산업 활성화 측면의 장점이 있으나 기술 종속의 우려도 있다”고 지적했다.

권유진 기자 kwen.yujin@joongang.co.kr