ADVERTISEMENT
오피니언 김병필의 인공지능 개척시대

한국어 인공지능과 공공재

중앙일보

입력

지면보기

종합 29면

김병필 KAIST 기술경영학부 교수

김병필 KAIST 기술경영학부 교수

요즘 언어처리 인공지능 분야는 충격에 휩싸여 있다. 알파고가 이세돌을 이긴 사건만큼이나 놀라워하는 분위기다. 미국 비영리 인공지능 연구소인 오픈에이아이(OpenAI)가 개발, 공개한 ‘GPT-3’ 글쓰기 인공지능 덕분이다. 아직 들어 본 적이 없다면 기억해 둘 만하다. 인공지능 역사에 중요한 이정표를 세운 기술로 기억될 것이기 때문이다.

인간 글쓰기 실력의 언어처리AI #기존 100배의 인공신경망 갖춰 #초대형 신경망, 막대한 비용 소요 #정부 투자해 공공재로 개발해야

GPT-3는 사람이 쓴 것과 구별할 수 없는 수준으로 글을 쓴다. “코로나19로 인해 가장 크게 영향을 받을 사업 분야가 무엇인가?”라고 물으면 GPT-3는 “사람들이 직접 상호 작용을 하는 사업이다. 이는 식당, 소매점, 다른 대부분의 서비스 기반 산업을 포함한다”라고 답한다. 상식적 질문에 대해 정확히 답한다. “동물은 다리가 몇 개지?”라고 물으면 “동물은 다리가 4개입니다”라 하고, “왜 다리가 세 개인 동물은 없지?”라고 물으면 “다리가 세 개이면 넘어질 것이기 때문입니다”라고 답한다. GPT-3는 글을 쓸 수 있을 뿐 아니라, 간단한 컴퓨터 프로그램도 짤 수 있다. 일정 관리 앱을 만들라고 지시하면 소스 코드를 출력해 낸다. 법률 분야와 같은 전문적 영역에도 활용할 수 있다. 일반인이 쓴 글을 넣으면 마치 변호사가 작성한 것처럼 변환해 내기도 하고, 반대로 어려운 법률용어로 된 계약서를 쉽게 풀어서 쓴 글로 변환하기도 한다.

GPT-3를 사용해 본 뉴욕타임스 칼럼니스트는 “무서우리만큼” 글을 잘 쓴다고 설명했다. 이제껏 인공지능이 칼럼니스트 직업을 대체하는 것은 아주 먼 미래의 일이라고 생각했는데, 이제 눈앞에 닥친 일처럼 느껴진다고 위기감을 표했다. 인공지능은 이미 수년 전부터 스포츠나 주식 관련 기사와 같이 사실 전달 중심의 글을 쓰는 데 활용되어 왔지만, 이제 논설문과 같이 복잡한 문장까지 생성해 낼 수 있는 새로운 경지에 도달했다.

이 기술이 충격적인 이유는 성능 때문만은 아니다. GPT-3 개발자들은 새로운 인공신경망 구조나 학습 방법을 고안해 낸 것이 아니다. 그저 인공신경망의 크기를 키웠을 뿐이다. 그것도 아주 크게 말이다. GPT-3는 종래의 언어처리 인공신경망보다 100배 넘게 크기를 키워서 지금의 성능을 가지게 되었다. 그래도 GPT-3의 인공신경망 크기는 아직 인간 뇌의 0.2%도 되지 않는다. 앞으로 인공신경망의 크기가 더 커지면 어디까지 발전할 수 있을지 가늠하기도 어렵다.

인공지능 9/7

인공지능 9/7

이렇게 큰 인공신경망을 학습시키려면 많은 자원이 필요하다. GPT-3를 학습시키기 위해 수십만 개의 중앙처리장치(CPU) 코어를 가진 슈퍼컴퓨터가 사용되었다. 인공신경망을 한 번 학습시키는데 50억 원이 넘는 비용이 소요되었다고 한다. 인공신경망 하나를 학습하기 위해 이 정도 예산을 쉽게 가져다 쓸 수 있는 곳은 드물다. 그래서 이제 인공지능 기술 경쟁이 대학 연구실이나 스타트업 수준에서 처리할 수 있는 단계를 넘어섰다고 평가하기도 한다. 막대한 자금력과 풍부한 자원을 가진 대규모 연구소나 세계적 기술 기업이 인공지능 기술 분야를 주도하게 될 공산이 크다.

우리도 GPT-3의 성능에 버금가는 한국어 인공지능을 만들 필요가 있다. 특히 영어와 한국어는 언어 체계가 다르므로 외국에서 개발한 기술을 그대로 가져다 쓰기 어렵다. 그런데 GPT-3와 같은 ‘초(超)대형’ 인공신경망을 만드는 데는 막대한 자원과 예산이 필요하다. 따라서 국내에서 개별 민간 기업이 이에 버금가는 기술을 만들 수 있을 것으로 기대하기란 쉽지 않다. 따라서 정부가 나서서 대규모 인공신경망을 구축하여 우수한 한국어 인공지능을 만들어야 한다. 정부 투자를 통해 한국어 인공지능 모델을 잘 학습시켜 그 결과물을 공개한다면, 우리 사회 구성원 모두가 그 혜택을 누릴 수 있다. 한국어 인공지능 기술은 경제학에서 말하는 공공재(公共財) 성격을 갖게 될 것이고, 우리나라 인공지능 생태계를 크게 발전시킬 수 있는 기반이 될 수 있다.

이미 과기정통부가 선도적으로 사업을 진행해 오고 있기도 하다. 2013년부터 국가전략 프로젝트로 ‘엑소브레인’이라는 한국어 인공지능을 개발하여 훌륭한 성과를 내고 있다. 한국전자통신연구원(ETRI)과 여러 민간 기업이 참여하고 있는 중요한 사업이다. 그러나 급변하는 인공지능 환경에 발맞추어 엑소브레인 프로젝트도 한층 더 업그레이드될 필요가 있다. GPT-3에 버금가는 우수한 한국어 인공지능이 조만간 등장하기를 기대한다.

김병필 KAIST 기술경영학부 교수