[트랜D] 2023년 AI 업계의 최대 관심사는 'GPT-4'

중앙일보

입력

트랜D

트랜D’ 외 더 많은 상품도 함께 구독해보세요.

도 함께 구독하시겠어요?

2022년이 이제 얼마 남지 않았습니다. 올해 IT 업계에서 인공지능(AI)의 발전은 눈부셨습니다. 오픈 AI의 '달리2(DALL-E2)'가 엄청난 퀄리티의 그림을 그려냈습니다. 오픈소스 인공지능인 '스테이블 디퓨전(Stable Diffusion)' 역시 인공지능 그림의 수준을 한 단계 높였고, 하루 사용자가 1000만명에 달합니다.

내년에는 더 많은 데이터가 생성되고 그림뿐만 아니라 음악, 영상, 글 등 다양한 분야에서 활용될 전망입니다. 더욱이 2023년에는 새로운 인공지능이 선보일 예정입니다. 바로 GPT-4의 등장입니다.

GPT가 뭐길래

GPT(Generative Pre-trained Transformer)는 대표적인 텍스트 생성 딥러닝 인공지능 모델입니다. 인공지능이 수많은 데이터를 학습하면 다양한 질문과 답변이 가능해 대화형 인공지능 서비스에 활용합니다. 번역, 텍스트 요약 등 할 수 있는 일도 많습니다.

2018년 처음 GPT-1이 공개됐습니다. GPT-1은 처음엔 1억1700만개의 매개변수를 활용했습니다. (인공지능은 학습하는 데이터양은 물론 매개변수의 수에 따라 성능이 크게 달라집니다.) 2019년 공개된 GTP-2는 무려 약 10배 이상인 15억개 이상의 매개변수를 활용하기 시작했습니다. 다시 1년 후 2020년 공개된 GPT-3는 무려 1750억 개의 매개변수를 활용합니다.

GPT는 특정 데이터를 조정하면 더 나은 결과를 생성합니다. GPT 모델의 데이터를 활용하면 자연어 처리나 텍스트 처리 프로젝트를 다양하게 시도할 수 있습니다. 비용과 시간을 절약하면서 거대한 데이터를 활용해 인공지능을 발전시킬 수 있는 장점이 있습니다.

현재까지 공개된 GPT-3는 인간이 사용하는 언어와 유사한 결과를 보입니다. '사피엔스'로 잘 알려진 세계적인 베스트 셀러 작가 유발 하라리는 자신의 글을 GPT-3에 학습시키고 출판 10주년 서문을 GPT-3가 작성하도록 했습니다. 유발 하라리는 GPT-3가 작성한 서문을 읽고 충격에 빠졌습니다. 인공지능이 자신의 글과 다름없는 수준의 글을 작성했기 때문입니다.

이미 GPT-3는 여러 작가와 함께 글을 쓰거나 이미 완성된 글을 수정하는 수준에 이르렀습니다. GPT-3가 그 자체로 이미 인공지능의 엄청난 발전을 증명했지만, 많은 이들은 이제 곧 세상에 모습을 드러낼 GPT-4가 GPT-3를 훌쩍 뛰어넘을 것으로 예상합니다.

달리1과 달리2가 그린 그림. 사진 오픈 AI

달리1과 달리2가 그린 그림. 사진 오픈 AI

인간을 넘어설까 GPT-4

GPT를 개발하는 오픈 AI는 내년 초 GPT-3의 다음 버전인 GPT-4를 공개할 예정입니다. GPT-4에 대한 구체적인 사항은 아직 베일에 싸여 있습니다. 하지만, 인공지능 업계 관계자들은 GPT-4에 100조 개의 매개변수를 사용할 수 있다고 예측합니다.

오픈 AI의 CEO인 샘 알트만(Sam Altman)은 이러한 소문에 대해 부인한 바 있습니다. 다만, 매개변수가 GPT-3보다 아주 크지 않을 것이라고 언급한 점에 비추어 볼 때 약 1조개 수준이 아닐까 예측합니다.

정확한 사양은 알 수 없지만 GPT-4가 튜링 테스트를 통과했다는 소문은 어느 정도 사실인 것 같습니다. 튜링 테스트는 인공지능이 인간과 다름없는 지능이 있는지를 판단하는 일종의 시험입니다.

과거 튜링 테스트를 통과한 인공지능이 있었지만, 예외 사례라 만약 GPT-4가 튜링 테스트를 통과했다면 인간과 비슷한 지능 수준의 인공지능 등장이라고 해도 과언이 아닙니다. 게다가 GPT-4는 GPT-3의 학습에 필요한 비용보다 훨씬 저렴한 비용으로 이용할 수 있을 것으로 알려졌습니다. GPT-4에 대한 기대감이 높아지는 이유입니다.

튜링 테스트 방식

튜링 테스트 방식

또한, GPT-4는 GPT-3가 지닌 한계를 뛰어넘을 것으로 보입니다. GPT-3는 인류 역사상 가장 뛰어난 인공지능으로 불리어도 손색없지만, 텍스트 데이터만 학습했다는 한계가 있습니다. 마치 세상 모든 일을 글로만 배운 것과 같습니다.

인간은 글로 세상을 이해하지 않습니다. 소리, 영상, 사진, 촉각 등 다양한 형태의 정보를 입력하고 사고합니다. 인공지능의 최대 화두는 바로 단편적인 데이터가 아닌 다양한 형태의 데이터를 인공지능이 학습하는 것입니다.

이미 GPT-3에서 이러한 시도가 이루어졌습니다. 달리2는 GPT-3에 이미지 인식을 더 해 글과 사진 정보를 학습하고 조합해 새로운 이미지를 창조했습니다. 이제 GPT-4의 핵심은 이러한 데이터를 학습하고 결과물을 만들어내는 멀티모달(Multimodal)에 있습니다.

멀티모달은 다양한 모달리티(Modality)를 동시에 받아들이고 학습합니다. 여기서 모달리티는 양상이라는 뜻으로 생체신호, 표정, 움직임 등 다양한 입력을 의미합니다. 텍스트나 이미지 외에 다양한 형태의 데이터를 통해 새로운 결과물을 만들어 낼 수 있습니다.

GPT-4가 텍스트, 이미지, 오디오 등의 데이터 입력과 학습이 가능하다면 마치 인간이 정보를 받아들이고 뇌가 사고하는 방식과 거의 동일합니다. 튜링 테스트를 통과할만한 지능을 갖췄다고 볼 수 있을 것입니다.

더글러스 에크(Douglas Eck), 구글 리서치 수석 과학자 겸 구글 브레인(Google Brain) 연구 책임자는 다음 인공지능의 혁신으로 멀티모달을 언급했습니다. 이제 인공지능은 주변 환경을 이해하고 다음 단계로 나아갈 수 있다고 말합니다.

여기에 더해 GPT-4는 희소 모델(Sparse Model)을 활용해 적은 데이터와 저렴한 컴퓨팅 비용으로 높은 수준의 결과물을 만들어 낼 것으로 기대합니다. 희소 모델은 정확도를 떨어뜨리지 않으면서도 처리량을 늘릴 수 있습니다. 인공지능의 희소성이 유지되면 다양한 인공지능 작업에도 정확성은 유지되고 비용은 줄일 수 있습니다.

텍스트, 이미지, 오디오 등 다양한 형태의 데이터를 활용하는 '멀티모달'.

텍스트, 이미지, 오디오 등 다양한 형태의 데이터를 활용하는 '멀티모달'.

2023년의 핵심 기술은 인공지능

유명 칼럼니스트인 NYU 스콧 갤로웨이 교수는 2023년의 테크 분야 핵심 키워드를 인공지능으로 예측했습니다. 인공지능이 신약을 개발하는 데 사용되기도 하고, 인공지능이 우리 삶의 곳곳을 바꿔가고 있다고 말합니다.

앞으로 우리는 훨씬 더 많은 양의 인공지능 생성 콘텐트를 접하게 될 것입니다. 또한, 이를 인간이 만들었는지 인공지능이 만들었는지 점차 구분할 수 없는 방향으로 향하게 될 것입니다. 인간 수준의 지능을 지니고 비용도 저렴한 인공지능이 모습을 드러낼 예정입니다.

GPT-4는 과연 어떠한 수준의 인공지능으로 우리 앞에 나타나게 될까요. 내년 GPT-4의 등장은 향후 인공지능과 기술의 미래를 완전히 바꿔 놓을지도 모릅니다.

윤준탁 에이블랩스 대표

윤준탁 에이블랩스 대표

윤준탁 에이블랩스 대표는 SK플래닛, 한국IBM 등에서 근무했다. 뉴욕대학교에서 기술경영 석사를 취득했다. 1인 컨설팅 기업인 에이블랩스의 대표를 맡고 있다. 인공지능·블록체인 등에 관심이 많고, 디지털 경제와 산업에 대한 3권의 책을 펴냈다.

트랜D

ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
Innovation Lab