사진 보여주면 답 척척…카카오 AI ‘허니비’공개

중앙선데이

입력

카카오가 19일 과학기술정보통신부가 개최한 ‘제5차 인공지능(AI) 최고위 전략대화’에서 ‘멀티모달(복합정보처리) 언어모델’(MLLM) AI인 허니비를 공개했다. 카카오브레인이 개발한 허니비는 이미지와 텍스트를 모두 입력할 수 있는 AI로, 기존 텍스트로만 입·출력하는 언어모델(LLM)에서 확장된 형태다. 구글의 ‘제미나이’나 오픈AI의 ‘GPT-4’가 대표적인 MLLM으로 꼽힌다.

허니비는 예컨대 ‘농구 경기 중인 두 명의 선수’ 사진과 함께 “왼쪽 선수는 몇 번 우승했나요?”라는 질문을 입력하면 이를 종합적으로 이해하고 답변을 생성한다. 질문 입력은 영어로만 가능하다. 카카오는 2021년 LLM 모델인 ‘코지피티(KoGPT)’를 공개한 바 있다. 이를 개선한 ‘코지피티 2.0’도 조만간 공개할 예정인 가운데 이와는 별도의 MLLM을 개발해 공개한 것이다. 정신아 카카오 대표 내정자는 “텍스트, 이미지가 융합된 형태로 서비스 확장성이 크다”며 “조만간 써 볼 수 있을 것”이라고 말했다.

한편 이날 전략대화 참석자들은 ‘전쟁터’(최수연 네이버 대표), ‘결연한 자세’(이종호 장관) 등의 표현을 쓰며 글로벌 AI 기술 경쟁 관련 위기의식을 드러냈다. 최수연 대표는 “우리보다 50배, 100배 규모가 큰 외국 회사들과 싸워야 하는 입장에서 절박함을 느낀다”고 말했다.

김철웅 기자 kim.chulwoong@joongang.co.kr