ADVERTISEMENT

[팩플] 왜 그들은 예술하는 AI에 꽂혔나…멀티모달AI의 미래

중앙일보

입력

지난달 열린 ‘미국 콜로라도 주립 박람회 미술대회’ 디지털아트 부문에서 1위를 한 작품 ‘스페이스 오페라 극장’. 게임 기획자인 제이슨 M. 앨런이 AI 프로그램 미드저니로 생성한 그림이다. [사진 위키미디어]

지난달 열린 ‘미국 콜로라도 주립 박람회 미술대회’ 디지털아트 부문에서 1위를 한 작품 ‘스페이스 오페라 극장’. 게임 기획자인 제이슨 M. 앨런이 AI 프로그램 미드저니로 생성한 그림이다. [사진 위키미디어]

최근 미국의 한 미술전에서 인공지능(AI)이 생성한 그림이 우승을 차지하며 AI 예술을 둘러싼 창작성 논란에 다시 불이 붙었다. AI가 만든 작품은 결국 기존 이미지를 표절한 ‘제품’이라는 주장과 기술을 활용해 창작성을 더한 ‘작품’이라는 주장이 충돌하고 있다. 이미 AI는 미술뿐 아니라 작곡도 하고, 시·소설도 쓴다. 물론, 이렇게 예술하는 AI 뒤엔 기업이 있다. 글로벌 빅테크가 예술 AI를 줄기차게 내놓는 이유는 뭘까.

무슨 일이야

지난달 미국 콜로라도 주립 박람회 미술대회에서 디지털아트 부문 1위에 오른 제이슨 앨런. 그가 출품한 그림 ‘스페이스 오페라 극장’은 AI 프로그램인 ‘미드저니’로 생성한 작품이다. 미드저니는 사용자가 채팅창에 메시지를 입력하면 그에 걸맞는 4장의 이미지를 5분 안에 만들어낸다. 사용자는 이 중 특정 이미지를 선택해 색상, 형태 등을 바꾸거나 확대·축소할 수 있고 배경과 스타일 등도 변경할 수 있다. 이미지, 음성, 동작, 표정 등 텍스트 아닌 정보들도 데이터로 처리하기에 가능한 결과. 글로벌 빅테크 기업들이 집중하고 있는 멀티모달AI의 성과다. 멀티모달AI는 텍스트, 이미지, 음성, 동작, 표정 등 다양한 생체 신호를 받아들이고 처리하는 AI모델.

이게 왜 중요해

빅테크 기업들은 기존 AI보다 정보 처리량을 대폭 확대한 초거대AI 개발에 집중해왔다. 초거대AI는 언어(텍스트) 정보를 통해 수많은 데이터를 학습하고 이를 토대로 인간과 유사한 판단을 하도록 학습된 AI다.

멀티모달AI는 여기서 한 단계 나아가 다양한 양상(모달리티)의 생체신호를 여러 방식으로 받아들이고 반응한다. 언어 외의 다른 정보도 수용하고 처리하기에 인간의 창작물과 유사한 결과물도 내놓을 수 있다. 이는 곧 AI가 인간의 뇌를 뛰어넘을 날이 머지 않았다는 의미. 일론 머스크 테슬라 CEO는 지난 2020년 뉴욕타임스와의 인터뷰에서 “AI가 인간보다 훨씬 더 똑똑해지기까지 5년도 채 남지 않았다”고 했다. 머스크는 실리콘밸리 액셀러레이터 Y컴비네이터 설립자인 샘 알트먼과 공동 설립한 오픈AI를 통해 멀티모달AI 개발에 집중하고 있다.

멀티모달AI, 어디까지 왔나

오픈AI가 만든 AI화가 ‘달리’가 그린 그림. 네덜란드의 화가 요하네스 페르메이르의 작품 ‘진주 귀걸이를 한 소녀’를 중앙에 두고 비슷한 화풍으로 주변 배경을 생성해 원작의 20배 크기 작품을 완성했다. [사진 오픈AI]

오픈AI가 만든 AI화가 ‘달리’가 그린 그림. 네덜란드의 화가 요하네스 페르메이르의 작품 ‘진주 귀걸이를 한 소녀’를 중앙에 두고 비슷한 화풍으로 주변 배경을 생성해 원작의 20배 크기 작품을 완성했다. [사진 오픈AI]

① AI 화가: 오픈AI는 지난해 텍스트를 이미지화해주는 AI 화가 ‘달리’를 선보였다. 최근 화제의 중심에 선 미드저니의 선배인 셈. 올해 초 공개된 ‘달리2’는 기존보다 독창성과 예술성이 향상됐다는 평가를 받는다. 구글 ‘이매진’, 엔비디아 ‘고갱2’, 카카오브레인 ‘칼로’ 등도 텍스트의 특징적인 내용을 기반으로 이미지를 만들어낸다. 하지만 AI 화가마다 화풍 차이도 있다. MS가 만든 ‘넥스트 렘브란트’는 네덜란드 거장 렘브란트의 화풍을 재현해 그가 그렸을법한 초상화를 생성한다.

② AI 작가: 지난 달 서울 대학로예술극장에서는 국내 최초로 AI가 쓴 시를 엮어 만든 시극 ‘파포스’가 무대에 올랐다. 작가는 카카오브레인이 만든 AI 시인 ‘시아’. 파포스는 시아가 쓴 첫 시집 ‘시를 쓰는 이유’에 실린 53편의 시 중 20편으로 구성한 작품이다.시아는 인터넷 백과사전과 뉴스 등으로 한국어를 배웠고 국내 근현대시 1만2000여편을 읽으며 작법을 배웠다. 주제어와 명령어를 입력하면 시아는 1초 만에 시 한 편을 짓는다. 파포스를 연출한 김제민 서울예대 교수는 “AI가 결국 인간을 인간답게 만들고 예술에 대한 근원적 질문을 던지는 형태로 발전할 것 같다”고 평가했다.

지난해에는 포스텍 인공지능대학원 연구팀이 개발한 AI 소설가 ‘비람풍’이 장편소설 ‘지금부터의 세계’를 출간하기도 했다. 주제, 소재, 배경, 캐릭터 등 입력된 정보를 활용해 비람풍은 500쪽이 넘는 이야기를 풀어냈다. 미국에서 2018년 출간된 ‘길 위 1번지’는 인간의 도움이 전혀 없이 AI가 쓴 소설이다.

카카오브레인은 미디어아트 그룹 슬릿스코프와 함께 AI시인 ‘시아’를 개발하고, 지난달 시아의 첫 번째 시집 ‘시를 쓰는 이유’를 출간했다. [사진 카카오브레인]

카카오브레인은 미디어아트 그룹 슬릿스코프와 함께 AI시인 ‘시아’를 개발하고, 지난달 시아의 첫 번째 시집 ‘시를 쓰는 이유’를 출간했다. [사진 카카오브레인]

③ 그 밖에: 영화·드라마·광고 등에서는 이미 AI가 작곡한 음악이 다양하게 쓰이고 있다. 국내에서는 포자랩스, 업보트 엔터테인먼트, 크리에이티브마인드, 뉴툰 등이 AI로 만든 음악을 선보이고 있다. 광주과학기술원(GIST)이 크리에이티브마인드와 만든 AI 작곡가 ‘이봄’은 클래식, 힙합, 트로트 등 다양한 종류의 음악을 작곡한다. KT스튜디오지니가 제작한 웹드라마 ‘가우스전자’의 로고송은 지니뮤직과 업보트 엔터테인먼트가 AI로 작곡했다. LG AI연구원이 개발한 AI 휴먼 틸다는 멀티모달AI ‘엑사원’을 두뇌로 탑재했다. 틸다는 박윤희 디자이너와 함께 ‘금성에서 핀 꽃’을 키워드로 의상을 제작한 끝에 올해 초 뉴욕 패션위크 무대에 이를 선보였다.

지니뮤직과 업보트엔터테인먼트는 AI로 올레tv 오리지널 '가우스전자'의 로고송을 작곡했다. [사진 KT스튜디오지니]

지니뮤직과 업보트엔터테인먼트는 AI로 올레tv 오리지널 '가우스전자'의 로고송을 작곡했다. [사진 KT스튜디오지니]

앞으로는

멀티모달AI 개발에 뛰어든 기술 기업들의 목표는 인간의 모든 활동을 대체할 수 있는 AI다. 다양한 입력방식을 통해 다량의 정보를 수용하고 처리할 수 있는 만큼 인간과 유사한 사고 결과를 내놓을 것이라는 기대가 크다. 우선 교육·제품 상담 등 각종 서비스 산업군에서 멀티모달AI를 만날 수 있을 전망이다.

다만 기술의 발전 속도에 비해 사회적 인식이나 제도의 변화는 늦다. AI 화가 미드저니의 미술전 수상 사례에서 볼 수 있듯 AI가 만든 작품을 창작물로 인정할지에 대한 공방은 여전히 진행 중이다. 한국을 비롯한 많은 국가가 ‘인간의 사상 또는 감정을 표현한 창작물’을 저작물로 보고 있다.

인간을 닮아가는 AI에 대한 윤리적 잣대도 필요하다. 최근 카카오가 국내 기업 중 처음으로 기술윤리위원회를 신설한 것도 이와 관련한 행보. 손승우 중앙대 산업보안학과 교수는 “AI 관련 산업과 기술 발전 속도에 비해 제도가 미비한 상황”이라며 “창작물에 대한 보호, 법적·윤리적 가이드라인에 대한 논의가 시급하다”고 말했다.

관련기사

배너 클릭 시 구독페이지로 이동합니다. https://www.joongang.co.kr/factpl

배너 클릭 시 구독페이지로 이동합니다. https://www.joongang.co.kr/factpl