하지만 흥미롭게도 오바마가 AI로 인해 가장 먼저 영향을 받을 것 같다. BBC뉴스의 17일(현지시간) 보도에 따르면 워싱턴대학교 컴퓨터 공학부 폴 알렌 센터 연구팀이 오바마의 목소리에 맞춰 립싱크로 말하는 '오바마 AI'를 만들었기 때문이다. 이들은 오바마의 고화질 영상을 합성해 목소리에 맞게 표정을 짓게 만들었다. 오바마의 연설 자료를 갖고 AI가 신경망 학습을 통해 음성에 입모양을 합성하는 방법을 익히는 식이었다. 연구팀은 자연스러운 입술 및 입 주변 근육의 움직임에 적당한 3D 포즈를 매칭해 제법 리얼한 오바마 연설 비디오를 만들어냈다.
워싱턴대학교 연구팀, 삼성 등 투자 받아 연구
영상 신경망 학습으로 오바마 표정 완벽 재현
영상의 왼쪽이 진짜 오바마, 오른쪽은 가짜다
연구팀이 오바마를 선택한 이유는 공개된 비디오의 분량이 머신 러닝을 하기에 충분했기 때문이다. 케멜마셔 쉴저만 부교수는 "향후에 스카이프나 메신저로 채팅 같은 도구를 통해 누구나 컴퓨터 모델을 훈련시킬 수 있는 비디오를 수집할 수 있을 것'이라고 말했다. 공동 연구자인 스티브 사이츠 교수는 "화상 채팅을 할 땐 종종 연결이 끊기기도 하고 해상도가 낮아 불쾌함을 느끼는 반면, 오디오는 무난히 전달되는 편"이라면서 "오디오를 활용해 훨씬 더 높은 품질의 비디오를 제작할 수 있다면 멋질 것"이라고 말했다.
연구팀은 '언캐니 밸리'를 넘어서기 위해 심혈을 기울였다고 한다. 언캐니 밸리란 일본의 로봇 연구자인 모리 마사히로가 1970에 발표한이론이다. 로봇의 생김새나 행동이 사람에 근접할수록 호감을 느끼는 경향이 있지만, 그것이 어느 한도를 넘어서 70~80%선에 들어서면 친밀도가 뚝 떨어지고 불쾌감을 느끼게 된다는 것이다.
이경희 기자 dungle@joongang.co.kr