문 대통령 전화한 줄 알았네…AI 성대모사, 범죄에 쓰일라

중앙일보

입력

업데이트

지면보기

종합 02면

“와타시와 프레지던트데스.”(문재인 대통령 목소리)

AI가 문대통령·손석희 성대모사 … 보이스피싱 악용 우려 #20대 엔지니어 음성합성 기술 소개 #유명인 목소리 분석해 새 문장 응용 #유튜브·뉴스 15시간 데이터 활용 #합성 목소리 만들자 “똑같다” 평가 #당사자 동의 없으면 위법 가능성 #개발자, 소스 코드 공개했다가 삭제

“손석희는 대한민국의 언론인으로 JTBC 보도담당 사장이다.”(손석희 JTBC 사장 목소리)

최근 한 웹사이트에 게시된 목소리들이 화제가 됐다. 문재인 대통령과 손석희 사장이 말한 것이 아니라 한 엔지니어가 음성 합성 기술을 이용해 만들었는데 실제와 매우 비슷하다는 반응이 나왔다. 게임제작사에서 엔지니어로 일하고 있는 김태훈(25)씨가 웹사이트에 약 일주일 동안 공개했던 이 목소리 샘플들은 19일 오전에 비공개로 바뀌었다.

[그래픽=차준홍 기자 cha.junhong@joongang.co.kr]

[그래픽=차준홍 기자 cha.junhong@joongang.co.kr]

게임제작사인 데브시스터즈가 샘플 공개 이후 제기된 악용 우려와 기술제휴 요청 때문에 공개하지 않는 것으로 방침을 바꾸었기 때문이다. 이 음성 합성 기술은 16일 네이버가 주최한 개발자 콘퍼런스에서 소개됐다.

합성 원리는 유명인의 목소리를 분석한 뒤 새로운 문장에 합성하는 것이다. 목소리와 그 소리가 무슨 의미인지를 동시에 컴퓨터에 학습시킨 뒤 이를 바탕으로 새로운 문장을 읽게 하는 방식이다. 목소리 데이터가 많고 음질이 좋을수록 합성 결과물도 좋아진다.

개발자인 김씨는 유튜브의 영상과 뉴스 등의 목소리 데이터를 활용했다. 문재인 대통령의 연설 목소리, 손석희 앵커의 뉴스 진행 목소리를 ‘원료’로 사용했다. 김씨가 웹사이트에 공개한 샘플에서 2시간짜리 음성을 분석해 만든 문 대통령의 합성 목소리는 다소 어색하다. 5시간짜리 음성을 분석해 만든 박근혜 전 대통령의 목소리는 상당히 흡사하고, 15시간짜리 음성으로 만든 손 사장 합성 목소리는 매우 똑같이 들린다는 게 이용자들의 반응이다.

애플과 삼성전자는 ‘시리’나 ‘빅스비’ 등 인공지능(AI)이 사람과 비슷한 목소리를 내도록 하는 데 이와 유사한 기술을 활용 중이다.

네이버는 배우 유인나씨의 목소리로 오디오북 서비스를 만들었다. 알파고를 만든 구글의 자회사 딥마인드는 신경망 기술을 활용해 사람의 목소리와 비슷한 소리를 내도록 스스로 훈련하는 AI를 개발 중이다.

개발자 김씨는 지난 16일 자신이 개발한 음성 합성 기술의 소스 코드(알고리즘)를 웹사이트에 공개했다. 그는 “그리 어려운 기술이 아니다. 앞으로는 기업뿐 아니라 일반인도 많이 사용하게 될 것”이라고 말했다. 김씨는 “누구나 음성 합성 기술을 이용할 수 있도록 하겠다”며 소스 코드를 공개했다가 관심과 논란의 주인공이 되자 19일 이를 삭제했다.

이 같은 음성 합성 기술은 보이스피싱 등의 범죄에 악용될 수 있다는 걱정을 낳는다. 웹사이트에서 문 대통령의 합성 목소리를 들은 이모(30)씨는 “신기하긴 한데 문재인 대통령이나 손석희 사장이 한 말인 것처럼 이상한 말을 만드는 사람도 있을 것 같아 무섭다”고 말했다.

전문가들은 합성 목소리를 모닝콜 등 개인적으로 이용하는 경우가 아니면 법적인 문제를 낳을 수 있다고 지적했다. 저작권 분야 전문인 박찬훈 변호사는 “당사자의 동의를 받지 않은 합성이라면 명예훼손에 해당하는 내용은 물론 일반적인 내용을 담은 목소리라 하더라도 인격권을 침해할 가능성이 있다. 음식점 홍보 등에 상업적으로 이용하면 유명인의 초상권 침해에 해당할 수 있다”고 설명했다. 저작권 관련 소송을 자주 맡아 온 고한경 변호사는 “합성된 목소리의 말은 실제로 그 주인공이 한 말이 아니기 때문에 권한 침해가 아니라는 주장도 제기될 수 있다. 법적으로 애매한 부분이 있다”고 말했다.

신광영 중앙대 사회학과 교수는 “음성 합성 기술에 대한 우려는 지문·홍채 복제처럼 기술이 발전하면서 생기는 걱정과 비슷하다. 새 기술의 등장은 규범에 대한 고민을 부른다”고 설명했다. 네이버 관계자는 “연예인 목소리 합성은 소속사와 계약하고 진행한다. 앞으로 이런 부분에 대한 사회적 논의가 진행될 것으로 예상한다”고 말했다.

송우영 기자 song.wooyeong@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT