'밤양갱' 부르는 故김광석 깜짝…AI '페이크보이스' 잡아낸다

중앙일보

입력

업데이트

1996년에 세상을 떠난 가수 김광석이 지난달 발매된 가수 비비의 '밤양갱'을 부르는 영상. 유튜브 캡쳐

1996년에 세상을 떠난 가수 김광석이 지난달 발매된 가수 비비의 '밤양갱'을 부르는 영상. 유튜브 캡쳐

지난달 발매된 비비의 ‘밤양갱’을 1996년에 세상을 떠난 가수 김광석이 부른다. 김광석이 생전에 남긴 목소리를 AI(인공지능)에 학습시켜 노래를 따라 부르게 한 것이다. 김광석이 나온 영상 속 목소리는 실제가 아니다. AI 딥러닝 기술로 만든 가짜 음성, ‘페이크 보이스(Fake Voice)’를 활용한 결과물이다.

페이크 보이스를 활용한 범죄에 대비해 검찰이 연구를 시작했다. 대검찰청 과학수사부 음성분석실은 22일 “올해부터 4년간 페이크 보이스를 탐지하고 분류하는 AI 프로그램 개발에 나선다”고 밝혔다. 이는 2024년 검찰의 포렌식 역량 강화 7개 사업 중 하나로, 페이크 보이스에 대한 검찰 차원의 기술 개발은 이번이 처음이다.

강남 부녀자 살인사건에도 활용된 음성분석

'강남 납치·살해 사건'의 피의자 이경우, 황대한, 연지호(왼쪽부터). 뉴스1

'강남 납치·살해 사건'의 피의자 이경우, 황대한, 연지호(왼쪽부터). 뉴스1

음성 자료는 범죄 수사와 재판 과정에서 활발히 활용돼왔다. 그리고 이 음성 자료를 분석하고 판단하는 곳이 대검 과수부 음성분석실이다. 사람마다 발성과 발음이 다른 점을 이용해 음성을 과학적으로 살피는 것이다. ▶범인의 음성과 용의자의 음성이 동일한지에 대한 판단 ▶음성 증거가 원본인지, 의도적으로 조작되었는지에 대한 판단 ▶녹음 품질이 불량한 자료에서 잡음을 제거하고 명료도를 향상시키는 작업 등을 통해 범죄에 대응해왔다.

지난해 3월 발생한 강남 부녀자 납치‧살인 사건에서도 이 같은 음성분석이 활용됐다. 납치에 이용된 차량 블랙박스에 범죄자들의 대화 내용이 녹음됐는데, 엔진음과 신호음 등이 섞여 대화 내용이 잘 들리지 않았던 것이다. 음성분석실에서는 수사에 방해되는 불필요한 소리를 줄이고 범죄자들의 목소리를 높여 대화 내용을 명확히 했다. 우발적 범행이라는 피고인들의 주장을 깨고 ‘사전에 공모된 범행’이었다는 점을 밝혀낸 결정적 증거가 됐다.

이 외에도 정치자금법 위반 사건, 사기 사건, 공직선거법 위반 사건 등에도 음성 분석은 활발히 사용된다. 선거운동 대가로 금품을 받았다는 녹음파일, 보이스피싱 등 사기의 순간을 녹취한 음성들은 위‧변조가 제대로 판단된 뒤에야 온전한 증거로 활용될 수 있기 때문이다.

대검찰청 과학수사부에서 진행한 음질 개선 사례. 녹음 품질이 불량한 자료에서 잡음을 제거하고 음성의 명료도를 향상시키는 작업을 한다. 위는 개선 전, 아래는 개선 후. 사진 대검찰청 과학수사부

대검찰청 과학수사부에서 진행한 음질 개선 사례. 녹음 품질이 불량한 자료에서 잡음을 제거하고 음성의 명료도를 향상시키는 작업을 한다. 위는 개선 전, 아래는 개선 후. 사진 대검찰청 과학수사부

“페이크 보이스, 정확히 분류해 범죄 막겠다”

대검 음성분석실은 2024~2027년 ‘페이크 보이스 탐지 기술 개발’ 중장기 연구를 수행할 계획이다. 올해에는 네이버·KT 등 음성 데이터베이스를 가진 기업들과 협력해 페이크 보이스의 기술과 특징을 분석하고, 음성 조작 여부 판단에 활용할 자료를 수집한다. 정부 예산 확보는 마쳤으며, 오는 4월중 연구를 협업할 업체를 선발하는 입찰 공고를 낸다.

김경화 대검찰청 과학수사부 음석분석실장(언어학 박사)은 “AI가 급속히 발전해 누구나 가짜 음성을 만들 수 있는 시대가 됐다. 페이크 보이스를 악용한 범죄에 선제적으로 대응하기 위해 지난해부터 기술 개발을 위한 준비를 시작했다”며 “기술이 개발되면 가족 목소리를 본딴 보이스피싱 등 범죄에도 효과적으로 사용할 수 있을 거라고 기대한다”고 말했다.

ADVERTISEMENT
ADVERTISEMENT