[팩플] 영상 표절 도운 ‘신사임당표 AI’…유튜브는 왜 못잡아냈나

중앙일보

입력

유튜버들이 만든 영상을 둘러싼 표절 싸움이 벌어졌다. 단순히 누군가 올린 영상을 베껴서 또 다른 영상을 만드는 데 그치지 않고 빅데이터와 인공지능(AI)을 활용해 조직적이고 집단적인 표절이 이뤄지고 있다는 것. 그동안 창작자의 저작권 보호를 위해 여러 장치를 마련해온 유튜브도 이를 검증하는 알고리즘의 허점이 드러나자 당황하는 모양새다.

무슨 일이야    

유튜버 리뷰엉이가 15일 공개한 우주고양이 김춘삼의 영상 목록. 썸네일과 제목 모두 유사하다. 유튜브 캡처

유튜버 리뷰엉이가 15일 공개한 우주고양이 김춘삼의 영상 목록. 썸네일과 제목 모두 유사하다. 유튜브 캡처

구독자 135만명을 보유한 과학 유튜버 리뷰엉이는 15일 “제 유튜브가 도둑질당하고 있다”는 제목의 영상을 게시하며 문제를 제기했다. 같은 분야 유튜버 우주고양이 김춘삼이 제목, 썸네일, 스크립트까지 그대로 복사한 영상을 통해 돈을 벌고 있다는 주장. 리뷰엉이가 공개한 스크립트를 보면 영상의 구성 순서는 물론 예시로 든 사례까지 ‘복붙’한 수준이다.

리뷰엉이는 과거 김춘삼이 유튜브 주피디(노아AI) 채널에 출연한 인터뷰 영상도 증거로 제시했다. 김춘삼은 “실제로 터졌던(인기가 많았던) 썸네일을 참고해 내 식대로 조금 바꾸거나 최대한 비슷하게 만들었다”며 “노아, 클로바노트, 뤼튼 프로그램을 사용하니 너무 쉬웠다”고 영상 제작 노하우를 공개했다. 이를 두고 “완벽한 방법”이라 칭찬했던 ‘주피디’ 주언규는 해당 인터뷰 등 관련 영상을 비공개로 전환하고 “자숙의 시간을 갖겠다”고 밝혔다.

표절 도운 기술은

12일 예능 ‘집사부일체2’에 출연한 주언규. 신사임당, 주피디 등 경제 유튜버로 활동 중이다. 사진 SBS

12일 예능 ‘집사부일체2’에 출연한 주언규. 신사임당, 주피디 등 경제 유튜버로 활동 중이다. 사진 SBS

노아는 주언규와 현승원 대표가 만든 크리에이터를 위한 AI 빅데이터 기반 플랫폼이다. 한국경제TV PD 출신인 주언규는 구독자 180만명을 보유한 유튜버 신사임당으로도 유명하다. 지난해 8월 해당 채널을 투자 유튜버 디피에 20억원에 매각한 이후, 주피디(노아AI) 채널로 옮겨 활동해왔다. 12일 SBS 예능 ‘집사부일체2’에 출연해 100억원대 자산가로 소개되기도 했다. 현승원 대표는 영어 스타강사 출신으로 교육기업 디쉐어를 만든 사업가. 2019년 디쉐어 지분 50%를 사모펀드 VIG파트너스에 1650억원에 매각하면서 화제가 됐다.

노아가 제공하는 서비스는 키워드 마이닝, 토픽 마이닝, 노출 확률 분석, 채널 분석 등이다. 인기 영상의 키워드와 토픽을 수집해 이에 대한 분석 결과를 제공한다고 설명하고 있지만, 사실상 참고할 만한 영상을 찾아 효과적으로 베낄 수 있도록 도와주는 셈. 리뷰엉이는 “도둑질 노하우를 강연하러 다니면서 후학 도둑을 양성하며 돈을 벌고 있다”고 강하게 비판했다.

김춘삼은 인터뷰에서 “노아가 유튜브 영상 시작점”이라고 밝혔다. 다음 단계는 네이버 AI 음성 기록 관리 서비스 클로바노트를 통해 영상 대본을 추출하고, AI 콘텐트 생성 플랫폼 뤼튼을 통해 비슷한 톤앤매너의 대본을 작성하는 것. 그의 고백대로라면 “논문을 읽어봐도 이해할 수가 없지만 논문을 참고해 만든 영상만 있으면 대본 작성은 3시간, 영상 편집까지 10시간이면 가능”하다. 리뷰엉이는 “지난해 12월부터 올 1월 사이 과학 유튜브 채널이 10개 이상 생겨났고, 모두 다른 채널을 복붙했다”고 주장했다. 그의 지적대로라면, 이와 유사한 사태가 다른 분야로 번질 가능성도 있다.

노아AI 홈페이지에 공개된 키워드 마이닝 예시. 홈페이지 캡처

노아AI 홈페이지에 공개된 키워드 마이닝 예시. 홈페이지 캡처

유튜브는 왜 못 잡는데  

유튜브는 기본적으로 저작권 일치 도구(Copyright Match Tool)를 통해 다른 영상과 일치하는 영상 또는 그러한 가능성이 있는 영상을 자동으로 식별할 수 있다. 사용자가 이를 통해 저작권 문제가 있는 영상을 발견하면 이를 보관 처리하거나 삭제 요청, 혹은 채널에 연락할 수 있는 방식. 영화사나 방송사, 기획사 등 보다 체계적인 저작권 관리가 필요한 기업은 콘텐트 ID를 받아서 모니터링할 수 있다.

하지만 저작권 소유자가 유튜브에 제출한 오디오 및 영상 콘텐트의 데이터베이스와 비교해서 검사하는 방식이어서 한계가 있다. 가수가 부른 노래처럼 명확한 비교 대상이 있으면 일상 브이로그 영상 중 카페에서 틀어놓은 노랫소리까지 찾아낼 수 있지만, 텍스트나 음성은 조금만 바꿔도 다른 콘텐트로 인식할 수 있기 때문이다. 유튜브 측은 해당 이슈를 비롯해 지속적인 모니터링을 통해 개선해 나간다는 방침. 다만 다만 영상·음악·어문 등 콘텐트 유형별로 저작권법이 다르고, 국가별로도 달라서 즉각적인 대응은 어려울 것으로 보인다.

더 알아야 할 것

챗GPT 등 생성 AI 사용이 본격화되면서 저작권 문제에 대한 우려도 함께 대두하고 있다. 사용자가 어떤 콘텐트를 참고해 텍스트나 이미지 제작을 요청하고, 이를 활용해 영상을 만들게 되면 원 데이터를 추적하는 것 역시 어려워질 수밖에 없다. AI를 검증하는 AI도 쏟아지고 있지만, 어디까지가 창작이고 어디까지가 표절인지 범위를 정하기도 쉽지 않다. 노암 촘스키 미국 메사추세츠공대 명예교수는 지난달 교육 유튜브 에듀키친에 출연해 “챗GPT는 첨단 기술을 활용한 표절 시스템”이라고 비판하기도.

관련기사