공공 데이터 쌓아 악의적인 '딥페이크' 방지 나선다

중앙일보

입력 2020.06.21 15:33

수정 2020.06.21 15:34

SNS로 공유하기
페이스북
트위터

영화 속 배우의 얼굴을 일반일 얼굴로 대체하는 애플리케이션 'zao'에 대한 관심이 폭발적으로 늘어나면서, 프라이버시 침해 등의 부작용에 대한 우려도 커지고 있다. [소후닷컴]

인공지능(AI)이 뇌파 영상을 분석해 치매를 진단하고, 사람의 얼굴을 악의적으로 변조하는 딥페이크를 방지하는 공공데이터가 구축된다.  
 
21일 과학기술정보통신부는 올해 'AI 학습용 데이터 구축사업'의 지원 과제 20개를 선정했다고 밝혔다. AI 학습용 데이터 구축은 정부가 AI 개발에 필요한 양질의 데이터를 대규모로 구축하고 개방하는 '데이터 댐' 사업이다. 2017년 시작돼 한·영 번역 말뭉치, 한국어 음성, 이상행동 영상 등 인공지능 서비스 개발을 위한 데이터 21종, 4650만건이 AI 허브를 통해 공개됐다. 
 

데이터 댐에 들어갈 공공데이터 20가지 선정

올해는 지난해보다 예산과 과제가 2배로 늘었다. 390억원(지난해 195억원)을 투입해 20개 과제를 추진한다. 과제 공모에 92개 사업자가 참여해 평균 4.6대 1의 경쟁률을 보였다.  
 
과기정통부는 자연어 처리와 자율주행 기술 분야, 음성·시각·언어 등 융합 분야 등 활용가치가 높고 데이터 확보 필요성이 시급한 과제를 우선 선정했다. 이와 함께 치매·구강질병 등을 진단하고 피트니스 자세 등을 지도하는 헬스케어, 사람의 얼굴을 악의적으로 변조하는 딥페이크 방지, 장애인 삶의 질을 향상하는 기술 등도 채택했다. 

올해 AI 학습용 데이터 구축 사업에 선정된 20개 과제. [과학기술정보통신부 제공]

크라우드소싱 전면 도입…인력난 해소, 일자리 창출 기대

모든 과제의 데이터 수집·가공에 크라우드 소싱 방식을 도입했다. 크라우드 소싱 방식이란 시간·장소에 구애받지 않고 누구나 데이터 수집과 가공에 참여한다는 의미다. 과기정통부는 이 방식을 전면적으로 도입함으로써 인력 부족 문제를 해결하고 일자리 창출 효과도 기대하고 있다. 지난해는 2개 과제에만 크라우드 소싱을 적용한 바 있다.  


아울러 과기정통부는 올해 3차 추경으로 AI 학습용 데이터를 확대 구축한다. 2925억원을 투입해 150개의 AI 학습용 데이터를 구축해 AI 허브를 통해 무료 개방할 방침이다. 과기정통부 관계자는 "AI 산업 분야에서 다양한 기술과 서비스를 개발하는 데 활용될 수 있도록 AI 학습용 데이터를 대규모로 구축하고 데이터 댐에 모아둘 방침"이라고 말했다.
박형수 기자 hspark97@joongang.co.kr