4년간 음란물 400만장 달달 외웠다···희미해도 99.5% 차단

중앙일보

입력

업데이트

격투기처럼 신체 노출이 많은 동영상, 뷰티·메이크업 등 얼굴이나 특정 부위를 클로즈업한 장면, 원주민의 나체 같이 성적 의도가 없는 영상, 비키니·속옷 판매를 목적으로 하는 화보….

이런 장면을 인공지능(AI)이 음란물인지 아닌지 구분할 수 있을까. 가능하다. 사진과 동영상뿐 아니라 BJ가 실시간으로 인터넷방송을 진행하는 경우에도 음란한 장면이 노출되면 99.5%까지 차단할 수 있는 기술이 나왔다.

네이버는 음란 이미지가 네이버에 등록될 경우 연중 24시간 실시간으로 감지해 검색 노출을 막아주는 ‘엑스아이(X-eye) 2.0’을 다음 달부터 적용한다고 29일 밝혔다.

엑스아이2.0 등급 기준. [사진 네이버]

AI 기술 진화로 적중률 98.1→99.5%
지난 2017년 처음 선보인 ‘엑스아이’는 AI가 네이버에 축적된 400만여 장의 이미지를 10개월간 학습해 탄생했다. 기존에는 이미지 모니터링 담당자가 직접 조처할 때까지 유해물이 노출되는 문제가 있었다. 하지만 엑스아이 도입 이후 98.1%의 적중률로 유해한 사진과 동영상을 실시간으로 걸러낼 수 있게 됐다.

엑스아이 2.0은 여기서 진화해 적중률을 99.5%까지 높였다. 고성능 이미지 인식 모델 ‘렉스넷’, 학습할 데이터를 늘려주는 데이터 증강 기법(‘컷 믹스’), 인식 정확도를 향상하는 최적화 기법(‘AdamP’) 등 다양한 AI 기술을 적용한 결과다.

일부 놓친 이미지는 빠른 자동학습 가능

기준 등급도 확대했다. 기존에는 ‘정상’ ‘음란’으로만 구분했으나 엑스아이 2.0에서는 ‘정상’ ‘음란’ ‘성인’ ‘선정’ 등 4개 등급으로 구분이 가능하게 됐다. 선정적 표현에 대한 판단 정확도가 뛰어나 다양한 서비스에서 활용이 가능할 전망이다. 또 문제 되는 부분이 지나치게 작게 나오거나 희미한 경우 등 탐지 오류가 나올 가능성이 큰 사례를 보완했다. 일부의 놓친 이미지에 대해서는 빠른 자동학습이 가능하도록 설계했다.

유봉석 네이버 서비스운영총괄은 “네이버는 건전한 인터넷 이용환경 조성을 위해 음란물·성인물은 물론 불법 촬영물, 혐오 등 유해 콘텐트 차단을 위해 노력하고 있다”며 “추후 엑스아이의 오픈 API 기술을 공개해 기술이 부족한 스타트업과 사업자 등 다양한 영역에서 활용할 수 있도록 하겠다”고 말했다.

김경진 기자 kjink@joongang.co.kr