ADVERTISEMENT

혐오발언 내뱉은 '이루다'···아무말대잔치 AI 뒤엔 규제 역설

중앙일보

입력

업데이트

인공지능(AI) 챗봇인 ‘이루다’가 사회적 논란을 남긴 채 서비스를 시작한 지 20여 일 만인 12일 운영 중단을 발표했다.

그동안 이루다는 성희롱, 차별ㆍ혐오, 개인정보ㆍ사생활 침해 등 AI와 관련한 다양한 논쟁에 불을 지폈다. 지난 3주일 동안 이루다가 던진 우리 사회에 화두는 무엇이며, 이 문제를 해결할 수 있는 대안은 어떤 것이 있는지 살펴봤다.

공식 웹페이지에 소개된 이루다의 정체성. [사진 이루다 웹페이지 캡쳐]

공식 웹페이지에 소개된 이루다의 정체성. [사진 이루다 웹페이지 캡쳐]

① 이루다는 AI인가

먼저 AI 챗봇인 이루다가 어느 정도 수준의 AI인지 짚어봐야 한다. 전문가들은 이루다의 경우 고도화한 AI가 아니어서 이루다를 통해 AI의 미래를 걱정할 정도는 아니라고 지적한다.

한국인공지능법학회 회장인 고학수 서울대 교수는 “이루다는 딥러닝(심층학습) 수준이 아닌 머신러닝(기계학습) 수준의 AI로 볼 수 있다”며 “데이터를 단순 학습했기 때문에 단어나 문장이 어떤 함의를 가지는지에 대한 트레이닝이 돼 있지 않다”고 분석했다.

AI 전문가인 이경전 경희대 경영학과 교수는 페이스북을 통해 “현재 이루다는 ‘아무말 대잔치’를 하는 성능 낮은 스몰 톡(짧은 대화) 챗봇에 불과하다”며 “이런 저품질의 대화 기계를 가지고 이루다가 레즈비언을 혐오했다고 주장하는 것은 이제 겨우 말을 뗀 아이에게 ‘레즈비언이 좋아 싫어’ 하고 물어본 뒤 싫다고 했다고 난리 치는 것보다 바보 같은 일일 뿐”이라고 지적했다.

'이루다'는 자연스러운 대화가 가능한 인공지능 챗봇이다. [사진 스캐터랩]

'이루다'는 자연스러운 대화가 가능한 인공지능 챗봇이다. [사진 스캐터랩]

② 데이터 확보 논란 

그렇다고 이루다가 남긴 기술적 진전이 없는 것은 아니다. 고학수 교수는 “기존 서비스(‘연애의 과학’ 어플리케이션)를 통해 20대 연인들의 실제 대화 내용을 확보했고, 이를 통해 사실처럼 대화하는 느낌을 만들어낸 것이 강점”이라고 평가했다.

하지만 이렇게 사용된 데이터의 확보 과정에서 법적·윤리적 논란이 생겼고, 이를 활용하는 알고리즘 기술이 부족했다는 게 문제점으로 거론된다. 오병철 연세대 법학전문대학원 교수는 “관공서에 문의하는 대화 내용과 애정이나 친밀감을 가진 상대와 대화 내용은 다를 수밖에 없다”며 “이런 데이터를 합법적으로 모은다는 것 자체가 현실적으로 굉장히 어렵다”고 지적했다. 실제 데이터 출처로 알려진 ‘연애의 과학’ 이용자들 사이에선 집단소송 움직임이 일고 있다.

스캐터랩 로고.

스캐터랩 로고.

③ 기술력의 한계     

무엇보다 축적된 데이터를 바탕으로 대화 알고리즘을 만드는 과정에서 기술력이 떨어졌다는 지적이 나온다. 고학수 교수는 “사회적 약자나 소수자를 차별하지 않는다는 전제나 원칙 없이 자체적으로 실명이나 욕설 등 몇 가지 금기어를 걸러내는 수준에서 알고리즘을 적용한 것으로 보인다”고 말했다. 오병철 교수 역시 “인종차별ㆍ성차별은 물론 시대정신이라고 단언할 수 없는 대화가 나올 때 이를 거부할 수 있도록 고도화한 알고리즘이 필요하다”고 강조했다.

AI 개발 초기 단계부터 이런 고민을 하기 위해선 정부가 발표한 ‘AI 윤리 기준’이 보강돼야 한다는 주장도 있다. 고 교수는 “정부가 발표한 윤리 기준이 추상적이기 때문에 기업 입장에서 ‘공자님 말씀’으로 여길 수 있는 부분이 있다”며 “조금 더 상세한 가이드 역할을 제공해 기업에 고민과 과제를 안겨줘야 한다”고 주장했다.

④ 규제의 역설

업계에선 개인정보 보호를 위해 만든 각종 규제가 오히려 개인정보 보호의 사각지대를 만들었다는 비판을 제기한다. 지난해 1월 ‘데이터 3법(개인정보보호법ㆍ신용정보법ㆍ정보통신망법)’이 국회를 통과했지만, 제약사항이 많아 기업이 데이터를 적극적으로 활용하지 못하고 있는 실정이다. 이로 인해 창과 방패의 역할인 보안 관련 기술 발전도 더딜 수밖에 없다는 지적이다.

익명을 요구한 업계 관계자는 “선진국에선 의료 정보 같은 민감한 개인정보를 합법적으로 판매해 신약 개발 등 고품질 정보로 활용하고 있다”며 “국내에선 정부가 빅데이터 산업에 온갖 규제를 적용하다 보니 개인정보의 활용뿐 아니라 보안에 대한 기술 발전도 더딘 것”이라고 말했다.

김재환 인터넷기업협회 정책국장은 “이번 이루다 논란은 AI가 학습할 수 있는 다양한 데이터가 부족했던 점도 하나의 원인”이라며 “정부가 적극적으로 공공 데이터를 이용한 기업의 활용 사례를 발굴해 규제로 위축된 빅데이터 산업을 활성화해야 한다”고 말했다.

관련기사

김경진 기자 kjink@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT