"옛 애인 애칭 넣었더니···" 이루다 개인정보 이용 논란 조사

중앙일보

입력 2021.01.13 05:00

정부가 최근 개인정보의 활용 과정에서 논란을 빚은 인공지능(AI) 챗봇 ‘이루다’에 관한 조사에 착수한다. 이루다의 개발사가 만든 제3의 앱 ‘연애의 과학’에 제공된 사용자의 메시지 내용을 챗봇이 학습하도록 충분히 동의를 받았는지가 조사의 주안점이다.

연애의 과학 대화→이루다 학습…“개인정보 동의 여부 초점”

20세 여성 성별 캐릭터를 가진 AI챗봇(채팅 로봇) '이루다'는 스타트업 스캐터랩이 지난달 23일 출시한 AI 챗봇이다. [스캐터랩 홈페이지 캡처]

20세 여성 성별 캐릭터를 가진 AI챗봇(채팅 로봇) '이루다'는 스타트업 스캐터랩이 지난달 23일 출시한 AI 챗봇이다. [스캐터랩 홈페이지 캡처]

12일 개인정보보호위원회(이하 개인정보위) 관계자에 따르면 개인정보위와 한국인터넷진흥원은 이루다를 개발한 스타트업 스캐터랩에 대한 조사에 들어갔다. 배상호 개인정보위 조사2과장은 “사건 접수 후 기초적인 사실관계 확인 등 사전조사가 진행 중”이라며 “(스캐터랩이) 정보 주체의 동의를 얻어 적법하게 개인정보를 이용했는지와 정보 활용 범위가 조사의 초점”이라고 말했다.

‘이루다’는 페이스북 메신저를 통해 대화가 가능한 AI 챗봇이다. 20세 여성을 캐릭터로 설정해 지난해 12월 23일 출시, 2주 만에 이용자 75만명을 기록하는 등 인기를 끌었다. 딥러닝 알고리즘을 기반으로 사람들이 메신저로 나눈 대화 내용을 학습해 만들어졌다. 이 때문에 채팅을 하다 보면 마치 사람과 유사한 듯한 느낌을 주는 게 특징이다.

이루다가 개발되면서 학습한 대화는 스캐터랩이 지난 2016년 출시한 별도의 앱, ‘연애의 과학’ 이용자들이 제공한 카카오톡 내용을 가져온 것이다. 연애의 과학은 연인과 나눈 카톡 대화를 사용자가 집어넣으면 답장 시간·대화 패턴 등을 분석해 애정도 수치를 보여준다. 스캐터랩이 밝힌 이루다의 대화 학습량은 약 100억건 수준이다.

이용자 집단 소송 준비…“챗봇 학습할 거라 고지 안 해”

연애의과학 홈페이지에 올라와있는 '개인정보취급방침'의 개인정보 수집 및 이용 목적. 이용자들은 "신규 서비스 개발 및 맞춤 서비스 제공 고지 만으론 이루다 학습에 카톡 내용이 쓰일 것을 알 수 없다"는 입장이다. [연애의과학 홈페이지 캡처]

연애의과학 홈페이지에 올라와있는 '개인정보취급방침'의 개인정보 수집 및 이용 목적. 이용자들은 "신규 서비스 개발 및 맞춤 서비스 제공 고지 만으론 이루다 학습에 카톡 내용이 쓰일 것을 알 수 없다"는 입장이다. [연애의과학 홈페이지 캡처]

사건은 이루다가 대화 과정에서 소수자·약자에 대한 혐오 발언을 뱉는 사례가 발견되면서 불거졌다. 이후 연애의 과학 이용자들을 중심으로 “이루다에 옛 애인의 이름을 입력했더니 실제 다른 친구의 이름을 언급했다”, “옛 애인의 애칭을 넣었더니 실제 애인 말투로 말했다”는 등 개인정보 유출 의혹으로 번졌다.

문제는 연애의 과학에 제공된 대화를 이루다 개발에 가져다 쓰면서 회사가 관련 내용을 충분히 고지하고 동의를 받았는지 여부다. 스캐터랩 측은 지난 11일 낸 입장문을 통해 “사전에 동의가 이뤄진 개인정보취급 방침의 범위 내에서 활용했다”는 입장이다. 연애의 과학 ‘개인정보 취급 방침’에 명시된 개인정보 수집 및 이용 목적에는 ‘신규 서비스 개발 및 마케팅·광고에의 활용’이라고 고지돼 있다.

그러나 이용자들은 “문장이나 표현이 고스란히 AI 챗봇이 학습하는 데 쓰일 것이라는 사실은 명시적으로 고지되지 않았다”는 입장이다. 여기에 대화는 2명이 나눈 것인데 2명 중 1명의 동의만 받고 양쪽의 카톡 대화를 모두 수집한 것은 부적절하다는 지적도 나온다. 현재 연애의 과학 이용자들은 총 140여명 규모의 오픈 채팅방을 만들어 집단 소송을 준비 중이다.

개인정보법 위반 여부 관심…“이름만으로 개인 특정 어려워”

동성애 혐오 논란을 야기한 챗봇 이루다와 한 이용자의 대화. [페이스북 캡쳐]

동성애 혐오 논란을 야기한 챗봇 이루다와 한 이용자의 대화. [페이스북 캡쳐]

개인정보보호법 제3조(개인정보 보호 원칙)에 따르면 앱 개발사 등 정보처리자는 처리 목적에 필요한 범위에서 적법하게 최소한의 개인정보를 처리해야 하고, 목적 외의 용도로 활용할 수 없다. 22조(동의를 받는 방법)에 따르면 정보주체가 명확히 인지할 수 있도록 동의사항을 구분해 알려야 하며, 글자 크기·색깔·밑줄 등을 이용해 명확히 알아보기 쉽게 해야한다.

그러나 법적으로 이를 문제 삼기는 어렵다는 시각도 있다. 김가연 오픈넷 변호사는 “법적 의미의 개인정보란 여러 정보를 결합해 특정 개인을 식별할 수 있어야 한다”며 “단순히 챗봇에 이름이나 주소 등이 나왔다는 것만으로는 개인정보 침해라고 보기 어려운 데다 사용자의 동의도 받은 상황”이라고 말했다. 다만 “스캐터랩이 앱 개발과정에서 제대로 비식별화를 하지 않아 현재도 특정인을 식별할 수 있는 상태라면 얘기가 달라질 수 있다”며 “이는 향후 조사를 통해 밝혀져야 할 부분”이라고 설명했다.

허정원 기자 heo.jeongwon@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT

Innovation Lab

ADVERTISEMENT