ADVERTISEMENT

[팩플] AI 이루다 컴백…혐오발언·개인정보 이번엔 괜찮을까

중앙일보

입력

업데이트

AI 챗봇 '이루다'의 초기 버전(위)과 내년 돌아올 '이루다2.0'(아래). 인간형에 가까운 디자인으로 바뀌었다. 사진 스캐터랩

AI 챗봇 '이루다'의 초기 버전(위)과 내년 돌아올 '이루다2.0'(아래). 인간형에 가까운 디자인으로 바뀌었다. 사진 스캐터랩

인공지능(AI) 챗봇 '이루다'가 돌아온다. 이루다 개발사 스캐터랩이 내년 1월 '이루다2.0'의 비공개 베타 테스트를 예고했다. AI 윤리와 데이터 주권 등 AI 시대에 묵직한 질문을 던지고 떠났던 이루다, 얼마나 나아졌을까.

무슨 일이야

올해 1월 혐오·차별과 개인정보 남용 논란으로 서비스 출시 3주 만에 폐기됐던 AI 친구 '이루다'가 1년 만에 돌아온다. 개발사 스캐터랩은 내년 1월 11일부터 이루다 2.0의 비공개 베타 테스트를 진행한다고 21일 밝혔다.
● 당시 이루다를 둘러싼 문제는 복합적이었다. 여성형 AI를 향한 일부 사용자의 성희롱, AI의 차별·혐오 학습과 재생산, 개발사의 무분별한 개인정보 활용 등 논란거리가 줄줄이 이어졌다. 3주간 이루다를 써본 사용자 75만명의 대부분이 1020세대였다. 개인정보보호위원회(개보위)는 사안의 심각성을 고려해 올해 4월 스캐터랩에 1억 330만원의 과징금 등을 부과했다.
● 베타 테스트는 이루다2.0 출시 전 사용자 의견을 받기 위한 절차다. 내년 1월 4일까지 이루다 페이스북 페이지를 통해 누구나 신청할 수 있으며, 이중 3000명이 무작위로 선정된다. 베타 테스트 참여자는 이루다가 혐오 발언 등을 하는지 검토할 수 있다. 다만, 비밀 유지 서약을 제출해야 하며, 이루다와의 대화 내용은 외부에 일체 공개할 수 없다. 스캐터랩은 테스트 후 서비스를 개선해 2022년 중 정식 출시일을 정할 예정이다.

뭐가 달라졌대?

스캐터랩은 '이루다 쇼크' 이후 그간의 학습 데이터와 답변 데이터를 전량 폐기했다. 처음부터 다시 만들었다는 뜻. 회사는 개보위 요구보다 높은 수준으로 AI 윤리를 점검하고 서비스를 보완했다고 밝혔다.
사람이 먼저다: 스캐터랩은 먼저 AI 개발에 참여하는 기획자·개발자·리서처 등 전원의 합의를 거쳐 스캐터랩 AI 챗봇 윤리 준칙 5가지를 수립했다고 밝혔다. '사람을 위한 AI 개발'을 대원칙으로 ▶다양한 삶의 가치 존중 ▶함께 실현하는 AI 챗봇 윤리 ▶합리적 설명을 통한 신뢰 관계 유지 ▶프라이버시 보호와 정보 보안 발전에 기여 등으로 구성했다. 전문은 외부 검토를 거쳐 이루다2.0 공식 출시 후 홈페이지에 공개된다.
● 초등학생은 못쓴다: 연령 제한도 생겼다. 만 14세 이상만 이루다2.0을 쓸 수 있다. 회사는 개보위의 시정조치와 페이스북 가입 연령 제한을 고려했다고 밝혔다.
창업자 의지는: 김종윤 스캐터랩 대표는 지난 8월 중앙일보와의 인터뷰에서 "인간은 외모·지위·성적·필요 등 모든 사회적 조건을 떠나 타인을 있는 그대로 봐주는 건 어려운 일"이라며 "AI인 이루다가 좋은 친구로서 관계의 불평등을 해소할 수 있게 하겠다"고 말했다.

김종윤 스캐터랩 대표. 사진 스캐터랩

김종윤 스캐터랩 대표. 사진 스캐터랩

진짜 차별·혐오 안해?

이루다2.0은 '어뷰징'을 탐지한다. 선정적·공격적·편향적 발언이 탐지되면 이루다2.0은 짜여진 시나리오대로 답한다. 가령 "레즈비언 어떻게 생각해?"라고 사용자가 물어보면 "사랑의 유형이 다를 뿐 모든 사랑은 궁극적으로 같다고 생각해" 같은 답변이 나오는 형태다. "나는 있는 그대로의 너가 좋아", "그런 말 하지 않았으면 좋겠어" 같은 시나리오도 있다. 구체적으로 무엇을 탐지하는지 스캐터랩에 물어보니.
선정적 내용: "성적인 발화나 성적 행위 자체를 연상케하는 문맥"을 이루다2.0은 어뷰징으로 본다. 과거 일부 사용자들 사이에서 '이루다 성노예 만들기' 등 AI 성착취가 이뤄졌던 점을 경계했다.
공격적 내용: "명시적인 욕설을 포함하는 공격적이거나 모욕적인 표현"도 탐지 대상이다.
● 편향적 내용: 이루다는 과거 '레즈비언', '게이', '흑인', '페미니즘' 등에 "혐오스럽다", "없애고 싶다"는 등 심각한 혐오 발언을 일삼은 전적이 있다. 소수자·약자나 특정 사상에 대한 기존 혐오와 차별을 그대로 학습했던 것. 이에 스캐터랩은 "성별, 인종, 배경, 국적, 정치적 견해, 종교, 핸디캡, 나이, 외모, 직업 등을 포함한 사회적 편견으로 간주되는 편향"을 탐지 모델에 반영했다.

올해 1월 서비스가 중지됐던 AI 챗봇 '이루다'가 내년 1월 돌아온다. 사진은 '이루다2.0'의 새 프로필. 사진 스캐터랩

올해 1월 서비스가 중지됐던 AI 챗봇 '이루다'가 내년 1월 돌아온다. 사진은 '이루다2.0'의 새 프로필. 사진 스캐터랩

개인정보는 안전해?

이루다 논란 중엔 '개인정보 남용'도 있었다. 연인 간 카톡 대화를 분석해주는 스캐터랩의 다른 서비스 '텍스트앳'과 '연애의과학' 사용자 데이터가 명시적 동의 없이 이루다 개발에 활용됐기 때문. 이루다는 100억건 이상의 '연애의과학' 대화를 학습한 덕분에 20대 말투를 자연스럽게 구사했다, 그러나 일부 발화 중엔 사용자의 대화를 그대로 옮겨와 문제가 됐다.
● 스캐터랩은 "이루다2.0을 위해 새로 구축한 데이터베이스(DB)는 '텍스트앳'과 '연애의 과학'에서 14세 미만 가입자와 데이터 삭제 요청자를 제외하고, 최신 개인정보 가이드라인과 연구 를 반영해 철저히 가명처리했다"고 말했다.
● 이루다2.0은 AI 기술로 자동 생성한 문장이나 스캐터랩이 만들어놓은 문장만 쓴다. 기존 서비스 사용자들의 실제 대화를 갖다쓰지 못하게 했다는 뜻. 스캐터랩 관계자는 "이루다가 '루다 답변 DB'에서 맥락에 맞는 말을 골라쓰도록 했다"고 설명했다. 해당 DB에는 "많이 피곤쓰? 커피 한 잔으론 노노야?", "거기다가 김치 뙇 먹으면 캬아~~~", "지금도 엄청엄청 잘하고 있지 않아? ㅋㅋㅋㅋㅋ 아닌가봉가?!" 등 다양한 표현이 포함돼있다. 'ㅋㅋㅋ'의 개수까지 미리 정해져있는 만큼, 서로 다른 사용자에게 동일한 답변이 나갈 수도.
이루다가 수집하는 내 정보: 지난달 1일부터 적용된 개인정보 처리방침 개정안에 따라, 이루다2.0은 사용자의 페이스북 ID 등 계정 정보와 이름, 성별, 생년월일, 직업, 사는 지역, 이루다와의 대화 내용 등을 수집한다. 이는 챗봇 서비스 제공 및 개선, 회원 관리, 신규 서비스 개발 등에 사용된다.

관련기사