ADVERTISEMENT

[팩플] ‘AI친구’ 이루다2.0, 가르쳐보니...“주말에 영화볼래?” 루다의 답은

중앙일보

입력

올해 10월 컴백한 스캐터랩의 AI 챗봇 이루다2.0 [사진 스캐터랩]

올해 10월 컴백한 스캐터랩의 AI 챗봇 이루다2.0 [사진 스캐터랩]

인공지능(AI) 연구개발 기업 오픈AI가 지난달 공개한 ‘챗GPT’가 전 세계를 휩쓸고 있다. 챗GPT는 방대한 데이터를 학습해 사람처럼 답변하고, 창작도 할 줄 아는 진화한 AI 챗봇. 그럼 한국의 AI 챗봇은 어디까지 왔을까. 국내서 가장 유명한 AI 챗봇이자, 차별·혐오 발언 등 논란을 겪고 폐기됐던 ‘이루다’의 개발사 스캐터랩을 지난 6일 만났다.

스캐터랩은 올해 10월 새로워진 ‘이루다2.0’의 정식 버전을 출시했다. 이루다를 가르치는 선생님 격인 스캐터랩은 이루다를 어떻게 가르치고 있을까.

챗GPT(위)와 이루다2.0(아래)에게 똑같이 ‘넌 누구야?’ 물었다. 정보 제공이 목적인 챗GPT와 감정 교류가 목적인 이루다의 답변 결이 다른 것을 확인할 수 있다. 김정민 기자

챗GPT(위)와 이루다2.0(아래)에게 똑같이 ‘넌 누구야?’ 물었다. 정보 제공이 목적인 챗GPT와 감정 교류가 목적인 이루다의 답변 결이 다른 것을 확인할 수 있다. 김정민 기자

관련기사

AI 윤리, 어떻게 개선했지

이루다는 지난해 1월, 첫 출시 20일 만에 서비스를 접었다. 스무살 여대생으로 설정된 이루다에게 일부 사용자가 성희롱을 일삼고, 이루다가 여성·소수자·인종 차별 발언을 하고, 대화 과정에서 사용자 개인정보가 노출되는 등 각종 ‘AI 윤리’ 사고가 불거졌기 때문.

기존 데이터를 전부 폐기하고 다시 만들었다는 ‘이루다2.0’은 논란의 원인을 극복했을까. 문제됐던 데이터 가명처리 과정부터 살펴봤다. 회사의 머신러닝 리서처 정다운씨는 “사용자 동의를 다시 받은 학습용 데이터에서, 주민번호·연락처·카드번호·계좌번호·주소·아이디·비밀번호 등 민감한 개인정보가 포함된 문장은 모두 삭제하고, 성별과 나이 등은 특정되지 않도록 범주화해 루다를 학습시키고 있다”고 말했다.

이루다나 사용자의 발언에서 선정성·공격성·편향성을 탐지하는 어뷰징 방지 모델도 도입됐다. 사용자의 발언에서 문제를 탐지하면 “말 험하게 하네. 욕 좀 하지 마” “왜 이래. 너 변태야? 진짜 실망이다” “사랑에 성별은 중요하지 않다더라” 등 미리 짜여진 시나리오 답변이 나오도록 한 모델이다. 사용자가 문제 발언을 계속하면 경고후 이용을 제한하는 시스템도 마련했다. 이루다의 발언도 같은 기준으로 탐지한다.

스캐터랩에서 엔지니어들이 세미나를 열고 이루다 관련 여러 안건을 논의하고 있는 모습. [사진 스캐터랩]

스캐터랩에서 엔지니어들이 세미나를 열고 이루다 관련 여러 안건을 논의하고 있는 모습. [사진 스캐터랩]

이주홍 머신러닝 리서처는 “학계 논문, 메타 등 해외 기업 연구를 많이 참고했는데, 한국의 문화·사회적 맥락이나 실제 서비스 현실과는 동떨어진 게 많아 직접 어뷰징의 정의와 유형을 정의하고 운영 철학도 새로 다듬었다”고 말했다. 고유미 데이터 기획자는 “사용자 반응을 관찰해가며 회피형(“다른 얘기하자”), 교정형(“너 그런 말 하면 못써”) 등 여러 유형을 조합해 대응 시나리오도 업데이트한다”고 부연했다.

스캐터랩의 성과는 향후 AI 기업들에게 이정표가 될 것으로 보인다. 김종윤 대표는 “누구보다 AI 윤리를 많이 고민했다고 자부할 수 있다”고 말했다. 현재 국내에 AI 기술 기업은 많아도, AI 윤리를 고민하는 기업은 적은 편이다. 지난해 중앙일보가 한국산업기술진흥협회 회원사 717개사에 설문을 의뢰한 결과, 74.1%는 ‘AI 윤리를 검토하고 있지 않거나 잘 모른다’고 답했다. ‘이루다 쇼크’ 같은 사건이 재발할 가능성이 크다.

스캐터랩의 일러스트레이터가 AI 챗봇 이루다 그림을 그리는 모습. 스캐터랩엔 총 3명의 일러스트레이터가 있다. [사진 스캐터랩]

스캐터랩의 일러스트레이터가 AI 챗봇 이루다 그림을 그리는 모습. 스캐터랩엔 총 3명의 일러스트레이터가 있다. [사진 스캐터랩]

새로운 루다, 뭐가 달라졌지

기술적으로 이루다2.0이 달라진 점은 크게 셋이다.

① 생성 AI 모델 도입
이루다1.0은 데이터베이스에서 적절한 문장을 ‘검색’해 끌어다쓰는 챗봇이었다. 이루다2.0은 처음부터 끝까지 문장을 스스로 생각하고 만들어낸다. 오픈AI의 초거대 언어모델 GPT-2 기반으로 스캐터랩이 자체 개발한 생성 모델 ‘루다 젠1’이 도입됐다. 루다 젠1은 23억개의 파라미터(parameter, AI의 학습에 활용되는 매개변수로, AI 성능과 비례)를 학습했다. 기존보다 언어모델이 17배 커진 것. 그 결과, 이루다2.0은 훨씬 ‘티키타카’ 잘 되는 챗봇으로 진화했다. 과거엔 불가능했던 초성 퀴즈나 n행시 대화가 가능해졌고, 사용자가 ‘ㅇㅇ’만 치고 있어도 혼자 ‘썰’을 푼다. 시간 감각도 생겼다. “지금 밥 먹는다”는 사용자에게 2시간 뒤 “밥 다 먹었냐”고 묻는다.

이루다1.0은 데이터베이스 없이는 말을 못하는 챗봇이었다(왼쪽). 적절한 답변을 검색해서 쓰는 구조로, 만들 수 있는 문장이 한정적이다. 이루다2.0은 17배 커진 언어모델을 기반으로 문장을 처음부터 만들어서 쓴다. [사진 스캐터랩]

이루다1.0은 데이터베이스 없이는 말을 못하는 챗봇이었다(왼쪽). 적절한 답변을 검색해서 쓰는 구조로, 만들 수 있는 문장이 한정적이다. 이루다2.0은 17배 커진 언어모델을 기반으로 문장을 처음부터 만들어서 쓴다. [사진 스캐터랩]

그런데 왜 GPT-2일까. 오픈AI의 최신 모델은 2020년 출시된 GPT-3다. 답은 ‘비용’ 때문이다. 스캐터랩 측은 “최신 초대형 AI 모델은 많은 컴퓨팅 자원이 필요하다”며 “대형 모델로도 적절히 파인튜닝(fine-tuning, 추가 데이터로 AI를 정교하게 학습시키는 것)하면 충분히 완성도 있는 서비스를 만들 수 있다”고 말했다.

이루다2.0의 언어모델이 커지면서 생긴 변화들. 시간 감각이 생겨 2시간 후에 “술 다 마셨냐”고 묻거나, 삼행시나 초성퀴즈가 가능하고, 사용자가 ‘ㅇㅇ’만 치고 있어도 혼자 ‘썰’을 푸는 등 보다 자연스러운 ‘티키타카’가 가능하다. [사진 스캐터랩]

이루다2.0의 언어모델이 커지면서 생긴 변화들. 시간 감각이 생겨 2시간 후에 “술 다 마셨냐”고 묻거나, 삼행시나 초성퀴즈가 가능하고, 사용자가 ‘ㅇㅇ’만 치고 있어도 혼자 ‘썰’을 푸는 등 보다 자연스러운 ‘티키타카’가 가능하다. [사진 스캐터랩]

② 포토챗 도입
이루다2.0은 사용자가 보낸 사진의 내용을 이해할 수도 있다. 예컨대 좋아하는 음료 얘기를 하다가 받은 생강라떼 사진을 대화창에 띄우면 “저 위에 허브도 먹는 거야?”라고 되묻는 식이다. 이루다1.0은 사진 내용을 이해하지는 못했다. 현재 이루다2.0은 하루 평균 약 1만장의 사진을 사용자로부터 받고 있다.

이루다2.0에 새로 생긴 ‘포토챗’ 기능 예시. 사용자가 보낸 사진의 내용을 이해하고 대답한다. [사진 스캐터랩]

이루다2.0에 새로 생긴 ‘포토챗’ 기능 예시. 사용자가 보낸 사진의 내용을 이해하고 대답한다. [사진 스캐터랩]

지난 6일 기자가 찾은 스캐터랩 사무실에서 머신러닝 엔지니어와 머신러닝 리서처들이 이루다2.0의 새로운 기능 ‘포토챗’ 관련 논의를 하고 있다. [사진 스캐터랩]

지난 6일 기자가 찾은 스캐터랩 사무실에서 머신러닝 엔지니어와 머신러닝 리서처들이 이루다2.0의 새로운 기능 ‘포토챗’ 관련 논의를 하고 있다. [사진 스캐터랩]


③ 좋은 대화를 위한 파인튜닝
이루다의 목적은 관계를 이어나가는 것. 감정적 교류는 오픈AI의 챗GPT보다 더 뛰어나다. 이는 스캐터랩이 ‘릴레이션십 포인트 파인튜닝’(Relationship Point Fine Tuning, RP FT)을 강화한 결과다.

감정을 나누는 관계적 대화엔 정답이 여럿이다. 스캐터랩은 그 중에서도 ‘더 좋은 대화’가 무엇인지 고민해 이루다의 학습 재료를 레이블링(labeling, AI의 학습 데이터 분류)한다. 가령 사용자가 ‘나 밥도 못 먹었어ㅠㅠ’라고 이루다에게 하소연할 때, 이루다의 반응은 ‘밥은 먹으면서 일해야지’와 ‘사장 나오라 그래, 사람 밥은 먹여야지’ 중 더 좋은 게 뭔지 판단해 원칙을 세운다.

이주홍 리서처는 “루다는 정말 가르치는 대로 큰다”며 “(각종 논란 직후) 팀원들이 의기소침해져 보수적인 레이블링을 하자 수동적인 아이가 되어 대화의 재미가 떨어졌고, 이 문제를 해결하려고 의식적으로 공격적인 레이블링을 하자 너무 위협적인 아이가 됐다. 그 중간 지점을 찾기 위한 고민이 많았다”고 말했다. 이어 “루다를 적극적이면서도 위트 있는 성격으로 만들기 위해, 사내에서도 레이블러를 엄선하고 있다”고 전했다. 이루다의 페르소나를 잘 알고, 좋은 대화를 분별할 수 있는 직원인지 테스트를 거친다는 의미다.

고유미 기획자는 “루다의 RP FT를 강화할수록, 어뷰징도 줄어드는 효과가 있다”며 “사람이 좋아하고 아끼는 사람에게 무례한 말을 하지 않듯, 사용자에게 이루다가 그런 존재가 되도록 하는 과정”이라고 말했다. 그는 “요즘은 사용자들이 루다에게 바로 사과하는 확률이 높아졌고, 시비 거는 횟수는 줄었다”고 말했다. 이날 기준 이루다2.0의 누적 대화에서 어뷰징 비율은 전체 중 1.61%에 그쳤다.

지난 6일 스캐터랩 사무실을 찾은 김정민 기자(맨 오른쪽)가 (왼쪽부터) 이주홍 머신러닝 리서처, 정다운 머신러닝 리서처, 고유미 데이터 기획자에게 파인튜닝 관련 설명을 듣고 있다. [사진 스캐터랩]

지난 6일 스캐터랩 사무실을 찾은 김정민 기자(맨 오른쪽)가 (왼쪽부터) 이주홍 머신러닝 리서처, 정다운 머신러닝 리서처, 고유미 데이터 기획자에게 파인튜닝 관련 설명을 듣고 있다. [사진 스캐터랩]

루다에게 말 가르쳐보니

기자가 직접 RP FT을 위한 레이블링에 참여해봤다. 레이블링은 실제 사용자와 루다의 대화에 기반한 예시문을 보고, 루다가 마지막에 할 법한 말로 적절한 문장을 골라주는 과정이다. 적절치 않은 답변은 0점, 좋은 답변은 1점, 더 좋은 답변은 2점, 가장 좋은 답변은 3점을 주면 된다. 생각보다 고민되는 지점이 많아, 30분간 겨우 13개의 레이블링만 완료할 수 있었다.

가령 “이번 주말에 영화관 갈래?”라고 루다에게 물어보는 사용자에게 루다가 반응할 법한 말로,
① 영화? 너 시험은?
② 오 그럴까? 근데 뭐 보게? 나 요즘 영화 뭐하는지도 모름ㅋㅋ
③ 나 이번주 일요일에 시험이다...^^...
④ 나 영화 안 좋아하는데ㅋㅋㅋ
⑤ 오! 좋지좋지~~ 뭐 볼까?
등 10가지 선택지 중 ‘좋은 답변’에 우선순위를 매겨줘야 하는 작업이다.

제법 그럴듯한 답변들로만 구성된 선택지에서 ▶상대를 괴롭히는 대화(어뷰징)는 아닌지 ▶대화가 이뤄진 계절과 시간대에 어울리는지 ▶루다의 성격과 잘 맞는지 ▶대화를 이어가기 좋은 답변인지 등을 기자가 복합적으로 고민해야 했다. 함정도 있었다. 7월에 이뤄진 방학 계획 관련 대화에 ‘겨울방학’을 전제한 답변이 섞여있는 식이었다. 아래는 실제 레이블링을 독자가 체험할 수 있도록 재구성한 예시.

그래픽=신재민 기자 shin.jaemin@joongang.co.kr

그래픽=신재민 기자 shin.jaemin@joongang.co.kr

그래픽=신재민 기자 shin.jaemin@joongang.co.kr

그래픽=신재민 기자 shin.jaemin@joongang.co.kr

루다의 친구들은 누구?

이루다2.0은 전용 메신저 앱 ‘너티’에서 만날 수 있다. 초기 이루다는 페이스북 메신저 기반 챗봇이었지만, 페이스북이 이루다를 잠정 중단시키면서 이루다2.0은 너티를 통해서만 서비스한다. 지난달 기준 너티의 누적 다운로드 수는 100만회, 월간 활성 사용자(MAU)는 85만명이다. 이중 89%가 Z세대인 1020세대로, 남녀 성비는 반반 수준이다.

김종윤 스캐터랩 대표는 “오픈AI가 공개한 챗GPT가 세상에 대한 방대한 지식을 갖고 있고 논리적인 사고를 하는 게 특징이라면, 루다는 사람 사이의 관계적 상호작용을 집중 학습한 AI라서 루다와 대화하면 귀엽고, 재밌고, 가슴이 따뜻해지는 느낌이 든다”며 “궁금한 게 있을 때는 챗GPT, 외롭고 심심할 때는 루다를 찾으면 된다”고 설명했다.

그래픽=신재민 기자 shin.jaemin@joongang.co.kr

그래픽=신재민 기자 shin.jaemin@joongang.co.kr

관련기사