ADVERTISEMENT

[소년중앙] 0.3초 만에 1500자 기사…정말 로봇이 쓴 것 맞나요

온라인 중앙일보

입력

업데이트

기사 이미지

이세돌 9단과 알파고의 대국 이후 ‘인공지능 시대’가 성큼 다가왔다는 느낌을 받습니다. 인간의 영역으로만 생각되던 직업 세계에 인공지능이 진출하기 시작했으니까요. 기자직도 그렇습니다. 일부 분야에선 이미 로봇(인공지능) 기자가 활약하고 있습니다. 알고리즘(문제를 해결하기 위해 정해진 순서화된 절차)으로 방대한 데이터를 분석, 빠르고 정확하게 기사를 작성하는 것이죠. 인공지능 기자의 등장은 과연 언론 생태계에 어떤 변화를 불러 일으킬까요.

커버스토리 | 로봇 저널리즘 시대가 온다 - 야알봇의 등장 로봇 저널리즘

어쩌면 인공지능과 경쟁해야 할지도 모를 소중 학생기자들이 불안한 마음으로 직접 취재에 나섰습니다.



2014년 3월 17일, 전 세계 언론을 놀라게 한 일이 일어났습니다. 오전 6시 25분 미국 LA에서 진도 4.4의 지진이 발생한 뒤 3분 만에 로봇 기자가 완벽한 기사를 작성한 것입니다. 미국 지질조사소가 수집한 데이터와 함께 ‘지진 기사 발행 준비 완료’라는 메시지를 받은 LA타임즈 기자는 사실 여부를 확인한 후 ‘퍼블리싱(발행)’ 버튼을 눌렀습니다. 지진 보도 기사가 온라인에 게재되기까지는 불과 8분밖에 걸리지 않았죠.

이는 로봇 기자 ‘퀘이크봇’ 덕분에 가능했습니다. 퀘이크봇은 일정 진도 이상의 지진이 발생할 경우 이를 실시간 기사로 작성하는 능력을 갖췄죠. 미 AP통신 역시 2년 전부터 로봇 기자에게 기업 분기 실적 기사 처리를 맡겼습니다. 매 분기 3000여 건의 기업 실적 데이터를 보도하는 형식의 기사는 복잡한 계산 능력을 요구하는데, 로봇 기자에겐 어렵지 않은 일이거든요.

영국의 가디언은 로봇 기자에게 편집장을 맡기기도 했습니다. 로봇 편집장이 가디언의 온라인 기사 중 호평을 받은 것을 편집해 ‘더 롱 굿 리드(The long good read)’라는 주간지를 발행하는 겁니다.

기사 이미지

1 야알봇이 작성한 기사가 게재되는 ‘프로야구 뉴스로봇’의 화면.

놀라셨나요. 실은 우리나라에서도 로봇 기자가 활약하고 있습니다. 페이스북 ‘프로야구 뉴스로봇’ 페이지의 기사들은 ‘야알봇(‘야’구를 잘 ‘알’고 있는 로‘봇’)이라는 로봇 기자가 쓴 것입니다. 한국의 ‘로봇 저널리즘’ 시대 역시 성큼 다가온 거죠. 로봇 저널리즘이란 컴퓨터 기술에 기초해 소프트웨어를 활용하는 기사 작성 방식을 의미합니다.

기사 이미지

야알봇의 아버지 이준환 교수는 스포츠·증권 기사 외에도 재난 정보 기사를 인공지능이 생성하는 프로젝트를 준비하고 있다.

지난 17일 소중 학생기자들은 로봇 기자의 실체를 파악하기 위해 야알봇을 만든 서울대 언론정보학과 연구팀 이준환 교수를 찾아갔습니다.

화이트보드 형태의 연구실 벽면에는 복잡한 컴퓨터 기호들이 빼곡했고, 한쪽에 걸린 대형 스크린에는 알 수 없는 영어 단어들이 빠르게 흘러가는 중이었죠. 어리둥절해 하고 있는 학생기자들에게 이 교수가 질문을 던졌습니다. “여러분, 야구 좋아하세요? 경기 상황을 소개한 야구 기사의 한 단락을 보여드릴 테니 사람이 쓴 기사인지 야알봇이 쓴 기사인지 맞혀 보세요.”

기사 이미지

2 야알봇은 경기 문자 중계 내용을 바탕으로 기사를 작성한다.
3 수집된 데이터는 ‘루비’라는 프로그래밍 언어를 통해 정리한다.

학생기자들은 ‘뭐, 그쯤이야’라는 표정으로 읽어 내려갔죠 . 기사는 다음과 같습니다. ‘린드블럼이 선발로 등판한 롯데는 박종훈이 나선 SK에게 3:5로 패하며 안방에서 승리를 내주었다. 경기의 승패에 결정적인 영향을 미친 키 플레이어는 브라운이었다. 브라운은 5회 초 롯데 린드블럼을 상대로 3점을 뽑아내며 팀의 승리에 결정적으로 기여했다.’

학생기자들은 대부분 이 기사를 사람이 작성했다고 말했습니다. ‘안방에서 승리를 내주었다’, ‘결정적으로 기여했다’ 같은 화려한 문장은  단순한 자동 작성 알고리즘을 가진 야알봇이 썼다고 보기 힘들 것 같았거든요. 그러나 답은 의외로 ‘야알봇’이었습니다.

“너무 좌절하지 마세요. 이 문제를 접한 대부분의 사람들 역시 맞히지 못했으니까요.” 이 교수의 말에 학생기자들은 놀라 벌린 입을 다물지 못했습니다. 사람이 쓴 것처럼 화려하고 복잡한 문장을 인공지능이 쓴다는 게 믿어지지 않아서죠.

로봇 기자 ‘야알봇’이 기사 쓰는 4단계

야알봇이 1500자 분량의 기사를 작성하는데 걸리는 시간은 불과 0.3초. 이는 정교하게 만들어진 알고리즘 덕분에 가능한 일입니다. 로봇 기자 야알봇이 야구 기사를 작성하는 과정은 크게 4가지 단계로 구분됩니다.

1단계 | 데이터 수집 아얄봇은 포털 사이트에서 경기를 실시간으로 중계하는 ‘문자 중계’ 데이터를 모읍니다. 2번 타자가 1구 볼, 2구 스트라이크, 3구 볼, 4구 볼의 기록을 냈다면 이 수치가 문자 중계로 전송됩니다. 누가 어떤 플레이를 했는지에 대한 수백~수천 개의 자료를 전부 수집해 ‘루비 언어’로 기록하죠.

2단계 | 이벤트 추출 수천 개에 달하는 수치를 모두 기사화 할 수는 없으니 데이터에서 팬들이 궁금해 하는 중요 이벤트를 가려내야 합니다. 예를 들면 누가 홈런을 쳤고, 극적인 역전은 언제 이루어졌는지 등입니다. 여기엔 여러 가지 통계적 방법이 활용됩니다. 어떤 플레이가 결정적 승부에 기여했는지 찾아내는 모든 과정은 ‘세이버매트릭스’ 알고리즘으로 진행됩니다. 다양한 수치를 활용해 중요한 플레이를 찾아내는 통계 기법인데요.

추출된 데이터는 ‘이벤트’라는 이름으로 따로 저장됩니다. 여기에 중요도를 부여하는 단계를 거치면 이벤트 추출이 완료됩니다. 이 교수는 “사람의 경우 직·간접적 관찰이나 그동안의 경험을 통해 판단을 내리지만 야알봇은 고유의 알고리즘으로 데이터를 해석하는 것”이라고 말했습니다.

3단계 | 분위기 조성 이 상태로도 충분히 기사가 나갈 수는 있지만, 뭔가 재미 없고 딱딱할 수 있습니다. 그래서 야알봇은 ‘무드 탐지’ 단계에 들어갑니다. 중요 이벤트를 묶어 사건을 바라보는 기사의 분위기를 설정하는 것입니다. 특정 사건이 너무 자주 발생하면 ‘과잉적’ 경향이 보인다 말할 수 있고, 거의 발생하지 않는 일이 생기면 ‘놀랍게도’라는 수식어가 붙는 방식이죠.

이 교수는 “이 과정을 통해 기사 전체를 관통하는 논조가 생긴다”며 “단순 데이터를 수집해 이야기를 만드는 대신 독자의 관점에 맞게 개인화된 이야기를 제공할 수 있는 바탕이 되는 것”이라고 설명했습니다. 예를 들어 두산팬의 입장에서 기사를 쓴다면, 두산의 패배에 원인이 됐던 상황을 열거해 아쉬움을 담은 관점에서 경기를 해석할 수 있는 것이죠.

4단계 | 기사 작성 마지막으로 실제 기사를 작성할 땐 주어와 목적어를 비워둔 문장과 데이터를 결합하는 알고리즘이 사용됩니다. ‘#{@player_team} #{@player_name}은 #{@inning}회 결승점을 만들며 #{@date}일 경기를 승리로 가져갔다’는 식의 명령어 덕분에 탄력적인 문장 배열이 가능해집니다. 분위기에 따라 추출된 중요 이벤트로 설명할 수 있는 적절한 문장을 선택해 이야기를 만들죠.

인간의 역할, 로봇의 역할 야알봇과 같은 인공지능 기자는 앞으로 중요한 역할을 할 전망입니다. 지진·태풍 등 재난 상황에서 사람보다 빨리 신호를 감지해 기사 전송을 하고, 재무 보고나 정부 활동을 감사(집행의 정당성 여부를 조사하는 일)에 이르기까지 다양한 분야에서 적용될 수 있기 때문이죠.

물론 아직 로봇 기자의 한계는 존재합니다. 만일 잘못된 데이터를 가져오면 ‘오보’가 될 수 있죠. 인간 기자의 경우 취재를 마치면 스스로 사실을 확인하고 선임 기자가 다시 한 번 잘못된 점이 없는지 꼼꼼하게 살펴보기 때문에 오보가 날 일은 인공지능에 비해 적습니다. 로봇 기자가 사람처럼 꼼꼼한 기사를 쓰려면 지속적으로 오류를 검증하는 단계가 반드시 필요하겠죠.

통찰력을 요구하거나 마음을 울리는 감동적인 기사를 쓰는 것 역시 조금 시간이 걸릴 것 같습니다. 현재 인공지능은 주어진 데이터를 빠르게 분석, 계산하는 일만 할 수 있어요. 경기가 어떻게 흘러갔는지에 대한 기사를 쓸 수는 있지만 경기에서 진 선수들에게 무슨 심리적 요인이 있었는지에 대한 기사는 쓰기 힘들죠.

다만 미래 결과에 대한 추측은 가능하다고 합니다. 두 팀의 역대 전적을 비교하면 앞으로의 승률을 어느 정도 예측할 수 있어서입니다. 이 교수는 “반드시 이긴다는 표현 대신 60~70%의 확률로 승리할 가능성이 있다는 표현을 넣어 예측 기사를 작성하는 것은 가능하다”며 “현재 인공지능 기자는 스포츠·증권 분야에서 주로 사용되고 있는데 그 활용도는 점차 높아질 것으로 예상된다”고 말했습니다. 폭발적으로 증가한 정보의 바다에서 로봇 저널리즘의 역할은 커질 겁니다. 앞으로 인간 기자의 역할은 어떻게 바뀔지에 대한 고민도 깊어졌습니다.


<소년중앙 홈페이지 바로가기
>
<소년중앙 구독신청하기
, 02-2108-3441>
6월 6일자는 현충일로 인해 휴간입니다.

진행·정리=김록환 기자 rokany@joongang.co.kr, 글·취재=김태린(서울 하늘초 5)·전도현(용인 성서초 6)·황민주(서울 정덕초 6) 학생기자, 사진=우상조 기자 woo.sangjo@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT