LA타임스 '로봇기자' 등장

미주중앙

입력


로봇 저널리즘이 새로운 산업으로 성장할 조짐이다. 사진은 로봇 기자가 작성한 LA타임스의 지진속보 기사 내용.

로봇 저널리즘 시대가 성큼 다가왔다. 지난 3월 LA타임스는 로봇이 쓴 지진 속보 기사를 게재하여 큰 반향을 불러 일으켰다. 로봇기자는 지진발생 1분 만에 기사를 완성하고 8분 만에 온라인 게재까지 마쳤다. 로봇기자가 데이터를 토대로 작성한 기사는 사람이 쓴 것과 구분하기 힘들 정도로 완벽했다. 로봇 저널리즘이 주류로 진입했다는 평가를 받았다.

현재 내러티브 사이언스(Narrative Science), 오토메이티드 인사이트 (Automated Insights), 이지옵(Yseop) 등 로봇저널리즘 기술력을 갖춘 회사들이 속속 등장하고 있다.

CBS인터랙티브(CBS Interactive) 등의 주류언론은 물론 신생기업 팬터시 저널리스트(Fantasy Journalist) 등이 가세하고 있어 로봇 저널리즘이 하나의 산업으로 성장할 조짐이다.

최근 컬롬비아 저널리즘 스쿨의 한 연구원이 로봇 저널리즘의 알고리즘을 분석해 소개했다. 그는 로봇저널리즘에서 알고리즘이 어떻게 작동되는지, 뉴스 가치를 판단할 때 어떤 한계가 있는지에 대해 중점적으로 분석했다. 그동안 특허에 묶여 있어 잘 알려지지 않았다가 이번에 공개됐다.

로봇 저널리즘의 기사구성은 다섯 단계로 구성된다. 첫째는 다량의 자료를 수집하는 단계다. 날씨, 스포츠, 금융 등은 자료가 표준화되어있다. 로봇기자는 이러한 명확하고 풍부한 데이터를 이용하여 기사를 작성한다.

둘째는 데이터를 읽은 다음에 알고리즘에 의해 뉴스 가치를 판별하는 단계다. 가치를 판단하는 알고리즘이 로봇저널리즘의 핵심기술이다. 기본적으로 알고리즘은 스포츠 게임 같은 이벤트에서 가장 중요한 요소를 우선 판별한다. 판별의 기준은 통계적 수치에서 시작한다. 예를들면 최소, 최고치, 기대치를 넘어서는 큰 변화 등을 확인하는 것이다.

셋째는 어떤 각도로 기사를 작성하는가 하는 단계다. 이 부분은 이야기를 풀어가는 방식에 해당한다. 예를 들어 스포츠기사라면 "시소 게임", "역사적 성취", "강력한 팀 후원", "슬럼프 탈출" 등의 패턴을 따른다. 전 단계로부터 유추된 내용에 따라서 다양한 각도로 작성된다. 기사의 중요도는 1~10까지 10단계로 분류된다.

넷째는 기사를 배열하는 단계다. 주제가 정해지면 선수 이름이나 스코어 데이터 등이 따라붙는다. 시합장소, 인용구 등의 데이터는 인터넷 데이터베이스에서도 가져와 내용을 풍성하게 만든다.

마지막으로 자연어로 기사를 쓰는 단계다. 주어진 관점을 토대로 하여 영어로 문장을 만든다. 이 단계는 다섯 단계 중에서 가장 쉬운 단계다. 영어 문장을 단락으로 만들어 하나의 기사를 완성하기 때문이다. 기사는 원하는 톤에 따라서 단어형식이 바뀐다. 비관적인 내용, 확신에 찬 기사, 냉담한 내용의 기사 등 문맥에 따라서도 알고리즘이 선택하는 단어가 바뀐다.

로봇 저널리즘(robo-journalism)이란?

기사 작성 알고리즘을 갖춘 소프트웨어를 이용, 로봇이 기사를 작성하는 것을 말한다.

컴퓨터가 기자의 도움없이 데이터를 수집, 분석하여 기사로 작성하는 방식이다

예일대학에서 틀이 처음 만들어진 후 40여 년이 지났지만 아직도 윤리적 문제와 토론이 지속하고 있다.

일부는 로봇이 스스로 생각할 수 없으므로 로봇 저널리즘은 알고리즘이 내놓는 소프트웨어의 결과물이라고 폄하하는 측도 있다. 그러나 스포츠 기사나 보도자료를 토대로 작성되는 기사들은 기자들이 쓴 것처럼 손색이 없다는 평가를 받고 있다.

이재호 객원기자

ADVERTISEMENT
ADVERTISEMENT