구글 AI 신경망 기계번역

“거의 완벽에 가깝게 읽히네요.” “뭔가 무서우면서도 신기하네요.”

한국어·영어·불어 등 8개 언어

사람이 말하듯 문장 단위로 번역

네이버 ‘파파고’도 영한번역 우수

구글의 바뀐 번역 서비스를 사용해 본 네티즌들의 반응이다. 구글의 번역 서비스가 인공지능(AI)을 만나 더 똑똑해졌기 때문이다. 구글은 15일(현지 시간)부터 8개 언어에 대한 번역 서비스에 ‘신경망 기계번역(NMT)’ 기술을 적용하기 시작했다. 한국어를 비롯해 영어, 프랑스어, 독일어, 스페인어, 중국어, 일본어, 터키어가 이에 해당한다.

기계번역은 컴퓨터의 처리 능력을 이용해 한 언어를 다른 언어를 번역하는 기술로 흔히 ‘자동번역’이라고도 부른다. 문법을 규칙으로 만들어 번역하는 기술과, 다양한 언어 자료 를 통계화해 번역 하는 기술이 주로 활용됐다. 하지만 단어와 구문을 개별적으로 번역해 조합하는 방식이어서 문장이 매끄럽지 않고 부자연스러운 경우가 많다. 특히 한국어와 영어처럼 어순이 다른 언어의 경우 정확도가 확연히 떨어진다. 과거 구글이 ‘백조가 한 마리 살았습니다’라는 한국어 문장을 영어로 옮길 경우 백조를 ‘새(swan)’가 아닌 ‘숫자(100 trillion)’로 번역할 정도였다.

반면 NMT 기술 은 언어를 쪼개지 않고 한번에 전체 문장 단위로 번역한다 . 덕분에 기존의 어색한 번역투와 달리 사람이 말하는 것 같은 문장(자연어)으로 표현한다. 구글은 “번역 후 가장 관련성이 높은 결과를 추리고, 다시 사람이 말하는 것처럼 문장을 재구성하기 때문 ”이라고 설명했다. 게다가 구글의 ‘알파고’처럼 머신러닝(기계학습) 방식을 사용하기 때문에 더 많은 사람이 사용할수록 번역 능력이 향상된다.

AI를 덧입은 구글 번역 서비스가 얼마나 똑똑해졌는지 실제로 사용해봤다. 네이버가 만든 번역 애플리케이션 ‘파파고’와 한국전자통신연구원(ETRI)이 만들고 한컴인터프리가 상용화한 ‘지니톡’과 구글의 번역 실력을 비교해봤다. 지난 8월 출시된 파파고는 구글 번역처럼 NMT 기술을 적용한 번역 서비스다. 한국어·영어·중국어·일본어에 대해 번역을 제공한다. 지니톡은 2018년 평창 동계올림픽 공식 통·번역 소프트웨어로 선정됐으며 영어·중국어·일본어·프랑스어·스페인어 등에 대한 번역이 가능하다.

우선 구글 공식 블로그에 올라 온 영문 공지글(We’re introducing the next step in making Google Translate even better)을 한글로 번역해봤다. 구글 번역은 ‘우리는 구글 번역을 더욱 개선하기 위한 다음 단계를 소개합니다’라는 문장을 내놨다. 번역투가 조금 남아있지만 문맥이 잘 전달됐다. 파파고는 ‘우리는 구글 번역을 더 잘하기 위해 다음 단계를 도입할 것입니다’라는 문장을 내놨다. 역시 자연스러운 문장으로 의역했다. 하지만 일반 기계번역 방식의 지니톡은 일부 구절을 번역하지 못했고 문장 구사력도 앞선 두 가지 서비스보다 부족했다.

이번에는 ‘내가 이러려고 영어공부했나. 자괴감이 들어’라는 한국어 문장을 영어로 옮겨봤다. 구글 번역은 완결된 영어 문장(I studied English to do this. I feel numb)으로 번역했지만 파파고는 ‘자괴감이 든다’는 표현을 번역하지 못해 발음 그대로 영어로 옮겨놓았다. 지니톡은 완결된 문장을 내놓긴 했지만 의미가 조금 달랐다.

AI 기계학습 방식이 적용된 구글과 파파고의 번역 실력이 일반 번역 방식보다는 조금 앞서는 것으로 나온 결과였다. 한국어를 영어로 번역하는 능력의 경우 구글 번역의 결과가 돋보였다.

네티즌들은 구글 번역의 성능에 만족감을 표시하며 ‘영어 공부가 필요없는 세상이 머지 않았다’는 기대감을 표현하고 있다. 게다가 음성 인식 기술이 도입되면서 외국인이 한 말을 한국어 문장으로도 번역할 수 있고 한국어로 말한 문장을 외국어 음성으로 들려줄 수도 있게 됐다. 실제로 가까운 미래에는 AI 기계번역이 통·번역 업무의 상당 부분을 대체할 것이라는 전망도 나온다.

반면 일부 기업에서는 직원들에게 구글 번역 서비스 사용을 자제하라고 요구하고 나섰다. 기존 번역 사례를 빅데이터로 활용하는 기계학습의 특성 때문에 보안에 대한 우려가 커진 것이다. 한 정보통신(IT)업계 관계자는 “회사의 내부 정보가 다른 업체의 번역 사례로 활용될 수도 있는 것 아니냐”며 “보안이 필요한 문서를 번역할 때는 여전히 사람이 직접 번역하는 것이 가장 낫다고 본다”고 말했다.

김경미 기자 gaem@joongang.co.kr