기계번역 수준 어디까지 왔나
“10년 내에 언어의 장벽이 사라질 것이다. 조그만 이어폰 크기의 통역기가 상대방이 외국어로 말하면 당신의 모국어로 실시간으로 바꿔 말해줄 것이다.”
터키 출장 때 번역 앱으로 식사 주문
메뉴판 찍으니 영어로 번역해줘
에어비앤비, 사용자 평 실시간 번역
쇼핑몰도 상품 소개 다국어로 제공
AI 딥러닝 기술 접목 정확도 높아져
“10년 뒤 외국어학원 사라질 수도”
흔히 자동 번역으로 일컬어지는 ‘기계번역’은 컴퓨터의 처리 능력을 이용해 한 언어를 다른 언어로 번역하는 기술이다. 언어 장벽을 깨기 위한 인간의 노력이 컴퓨터와 만나 기계번역이 시작됐다. 1950년대 미국이 러시아어와 영어를 대상으로 기계번역 실험을 시도한 것이 최초였다. 당시엔 컴퓨터 처리 능력이 좋지 않아 관심을 끌지 못했고, 번역 품질도 좋지 않았다. 사람이 직접 번역하는 ‘휴먼 번역’보다 시간도 느리고 비용도 많이 들었다.
규칙기반 기술은 언어의 문법을 규칙화해 번역하는 방법이다. 언어학자가 중심이 되어야만 가능한 번역 기술이다. 이에 반해 통계기반 기술은 방대한 양의 연구재료, 즉 빅데이터를 이용해 통계적으로 규칙을 생성해 번역하는 방법이다. 기계번역에 언어학자가 필요없는 시대가 열린 것이다.
통계방식의 기계번역이 도입된 이후 언어 데이터가 많은 글로벌 정보기술(IT) 기업이 기계번역에 뛰어들 수 있게 됐다. 규칙기반 기계번역의 장점은 문법에 기반을 두기 때문에 정확성이 높다는 것이다. 다만 시간과 개발비용이 많이 들기 때문에 시스트란 같은 번역전문 대기업만 할 수 있는 분야였다. 통계기반의 기계번역은 언어학자 없이도 개발을 할 수 있고 데이터가 많이 쌓일수록 번역의 품질이 높다는 장점이 있다. 대량의 데이터가 쌓이기 전까지는 번역의 품질이 떨어진다는 단점이 있다. 요즘 규칙기반 기계번역은 통계기반 기술을 함께 사용하는 하이브리드 방식으로 진화 중이다.
현재의 기계번역에 대해 전문가들은 “일상생활에서는 불편함이 없을 정도”라고 평가하고 있다. 다만 기계번역을 이용하려면 스마트폰을 조작해야 하는 게 아직까지는 불편한 점이다. 10년 후에는 스마트 기기를 상대방에게 보여줘야 하는 불편함이 사라질 것으로 보인다. 김영길 한국전자통신연구원(ETRI) 실장은 “10년 후에는 이어폰 같은 웨어러블 기기를 이용한 통·번역기가 대중화될 것”이라며 “기계번역을 이용할 때 생기는 불편함이 상당 부분 해결될 것”이라고 예측했다.
구글·MS·네이버·한컴 같은 IT 기업이 기계번역 시장에 뛰어드는 이유는 잠재성이 크기 때문이다. 번역자동화 사용자협회(TAUS)는 지난해 세계 자동통·번역 시장 규모는 25억 달러(약 2조8492억원)였고, 2019년에는 70억 달러(약 8조원) 규모로 성장할 것이라고 내다봤다. 연평균 30% 이상 성장하는 것이다. 지난 8월 컨설팅업체 록트는 한국의 통·번역 시장 규모를 7274억원이라고 추정 발표했다.
쇼핑몰들은 상품 소개나 사용자 댓글을 구글 번역 같은 기계번역을 통해 다국어로 제공하면서 쇼핑몰 매출도 덩달아 올라가는 효과를 보고 있다. 에어비앤비나 호텔스닷컴 같은 여행·숙박 사이트의 경우 실시간으로 사용자 평이 다국어로 제공된다. 해외 뉴스 사이트의 기사 번역도 기계번역이 많이 사용되는 분야로 꼽힌다.
네이버 번역기를 연구하고 개발하는 네이버랩스의 파파고팀 김준석 리더는 “실시간으로 올라오는 사용자 평 같은 것은 워낙 양이 많아 시간적으로 사람이 번역하기 힘들다. 이런 경우 기계번역이 많이 활용된다”고 설명했다.
요즘 기계번역은 인공지능을 만나 더 급속히 발전하고 있다. 구글·네이버·MS·한컴 등이 기계번역의 품질을 높이기 위해 딥러닝 기술을 접목시키고 있다. 인공신경망 번역(NMT·Neural Machine Translation)이라고 불리는 기술로, 데이터를 스스로 학습해 번역을 수행하는 방법이다.
구글은 지난달 "구글 번역기에 딥러닝 기반의 새로운 알고리즘을 사용할 예정”이라고 발표했다. 이 기술을 통해 까다롭기로 유명한 ‘중국어-영어 번역’ 서비스 오류를 상당 부분 줄인 것으로 알려졌다. 네이버랩스의 파파고팀도 얼마 전 인공지능을 이용한 네이버 번역 베타서비스를 출시했다. 파파고팀의 김준석 리더는 “네이버랩스의 기계번역 팀은 최신 기술인 NMT를 적용한 번역 엔진을 완성했다”면서 “20일 안드로이드 앱부터 순차적으로 NMT 기반의 번역 엔진을 적용할 계획”이라고 밝혔다.
2018년 평창 겨울올림픽 자동 통·번역 공식 소프트웨어로 선정된 지니톡도 인공지능 기술을 접목해 번역의 품질을 높이고 있다. 지니톡을 개발한 신소우 한컴인터프리 대표는 “인공지능이 접목되면 3년 내 ‘얼라(어린이)’와 같은 사투리도 ‘키드(kid)’로 번역할 수 있을 것”이라고 내다봤다.
10년 후에는 일상생활의 회화를 위해 영어 학원을 다니지 않아도 되는 셈이다. 다만 비즈니스나 의학, 법률, 문학 같은 전문적인 분야는 앞으로도 기계번역이 완벽하게 번역할 수 없다는 게 정설이다.
최영진 기자 cyj73@joongang.co.kr