ADVERTISEMENT

「자동번역기」한몫 “톡톡”(지구촌화제)

중앙일보

입력

지면보기

종합 06면

◎한지붕… 아홉언어… 「EC가족」/미국보다 실용화 앞서
경제통합,나아가 정치통합까지 꾀하고 있는 유럽공동체(EC)에서 자동번역기가 회원국간 언어 장벽을 넘는데 큰 역할을 하고 있다.
12개국이 가입해 있는 EC는 공용어만도 영어·불어·독일어·이탈리아어·네덜란드어·덴마크어·그리스어·스페인어·포르투갈어 등 9개 언어를 채택하고 있다.
이에 따라 최소한 공식 문건만이라도 각국어로 번역해야 하기 때문에 번역관계 종사자가 1만4천명이나 된다.
EC는 언어통합까지는 고려하고 있지 않은 상태여서 회원국간 원활한 의사소통을 위해 그동안 번역·통역부문에 많은 노력을 기울여왔다. EC가 기계번역에 손대기 시작한 것은 이미 15년전부터로 EC위원회 정보관리국안의 EC 다국어정책부가 이 일을 맡아왔다.
기계번역 관련 프로젝트는 시스트란·유로트라·에스프리 등 모두 세가지다.
그중 가장 초보적인 것이 시스트란(SYSTRAN). 이는 각국간 언어를 1대 1로 번역하는 것으로 76년부터 시작됐다. 영어·불어간 자동번역은 5년간의 사전개발등을 거쳐 80년부터 실용화되기 시작했다. 이후 개량을 거듭,문서용지 한장(약 2백50단어)에 평균 10개단어만 교정하면 되는 수준까지 와있다. 주요 언어간에는 자동번역 시스팀이 거의 실용화단계에 와있다. 현재까지 불어의 영역등 16가지 번역시스팀이 개발돼 13가지가 실제로 이용되고 있다.
이제까지 자동번역분야의 선진국은 미국과 구소련이었다. 그러나 EC는 시스팀연구보다 실용화에 주력,현재 이 분야에서 가장 앞서있는 것으로 평가되고 있다.
현재 5∼6개국어에 대응하는 전문용어사전과 14만단어를 수록한 약어사전 이외에 국어별 사전이 개발돼 있다. 시스팀별 기본사전의 평균어휘수는 단어사전이 8만어,숙어사전이 3만어 정도다. 영불간은 단어 약 8만어,숙어 8만어가 수록돼 있으며 독일어의 불역·영역을 위한 사전에는 단어 14만어,숙어 8만어가 수록돼 있다. EC가 추진하고 있는 두번째 프로젝트는 유로트라(EUROTRA)로 83년부터 개발에 들어갔다. 유로트라는 2개국어 이상을 동시에 번역하는 시스팀이다. 이 프로그램은 지난 90년 개발완료 예정이었으나 개발이 늦어지고 있다.
세번째 프로젝트는 더욱 야심적인 에스프리(ESPRIT)다. 이 시스팀은 음성번역연구로 85년부터 개발에 착수했다. 이것은 음성을 인식,곧바로 번역해내는 환상적인 시스팀이 될 것으로 기대를 모으고 있다.<곽한주기자>

ADVERTISEMENT
ADVERTISEMENT