ADVERTISEMENT

중2정도 영문을 한글로 자동번역|KAIST전산 팀 프로그램화에 성공

중앙일보

입력

지면보기

종합 08면

컴퓨터 영문자동 번역 시스템이 한국과학기술원 (KAIST)전산센터 연구팀(성기수·이단형·최영균)에 의해 시도되어 1단계로 중학2학년 정도의 영문을 자동 번역하는데 성공했다. 연구팀은 1천5백 영어단어를 컴퓨터에 기억시켜 이 단어들이 구성하는 중학 2∼3년 수준의 문장을 자유롭게 번역할 수 있게 했다. 자동언어 번역은 평면적인 컴퓨터가 입체적인 인간의 기능을 갖게 하는 작업으로 상당한 시간과 인력이 소요되는 일이다. 언어의 자동번역개념은 1940년 컴퓨터의 출현으로 가능성이 구체화되어 각국이 이에 대한 연구를 진행하고 있다. 미국에서는 이미 50년대 말에 하버드대학의「웨링거」교수가 영어·소련어 자동번역을 부분적으로 완성시켰다.
일본은 여행자를 위한 포키트 용 영·일어 번역기를 만들어 일문을 누르면 영문이 표시 판에 나오는 기계를 팔고 있다.
KAIST 전산센터 연구팀은 지난73년에 중학1년 수준의 자동번역을 시도한 후 일시 중단했다가 올 들어 다시 개발에 들어갔다.
그 이유는 국내외에서 자동번역기에 대한 관심이 높아졌고 소형 컴퓨터의 보급도 크게 늘어나 실용성이 높아졌기 때문.
연구팀은 영어정보의 빠른 한글화에 목포를 두어 우선 영문의 번역시스템을 시도했다. 영문의 국역과정이 확립되면 우리말의 영역은 기존의 연구로 상당히 수월할 것으로 연구팀은 보고 있다.
번역시스템에 있어 가장 핵심은 컴퓨터가 문장을 어떻게 인식하고 판단하도록 유도하느냐 에 있다.
컴퓨터는 한 단계 한 단계 씨밖에 작업을 못하므로 영문을 파악하는데 면밀한 언어분석이 필요하다.
즉 문장은 어떤 식이기 때문에 어떻게 번역해야 한다는 판단을 컴퓨터가 해낼 수 있도록 프로그램이 되어야 한다.
연구팀은 이를 위해 기본적인 영문법을 이용했다.
「We go to school」 (우리는 학교에 간다)이라는 문장을 예로 들어보자.
이 문장을 컴퓨터에 넣어 주면 컴퓨터는 먼저 복문인가 단문인가를 구별한다.
「주어+동사」가 하나인 단문으로 확인되면 다음단계로 나간다.
다음은 문의 형식을 구별하는 일이다. 컴퓨터에 미리 영어의 5형식 (주어+동사, 주어+동사+목적어 등)과 문형을 기억시켜 놓았으므로 바로 구분이 된다. (예문은 2형식) .
문형은 평서문이냐, 감탄문이냐, 의문문이냐 등을 구별해 기억시켜 구별해 낸다(예문은 평서문).
다음은 단어의 기능을 분별하는 단계다. We라는 단어가 어떻게 쓰이냐를 확인하는 순서다. (예문에서 주어로만 쓰인다.) 다음엔 영어단어에 따라 한글단어를 불러내어 배열한다. 「나+학교+간다」 동사의 어미변화는 배열하기 전에 체크하도록 짜여있다.
만일 2가지 이상의 뜻을 갖는 단어가 있을 때는 앞뒤 단어를 보고 판단한다. Have동사의 경우 다음에 음식 명이 있으면 「먹는다」로, 책 같은 먹을 수 없는 동사가 오면 「갖는다」로 번역된다.
한글의 명사에 붙는 조사 (은·는·을 등)나 동사변화는 사전프로그램에 의해 바로 나온다. (『우리』는 받침이 없으므로『는』이 붙는다) .
반면 『우리는 학교에 자주 간다』 또는 『우리는 자주 학교에 간다』 에서처럼 위치가 변할 수 있는 『자주』 와 같은 단어는 위치가 미리 정해진다.
따라서 이 문제는 어학전문가들에 의해 결론이 내려져야 한다. 컴퓨터는 스스로 아무 결정도 못 내리기 때문이다.
자동번역이 잘 되고 못되는 것은 얼마나 예외성과 뉘앙스를 살리느냐에 달려있다.
복잡한 문장의 예를 들어보자. 『If it rains tomorrow I will not go』 의 뜻은『내일 비가 온다면 나는 가지 않겠다』 는 뜻이지만 컴퓨터는 『그것은 내일 비가 오면 나는 가지 앉을 것이다』라고 번역했다.
여기에 「그것이」 가 들어간 것은 날씨 표현에 쓰는 의미 없는「it」를 컴퓨터는 처리할 능력을 지시 받지 못했기 때문이다.
앞으로의 문제는 문형인식을 좀더 단순화·패턴화 시켜 경제성과 신뢰성을 확보하는 일이다. 그래야만 제품이나 교육용으로 활용이 가능하다.
또 지금의 1문장에 평균0·2초 걸리는 처리시간도 좀더 짧게 해 컴퓨터 사용시간을 줄여야 한다.
연구자 이단형씨는 『아직 중학2년의 수준도 완벽한 것이 아니다』며 『일단은 이 분야의 기술축적이 중요하다』고 말한다.
자동번역 시스템은 영어 이외에 불어·독어도 가능하겠지만 가장 활기를 띨 언어는 일어로 추정된다.
우리말처럼 어순이나 한자를 같이 쓰는 일어는 구미 언어보다 몇 배나 쉽기 때문이다.
이러한 프로그램이 실험을 거쳐 확립되면 상업화되어, 중학생들의 어학 참고서 노릇을 할 수 있게된다.<장재열기자>

ADVERTISEMENT
ADVERTISEMENT