전화번호 안내등 초보적인 「음성합성·인식」단계

중앙일보

입력

지면보기

종합 05면

국내의 반도체에 의한 음성인식과 합성에 관한 연구는 이제 시작단계지만 응용분야가 다소 넓은 합성부문을 중심으로 활발히 진행되고 있다
한국과학기술원(KAIST)은 은종관박사는 지난해 2월 6개월간의 연구로 반도체음성합성에 의한 전화번호안내장치를 개발했다
은박사가 개발한 이장치는 음의 기본주파수가 되는 여러개의 주파수를 반도체에 기억시켰다가 한개의 음을 만들때 필요한 주파수를 몇개씩 뽑아 합성하는, 정확한 의미의 합성은 아니지만 그 중간 기술인 선형예측계수를 사용한 국내 최고의 합성음 기술이다
안내양들이 전화번호부에서 번호를 찾아 숫자판을 눌러주면 『문의하신 번호는×국에 ×번입니다』라는 응답이 합성음으로 전달되는 장치다
합성음인지 안내양의 음성인지 분간하기 어려울 정도로 발음과 억양이 정확하고 자연스러운 이장치는 단일번호 복수번호·대대표번호등을 구분해서 안내하는 것은 물론, 전화번호부에 등재되지 않은 경우는『미안합니다 문의하신번호는 전화번호부기록에 없읍니다』라고 응답할 수 있도록 충분한 어휘를 합성해 낸다. 삼덕전자도 지난1월 합성음을 이용한 호출기를 개발, 시판중이다. 3자리번호까지 『×백×십×번 손님』이라는 합성음을 내도록 만들어진 이 호출기는 음절단위로 음을 메머리칩에 기억시켰다가 프로그램에 의해 그대로 빼내쓰는 것이어서 엄밀한 의미에서는 합성이라고 할 수 없지만 반도체를 이용한 음성제작제품으로는 국내 최초의 것이다. 이 호출기는 현재 고대의대 약국에서 쓰고 있으며 금년내로 서울시내 각구청 민원실 창구에도 설치할 예정이다
음성인식은 합성보다 훨씬 어려운 기술이다. 합성은 이상적인 고성음이나 주파수를 디지틀부호로 메머리칩에 기억시켰다가 사용하는 것이지만 인식은 사람마다 다른 음폭과 음역등을 컴퓨터가 분류, 인식해야 하기 때문이다
국내에서는 최초로 지난해 광운공대의 김순협박사(전자공학과)가 불특정화자가 말하는 0에서 9까지의 숫자를 컴퓨터가 인식해 내는데 성공, 초보적인 음성인식기술을 확보했다

<이덕영기자>

ADVERTISEMENT
ADVERTISEMENT