말로 하는 컴퓨터 속속 현실로

중앙일보

입력

지면보기

종합 49면

"Read me the newspaper.(신문 읽어 줘)"

미국 로스앤젤레스에 사는 이원기(31)씨가 출근을 위해 자동차에 시동을 걸며 한 말이다.

"Which paper do you have in mind? (어느 신문을 읽을까요?)" 누군가 이씨를 향해 물었고, "LA 타임스" 라고 답하자 1면 머리기사를 읽는 상냥한 목소리가 들려왔다.

그러나 차 안에는 이씨 외엔 아무도 없다. 기사를 읽는 것은 다름아닌 핸즈프리 장치가 달린 휴대폰.

신문 기사를 다 들은 이씨는 "Organize my schedule.(스케줄 정리)" 라고 지시한 뒤 자신의 일정을 휴대폰에 불러줬다. 이씨가 사무실에 들어서자 휴대폰에 불러준 일정이 프린터에 출력돼 있었다. 미래 사회같은 모습이지만 미국에선 이미 현실화한 풍경이다.

말로 하는 인터넷 시대가 바짝 다가섰다. 컴퓨터가 사람의 말을 인식하고 합성할 수 있는 음성기술이 급속도로 발전하고 있다.

한국과학기술원의 이수영 교수는 "천공카드에서 키보드로, 키보드에서 마우스로 발전해 온 MMI(Man-Machine Interface)기술은 컴퓨터가 이해하기 쉬운 것에서 인간이 이해하기 쉽고 조작하기 간편한 방향으로 발달하고 있다" 고 말했다.

마이크로소프트의 빌 게이츠 회장은 "음성은 윈도의 미래만은 아니다. 이 기술은 컴퓨터의 미래다" 라며 음성기술이 향후 운영체제(OS)뿐만 아니라 컴퓨터 자체를 변화시킬 이정표가 될 것임을 강조했다.

◇ 뭐든지 '말' 로 해결한다〓지난달 방한한 영국의 물리학자 스티븐 호킹 박사는 말을 전혀 못하지만, 음성기술을 활용해 청와대에서 강연을 했다.

호킹 박사가 키보드로 내용을 입력하면 음성합성기 'DEC토크' 가 굵직한 30대 남성의 목소리를 스피커로 내보냈다.

음성데이터통합장비업체인 한국쓰리콤의 김충세 사장은 "음성기술은 개별 기술만 이용한 서비스도 가능하지만 여러 기술을 조합하면 수없이 많은 서비스를 창조할 수 있다" 고 말했다.

예컨대 음성인식기술과 음성합성기술을 이용하면 '듣는 신문' 이 가능하며, 음성인식기술.언어식별기술.자동번역기술.음성합성기술을 결합하면 외국어 동시통역이 가능하다는 것. 실제로 일본의 일부 호텔에서는 예약전화에 자동통역기를 설치해 한국어로 말하면 일본어로 통역해 주는 서비스를 제공하고 있다.

최근 각광받는 보이스포털은 PC 대신 일반 전화나 휴대폰을 통해 음성으로 명령을 내리면 자동으로 인터넷에 접속, 원하는 정보를 찾아 다시 음성으로 읽어주는 신개념 서비스.

해외에선 텔미네트워크.텔서프.비보컬 등의 업체가 이미 전화를 이용한 보이스포털 서비스를 제공하고 있다. 국내에선 헤이아니타코리아.CJ드림소프트 등이 서비스를 준비중이다.

◇ 국내외 업체들 개발 현황〓1990년대 초반부터 개발되기 시작한 음성기술은 90년대 후반에서야 제한된 기능이나마 실생활에 응용되기 시작했고, 올들어 실용화가 본격화됐다.

현재 음성기술 분야에서 가장 앞서 있는 업체는 벨기에의 L&H. 올해 최대 경쟁자인 미국 드래곤시스템을 인수, 독보적인 위치에 선 이 회사는 음성인식 워드프로세서인 '보이스익스프레스(VoiceExpress)' 와 음성인식 무선단말기인 '낙(NAK)' 을 출시한 바 있다.

오는 11월에는 말을 알아듣고 대답하는 컴퓨터 앵무새 '토킹맥스(Talking MAX)' 를 국내 시장에 내놓을 예정이다.

국내에선 한국과학기술연구원(KIST).한국통신.보이스웨어.거원시스템 등이 음성기술을 개발중이거나 서비스하고 있다.

최근에는 뇌과학연구사업단이 미국과 일본에 이어 음성인식 반도체칩 개발에 성공했다.

조인스닷컴과 L&H의 합작법인인 보텐츠는 자동번역시스템과 음성기술을 결합한 솔루션으로 외국인과 내국인을 한데 묶는 커뮤니티를 구축하고 있다.

CJ드림소프트의 우광호 대표는 "이러한 서비스를 활용하면 영어를 몰라도 외국인과 자유롭게 대화할 수 있고, 장애인들도 인터넷과 워드프로세서를 자유롭게 사용할 수 있다" 고 말했다.

세계 음성기술 시장은 지난해 13억 달러에서 올해는 54억 달러로 3백% 이상 늘어나고, 2005년에는 4백억 달러에 이를 전망이다. 국내 시장은 올해 1천억원에 이를 것으로 업계는 추정한다.

◇ 한계는 없나〓음성확장 표시 언어인 VXML(Voice XML)이 대중화할 경우 음성기술도 새로운 전기를 맞을 것으로 보인다.

VXML은 IMT-2000에서 음성관련 서비스를 지원하기 위한 유력한 기술로 대두되고 있다.

그러나 남녀노소의 음성.사투리.표준어 등을 완벽하게 인식할 수 있느냐는 여전히 숙제로 남아 있다.

단어는 다르지만 발음이 같은 '영구' 와 '연구' , 문맥에 따라 표기를 달리하는 '삼삼오오' 와 '3355' 등은 아직 구별이 안된다.

IBM이 개발한 컴퓨터 음성명령 소프트웨어 '바이아보이스(Via Voice)' 의 경우 잡음이 없을 땐 95%의 인식률을 보이나 잡음이 섞이면 50%까지 떨어진다.

이트렉인포다임의 김형식 팀장은 "국내 음성인식 기술은 외국에 비해 2년 정도 뒤졌다" 며 "특히 외국어에 없는 두음법칙 등 한국어 인식은 풀어야 할 과제가 많다" 고 말했다.

원낙연.오현 기자

ADVERTISEMENT
ADVERTISEMENT