ADVERTISEMENT

AI가 회의록도 정리해준다…네이버, 새 음성인식 기술 공개

중앙일보

입력

업데이트

네이버가 회의록 음성파일을 문서로 정리할 수 있는 인공지능(AI) 서비스를 사용자들에게 공개했다.

13일 네이버는 길고 복잡한 문장을 인식하고 이를 텍스트로 변환할 수 있는 새로운 음성인식 엔진을 클로바 홈페이지에 공개했다. 이 엔진에는 네스트(NEST, Neural End-to-end Speech Transcriber) 기술이 활용됐다. '심층 신경망 통합 모델링 음성 자동자막 생성 기술'로, 지난 1월부터 네이버 동영상 뉴스 등 일부 서비스에서 도입됐다가 이번에 일반 사용자에게도 무료로 공개됐다.

[네이버 캡쳐]

[네이버 캡쳐]

NEST의 가장 큰 특징은 통합 모델링 방식(end-to-end)이다. 기존에는 음성 인식엔진이 음향과 언어 정보를 별도로 학습했지만 NEST는 음향과 언어 정보를 한꺼번에 인식한다. 학습 시간과 학습량은 기존의 10분의 1로 줄었고, 정확도는 기존보다 높아졌다. 네이버는 "NEST는 대량의 정제된 데이터를 사전에 학습하지 않고도, 예상치 못한 새로운 표현이 나와도 정확하게 음성 인식을 할 수 있다"고 설명했다.

NEST는 지난 1월에는 네이버 동영상 뉴스의 자동자막 서비스에 먼저 도입됐다. 또 AI가 전화로 코로나19 자가격리자 등 능동 감시자의 상태를 확인하는 ‘클로바 케어콜’에 지난달 9일부터 적용됐다. ‘클로바 케어콜’은 인공지능(AI)이 자가격리자에게 하루에 2번(오전 9시, 오후 3시) 자동으로 전화를 걸어 발열·호흡기 증상 등을 확인하는 시스템이다.

일반 사용자들은 클로바 스피치 홈페이지(https://clova.ai/speech)에서 NEST 기술을 무료로 체험할 수 있다. 기업과 단체도 제휴 제안을 통해 사용이 가능하다. 강의록이나 회의록 같은 장문의 음성을 손쉽게 텍스트로 변환할 수 있어 실생활에도 유용할 것으로 보인다.

네이버는 NEST를 적용한 자동자막을 뉴스 이외에 다양한 동영상·오디오 서비스로 확대할 계획이다. 클로바 AI 스피커 등에도 이 기술이 적용될 예정이다. 또 하반기 일본어 기반 NEST를 시작으로 영어·중국어 등 제공 언어도 확대할 계획이다.

한익상 네이버 클로바 스피치 리더는 “NEST는 동영상·오디오 콘텐트의 자막 제작이나 고객센터의 통화 데이터 관리 등 다양한 분야에서 활용 가치가 높을 것으로 기대된다”고 말했다.

김원 기자 kim.won@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT