ADVERTISEMENT

스마트폰 터치도 귀찮아, 말로 하면 되지

중앙선데이

입력

업데이트

지면보기

517호 21면

IT는 지금 음성기반 인공지능 시대

지난달 미국 라스베이거스에서 열린 CES 2017에 등장한 중국 유비테크의 로봇 ‘링스’. 아마존의 음성인식 비서 ‘알렉사’가 탑재돼 있다. [로이터=뉴스1]

지난달 미국 라스베이거스에서 열린 CES 2017에 등장한 중국 유비테크의 로봇 ‘링스’. 아마존의 음성인식 비서 ‘알렉사’가 탑재돼 있다. [로이터=뉴스1]

할리우드 영화에 등장하는 아이언 맨 슈트는 거의 모든 남성의 로망일지도 모른다. 하늘을 자유자재로 날아다닐 수 있고 슈트를 입으면 무적이 되기 때문이다. 특히 음성기반 인공지능(AI)인 자비스를 가지고 있는 주인공 스타크는 부러울 따름이다. 복잡한 버튼 입력 없이 말로만 하면 슈트에 거의 모든 명령을 내릴 수 있다. 뿐만 아니라 스타크 기지에 구축한 자비스를 이용해서 복잡한 기기 설계와 시뮬레이션까지 할 수 있다. 실제로 이런 기술이 일상생활에 있으면 얼마나 좋을까? 이러한 바람이 가까운 미래에 현실로 다가올 것으로 보인다.

음성AI 기기 생산 4년 뒤 9배 전망 #가전기기뿐 아니라 자동차에도 적용 #집안에서 시동 걸고 온도 조절 가능 #SKT ‘누구’는 한국어 특화 기술 #삼성 갤럭시 S8 ‘빅스비’ 적용 예고 #음식주문, 택시호출 등 가능해질 듯 #LG도 G6에 구글 어시스턴트 적용 #화면 꺼진 상태에서 음성으로 전화

라이프스타일 급변 예고

지난달 미국 라스베이거스에서 개최된 국제전자제품박람회(CES)에서는 음성기반 인공지능이 특히 큰 주목을 받았다. 그중 가장 눈에 띈 기술은 아마존의 ‘알렉사’였다. 시장조사 전문업체인 스트래티지 애널리틱스는 음성기반 인공지능 기기 연간 생산량이 2016년 180만대에서 2020년에는 1510만대로 늘어날 것으로 전망했다. 불과 4년 사이에 연간생산량이 9배 넘게 증가하는 셈이다. 음성기반 인공지능 기술의 급성장은 라이프스타일의 변화를 의미한다. 과거 애플이 터치기반의 아이폰을 첫 출시한 것과 같은 정도의 변화를 가져다줄 것으로 예상된다.

인터넷 초창기 시대에는 정보를 찾기 위해서 컴퓨터 본체와 모니터 전원을 켜야 했고 키보드와 마우스를 조작해야 했다. 그러나 2007년 아이폰이 출시되면서 이러한 불편한 점들이 확 사라져 버렸다. 컴퓨터까지 갈 필요도 없이 주머니에서 아이폰을 꺼내 터치 한 번만으로 동작할 수 있게 됐기 때문이다. 조작 또한 간편해서 터치 몇 번이면 모든 명령을 내릴 수 있다. 스마트폰 출시로 사람과 기기 간의 주요 인터페이스 수단이 급변한 것이다. 이러한 인터페이스 변화는 누워서도 정보검색, 영화보기, 음악듣기 등의 서비스를 누릴 수 있는 편리함을 제공해줬다.

음성기반 인공지능 시대에는 터치할 필요도 없다. 말만 하면 거의 모든 조작을 할 수 있다. 조작이 간편해질 뿐만 아니라 조작 대상까지 늘어나게 된다. CES 2017에 전시된 700여 개의 제품이 아마존 알렉사를 기반으로 하고 있었는데, 이는 곧 이런 서비스가 활발히 구현될 수 있음을 의미한다.

말로 스마트가전 제어 가능

음성기반 인공지능들이 어떻게 개발되고 있는지 현황을 살펴보자. 지난해 5월 구글은 똑똑한 음성비서 컨셉으로 ‘구글 어시스턴트’를 선보였다. 구글 어시스턴트는 기존 버전인 구글 나우에서 업그레이드 된 인공지능 스피커다. 구글 어시스턴트 사용자들은 주머니 속의 스마트폰을 꺼낼 필요가 없다. 사용자들이 단지 말로 명령만 내리면 구글 어시스턴트는 검색, 일정 관리, 예약 서비스를 해준다. 음성인식 기반 기술 적용은 집안의 가전기기에만 국한되지 않는다. 자동차에도 접목할 수 있다. 지난해 8월 아마존 알렉사에 이어 올해 1월 구글 어시스턴트가 자용차에 적용됐다. 이에 따라 운전자는 자동차가 아닌 집안에서 아마존 혹은 구글에서 제공하는 음성기반 인공지능 스피커를 통해서 시동 걸기, 자동차 내 온도조절, 위치 찾기, 교통상황 파악 등의 명령을 내릴 수 있게 됐다. 아쉽게도 영어와 독일어만 지원해 국내에서 음성인식 서비스를 이용하는 데는 한계가 있다.

SKT가 지난해 6월 출시한 음성인식 기반 AI 서비스 ‘누구’. 블루투스 스피커 형태로 판매됐다. [중앙포토]

SKT가 지난해 6월 출시한 음성인식 기반 AI 서비스 ‘누구’. 블루투스 스피커 형태로 판매됐다. [중앙포토]

현대자동차는 자체적으로 음성인식 인공지능 기술을 개발해 제공하고 있다. 현재 제공하는 서비스로는 운전 중 음성으로 음악재생, 위치찾기 정도뿐이지만 앞으로는 확대될 것으로 보인다.

앞서 언급했듯이 알렉사와 어시스턴트는 한국어를 지원하지 않는다. 그렇다면 국내에 적합한 음성기반 인공지능은 없는 것일까? SK텔레콤은 지난해 6월 인공지능 스피커인 ‘누구’를 출시했다. 누구는 사용자가 말을 하면 이를 파악해 스마트서비스를 제공한다. 음악 스트리밍, 스마트가전기기 제어, 스마트폰 위치 찾기, 날씨 검색 등이 가능하다. 누구의 가장 큰 장점은 ‘한국어 특화 음성인식 기술’이다. 이 기술은 목소리 톤과 억양을 분석하고 지방 사투리까지 알아들을 수 있게 하는 것으로 국내에서 가장 높은 음성인식률을 자랑한다. 덕분에 판매실적은 매우 좋은 편이다. 출시한 지 한 달 만에 1만대 이상이 팔렸고, 지금까지 총 4만대 이상이 팔렸다.

누구의 혁신은 여기서 그치지 않는다. SKT는 IT 거대기업인 IBM과 기술 파트너십을 맺고 누구를 더욱 발전시켜 나갈 방침이다. IBM은 인공지능 시스템인 왓슨을 개발했다. 왓슨은 미국 유명 퀴즈쇼인 제퍼디에서 역대 우승자들을 가볍게 이겨 우수한 인공지능 기술력을 선보였다. 왓슨은 자연어 처리 기반으로 동작한다. 현재 의료, 금융 등 17개 업종에 적용되고 있다. 미국·홍콩·호주 등 36개국에서 서비스된다. SKT는 IBM과 협력해 왓슨의 우수한 인공지능 기술을 누구에 적용할 수 있을 것으로 기대한다. 반면에 왓슨은 SKT가 가지고 있는 우수한 한국어 인식능력 기술을 적용할 수 있다는 이점을 얻을 수 있다.

스마트폰 서비스에도 큰 변화 예상

음성기반 인공지능 적용은 스마트폰 산업에서도 활발해질 전망이다. 삼성전자는 스마트폰 갤럭시 S8에 음성기반 인공지능인 ‘빅스비’를 적용해서 출시할 것이라고 밝혔다. 삼성전자는 S8에 탑재할 음성기반 인공지능 기술력 확보를 위해서 지난해 10월 비브랩스를 인수했다. 비브랩스는 애플의 음성비서 서비스인 ‘시리’를 개발한 다그 키틀로스와 아담 체이서 등이 설립한 음성기반 인공지능 전문회사다. 빅스비를 적용함으로써 음성만으로 음식주문, 택시호출, 금융거래 관련 앱들을 실행시켜 동작할 수 있게 할 방침이다. 더 나아가 빅스비는 음성명령에 따른 쇼핑, 번역 등의 서비스를 제공할 수 있을 것으로 예상된다.

LG전자도 역시 제품 경쟁력 강화를 위해서 음성기반 인공지능을 적용할 방침이다. LG는 CES 2017에서 아마존 알렉사를 탑재한 스마트가전을 선보인 데 이어 스마트폰 G6에는 구글 어시스턴트를 적용한다. LG 스마트폰이 구글 OS인 안드로이드를 기반으로 하고 있기 때문에 구글 어시스턴트와 손잡은 것으로 보인다. G6에서는 화면이 꺼진 상태에도 음성으로 전화를 걸고 인터넷 검색 등이 가능할 것으로 예상된다.

음성기반 인공지능 원조 개발회사인 애플도 적극 대응에 나서고 있다. 시리를 더욱 강화하기 위해서 인공지능 석학인 카네기멜론대 살라쿠트니노프 교수를 애플 AI팀에 팀장으로 영입했을 뿐만 아니라 음성인식 스타트업인 보컬큐와 머신러닝 전문업체인 튜리를 인수했다. 애플은 향후 시리 기술을 고도화 해 음성인식률을 향상시키고, 상황분석 능력을 주입시켜 상황에 맞는 적절한 서비스를 제공할 수 있게 차별화할 방침이다. 뿐만 아니라 애플은 감정분석 인공지능 기술을 보유한 스타트업인 ‘이모션트’를 인수했다.

거의 모든 분야에서 음성기반 인공지능이 도입되고 있다. 터치스크린을 적극 활용하는 스마트폰에서도 음성기반 인공지능 도입 열풍이 뜨겁다. 그렇다면 이는 ‘터치스크린’의 종말을 의미하는 것일까? 답변은 ‘그렇지 않다’ 이다. 터치스크린이 나오고도 마우스와 키보드는 여전히 남아 있다. 클릭과 같은 간단한 조작에는 터치스크린이 편리하지만 문서작업과 같은 복잡한 조작은 마우스와 키보드가 훨씬 더 편하기 때문이다. 터치스크린은 키보드와 마우스를 일부 대체해 사용자의 편리성을 극대화시킬 것으로 보인다.

마찬가지로 음성기반 인공지능은 말만 하면 되기 때문에 간편하다는 장점이 있지만, 모든 부분에서 편리한 것은 아니다. 직접 클릭해서 터치하는 경우가 말로 하는 것보다 더 편한 경우도 있다. 예를 들어 검색 시 검색결과들을 조회하고 방문하는 것은 음성보다 터치가 훨씬 더 편리하다. 일부 다른 보고서들의 전망처럼 음성기반 인공지능이 사용자 화면 없는 세상을 구현하거나 터치스크린을 종말시키지는 않을 것으로 보인다.

유성민 IT칼럼니스트

ADVERTISEMENT
ADVERTISEMENT