ADVERTISEMENT

[J리포트] 알렉사 스킬 2만 개 돌파, 국내 생태계는 아직... AI 스피커 열풍으로 짚어본 음성인식 플랫폼 시장

중앙일보

입력

1차 판매분 4000대 35분 만에 매진. 2차 판매분 4000대 하루 만에 매진. (네이버 웨이브)
예약판매 38분 만에 3000대 매진. (카카오 카카오미니)
요즘 인공지능(AI) 스피커 시장 열기가 이 정도다. 이쯤에서 짚고 넘어가야 할 것이 있다. 이 열기의 근원은 무엇일까. 파격적인 할인? 음악 서비스 1년 이용권? 그도 아니면 붙어 있는 라이언 캐릭터 피규어?

수십 분만에 매진되는 AI 스피커 열풍 #음성인식 플랫폼, 기술·산업적 변곡점? #인공지능의 '귀' 완성…1차 변곡점 돌파 #똑똑한 답변엔 알고리즘·빅데이터 한계 #시장 승부수는 생태계 규모에 따라 갈려 #알렉사 스킬 2만개… 네이버 11월에 출발

무엇이 열기를 부채질했건, 분명한 건 시장이 달라졌다는 것이다. 지난해까지만 해도 얼리 어답터의 독특한 취향으로 여겨졌던 AI 스피커는 어느새 대중의 관심 한복판으로 성큼 걸어 들어왔다. 이를 두고 “본격적인 ‘음성 인식의 시대’가 꽃을 피우려 한다”는 분석까지 나올 정도다. 시장조사기관 가트너는 지난해 7억2000만 달러 규모였던 AI 스피커 시장이 2021년 35억2000만 달러 규모로 확대될 거로 전망했다.

정말 음성 인식 플랫폼은 기술적, 산업적 '티핑포인트'(변곡점)를 지나고 있는 걸까. 세 가지 궁금증을 전문가들과 짚어봤다.

1. 기술은 무르익었나

AI 스피커는 음성인식 기반의 인공지능 서비스다. 얼마나 잘 듣고(음성인식), 똑똑한 답을 내놓느냐(인공지능)가 관건이다.

전문가들은 최근 AI 스피커의 기능을 바탕으로 “첫 번째 장벽, 즉 자연어 인식 기술에선 일단 티핑 포인트에 근접한 게 확실하다”고 진단했다. 최근 출시된 서비스의 자연어 인식 정확도는 96%에 근접한 것으로 알려졌다. 이는 평균적 청력의 사람이 실제 생활에서 인식하는 것과 큰 차이가 없는 수준이다. 신진우 카이스트 전기·전자공학부 교수는 “이제는 인공지능의 ‘귀’는 걸림돌이 되지 않는다. 인공지능이 얼마나 대화의 맥락과 의도를 이해해 똑똑한 답변을 내놓느냐가 문제”라고 말했다.

똑똑한 답이 나오려면 두 가지가 필요하다. 머리가 좋아야 하고(인공지능 알고리즘) 공부를 많이 해야 한다(빅데이터). 아직 대부분의 음성인식 플랫폼은 성인이 기대하는 수준으로 똑똑하지 않다는 게 한계다. 체계적으로 쌓인 빅데이터도 적지만, 빅데이터를 어떻게 조합해야 최적의 답을 내놓을지에 대한 노하우를 장악한 기업도 없다. 이경전 경희대 경영학과 교수는 “아직 대부분의 플랫폼은 날씨 같이 단편적 정보를 내놓는 수준”이라며 “여러 명령을 한번에 수행하거나 대화의 맥락을 파악하는 것 같은 기술은 아직 갈길이 멀다”고 말했다.

2. 시장은 얼마나 열렸나

음성인식 플랫폼이 본격적인 시장성을 갖추려면 생태계가 구축돼야 한다. 스마트폰 운영체제의 경쟁력이 얼마나 다양한 애플리케이션 생태계를 확보했느냐로 갈리는 것과 같다.

가장 발빠르게 움직이는 게 아마존이다. 2014년에 이미 AI 스피커를 출시한 ‘선두 기업’인 아마존은 2015년 음성인식 플랫폼 '알렉사'에 연동되는 ‘스킬’(앱과 같은 개념) 생태계를 구축하기 시작했다. 스킬 생태계는 무서운 속도로 확장되고 있다. 기술전문기업 보이스봇에 따르면 6월 말 기준 1만5000개였던 알렉사의 스킬 수는 최근 2만개를 넘어섰다.
최재홍 강릉원주대 멀티미디어공학부 교수는 “알렉사의 스킬 생태계는 증가세에 탄력이 붙어 내년 중 10만개를 돌파할 수 있을 것으로 본다”며 “애플이 처음 아이폰을 공개했을 때 iOS의 앱이 500여개에 불과했다는 것을 감안하면 어마어마한 규모”라고 말했다.

네이버도 음성인식 플랫폼 ‘클로바’를 11월 공개해 생태계를 구축할 계획이다. 최 교수는 “아직 음성인식 시장은 초기에 불과하기 때문에 더 풍성한 생태계를 구축하는 기업이 나오면 기존 질서가 뒤집힐 가능성이 있다”고 말했다.

3. 한국 기업의 현 주소는

국내 기업도 이런 상황을 알고 있다. 인공지능 분석 기술이나 빅데이터 보유량, 서비스 생태계 등을 감안할 때 국내 기업이 영어권 시장에서 아마존이나 구글을 앞서긴 쉽지 않다는 게 객관적 평가다.

관건은 한국어 시장에선 국내 기업들이 패권을 쥘 수 있느냐는 것이다. 전문가들은 “한국어 음성인식 플랫폼 시장을 외국 기업이 뺏아가긴 쉽지 않을 것”이라고 평가한다. 일단 한국어 인식 기술이나 한국어 빅데이터에서 국내 기업이 앞선다. 인공지능 알고리즘에선 삼성전자가, 빅데이터 보유량에선 네이버가 압도적이다. 카카오는 O2O(온ㆍ오프라인 연계) 서비스를 중심으로 생태계 구축에 주력한다는 전략이다. 이경전 교수는 “네이버는 오디오 콘텐트 확보에서 앞서있고, 카카오는 O2O 서비스 연계 전략이 기대된다”며 “어느 회사건 ‘터치보다 편하다’는 평가를 받는 음성 기반의 킬러 서비스를 내놓으면 승기를 잡을 수 있을 것”이라고 말했다.

임미진 기자 mijin@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT