[J report] 저무는 손가락 터치 시대, 목소리로 다 되는 세상 열린다

임미진 2017. 9. 27. 01:01
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 스피커 열풍에 음성인식 대중화
인식 정확도 96% 사람과 엇비슷
아마존 '알렉사' 앞세워 플랫폼 구축
앱 개념 '스킬' 아이폰 초기의 40배
네이버·카카오 국내 시장 패권 경쟁
빅데이터 활용 등 아직 기술적 한계

1차 판매분 4000대 35분 만에 매진. 2차 판매분 4000대 하루 만에 매진. (네이버 웨이브)

예약판매 38분 만에 3000대 매진. (카카오 카카오미니)

요즘 인공지능(AI) 스피커 시장 열기가 이 정도다. 이쯤에서 짚고 넘어가야 할 것이 있다. 이 열기의 근원은 무엇일까. 파격적 할인? 음악 서비스 이용권? 그도 아니면 제품에 붙은 라이언 캐릭터 피규어?

무엇이 열기를 부채질했건, 분명한 건 시장이 달라졌다는 것이다. 지난해까지만 해도 얼리 어답터의 독특한 취향으로 여겨졌던 AI 스피커는 어느새 대중의 관심 한복판으로 성큼 걸어 들어왔다. 이를 두고 “본격적인 ‘음성 인식의 시대’가 꽃을 피우려 한다”는 분석까지 나올 정도다. 시장조사기관 가트너는 지난해 7억2000만 달러(8200억원) 규모였던 AI 스피커 시장이 2021년 35억2000만 달러(4조원) 규모로 확대될 거로 전망했다.

정말 음성 인식 플랫폼 시장은 기술적, 산업적으로 ‘티핑포인트’(변곡점)를 지나고 있는 걸까. 세 가지 궁금증을 전문가들과 짚어봤다.

주요 IT기업 음성인식 플랫폼
◆기술은 무르익었나=AI 스피커는 음성인식 기반의 인공지능 서비스다. 얼마나 잘 듣고(음성인식), 똑똑한 답을 내놓느냐(인공지능)가 관건이다.

전문가들은 최근 AI 스피커의 기능을 바탕으로 “첫 번째 장벽, 즉 자연어 인식 기술에선 일단 티핑 포인트에 도달한 게 확실하다”고 진단했다. 최근 출시된 서비스의 자연어 인식 정확도는 96%에 근접한 것으로 알려졌다. 이는 평균적 청력의 사람이 실제 생활에서 인식하는 것과 큰 차이가 없는 수준이다. 신진우 카이스트 전기·전자공학부 교수는 “이제는 인공지능의 ‘귀’는 걸림돌이 되지 않는다. 인공지능이 얼마나 대화의 맥락과 의도를 이해해 똑똑한 답변을 내놓느냐가 문제”라고 말했다.

똑똑한 답이 나오려면 두 가지가 필요하다. 머리가 좋아야 하고(인공지능 알고리즘) 공부를 많이 해야 한다(빅데이터). 아직 대부분의 음성인식 플랫폼은 성인이 기대하는 수준으로 똑똑하지 않다는 게 한계다. 체계적으로 쌓인 빅데이터도 적지만, 빅데이터를 어떻게 조합해야 최적의 답을 내놓을지에 대한 노하우를 장악한 기업도 없다.

이경전 경희대 경영학과 교수는 “아직 대부분의 플랫폼은 날씨 같이 단편적 정보를 내놓는 수준”이라며 “여러 명령을 한번에 수행하거나 대화의 맥락을 파악해 대답을 내놓는 것 같은 기술은 아직 갈길이 멀다”고 말했다.

◆시장은 얼마나 열렸나=음성인식 플랫폼이 본격적인 시장성을 갖추려면 생태계가 구축돼야 한다. 스마트폰 운영체제의 경쟁력이 얼마나 다양한 애플리케이션 생태계를 확보했느냐로 갈리는 것과 같다.

가장 발빠르게 움직이는 게 아마존이다. 2014년에 이미 AI 스피커를 출시한 ‘선두 기업’인 아마존은 2015년 음성인식 플랫폼 ‘알렉사’에 연동되는 ‘스킬’(앱과 같은 개념) 생태계를 구축하기 시작했다. 스킬 생태계는 무서운 속도로 확장되고 있다. 기술전문기업 보이스봇에 따르면 6월 말 기준 1만5000개였던 알렉사의 스킬 수는 최근 2만개를 넘어섰다.

최재홍 강릉원주대 멀티미디어공학부 교수는 “알렉사의 스킬 생태계는 증가세에 탄력이 붙어 내년 중 10만개를 돌파할 수 있을 것으로 본다”며 “애플이 처음 아이폰을 공개했을 때 iOS의 앱이 500여개에 불과했다는 것을 감안하면 어마어마한 규모”라고 말했다.

네이버도 음성인식 플랫폼 ‘클로바’를 11월 공개해 생태계를 구축할 계획이다. 최 교수는 “아직 음성인식 시장은 초기에 불과하기 때문에 더 풍성한 생태계를 구축하는 기업이 나오면 기존 질서가 뒤집힐 가능성이 있다”고 말했다.

◆한국 기업의 현 주소는=국내 기업도 이런 상황을 알고 있다. 인공지능 분석 기술이나 빅데이터 보유량, 서비스 생태계 등을 감안할 때 국내 기업이 영어권 시장에서 아마존이나 구글을 앞서긴 쉽지 않다는 게 객관적 평가다.

관건은 한국어 시장에선 국내 기업들이 패권을 쥘 수 있느냐는 것이다. 전문가들은 “한국어 음성인식 플랫폼 시장을 외국 기업이 뺏아가긴 쉽지 않을 것”이라고 평가한다. 일단 한국어 인식 기술이나 한국어 빅데이터에서 국내 기업이 앞선다. 인공지능 알고리즘에선 삼성전자가, 빅데이터 보유량에선 네이버가 압도적이다. 카카오는 O2O(온·오프라인 연계) 서비스를 중심으로 생태계 구축에 주력한다는 전략이다. 이경전 교수는 “네이버는 오디오 콘텐트 확보에서 앞서있고, 카카오는 O2O 서비스 연계 전략이 기대된다”며 “어느 회사건 음성 기반의 킬러 서비스를 먼저 내놓으면 승기를 잡을 수 있을 것”이라고 말했다.

임미진 기자 mijin@joongang.co.kr

Copyright © 중앙일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?