내 곁의 색다른 음성비서..믿고 쓸만 할까요

엄형준 입력 2017. 3. 18. 14:53 수정 2017. 3. 18. 14:56
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[AI 스피커 집중탐구] (1) 사양, 인식능력
SK텔레콤이 MWC 선보인 로봇 제품들. 이 중 일부는 앞서 출시된 AI스피커인 ‘누구’의 음성인식 기술을 채용했다.
요즘 인공지능(AI) 스피커가 열풍이다. “그래서? 사서 쓸만하냐고?” 거두절미하고 묻는다면 일단 “그렇다”고 대답할 수 있다. 하지만 “왜 그런가. 어떤 점이 좋냐”고 물으면, 그건 좀 길게 얘기해야 할 것 같다. 평균치로서 “그렇다”는 것이지, ‘AI 스피커라’고 다 같은 성능을 보인 것도 아니다.

서론을 좀 달자면, 아마존이 개발한 인공지능(AI) 스피커인 ‘에코’가 지난해 미국의 최대 쇼핑시즌인 ‘블랙프라이데이’에서 히트상품이 됐다. 이후로도 에코의 2.5인치 우퍼와 2.0인치 트위터 스피커를 제거하고, 크기를 줄인 후 아주 기본적인 미니 진동판만 탑재한 형태의 ‘에코닷’은 지금도 아마존 닷컴에 재고가 없어 출고까지 며칠을 기다려야 한다.

아마존 외에도 구글이 지난해 11월 인공지능(AI) 음성비서인 ‘구글 어시스턴트’를 탑재한 구글홈을 내놨고, 국내에서는 지난해 9월 SK텔레콤이 AI 스피커인 ‘누구’를 출시했다. 출시 후 누구는 6만여대가 팔렸다. 이어 올해엔 KT가 셋탑박스에 음성인식 스피커를 합친 ‘기가지니’를 내놨고, 상반기 중으로 네이버도 AI 스피커를 내놓을 예정이다.

지금까지 나열한 AI 스피커를 다 사면 ‘아리아’, ‘알렉사’, ‘지니’, ‘구글’ 이름의 ‘여자친구’(목소리가 여성스럽다)를 만들 수 있겠지만(부르는 이름은 바꿀 수 있다), 기능이 비슷해 다 살 필요는 없을 것 같다. 그리고 아직 진솔한 대화를 나눌만한 ‘사이’(지능)도 아니다. 앞으론 달라질 수 있겠지만…
열거한 제품들 중 기대 반, 호기심 반으로 이 제품들 중 아마존 ‘에코닷’과 SK텔레콤의 ‘누구’를 직접 구매하고, KT는 대여해 기능을 테스트해봤다.

◆‘스펙‘(사양) 확인

구체적인 상품 얘기를 할 것도 없이 스펙은 ‘에코닷’이 1승이다. 성능을 떠나 온라인 사이트에 나와 있는 설명이 자세하다. 적어도 전자제품이라면 이 정도는 밝혀줘야 하는 게 아닐까. (AI 스피커가 외에도) 많은 제작사가 전자제품을 미사여구로 포장한 뒤, 스펙은 대충 적어두는 경우가 많다. 그래서 때론, 제품을 사기도 전에 제조사나 서비스센터에 전화를 걸어 “이런 기능이 되나요”라고 물어야 하는 경우가 생기는데, 답변을 못 듣거나 잘못된 정보를 듣는 경우도 생긴다.

아마존 에코닷

에코닷의 제품 사이즈는 32㎜ × 84㎜ × 84㎜(높이·가로·세로), 무게는 163g으로 손바닥 안에 들어오는 앙증맞은 원통형 스피커다. (본격 음악감상용은 아니지만, 어쨌든 스피커는 달려있다.) 내장 스피커외에 3.5㎜ 단자를 이용해 외부 스피커에 연결하거나 블루투스 스피커로 음악을 전송할 수 있다. 블루투스와 와이파이 네트워크를 지원하며, 무려 7개의 마이크가 재품 상단에 달려 있다. 전원은 마이크로 USB 단자를 이용해 공급한다. 정가는 49.99달러.
SK텔레콤 AI스피커 누구

누구(모델명 NU100)는 94㎜ × 94㎜× 219.8㎜(가로·세로·높이), 무게 1.1㎏이다. 출력 15W, 2.5인치 우퍼와 2.0인치 트위터를 달고 있으며, 와이파이와 블루투스를 지원한다. 마이크는 기기 상단에 2개가 딜린 것으로 추정된다. 전원은 어댑터 방식의 플러그로 공급 받는다. 정상가격은 24만9000원이지만, 지금까지 14만9000원에 팔고 있다. 정가로 굳어지는 분위기다.
KT 기가지니

기가지니(모델명 CT1100)는 182㎜ × 279.2(지름·높이), 무게 1.8㎏으로 3개 제품 중 가장 크고 무겁다. 블루투스와 와이파이 네트워크를 지원하며, AV OUT 포트, HDMI 포트, 이더넷 포트(유선 인터넷, 1000Mbps 지원), USB2.0 포트, 마이크로SD카드 슬롯까지 달려있다. 영상을 지원하는 셋탑박스 일체형 스피커기 때문이다. 리모컨이 동봉되며, 카메라를 별도로 구입해 달 수 있다. 스피커 튜닝은 하만카돈이 맡았으나, 온라인에 자세한 내역은 공개돼 있지 않다. 보도자료에 따르면, 20W 출력의 2.75인치 우퍼와, 15W 출력의 2.25인치 트위터가 장착돼 있다. 마이크는 2개다. 전원은 어댑터가 달린 플러그로 공급한다. 정가는 29만9000원이나, 현재 맴버십 할인가로 26만9100원에 판매 중이다. KT의 다른 상품과 결합해 임대를 할 수도 있다.

◆음성인식 능력은

아마존은 영어를, 누구와 기가지니는 한국어를 인식하기 때문에 정확한 일대일 비교라고는 할 수 없지만, 전반적인 언어인식 기술은 에코닷이 뛰어나다.
기자가 출장이나 짧은 여행을 제외하고 대부분의 세월을 한국에서 보냈음에도, 에코닷은 ‘L’과 ‘R’이 들어가는 단어를 제외하고는 대체로 영어 문장을 알아들었다. 시간이나 날씨를 묻고, 알람을 설정하는 등의 작업은 문제가 되지 않았다. 에코닷은 언어의 특성도 있겠으나, 단어만 얘기해도 의미를 이해하기도 했다. 물론 에코는 한글은 할 줄도 들을 줄도 모른다. 한글이 영어로 써 있을 경우 소리나는대로 읽을 수는 있다.

누구와 기가지니는 회사 측이 제시하는 짧은 문장, 예를 들면 “지금 몇시야”, “오늘 날씨 알려줘” 등은 잘 알아 듣는다. 한국 노래도 꽤 잘 찾아준다. 하지만 외국 노래나 가수는 못 찾을 때가 많다. “제가 적절한 답변을 찾지 못했어요”라는 사과나 ‘3.1운동’에 대해서 물었는데, 클럽 음악을 트는 엉뚱한 행동을 할 때도 있다. 아마존 역시 빈도는 낮지만 못 알아들을 때가 있다.
음악을 틀고 있거나 소음이 많은 상황에서는 에코의 인식 능력이 특히 눈에 띄었다. 음성인식 기술과 함께 마이크 숫자가 7개로 국내 제품보다 3배 이상 많은 것도 영향을 미친 것으로 보인다. 에코는 집안에 여러대가 있을 경우 7개의 마이크가 소리가 나는 방향을 찾아내고, 가까운 쪽의 기기가 작동하도록 설계돼 있다.(기능 확인은 못해봤다.) 기기지니는 우퍼의 영향인지, 큰 소리로 말해도 반응을 보이지 않을 때가 많아 답답했다.

같은 톤, 같은 상황에서 음성 인식 능력은 아마존, 누구, 기가지니 순이다. 다만 에코닷은 맞춰 놓았던 알람이 울릴 때만은 불러도 반응을 하지 않을 때가 많다. (던지고 싶어 진다.) 기가지니는 주변이 시끄러울 경우, 리모컨의 마이크를 이용해 명령을 내리는 것이 가능하다.

AI 음성인식 스피커는 사람과 자유로운 대화를 하는 수준은 아니며, 아직 ‘답정너’에 가깝다. 자연어를 인식하고 정보를 검색한다는 측면에서는 기술의 진보를 이뤘다고 볼 수 있지만, 이 제품들을 AI스피커라 부르는 것 자체가 틀린 표현일 수도 있다. 개인의 성향을 파악하고 이를 다음 검색에 반영하지 못한다.

2편에서는 AI 스피커의 기능에 대해서 알아본다.

엄형준 기자 ting@segye.com

Copyright © 세계일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?