국산 AI 스피커를 한 자리에 놓고 써 보니

오가희 기자 2018. 1. 29. 20:01
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

지난해 말, 우리나라에서 내로라 하는 IT, 통신 기업들이 일제히 ‘인공지능 스피커’라는 흥미로운 아이템을 출시했다. 마치 사람과 대화를 하는 것처럼 버튼을 누르지 않고 말로 명령해 원하는 노래나 정보를 내놓는 스피커다. 아이언맨의 자비스를 생각하면 이 스피커의 기능과 앞으로의 활용도에 대해 ‘상상’할 수 있다. ‘상상’이라고 부르는 이유는 간단하다. 상용화된 스피커 4종을 한 군데 모아 놓고 실험해 봤는데, 아직 멀었다.

실험 대상은 총 4종. 카카오, 네이버, SK텔레콤(SKT), KT에서 출시한 스피커를 이용했다. 네이버는 라인 프렌즈 스피커(이하 클로바)를, SKT는 NUGU 미니(이하 누구), KT는 기가지니LTE를 썼다.

왼쪽부터 네이버 라인 프렌즈 스피커, SKT NUGU 미니, 카카오 미니, KT 기가지니 LTE - 오가희 기자 solea@donga.com 제공

● 공통적으로 잘하는 것: 일기예보, 노래 틀기

4종을 동시에 비교하는 기획을 짤 당시 계획은 야심찼다. 스피커 4종의 이름을 모두 똑같이 짓고 누가 가장 똑똑한지 비교해보고 싶었다. 이 계획은 일단 시작부터 잘못됐는데 스피커 이름을 내 맘대로 지을 수가 없었다! 미리 정해진 이름 안에서 변경만 가능할 뿐이었다.

노래 듣기 기능은 그야말로 충실했다. “최신 음악 틀어줘” 라든가 “레드벨벳 노래 틀어줘” 같은 명령어는 누가 더 낫다고 말할 수 없을 정도로 확실했다. 다만 제목이 영문이라거나 (기자의 영어 발음이 문제일 수도 있다), 출시된 지 조금 오래되고 사람들이 잘 듣지 않는 노래는 정확하게 알아듣지 못 했다. 기자는 오랜 신화 팬인지라 신화 노래로 실험해 봤는데, 1999년 출시된 2집의 YO!의 경우 ‘신화의 요 틀어줘’라고 했을 때 제대로 한 번에 틀어주는 비율은 반반이었다. 똑같은 명령어를 반복해도 ‘신화’만 인식해서 신화의 다른 노래(최신곡인 ‘표적’이나 ‘터치’)를 튼다거나 전혀 엉뚱한 노래 (왕좌의 게임 OST)를 재생하는 경우도 있었다.

노래보다 유용한 것은 일기예보 기능이었다. 요즘처럼 추운 날씨에 아침마다 코트를 꺼낼지, 패딩을 꺼낼지 고민할 때 ‘매우 매우’ 유용했다. 옛날처럼 TV나 라디오 뉴스를 켜고 일기예보를 기다리거나, 스마트폰을 손에 들고 조작할 필요없이 칫솔을 입에 물기 전 ‘○○○, 오늘 날씨’라고 말하고 양치질을 하고 있으면 오늘 날씨를 확인할 수 있다.

그런데, 그게 전부다. 음악을 제대로 듣기 위해서는 음악 서비스의 스트리밍 이용권을 구매해야 한다. 저렴한 스마트폰 전용 요금제 사용자라면 PC에서도 재생할 수 있는 요금제 (보통 더 비싸다)로 변경해야 한다. 기자처럼 특정 노래만 반복적으로 들어서 스트리밍 이용권을 구입하지 않는 사람이라면 1분 미리 듣기만 가능하다(!). 블루투스 기능으로 스마트폰과 연결해 스마트폰에 저장된 노래를 재생할 수는 있는데, 그 기능은 AI 스피커가 아니라 블루투스 스피커 만으로도 충분히 가능하다.

▲ 스피커 4개를 순서대로 부르면 번갈아 대답하면서 경우에 따라서는 자기 이름이 아니라고 주장한다.

 

● 기자가 제멋대로 판단한 각 스피커 특징

# KT 기가지니 LTE: 휴대용 LTE 단말기
KT가 AI 스피커의 용도로 먼저 생각한 것은 TV 셋톱박스다. KT는 기가지니LTE에 앞서 셋톱박스 겸용 기기인 그냥 ‘기가지니’를 내놓은 바 있다. 인터넷 TV를 쓰는 사람이라면 누구나 경험했겠지만 원하는 프로그램을 찾기란 상당히 어렵다. 리모콘 어딘가에 있는 메뉴 버튼을 찾고 검색 버튼을 찾은 다음에 10~20년 전 휴대폰에서 문자 치듯 하나하나 입력하는 그 방식은 침대에 누워서 말만으로 ‘시리야 음악 틀어줘’라고 말하는 시대와는 한참 뒤떨어졌다. 기가지니는 그 불편함을 겨냥한 TV 셋톱박스 겸용 스피커다.

이어 나온 기가지니 LTE는 셋톱박스 기능은 없지만 ‘휴대성’에 초점을 맞췄다. 충전식 배터리를 이용해 케이블이 없어도 작동한다(이 이야기를 굳이 하는 이유는 다음에 소개할 카카오 미니는 케이블이 반드시 필요하기 때문이다). 배터리만으로 휴대성을 극대화했다고 보긴 힘들다. ‘들고 다닌다’라는 특징은 기가지니 ‘LTE’라는 명칭에서 드러난다. 기가지니 LTE는 휴대용 무선 단말기다.

저렴한 스마트폰 요금제를 사용하느라 데이터가 소중한 사람들을 위한 공유기다. 캠핑 같은 야외활동에서 아주 소중하게 쓸 수 있다. 단점은 당연하게도 가격. LTE로 데이터를 끌어오는 만큼 매달 일정 부분 요금을 내야 한다. 데이터 20GB에 월 1만 8150원(단말기 할부금 별도)니 요금제 자체는 저렴하지만 20만 원이 넘는 스피커 가격이 결코 만만하진 않다.

참고로 근처에 아이폰이 있을 경우 ‘기가지니!’라고 부르면 기가지니와 함께 시리도 반응한다. 시리 의문의 1패.

# 카카오 미니: 양파 썰다 카톡 보내기 좋음
지난 주말 영화관에 갔다가 카카오미니 광고를 봤다. 카카오 미니를 쓰면 수많은 일을 할 수 있다고 광고를 하고 있었다. 여러 가지 AI 스피커 중 카카오 미니만의 특징이라고 할 수 있는 것은 단연 ‘카톡 보내기’ 기능이다.

설거지를 하다가도, 청소를 하다가도 급한 메시지는 멈춰서서 간단한 명령어로 카톡을 보낼 수 있다. ‘헤이, 카카오! 한세희 팀장에게 ’내일 회의 10시에 하시죠‘라고 카톡 보내죠.’ 라는 간단한 말로 카카오톡 메시지를 보낼 수 있다.

카카오는 이 스피커를 자사 각종 어플리케이션과 연동할 계획이다. 택시를 부르거나, 카카오톡 주문하기 기능을 이용해 음식을 배달하게 할 수도 있다. 이 기능은 아직 구현된 상태는 아니지만 카카오는 홈페이지(카카오 I)를 통해 ‘coming soon’이라며 서비스 오픈 계획을 밝히고 있다.

그런데 카카오 택시나 주문하기보다 먼저 해야 하는 것이 있다. 여러 가지 플랫폼을 통해 카카오 미니를 광고하고 있지만 정작 제품은 구입할 수 없다. 일단 물량 공급부터 해야할 판이다. 또 하나, 카톡을 보낼 수는 있는데 읽어 주진 않는다. 결국 대화를 위해서는 스피커를 포기하고 스마트폰을 집어들어야 한다. 메시지를 주고 받기 위해서는 굳이 ‘헤이 카카오’를 부르는 것 보다 스마트폰의 음성 인식 기능을 이용하는 것이 편리하다.

▲ 카카오미니를 이용해 카톡을 보내봤다. 메시지를 보낼 수는 있지만 읽어주진 않는다.

# 네이버 라인 프렌즈 스피커: 네이버 서비스에 기반한 검색
네이버의 AI 스피커는 자체 인공지능 클로바 AI를 이용한다. 클로바 스피커의 가장 큰 특징은 ‘검색’이다. IT 공룡 네이버에 대해서 이런 저런 말이 많지만 어쨌든 우리나라에서 생활 관련 정보를 검색할 때 네이버만큼 편리하고 정보량이 많은 것도 없다. 클로바는 네이버 검색과 연동, 방대한 정보량을 자랑한다. 필요할 경우 지식인에 있는 정보를 검색해주기도 한다.

네이버에서 제공하는 여러 서비스 역시 AI 스피커로 이용 가능하다. 다른 스피커와 차별화되는 부분은 ‘번역’ 기능. 간단한 문장을 영어나 중국어 등으로 바꿀 수 있다. 의외로 발견한 것은 계산기 기능. 더하기를 할 수 있다. 집에 더하기를 배우는 어린이가 있다면 부모님 몰래 숙제를 도와달라고 할 수도 있을 것 같다. 다만 더하기는 되는데 빼기는 안된다는 것이 함정. 여러 차례 빼기를 시도해봤지만 안됐다.

요즘 한창 광고하고 있는 배달 어플과 연동? 배달 어플과의 연동 문제는 SK 누구의 특징에서 함께 이야기해보도록 하겠다.

# SKT NUGU 미니: 스마트폰 어플리케이션이 핵심
SKT NUGU AI는 스피커 말고 스마트폰 내비게이션에서도 쓸 수 있다. 싸우면 진다는 ‘T맵’에서다. 운전 중 스마트폰을 조작해 목적지를 설정하는 것을 음성인식으로 대체하기 위해 도입됐는데 음성 인식률, 사용자 UX, 자동차 엔진 소음 등 문제가 복잡하게 얽히면서 아직은 누구를 이용하는 것보다는 자동차를 멈추고 직접 손으로 설정한 뒤 출발하는 게 더 안전하다.

이 누구 AI를 스피커에 담았을 때는 T맵의 누구와는 또 다른 느낌이다. 스마트폰 의존도가 상당히 높다. 누구 어플에는 스피커와 함께 이용할 수 있는 다양한 기능이 함께 들어있다. 클로바가 지식 정보를 전달하기 위해 네이버 검색을 이용한다면 누구는 위키피디아를 이용한다. 스피커에서 질문하면 위키피디아에서 검색한 뒤 첫 세 문장을 읽어준다. 더 많은 정보는 어플리케이션 – 위키피디아 항목에서 볼 수 있다.

도미노 피자 같은 음식 배달 서비스도 가능한데 AI 스피커에서는 이 배달 서비스가 계륵과 같은 존재다. 누구뿐만 아니라 배달 서비스를 도입하려는 모든 스피커가 그렇다. 이상적인 음식 배달 주문이라면 아래와 같은 순서로 진행된다.

아리아, 도미노 피자 먹고 싶어 – 어떤 피자가 드시고 싶으세요? - 요새 새로 나온 거 뭐 있어? - (메뉴와 토핑 종류, 특징을 말한다) - 그 피자 라지 사이즈로 할래 – 사이드 메뉴는요? …

사이드 메뉴는 무슨, 아직 택도 없다. 무엇을 먹고 싶은지 스마트폰 어플리케이션에서 미리 설정을 해놔야 한다(!). 아직까지는 설정을 하다가 그냥 스마트폰으로 주문하거나 전화로 하는 편이 편하다. 물론 AI 스피커인 만큼 앞으로 계속 개선해 나갈 여지가 있다.

● 갈길 먼 AI 스피커, 아직은 ‘일기예보’ 기계

결국 현재 AI 스피커들은 ‘새로운 장난감’ 이상도 이하도 아닌 상황이다. 남아있는 스피커는 출근하기 직전 옷차림을 확인하게 해주는 일기예보 머신 정도로 남아있다. 스피커 음질은 나쁘지 않지만 이용권이 없어서 정작 음악 기능은 사용하지 못한다. 끝으로 후기를 마치며 주변에서 제보 받은, 몇 가지 ‘웃픈’ 사례를 소개하며 마무리한다. 이런 후기가 AI 스피커가 발달하는데 피가 되고 살이 됐으면 하는 바람이다.

- 아이를 재우기 위해 ‘자장가 틀어줘’라고 했을 때 갑자기 분위기를 깨는 음악이 나올 때가 있다. 아이가 잠든 뒤 꺼야 하는데 음악을 끄기 위해 스피커에게 육성으로 명령어를 내리는 순간 아이가 깨버린다

- 클로바의 경우 주사위 굴리기 기능이 있는데, ‘주사위 세 개 굴려줘’와 ‘주사위 세게 굴려줘’를 구분하지 못한다.

- 편리하게 쓰자고 음성 인식 AI 스피커를 쓰는 건데 정작 스피커에게 명령을 내리기 위해서 명령어를 공부하고 외워야 한다.

- 음성 인식이 왜 이리 안되는지 모르겠다(각 AI 스피커 사용자들은 서로 자신이 쓰는 스피커가 음성 인식이 가장 안된다고 주장한다).

- 집에 혼자 있어 외로울 때 스피커랑 대화할 수 있는 것은 좋다. 고리짝 ‘심심이’와 대화하는 느낌.

▲ 둘의 이름을 번갈아 불러보면 나름대로 서로 호응도 한다.

[오가희 기자 solea@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?