AI 스피커 살까 고민 중이신가요?

김유성 2017. 10. 21. 09:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

유아동 있는 맞벌이 부부, 家內 음악듣기용 '고려할 만'

[이데일리 김유성 기자] SK텔레콤의 ‘누구’, 네이버의 ‘웨이브’, 카카오의 ‘카카오미니’, KT의 ‘기가지니’ 등 벌써 국내에 유통 혹은 유통 예정인 AI스피커 제품 갯수가 4~5가지에 이르고 있습니다. 구글이나 아마존까지 합한다면 그 수는 더 늘어나겠죠.

특히 구글의 ‘구글어시스턴트’가 스피커 형태로 나온다면 AI스피커 시장을 둘러싼 국내 시장 경쟁은 더 치열해질 전망입니다.

여기서 잠깐. 유행이라고 해도 AI스피커를 꼭 사야만 하는 이유가 있을까요? 사실 호기심으로 AI스피커를 샀다가 쓰지 않는 경우가 많이 있습니다. 자리만 차지하는 경우죠. 아직은 가상비서로서의 기능이 떨어지기 때문입니다.

진짜 AI스피커가 많이 쓰이려면 집안의 모든 일, 영화표 예약 등 외부 일이 음성만으로 가능해야합니다. 아직은 집내 사물인터넷(IoT)과 AI스피커가 연결되려면 멀었습니다. AI스피커도 이제 시작 단계입니다. 실상 AI스피커를 갖고 할 게 그리 많지 않습니다.

그렇다면 지금 이 시점에서 AI스피커를 어떻게 사용할까요. 힌트는 음악에 있습니다. 음악 재생은 AI스피커 입장에서 어렵지 않은 질의입니다. 음성 인식만 되고 음원 스트리밍 서비스와 연결만 되면 됩니다. 다행히 네이버, 카카오, SK텔레콤 모두 네이버뮤빅, 멜론 등 음원 스트리밍 서비스와 기본 연결돼 있습니다.

실제 AI스피커 구매자들이 음악 듣기용으로 이를 많이 쓰는 것으로 나타났습니다. 네이버의 개발자 컨퍼런스 DEVIEW 2017에서 클로바뮤직 담당자도 “음성 명령의 70%가 음악과 관련됐다”고 말했습니다. 클로바뮤직은 네이버·라인의 AI스피커 ‘웨이브’에 들어가는 AI음원 솔루션 명칭이라고 할 수 있습니다.

다만 음악 듣기 형태는 기존 시장과 달랐습니다. 스마트폰이나 PC에서 음악 듣기가 대부분은 이어폰을 귀에 꼽고 혼자 듣는 형태라면, AI스피커는 여러 사람이 함께 듣는 식입니다.

예컨대 이런 거죠. 퇴근해 쇼파에 누우면서 “XX야, 조용한 음악, 틀어줘” 식입니다. 아니면 ‘노래 틀어줘’ 등의 모호한 명령일 수 있습니다. 퇴근하고 집에 들어와서 쉬고 싶을 때, 곡 선택까지 고민하고 싶지는 않겠죠.

자연스럽게 AI스피커의 질의중 으뜸은 ‘노래 틀어줘’입니다. 그런데 ‘노래 틀어줘’를 AI가 실행하기 위해서는 기존 데이터가 있어야겠죠. 좀더 고도화된다면 음성의 주인공이 누구인지 식별하고, 그에 맞춰 노래를 들려줘야 합니다. 음원 재생 요청이 들어온 시점도 판별해야겠죠. 저녁 쉬고 싶을 때 시끄러운 음악을 틀어줘서는 안되겠죠. 자연스럽게 곡 추천 기능이 AI스피커에서 중요할 수 밖에 없습니다.

물론 특정 곡 이름을 지칭하면서 ‘틀어줘’ 할 수도 있습니다. 이 때도 듣는 사람이 음악만 듣고 있지 않을 가능성이 높습니다. 청소를 한다거나 설거지를 하거나 혹은 누워서 책을 볼 수도 있습니다. 매번 일일이 곡 지정을 하기는 어렵겠죠. 자연스럽게 취향에 맞는 곡을 연달아 추천해줘야 합니다.

AI스피커를 집에 놓고 쓴다는 점은 환경적으로도 스마트폰과 PC와 너무 다릅니다. 사용 시간대가 저녁시간대에 몰린다는 점이죠. 귀차니즘에 극에 달하는 시간입니다. 본인이 좋아하는 가수만 지정하고 ‘틀어줘’할 가능성이 많습니다.

굳이 AI스피커가 필요한 부류의 사람을 꼽자면 아이가 있는 맞벌이 부부를 들 수 있습니다. 맞벌이 부부의 생활은 분주하기 짝이 없습니다. 퇴근한 이후 저녁 시간은 새로운 시작이죠. 아이들 밥 주는 것부터 씻기고. 집안 청소와 빨래까지 해야합니다. 남편이든 아내든 아이들이 잠들기 전까지 숨 돌리기 힘듭니다.

이때 AI스피커가 유용할 수 있습니다. ‘날뛰는’ 아이들을 진정시키는 ‘뽀로로 노래 틀어줘’를 별다른 조작없이 음성만으로도 명령 가능하니까요.

아이를 둔 맞벌이 부부한테 AI스피커가 맞다라는 가정은 억지 추정도 아닙니다. 네이버 웨이브의 사례를 보면, 두번째로 많은 명령 단어가 ‘동요 틀어줘’였습니다. ‘핑크퐁 노래 틀어줘’도 웨이브가 많이 듣는 명령어였습니다. 저녁 시간대 AI스피커 사용자 사이에서는 ‘아이유’보다 ‘핑크퐁’이 더 스타인 셈입니다.

노래가 아니라면 음성 동화 재생도 가능합니다. 네이버가 올해초 ‘오디오클립’을 출범하고, SK텔레콤 ‘누구’가 팟캐스트와 연결한 것도 단순 ‘보여주기’는 아니었습니다.

최근 네이버가 시도하고 있는 일 하나를 소개하면서 마치겠습니다. 1분 미리듣기입니다. 참고로 웨이브는 ‘네이버뮤직’, 누구와 카카오미니는 ‘멜론’에 유료가입해야 듣고 싶은 음악을 통째로 들을 수 있습니다. 돈 내야한다는 거죠.

클로바뮤직팀에 따르면, 특정 곡에서 ‘하이라이트’ 부문을 부각시켜 소개하는 연구 개발을 하고 있습니다. 이 기능도 딥러닝을 통해 가능하죠.

기존 미리 듣기는 곡 시작부터 1분, 혹은 1분 30초까지만 제공했습니다. 뜸을 들이다 말았던 거죠. 그러다보니 사용자들은 그 곡의 ‘진미’를 맛보지 못하고 넘기는 경우가 많았습니다.

조금 더 곡 구매 전환율을 높이는 방법이 없을까 연구하다가 생각해 낸게 ‘에너지’였습니다. 요 에너지를 음원 내 주파수 별로 분석합니다. 쉽게 말해 노래를 부르는 가수가 힘줘 부르는 부분을 골라내는 것이죠. 연주곡도 클라이막스 부분에 강조점을 줄테고요.

또다른 방법이 있습니다. 비슷한 장르의 곡 수십곡 수만곡을 분석합니다. AI가 이들 곡을 공부합니다. 그러면서 이 부분이 ‘클라이막스’ 즉 ‘하이라이트’일 것이라고 예측합니다. 학습하는 곡 수가 많을 수록 ‘하이라이트’ 부분을 더 잘 찾아내겠죠. 클로바 뮤직에서는 이 부분을 ‘어텐션’이라고 합니다.

실험 결과 단순히 처음부터 1분, 1분30초까지 미리듣기를 하는 것보다 특정 강조점을 소개할 때, 사용자 호응이 높았습니다.

보기에 따라서는 괜찮은 방법이죠. 그렇지만 현실 적용까지는 여러 벽이 있습니다. 우선은 ‘저작권법’상 권리 단체와의 협의가 필요합니다. 이들이 어떻게 이를 해석하느냐에 따라 좀 달라질 수 있을 것 같습니다. 뭐든 그렇죠. 기술이 현실 서비스로 구현되기에는.

결론을 내리며 마치겠습니다. AI스피커 구매 고려하신다면, 우선 본인이 음원 스트리밍 서비스에 유료 가입돼 있는지 확인하셔야 합니다. 최근들어 AI스피커를 구입하면 음원스트리밍 이용권을 주기도 합니다. 이 부분 고려하시면 됩니다.

집 안에서 사용한다는 점도 생각해야합니다. 사무실처럼 공동 공간에서는 스피커로 음악 듣기가 민망하겠죠. 집에서 음악 등 음성 콘텐츠를 들을 일이 있으셔야 합니다.

한편으로는 꼭 AI 스피커를 살 필요가 없다는 점도 말씀드리고 싶습니다. 블루투스 스피커가 시중에 많기 때문입니다. 스마트폰으로 스피커를 연결하고 들으시면 됩니다. 스마트폰 내 구글어시스턴트, 클로바를 실행하고 말씀하시면 그대로 실행됩니다. ‘음악듣기’ 용이라면 이렇게 사용해도 충분합니다.

김유성 (kys401@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?