음성인식 인공지능이 패러다임이 되는 순간

손현덕 2018. 7. 9. 15:48
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

/사진=게티이미지뱅크
[구석구석 4차 산업혁명 탐구-13] 2년 전에 회사 업무 차 일본을 간 적이 있습니다. 일본어에는 그야말로 까막눈인지라 길을 찾아가는 것도 저에겐 쉬운 일이 아니었습니다. 그런데 인공지능 덕을 아주 톡톡히 봤습니다. 스마트폰에 우리말로 "여기서 가장 가까운 곳에 아침에 따뜻한 오뎅을 파는 식당이 어디 있습니까"라고 입력해 그걸 일본어 음성으로 주위 사람에게 물어볼 수 있었습니다. 그랬더니 일본 사람이 알아듣고 친절하게 길을 가르쳐주는 것이었습니다. 그 말을 제가 알아들을 리 없죠. 제 휴대폰에 대고 말을 하라고 하고 그걸 우리말로 번역하니 아주 쉽게 정보를 얻을 수 있었습니다. 이런 게 기본이죠.

2017년 1월 초 미국 라스베이거스에서 열린 세계가전박람회(CES)에 간 적이 있었습니다. 여기서 세계인의 이목을 집중시킨 단 하나의 아이템을 꼽으라면 그건 아마존의 알렉사였습니다. 음성인식서비스지요. 이 알렉사가 지금 음성인식의 생태계를 주도하고 있습니다. 알렉사는 스피커가 있어야 하는데 그게 에코(Echo)입니다. 이 에코라는 스피커가 알렉사라는 음성 서비스(Alexa Voice Service)와 연결됩니다. 에코는 하드웨어, 알렉사는 소프트웨어라고 보면 됩니다.

담당자의 설명은 이렇습니다. "알렉사는 연결된 전자 제품 어디에나 음성 지원 서비스를 제공할 수 있는 똑똑하고 확장성이 뛰어난 클라우드 서비스입니다. 스피커만 있으면 누구나 사용 가능합니다." 그는 사용자가 알렉사 지원 제품에 대고 말하면 음악 재생, 질문 응답, 뉴스 및 지역 정보 검색, 그리고 스마트홈 제품 조종 등이 가능하다고 자랑합니다. 제가 테스트해 본 건 날씨, 스포츠 경기 결과, 음악 재생 등이었습니다. 그런데 아직은 초보 수준입니다. 예를 들어 "오늘 서울 날씨 어때" 이런 질문엔 쉽게 답하지만 조금 어렵게 들어가면 알아듣지 못합니다. "오늘 아침 매일경제신문 1면 톱에 뭐가 나왔지"하면 대답을 못합니다. 그래서 뉴욕타임스는 이를 두고 "꽤 멍청한 수준"이란 평가를 내렸나 봅니다. 그러나 알파고가 1개월 만에 바둑의 천하고수가 됐듯이 이런 음성인식서비스가 어느 날 인간의 능력을 훌쩍 뛰어넘을지 모를 일입니다.

그러나 이보다 더 중요한 질문이 있습니다. 그건 "'보이스'로 업무를 처리하고 생활의 편의를 추구하는 게 대세가 될까요"라는 질문일 것입니다. 통상적으로 새로운 제품이나 서비스, 제도 같은 것이 탄생에서부터 시작해 우리 생활에 깊숙이 뿌리내리기까지는 크게 3단계 발전과정이 있다고 합니다. 1단계는 패션(fashion)입니다. 처음에는 유행처럼 시작하지요. 일부 선각자, 얼리어답터들에게만 통용됩니다. 그러다가 제법 많은 사람들이 이 패션을 쫓아갑니다. 그럼 그건 트렌드가 됩니다. 2단계입니다. 그리고 트렌드가 장기화되고 많은 사람들이 여기에 합류하게 되면 그게 패러다임이 됩니다. 전 지구적으로 볼 때 패션은 10만~20만명, 트렌드가 되려면 1000만명 정도는 돼야 하고 이게 1억명, 10억명을 넘어서면 그때는 패러다임이 되는 거지요. 대부분의 한국인들이 사용하는 카카오톡도 이런 추세선을 따라왔습니다.

보이스 역시 처음에는 유행으로 시작했습니다. 일부 신기한 걸 좋아하는 사람들이 집에 스피커를 두고 아주 기초적인 음성인식서비스를 이용했습니다. 그러다가 이제는 이걸로 항공 예약도 하고, 피자 배달도 주문하기 시작했습니다. 2015년 음성인식서비스를 이용하는 사람이 전 세계적으로 4000만명을 육박했습니다. 이 정도면 확실한 트렌드일 겁니다. 이게 패러다임이 되려면 수억 명은 돼야 할 겁니다. 한 전문기관의 예측에 따르면 2021년. 그러니까 2년 반 정도 지나면 그때는 18억명의 인구가 음성인식을 이용할 것이라고 합니다. 그러면 확연한 패러다임이 될 겁니다.

이제 우리는 한 단계 더 나아가 생각해야 할 때입니다. 보이스가 패러다임이 되면 무엇이 달라질 것인가라는 점입니다.

인터넷이나 모바일에 접속을 하지 않을 것입니다. 그냥 스피커에 말로 하면 되니까요. 검색도 안 할 것입니다. "다음주 일본 도쿄 출장 가는 비행기 스케줄 알려줘"라고 말하면 되니까요. 그러면 가장 싼 비행기 편을 스피커가 알려줄 겁니다. 지금 인터넷에서 검색하는 여러 절차를 말 한마디로 하는 거지요. 정확하게 말하면 인공지능 스피커에게 검색 작업을 대신 시키는 겁니다. 지금 구글과 네이버가 이 분야에 대대적인 연구와 투자를 하는 것도 그런 이유입니다. 그다음 결제가 없어질 겁니다. 그 자리에서 바로 지불하니까요. 굳이 은행 이용할 필요가 있을까요? 음성인식, 즉 보이스가 패러다임이 되는 순간 우리의 삶은 정말 혁명적으로 바뀔 것입니다. 그런데 이미 보이스는 트렌드를 넘어 패러다임이 된 것 같지 않습니까?

[손현덕 논설실장]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?