IT

듣는 AI에서 보는 AI로.. 눈 돌리는 IT기업들

강동철 기자 2018. 5. 11. 03:12
음성재생 설정

이동통신망에서 음성 재생시
별도의 데이터 요금이 부과될 수 있습니다.

번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

스피커에서 카메라로 시장 변화.. 언어장벽 없어 해외 진출 쉬워

세계 최대의 인터넷 기업 구글은 지난 8일(현지 시각) 미국 캘리포니아주(州) 마운틴뷰에서 연 개발자대회 'I/O'(Input/Output)에서 LG전자·샤오미·소니 등 주요 스마트폰에 인공지능(AI) 카메라 '구글 렌즈'를 탑재하겠다고 밝혔다. 세계 전역에 10억대 이상 판매된 안드로이드 스마트폰에 구글 렌즈를 제공해 시각 AI 시장을 장악하겠다는 것이다. 새로운 기능들도 대거 탑재됐다. 구글 렌즈를 켜고 길을 비추면 자동으로 어느 길로 가야할지 AI가 경로를 안내해주고, 종이 문서를 비추면 자동으로 파일로 변환해 편집·공유할 수 있도록 해준다. 단, 자체 시각 AI 서비스에 주력하는 삼성전자 스마트폰은 제외됐다.

구글뿐 아니라 아마존·삼성전자·마이크로소프트(MS) 등 글로벌 주요 IT(정보기술) 기업들이 최근 들어 스마트폰과 고해상도 카메라를 활용한 시각(視角) AI 서비스를 확대하고 있다. 그동안 AI는 아마존 에코, 구글 홈, 네이버 클로바, SK텔레콤 누구 등 음성 인식 스피커 위주였지만 이제는 보는 AI로 바뀌고 있는 것이다. 정보통신기술진흥센터는 최근 보고서를 통해 "그동안 건설, 물류 등 산업 현장에서 주로 쓰여왔던 시각 AI가 스마트폰 카메라에 탑재되면서 본격적으로 확장되고 있다"고 밝혔다.

카메라로 비추면 번역부터 쇼핑까지 한 번에

MS는 지난 7일 미국 시애틀에서 연 개발자대회 '빌드'에서 미국 반도체 기업 퀄컴과 손잡고 시각 AI 기술을 개발하겠다고 밝혔다. 퀄컴의 반도체와 MS의 AI 기술을 카메라에 탑재해 실시간으로 이미지와 동영상을 분석하는 서비스를 제공할 계획이다. 또 MS는 작년 7월에는 시각장애인용 AI 서비스인 '씽잉(Seeing) AI'도 선보였다. 씽잉 AI는 앞을 보지 못하는 사람 대신 스마트폰의 카메라가 전담 비서처럼 글도 읽어주고 주변 장애물도 안내해준다.

미국 최대의 전자상거래 기업인 아마존은 작년, 의상 추천 기능을 제공하는 AI 카메라 '에코 룩'을 출시한 데 이어 시각 AI 기술인 '딥렌즈'를 공개하면서 시각 AI 사업 강화에 나섰다. 딥렌즈는 사용자 차량의 번호판을 인식해 차고 문을 열어주거나 집에 도둑이 들면 경찰에 신고하는 식의 서비스를 제공한다. 아마존웹서비스 앤디 제시 최고경영자(CEO)는 "사용자가 원하는 기능을 딥렌즈에 추가할 수 있어 맞춤형 시각 AI로 쓸 수 있다"고 말했다.

독자 노선을 선택한 삼성전자는 지난 3월 출시한 갤럭시S9에 시각 AI인 '빅스비 비전'을 탑재했다. 빅스비 비전은 카메라를 켜고 외국어로 돼 있는 안내판, 메뉴판 등을 비추면 한글로 번역해주고 사물·건물 등을 비추면 전화번호 등 관련 정보를 알려준다. 쇼핑, 음식, 메이크업 추천 기능도 제공한다. LG전자도 최근 공개한 스마트폰 G7에 AI 카메라와 Q렌즈라는 시각 AI 기능을 탑재했다.

음성과 시각을 결합한 AI 서비스도 등장하고 있다. 구글과 아마존은 AI 스피커에 디스플레이 화면을 탑재해 시각 정보도 제공하는 '스마트 디스플레이'와 '에코 쇼'를 선보이면서 음성·시각 AI를 동시 공략한다.

편리함을 내세워 서비스 확대

글로벌 IT 기업들이 시각 AI에 집중하는 이유는 음성 AI가 가진 언어의 한계를 극복하기 위해서다. 아마존의 AI 비서인 알렉사는 미국에서는 시장 점유율 70%를 차지하고 있지만, 영어로만 대화해야 하기 때문에 비(非)영어권에서는 아직 점유율이 미미하다. 반면 빅스비 비전이나 구글 렌즈 같은 시각 AI는 카메라에 자동 번역 기능도 있어 사물이나 거리를 비추기만 하면 관련 정보들을 편하게 볼 수 있다. 번역 기능 역시 음성보다는 텍스트가 훨씬 정교하다.

정보량도 시각 AI가 음성 AI보다 풍부하다. AI 카메라는 동영상, 사진, 문서 등 다양한 형식으로 정보를 제공하기 때문이다. 시각 AI는 음성인식 스피커 같은 별도 기기도 필요 없다는 점도 장점이다. IT 업계 관계자는 "애플의 시리 같은 음성 AI가 먼저 등장했지만 최근에는 스마트폰 카메라를 활용한 시각 AI가 각광받고 있다"며 "확장성과 사용성을 감안해보면 시각 AI가 소비자들에게 더 편리할 것"이라고 말했다.

- Copyrights ⓒ 조선비즈 & ChosunBiz.com, 무단 전재 및 재배포 금지 -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?