DGIST, 1000배 빠른 빅데이터처리 기술 개발

김진호 기자 2018. 5. 28. 17:15
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

4차 산업혁명을 말할 때 늘 등장하는 대표기술은 인공지능(AI)이다.

그리고 인공지능이 실현되기 위해 필요한 기술이 빅데이터 처리 기술이다.

최근 국내 연구팀이 기존의 빅데이터를1000배 빠르게 처리할 수 있는 기술을 개발했다.

지마이너는 빅데이터를 처리하는 패턴 마이닝 기술이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

4차 산업혁명을 말할 때 늘 등장하는 대표기술은 인공지능(AI)이다.  그리고 인공지능이 실현되기 위해 필요한 기술이 빅데이터 처리 기술이다. 무수한 데이터를 효과적으로 처리해 빠르게 학습해야 보다 완벽한 AI를 구현할 수 있기 때문이다.

GIB 제공

최근 국내 연구팀이 기존의 빅데이터를1000배 빠르게 처리할 수 있는 기술을 개발했다. 김민수 대구경북과학기술원(DGIST) 정보통신융합전공 교수팀은 28일 빅데이터 패턴을 초고속으로 분석할 수 있는 '지마이너(GMiner)' 기술을 개발했다고 밝혔다.

지마이너는 빅데이터를 처리하는 패턴 마이닝 기술이다. 패턴 마이닝 기술은 대형마트의 상품 구매, 은행의 거래, 네트워크 패킷, 소셜 네트워크 등 다양한 분야의 빅데이터에서 반복적으로 나타나는 주요 패턴들을 인식하는 것을 말한다. 대형마트 진열대의 상품 위치와 그에 따른 연령별 소비자의 이용 패턴, 할인가능한 신용카드를 추천하는 등의 패턴 인식 시스템이 이미 산업 분야에 쓰이고 있다.

정보의 종류와 양이 폭증하면서 보다 효율적으로 패턴을 인식하는 마이닝 기술의 중요성이 커지고 있다. 기존의 패턴 마이닝 기술은 중간 길이의 패턴을 먼저 인식해 저장하고 더 긴 패턴을 구할 때 이를 가져다 쓰는 방식이다. 중간 길이의 패턴을 따로 저장하고 불러와야하기 때문에 메모리 부족 문제가 발생했다.

연구팀이 개발한 지마이너 기술은 GPU(그래픽처리장치) 수천 개를 사용해 임시로 계산한 중간 길이의 패턴을 먼저 조합한다. 중간 길이 패턴을 따로 저장하지 않고 바로 최종 길이의 패턴을 계산하도록 설계했다. 그 결과 기존 기술들보다 최소 10배에서 최대 1000배 빠른 분석 성능을 나타내는 것을 확인했다.

김 교수는 "메모리 부족을 일으키고 처리 속도가 느린 패턴 마이닝 기술의 한계를 극복했다”며 “기하급수적으로 증가하는 빅데이터를 메모리 문제 없이 초고속으로 패턴 분석해 다양한 산업분야에 접목할 것”이라고 말했다.

이번 연구 결과는 정보과학 분야 국제학술지 '인포메이션 사이언스(Information Sciences)' 5월호에 게재됐다.

[김진호 기자 twok@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?