"음란물 사이트 꼼짝마" 연중 24시간 일하는 'AI 단속반'

김수연 2017. 8. 16. 18:15
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

24시간 연중무휴 일하는 'AI 음란물 단속반' 떴다
포털·SNS 사업자들 'AI 프로그램' 속속 투입
네이버 '엑스아이' 실시간 감지 검색노출 막아
카카오, 스팸·성인 이미지 분류 '딥러닝' 적용
페북은 '클로킹 게시물' 차단에 적극 활용 중

최근 네이버, 카카오, 페이스북 등 국내외 포털·SNS 사업자들이 AI 기술을 적용한 프로그램을 자사 서비스 내 '음란물 단속반'으로 속속 투입하고 있습니다. AI를 활용해 사업자로서는 음란물 등 불법 유해 정보 유포를 방지할 수 있는 조치에 대한 사회적 요구를 해결하는 동시에, 사내 콘텐츠 모니터링 담당 인력들의 업무 부하를 줄일 수 있는 일석이조 효과를 노리는 것으로 보입니다.

#여자친구에게 꽃을 선물하려고, 업무 중 몰래 페이스북에 뜬 꽃 배달 사이트 광고를 클릭한 A씨. 모니터를 꽉 채운 포르노 이미지에 화들짝 놀라, 누가 볼 새라 컴퓨터 전원을 꺼버렸다. 이제 A씨는 정상 사이트로 위장한 음란물 사이트가 뜰까 광고 클릭하기가 겁난다.

A씨처럼 포털·SNS 사용 중 얘기치 못한 화면이나 이미지로 인해 곤욕을 치르는 일이 없어질 수 있을까요?

365일 24시간 연중무휴 근무 가능한 'AI 단속반'이 활약하는 시대에는 불가능한 일도 아닙니다. 4차 산업혁명의 핵심 기술로 주목받고 있는 인공지능(AI) 기술이 '음란물 단속반'의 모습으로 대중 속으로 파고들고 있습니다. AI는 컴퓨터가 사람처럼 스스로 인지·추론할 수 있도록 하는 기술입니다.

네이버가 최근 음란물 필터링에 적용한 AI 기술 '네이버 엑스아이'가 대표적입니다. 네이버 엑스아이는 네이버가 자체 개발한 음란물 필터링 AI 기술로, 현재 이미지 데이터 부분에 적용 중입니다. 부적절한 내용을 담은 이미지(음란물)가 네이버에 등록될 경우 이를 실시간으로 감지해 검색 노출을 막아주는 게 이 기술의 핵심입니다.

이 기술은 네모난 돋보기로 그림을 보듯 이미지의 각 부분을 순차적으로 훑어 특징을 추출합니다. 이러한 작업을 반복해 최종적인 결과물을 기존 학습데이터의 카테고리로 분류해 음란성 여부를 판독합니다. 이미지 데이터를 하나하나 유형별로 세분화해 학습시킴으로써 필터링 정확도를 높이는 것입니다.

네이버 엑스아이의 근무시간은 연중 24시간입니다. 성인 이미지 실시간 감지 시스템이 가동되며, 감지하지 못한 극히 일부 성인 이미지의 경우 AI가 학습을 통해 진화하면서 극복하게 된다는 게 회사의 설명입니다. 앞으로는 동영상 필터링에도 이 기술이 확대 적용될 예정입니다.

카카오의 경우 2000년도 후반부터 가동했던 음란물 검수 시스템에 AI 기술을 입히는 작업을 해오고 있습니다. 포털 다음의 이미지 검색에는 업로드 되는 콘텐츠가 성인물인지 검출하는 시스템을 적용하고 있습니다. 검색 색인을 하기 전에 스팸 이미지나 성인 이미지를 제외하기 위한 전처리 작업이 필요한데, AI 기술을 활용하면 일반 이미지와 스팸·성인 이미지를 분류해 빠른 시간에 색인 대상으로 유입되는 이미지들을 분류·처리할 수 있습니다.

카카오는 2014년 7월 성인 이미지 필터링에 심층학습(딥러닝) 기술을 적용했고 매년 최신 기술로 업데이트 중입니다. 딥러닝 기술은 컴퓨터가 사람처럼 스스로 생각하고 배울 수 있도록 하는 기술입니다.

또 카카오TV의 동영상 중 이용자가 자유롭게 올리는 동영상의 경우 음란 영상이나 저작권 침해 소지가 있는 영상이 올라오는 것을 방지하기 위해 철저한 데이터 검수와 문제가 될 수 있는 콘텐츠를 걸러내는 작업이 필요합니다. 동영상의 경우 변형이 적고 비슷한 시기에 인기 있는 동영상이 몰려서 업로드 되는 경우가 많아, 기존에 검수했던 동영상과 중복되는 동영상을 찾아서 자동으로 검수할 수 있도록 하고 있다는 게 회사의 설명입니다.

중복되는 내용을 검출하기 위해, 동영상으로부터 프레임 단위로 이미지를 추출해 원본 동영상의 특징(feature)을 뽑고, 이를 양자화(디지털화 방법의 일종. 획득된 데이터(픽셀)에 숫자로 된 값을 할당하는 방식)해 특정 길이의 숫자로 된 '이미지 DNA'를 만듭니다. 이렇게 하면 결국 영상은 숫자열의 집합이 됩니다. 이 숫자들을 비교하면 동영상끼리 중복인지 아닌지 판단이 가능해지는 것이죠. 카카오는 향후 딥러닝 기술을 이용해 동영상에 보다 적합한 피처를 추출하는 방식으로 성능을 높일 예정입니다.

페이스북은 AI 기술을 클로킹(Cloaking) 게시물 차단에 활용 중입니다. 클로킹 게시물은 일반 게시물로 위장한 악성 콘텐츠입니다. 사이트 관리자가 클릭할 때는 정상적인 웹사이트로 보이지만, 일반 사용자가 클릭하면 미승인 의약품이나 등 음란물 구매 사이트로 연결되는 게 클로킹 게시물의 특징입니다.

페이스북은 이처럼 부적절한 내용을 담은 게시물을 데이터베이스에 저장하고 AI 기술을 활용해 문제가 되는 페이지, 계정 등을 실시간 적발하고 있습니다. 적발된 콘텐츠, 계정에 대해서는 삭제조치 하고 있습니다.

김수연기자 newsnews@

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?