닻 올린 로봇 저널리즘.."분석기사 작성에서도 파괴력 가져"

주영재 기자 2016. 1. 27. 18:22
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[경향신문] “코스피가 전날보다 4.92포인트(-0.27%) 하락한 1840.53포인트로 거래를 마쳤다. 이날 개인과 외국인이 각각 287억원, 2971억원어치를 동반 순매도하며 지수 하락을 이끌었으며, 기관은 3120억원을 순매수했다. 시가총액 상위 종목 중에는 오른 종목이 더 많았는데, 삼성전자(-0.62%), 한국전력(-1.94%) 삼성전자우(-1.14%)가 하락한 반면, 현대차(0.37%), 맵스리얼티1(0.49%) 삼성물산(0.68%) 등은 상승세를 보였다. 업종별로는 음식료업이 0.06%, 화학이 0.42%, 기계가 2.03% 상승했으며, 섬유의복이 -0.22%, 종이목재가 -0.57%, 의약품이 -1.49% 하락했다.”

[해당기사 보기] 코스피 4.92포인트 하락, 1840.53포인트 거래 마감

경제지 파이낸셜뉴스가 지난 1월21일 송고한 “코스피 4.92포인트 하락, 1840.53포인트 거래 마감”이라는 제목의 기사의 일부다. 기사 작성자는 ‘IamFNBOT’이다. 이름에서 알 수 있듯이 사람이 아닌 로봇이다. 국내에서 처음으로 언론사가 로봇을 기사 작성에 도입한 사례다.

독일 베를린에서 지난해 5월 8일 열린 스타워즈 피규어 전시회에 참석한 한 기자가 스타워즈의 로봇 ‘C-3PO’의 피규어를 카메라로 찍고 있다. Photo by Clemens Bilan/Getty Images

기사 말미에는 “이 기사는 파이낸셜뉴스와 협업으로 서울대학교 이준환·서봉원 교수 연구팀이 개발한 기사 작성 알고리즘 로봇이 실시간으로 작성한 기사입니다”라고 쓰여있다. 서울대 정보문화학과 이준환 교수는 지난해 4월 야구 기사를 알고리즘으로 작성한 국내 로봇 저널리즘의 선구자이다. 같은 대학 융합과학기술대학원의 서봉원 교수도 ‘인간 컴퓨터 상호작용’(HCI·Human Computer Interaction)의 최고 권위자로 인정받는다.

파이낸셜뉴스를 시작으로 국내 로봇저널리즘도 본격적으로 상용화의 단계에 들어섰다. 해외에서는 AP통신이 2014년 7월부터 금융 속보를 로봇에게 맡기고 있다. 지난해 1월 AP가 공개한 로봇의 ‘실적’은 대단했다. 분기당 약 4300건의 기사를 처리해 이전 ‘사람 기자’가 처리했던 양보다 14배가 많았다.

[로봇 저널리즘 알고리즘을 알고 싶다면?] 저널리즘 “포털 야구 중계, 로봇 저널리즘이 대체 가능해”

엄호동 파이낸셜뉴스 온라인편집부국장은 로봇 저널리즘 도입을 “언론이 제조업에서 서비스업으로 바뀌는 패러다임 전환의 중요한 전기를 마련한 사례”라고 평가했다. 엄 부국장은 로봇 저널리즘 도입이 단순히 속보 부담을 줄이기 위해서만은 아니라고 밝혔다. 로봇 저널리즘으로 불특정 다수를 위한 기사에서 ‘개인별 맞춤형 기사’로 기사 성격이 바뀔 것이라고 전망했다.

아직 로봇이 생산하는 기사의 양은 많지 않다. 엄호동 부국장은 “현재는 서비스 안정화와 콘텐츠 신뢰도를 검증하기 위한 베타 단계로 하루에 한 건의 기사만 쓰는데 실제로는 1분 단위도 가능하다”며 “본격적으로 활용하면 증권 분야의 속보 처리 업무는 줄어들 것이다”고 내다봤다. 엄 부국장은 본격 활용 단계가 한달 내로 시작될 것이라고 전했다.

로봇이 기사를 작성하는 데 대한 편집국 내의 우려도 없지는 않았다. 오보의 가능성 때문이다. 엄 부국장은 이에 대해 “기계가 기사를 잘못 썼다면 사림이 알고리즘을 잘못 썼기 때문이다”며 “정확한 알고리즘만 짜여있으면 오보의 우려는 크지 않다고 본다”고 말했다. 편집국 내부에서도 로봇이 생산한 기사에 대해 ‘내용면에서 흠잡을 곳이 없다’고 평가할 정도라고 덧붙였다.

로봇 저널리즘의 도입으로 속보보다 분석 기사 작성의 중요성이 높아질 것이라는 전망도 나왔다. 그는 “속보에서 사람이 로봇과 경쟁할 수 없는 단계에 왔기 때문에 앞으로 기자는 로봇이 할 수 없는 영역인 ‘왜’에 주목해야 한다”며 “로봇을 잘 활용하면 속보 처리에 쏟을 시간을 분석에 돌릴 수 있을 것이다”고 말했다.

그러나 한편에서는 로봇 역시 분석 기사 작성에 투입될 가능성도 있다. 알고리즘은 방대한 데이터를 수집해 지표로 만드는 일에 능하기 때문에 데이터의 일정 패턴을 분석해 기사를 만들 수 있다. 엄 부국장은 “로봇은 알고리즘으로 데이터를 실시간 추적해 기사가 필요한 시점에서 바로 텍스트화하고 거기에 그래프와 차트도 같이 붙일 수 있다”며 “데이터를 읽고 기사 작성, 차트 작성까지 0.3초만에 끝난다”고 말했다.

파이낸셜뉴스는 로봇 저널리즘을 금융 이외의 분야로 확대할 계획이다. 로봇이 잘 읽을 수 있는 패턴의 데이터가 금융 쪽 특히 증권시장에서 나오기 때문에 이 분야의 기사 작성을 먼저 하고 있지만 로봇 학습을 통해 고도화가 이뤄지면 다른 분야로 활용 범위가 넓혀질 것이라는 기대를 하고 있다. 이른 시일 내에 회사의 CMS(기사편집기)와 로봇의 연동작업을 완벽하게 만들어 실시간으로 기사를 처리할 수 있게 만드는 것도 목표다. 아래는 엄호동 부국장과의 일문일답이다.

-언제부터 로봇이 기사를 생산했나

지난주 목요일(21일)부터 출고했다. (댓글에도 로봇이 반응할 수 있냐는 질문이 기사 댓글에 달렸다) 댓글에도 응답을 할 수 있도록 알고리즘을 짤 수 있다. 로봇은 결국 사람이 알고리즘을 어떻게 짜냐에 따라 달라질 수 있다. 로봇이 기사를 만들면 개인별 맞춤형 기사가 가능해진다. 사람이 쓰면 불특정 다수를 독자로 상정할 수 밖에 없지만 로봇은 1인에 특화된 기사를 생산해 보낼 수 있는게 가능하다.

-금융 외에 다른 영역으로 확장할 계획은?

확대는 머지 않은 미래이다. 금융에만 적용하려고 만든 것이 아니라 활용 범위는 무궁무진하다. 로봇이 잘 읽을 수 있는 패턴의 데이터가 금융 쪽 특히 증권시장에서 나와서 그리고 증권 쪽에서 실시간 기사가 필요해서 한 것이다. 로봇 학습을 이용해 알고리즘을 고도화하면서 기사의 품질을 높이고 활용 범위도 넓힐 계획이다.

-로봇이 생산하는 기사의 양은?

지금 알고리즘 자체는 기사의 양을 무궁무진하게 늘릴 수도 있다. 기사만 나오는게 중요한 게 아니라 기사를 생산할 때 필요한 데이터 소스와 전달하는 퍼블리싱 부분이 붙어야 한다. 서비스 안정화와 콘텐츠 신뢰도를 봐야해서 하루에 하나만 쓰는데 실제로는 1분 단위도 가능하다. 현재도 데이터 하나로 5개 국어로 생산할 수 있다. 영어를 읽어서 한글로 번역하는 건 어렵지만 데이터를 읽어서 각국 언어로 만드는 건 장벽이 안된다.

-편집국 내 반응은?

작년부터 추진하면서 우려가 있었다. 오보를 어떻게 막을 거냐가 주된 우려였다. 오보는 사람이 내는 것이지 기계가 내는 것이 아니다. 기계가 기사를 잘 못 썼다면 사림이 알고리즘을 잘 못 쓴거지 기계가 아니다. 정확한 알고리즘만 짜여있으면 기계의 오작동은 있겠지만 그게 아닌 이상은 오보의 우려는 없다. 편집국 내에서도 시도해보고 판단해보자는 합의가 있었고 막상 나오는 걸 보더니 인정하는 분위기다. 이 정도면 내용 면에서 흠이 없다. 사람이 스트에서 로봇과 경쟁하는 건 경쟁이 안되기 때문에 앞으로 분석 기사의 중요성이 높아질 것이다. 로봇이 할 수 없는 영역인 ‘왜’라고 묻는 것이다. 주가가 왜 떨어졌고 언제 다시 오를 수 있나. 이런 분석은 사람이 할 수 있는 일이다. 로봇을 잘 활용하면 속보 처리에 쏟을 시간을 분석에 돌릴 수 있는 부분이 있지 않을까 기대하고 있다.

-편집국 내에서, 특히 증권 담당자로부터 업무 부담이 줄어들었다는 피드백이 있나?

아직까지 본격적으로 기사를 내지 않고 있고 시범 형태로 내고 있어서 일을 덜어주는 단계는 아니다. 본격적으로 활용하는 것은 늦어도 한달 내에 시작할 것이다. 예상보다 일찍 오픈한 상태다. 지금은 내용과 형식에 대한 공개적 평가를 받는 시기라고 보면 된다. 어느 정도 질이 담보가 된다면 그때부터 본격적인 업무를 시작할 것이고 증권 분야의 속보 처리 업무는 줄어들 것이다.

-개인화된 기사는 어떻게 만들어지나?

내가 만약 전자 관련주를 갖고 있다면 전자 관련주만 보고 싶은데 자동차 주식이 나와봐야 관심 없다. 처음부터 제공받을 기사를 선택해서 그 분야의 기사만 제공받는 것이다. 사람은 그것이 불가능한데 기계는 된다.

-속보처리로 기자 부담을 더는 것도 좋지만 개인화된 기사까지 만들어내면 독자들을 유인할 수 있는 기회도 될 것 같다. 비즈니스 모델은?

맞다. 활용 가치가 높아서 하는 것이지 기사 몇 개 쓰려고 하는 것은 아니다. 미래를 보려고 한다. CMS도 지난해 디지털로 전환했다. CMS에 로봇 계정이 발급된 상태로 로봇이 로그인해 기사를 쓴다. CMS와 연동작업이 완벽해지면 실시간으로 기사를 생산할 수 있다.

-기사 작성 주기는 어떻게 정하나

명령값에 따라 다르다. 1분마다 쓰라고 할 수도 있고 이슈가 발생했을 때 쓰라는 식으로 부정기적으로 할 수도 있다. 밤부터 쓰라고 할 수도 있다. 사람이 아니기 때문에 불만이 있을 수 없다.

-로봇 기사 어떻게 도입했는가

지난해 도입을 계획했고 서울대에서 기술을 지원받고 있다. 패러다임의 중요한 전기를 마련한 사례다. 제조업에서 서비스업으로 바뀌는 정도의 전환이기 때문에 이슈가 될 것으로 본다. 인터넷 상에 있는 데이터를 찾아서 판단하고 데이터를 읽고 기사를 만들어내는 것은 수집 자체부터가 노하우이기 때문에 다른 언론사와의 협업은 아직 생각하지 않고 있다. 종이신문 시스템은 앞으로 디지털에서 변화하기 힘들다. CMS 시스템이 뒷받침되지 않으면 디지털 시대에 어려움이 많다. 로봇 기사 제작도 그런 부분이 연동되어야 한다. 우리는 이미 기자 명단에 로봇 아이디 값이 있다.

-분석 기사에도 활용할 수 있지 않을까

맞다. 현재는 증권기사만 하고 있는데 스포츠를 보자. 하일성이나 허구연씨가 해설로 유명한데 이게 가능했던 이유가 선수 한명 한명의 개인 프로필이나 실력에 대한 정보를 많이 갖고 있는 분들이다. 이대호가 홈런을 치면 ‘통상 몇 호다’ 바로 나온다. 지금 기자들 중에 그런 많은 정보를 외우고 있는 사람들이 드물다. 그래서 기사 쓸 때 당일 경기 위주로 기사가 나오니 비슷비슷한 속보 기사가 된다. 반면 로봇은 이대호의 첫 홈런부터 모든 데이터를 갖고 있다. 초등학교 때부터 치면 통상 몇호고 특히 12월달과 비교하면 5월에 집중됐다. 이런 식으로 분석해 ‘역시 이번 달에도 결국 홈런을 처내는군요’라는 식의 기사를 쓸 수 있다.

굉장히 많은 데이터를 다 들여다봐야 좋은 기사 하나가 나온다. 오늘도 통계 쪽에서 지난해 우리나라 지역별 인구이동 현황이 나왔다. 데이터를 들여다보기 어렵기 때문에 결국 이런 기사도 보도자료 위주로 가게 된다. 분석능력이 되는 인력풀도 없고, 비용과 시간 대비 효율성도 낮다. 로봇은 이걸 실시간으로 또는 주간 단위로 만들 수 있다. 엄청난 데이터 기사가 나올 수 있다. 알고리즘으로 데이터를 실시간 추적해 기사가 필요한 시점에서 바로 텍스트화하는 것이다. 텍스트만 나오는게 아니라 그래프와 차트도 같이 만들 예정이다. 데이터를 읽고 기사 작성, 차트 작성까지 0.3초만에 끝난다.

다들 로봇으로 속보만 쓰냐 식으로 얘기하는데 로봇의 실력을 생각하면 이 쪽이 오히려 파괴력이 크다. 또 다른 예로 미국 증시 들여다보고 기사를 쓰려면 밤에 해야 하는데 굉장히 힘들다. 로봇은 밤이고 낮이고 기사를 써서 내보낼 수 있다. 지금까지 국내에서는 이 분야가 어려웠던 이유가 언어의 장벽 때문이었다. 영어는 언어구조가 로봇이 알고리즘을 적용하기가 쉽다. 문장을 만들기가 쉽다. 한글은 문장 만들기가 어렵다. 구글의 경우도 사람과 기계의 번역 일치율이 가장 낮은 언어가 한글이다. 긍정·부정인지 사람이 읽기 전까지 확실치 않는게 많다. 금융 데이터의 경우 긍정·부정을 잘못 해석하면 엄청난 손실이 발생할 수 있기 때문에 도입이 늦어졌다. 데이터 읽는 게 문제가 아니라 한글화 시키는 것이 문제였다.

<주영재 기자 jyj@kyunghyang.com>

Copyright © 경향신문. 무단전재 및 재배포 금지.