소설 쓰는 알파고는 없었다

2016. 6. 26. 20:56
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[한겨레]

알파고의 충격이 채 가시지 않은 지난 3월말 인공지능이 쓴 소설이 일본의 문학상 예심을 통과했다는 소식이 전해지며 화제를 일으켰다. 인공지능은 소설을 쓰는 수준으로까지 발전한 걸까? 대답은 ‘아니오’다. 최근 인공지능 열풍 속에서 나온 ‘소설을 쓰는 인공지능’에 대한 소식은 언론 보도 과정에서 사실상 과장된 것으로 나타났다.

일본 호시 신이치상의 1차 예심을 통과한 소설의 인공지능 개발자로 알려진 사토 사토시(56) 일본 나고야대 교수는 지난달 26일 <한겨레>와 만나 “소설을 쓰는 프로그램 개발을 더는 하지 않을 계획”이라고 밝혔다. 또한 소설은 인간이 더 잘할 수 있는 영역이므로 “더 이상 미래성이 없다”고 주장했다.

사토 교수는 인공지능이 소설을 쓸 수 있도록 하는 것을 목표로 하는 ‘변덕쟁이 인공지능 프로젝트 작가예요’ 프로젝트의 일원으로 참여했다. 이 프로젝트의 총괄 책임자인 하코다테미래대 교수의 마쓰바라 히토시 교수는 지난 3월21일 일본 도쿄에서 열린 프로젝트 보고회를 열어 문학상 예심 통과 사실을 발표했다. 그는 이 자리에서 “드디어 소설다운 형태로 응모하는 데까지는 왔지만, 현시점에서 기여도를 말한다면 에이아이(AI)가 20%, 인간은 80%라고 볼 수 있다. 하지만 2년 뒤에는 인공지능이 완벽하게 소설을 쓸 수 있게 하겠다”고 밝힌 바 있다.

일 문학상 예심 통과 들썩했지만
개발자 사토 교수 '미래성' 비관
“인간이 전부 썼다는 말도 맞다”

이에 대해 사토 교수는 인터뷰에서 마쓰하라 교수의 말을 “립서비스”라 일축하며, “(현재의 기술로 만든 소설은) 컴퓨터가 100% 썼다고 해도 상관없지만, 인간이 전부 썼다는 말도 맞다”고 밝혔다. 사토 교수팀은 이야기의 얼개와 단어 등을 모두 직접 작성한 뒤, 이 단어들을 무작위로 재조합하는 프로그램을 이용해 소설을 만들었다. 2500자 정도의 단편소설을 생성하기 위해 수만 줄의 명령어로 프로그램을 작성했다. 그는 “소설은 정답이 없는 영역이어서, 답을 찾아가는 과정인 머신러닝을 적용하지 않았다”고 말했다.

신이치상 예심 통과 사실이 알려지자 인공지능의 장밋빛 전망이 강조됐다. 또한 외신으로 전해지며 기술 수준에 대한 평가가 과장된 것으로 보인다. 조성배 연세대 교수(컴퓨터과학)는 26일 “인공지능은 인간의 지적 ‘기능’을 구현한 것인데, 실제로는 어떻게 해야 하는지 몰라서 결과적으로 그런 것처럼 보이도록 하는 방식을 취하는 경우가 많다. 결과물만 보고 침소봉대해 그 실체에 대해 막연한 두려움을 가질 필요는 없다”고 말했다.

나고야/음성원 기자 esw@hani.co.kr

8할이 인간의 작업…AI 소설, 아직은 ‘오지 않은 미래'

인간에게 바둑을 이긴 알파고의 충격이 채 가시지 않은 지난 3월 말께 충격적인 뉴스가 세간에 오르내렸다. 인공지능이 쓴 소설이 일본의 ‘호시 신이치상’이란 문학상에서 1차 심사를 통과했다는 소식이다. 4차 심사 뒤 발표된 최종 당선작에는 포함되지 않았다. 하지만 1450편의 소설 중 1차 심사를 통과했다는 사실만으로도 충분히 놀랄 만했다. 아무리 ‘알파고’의 시대가 되어도 ‘인간의 영역’으로 남을 것이라 여겨진 소설마저도 인공지능으로 대체될 수 있다는 신호로 받아들여지며 충격을 안긴 것이다. 언젠간 그런 일이 있을 것이라 예상했던 사람들 역시 이렇게 일찍 다가온 미래에 대해 놀랄 수밖에 없었다. 인공지능이 소설을 쓸 수 있다는 말은 모든 직업이 전부 사라질 수 있다는 의미다. 인공지능의 시대, 인간이 설 자리는 비좁아질 수밖에 없을까? <한겨레>는 지난달 26일 일본으로 날아가 소설 쓰는 프로그램을 만든 사토 사토시(56) 나고야대 교수를 만났다.

지난달 26일 일본 나고야대에서 만난 사토 사토시 교수(전자정보시스템 전공). 그는 소설은 답이 없는 영역으로 머신러닝이 불가능하며, 향후 발전가능성도 낮은 것으로 예상했다.

사토 교수는 공립 하코다테미래대학의 마쓰바라 히토시 교수가 주도한 인공지능의 신이치상 도전 프로젝트에 참여했다. 그는 “이번에 신이치상에 출품한 작품 중 11개 작품이 컴퓨터와 관련이 있는 것으로 알고 있다. 그중 4개 작품은 누가 썼는지 알고 있고, 2개 작품이 우리 팀에서 낸 것이다. 하나는 내가, 또 하나는 제자가 제출했다”고 설명했다. 나머지 2개 작품은 ‘에이아이(AI)울프’란 팀에서 제출했다.

이 문학상의 주최 쪽에서는 1차 예심을 통과한 작품이 무엇인지 공식적으로 확인해주지 않고 있다. 사토 교수 역시 “내 작품이 통과했는지 여부는 모른다”고 답했다. 다만 일본 언론들은 통과 작품이 아마도 사토 교수팀의 작품인 ‘컴퓨터가 소설을 쓴 날’일 것으로 보고 있다.

“주식시황 자동기술 방식과 비슷”
기본 소설의 내용과 흐름 등
수많은 단어 모두 미리 넣어둬
사용자 설정 따라 연결해주는 식

우선, 어떤 방식으로 인공지능이 소설을 쓸 수 있었는지 묻는 데 질문의 초점을 맞췄다. 사토 교수는 인공지능이란 표현은 쓰지 않았다. 단지 “프로그램이 소설을 썼다”고 말했다. 프로그램이 하는 일은 사용자가 몇 가지 설정에 따라 “언제, 어떤 날씨에, 무엇을 하고 있다”는 등의 요소를 포함하도록 지시하면 적절한 단어들을 무작위로 골라내 어울리는 형태로 문법에 맞춰 적절히 연결해주는 일이다. 사토 교수는 이를 위해 모든 일의 토대가 되는 기본 소설의 내용과 흐름을 포함해 주어에 해당하는 단어, 목적어에 해당하는 수많은 단어를 모두 꼼꼼하게 미리 작성해 이 프로그램 안에 넣어둬야 했다.

프로그램을 실행시키면 이야기가 무작위로 만들어진다. 예컨대 프로그램이 ‘바람이 강한 날씨’를 선택하게 되면, 그것에 맞춰 다음 글도 ‘창문을 모두 닫은 방’ 등의 내용이 나오도록 자연스럽게 문맥을 조정한다. 이를 반복해 의미를 갖는 긴 문장을 만들어내는 방식이다. 사토 교수는 “기본적으로는 주식시황이나 스포츠 기사를 쓰는 프로그램과 같다”고 설명했다.

기계가 쓴 네 개의 소설. 사토 사토시 나고야대 교수팀이 개발한 소설 쓰기 프로그램을 실행해 무작위로 에피소드 네 개를 만들었다. 네 개의 소설에서 따로 표시한 부분처럼 매번 똑같이 등장하는 단어가 있는 반면 등장인물과 날씨, 간단한 내용 등이 변화하는 것을 볼 수 있다.

■ “엄밀한 의미의 인공지능 아니다”

신이치상에 소설을 출품하는 프로젝트의 총책임자는 마쓰바라 교수였다. 그는 지난 3월21일 열린 호시 신이치상 응모 보고회에서 사토 교수를 포함한 프로젝트팀들의 작업에 대해 “인간이 80%, 컴퓨터가 20% 정도의 일을 한 것”이라며 “앞으로 인간의 개입을 줄여나가겠다”고 밝힌 바 있다. 하지만 이 표현에 대해 사토 교수는 “제가 한 말이 아니다”라며 그 표현에 대해 생각해볼 필요가 있다고 강조했다.

그는 여러 형태로 조립이 가능한 레고에 견줘 설명하기 시작했다. “예를 들어 누군가가 레고로 매뉴얼에 나온 그대로 집을 만들었다고 합시다. 그러면 그 집을 누가 만든 거죠? 매뉴얼이 만든 건가요, 아니면 매뉴얼을 만든 사람이 만든 건가요? 저희는 단어 하나하나를 어떻게 연결할 것인지에 대한 매뉴얼을 만든 겁니다.”

그는 “그런 점에서 컴퓨터가 일한 부분이 10~20% 정도라면 그렇게 말할 수도 있고, 100% 컴퓨터가 썼다고 말해도 상관은 없다. 또 그 프로그램은 전부 인간이 만든 것이니 컴퓨터가 아니라 전부 인간이 쓴 소설이라고 해도 그 표현이 맞다고 생각한다”고 말했다. 인간이 쓴 소설을 기반으로 인간이 설정해둔 단어 범위 안에서 변주가 일어난다면, 시각에 따라 이 소설은 ‘인간이 쓴 것’으로 볼 수도 있다는 설명이었다.

이 프로그램의 작동 방식과 사토 교수의 설명을 듣고 나면, ‘이게 과연 인공지능일까’라는 의구심이 들 수밖에 없다. 이에 대해 김찬수 한국과학기술연구원(KIST) 연구원은 26일 “엄밀한 의미의 인공지능은 학습(learning)과 진화(evolution)라는 개념이 포함돼 있어야 한다. 그런 엄밀한 정의에 따른다면, (사토 교수의 프로그램이) 인공지능이라 부르기는 어려울 것 같다”고 말했다. 여기서 말하는 학습과 진화란 컴퓨터 프로그램이 작동하는 과정에서 인간의 개입 없이 업데이트가 이뤄지고, 그에 따라 더 나은 결과물을 도출해내는 것을 뜻한다. 인공지능 교과서로 유명한 스튜어트 러셀의 책 < 역시 인공지능을 학습(learning)과 문제해결(problem solving) 같은 기능을 수행하는 기계로 보고 있다.

마쓰오 유타카 일본 도쿄대 교수는 저서 <인공지능과 딥러닝>에서 좀 더 현명하게 행동하기 위한 진화적 의미가 담겨 있는 것을 인공지능으로 정의하며 세간에서 통용되고 있는 인공지능이란 용어의 수준을 4단계로 분류했다. 레벨1은 그저 마케팅 차원에서 인공지능이라는 이름을 붙인 제어 프로그램이고, 레벨2는 입력과 출력을 맺는 방법이 세련돼 입력과 출력의 조합 수가 극단적으로 많은 경우다. 레벨3는 기계학습을 받아들인 인공지능, 레벨4는 딥러닝을 도입한 인공지능을 의미한다. 마쓰오 교수는 “최근의 인공지능은 레벨3를 일컫는 경우가 많다”고 설명했다. 사토 교수의 프로그램은 레벨1과 2 사이에 있는 기술로 여겨진다.

이런 논의를 토대로 보면 아직 이 프로그램은 우리가 생각하는, 창의적 영역에는 도달하지 않은 것 같다. 최초에 사토 교수가 직접 쓴 글 자체가 문학상을 통과할 정도로 문학적으로 뛰어났던 것이라고도 볼 수 있다. “당신의 글 자체가 좋았군요”라는 질문에 사토 교수는 “물론 그렇게 생각할 수도 있다”고 답했다.

그렇다고 이 소설 쓰는 프로그램의 가치를 폄하할 필요는 없다. 정형화된 문장을 가진 기사보다 훨씬 더 “자유도가 높은” 소설이란 영역으로 문장 쓰는 기술을 확장했기 때문이다.

문제는 이 연구 결과에 뒤따른 호들갑스러운 반응이었다. 뉴스를 접한 사람들은 인공지능이 소설이라는 가장 창의적이면서도 인간밖에 할 수 없는 영역을 침범했다며 놀라거나 기대하거나 좌절했다. 인공지능과 같은 미래기술에 대해 외신들은 짧게 ‘인공지능이 문학상 예심을 통과했다’는 메시지만 전달했고, 국내 언론들 역시 그 내용을 그대로 받아들여 확대 재생산했다. 이런 과정이 인공지능에 대한 최근의 열풍에 녹아들며 과장된 평가로 이어지게 된 것이다. 하지만 이 프로그램의 실체는 우리가 호들갑을 떨며 마음대로 펼쳐낸 상상과는 달랐다. 소설 쓰는 인공지능이 나오려면 아직, 조금 더 시간이 필요해 보인다.

■ 소설 머신러닝에 대한 두 가지 시각

요즘 인공지능 분야에서 가장 유망하다고 꼽히는 기술은 머신러닝(기계학습)의 일종인 딥러닝이다. 수많은 데이터를 통해 학습을 하면서 스스로 특징을 발견해 분류를 하고, 이를 바탕으로 원하는 결과물을 만들어낼 수 있는 시스템이다. 하지만 사토 교수는 그 기술을 쓰지 않았다. 소설은 머신러닝이라는 기법 자체를 적용할 수 없는 분야라고 보았기 때문이다.

소설은 인간만의 영역일까?
사토 교수 “소설은 답이 없어”
기계학습 적용 안했다 밝혀
일부선 “기계학습·딥러닝 가능”

“머신러닝은 바둑을 둘 때처럼 ‘어떻게 두는 것이 이기기 위한 최선의 수인가’라는 질문에 대한 정답이 있을 때 적용할 수 있어요. 그런데 소설은 ‘답이 없는 영역’입니다. 두 소설이 있을 때 어느 소설이 더 좋은지 알 수 없어요. 평가를 할 수 없습니다. 그러니 머신러닝 기법을 쓸 수 없습니다.”

머신러닝이 불가능하다는 판단을 한 사토 교수의 관점에 따르면 소설은 기계가 범접할 수 없는 분야다. 일단 기계는 소설을 인식할 수 없다. 또 인식 기술이 개발된다 하더라도, 소설을 읽는 사람마다 같은 소설에 대해 서로 다른 평가를 내릴 수도 있다. 이런 점이 바로 사토 교수가 레벨3의 인공지능 기술이 아닌, 레벨1에 가까운 문장 제어 프로그램 개발 쪽으로 방향을 잡은 이유다.

하지만 소설 쓰는 데에도 기계학습을 적용할 수 있다고 보는 시각도 있다. 소설마다 기-승-전-결, 서론-본론-결론 등의 문장구조와 함께 여러 개의 서사에 기쁘거나 슬픈 내용, 권선징악에 대한 내용이란 꼬리표를 모두 붙여주면 기계가 소설을 인식하는 일도 가능하다. 빅데이터를 바탕으로 머신러닝을 하고 딥러닝 기법으로 추상화를 한다면 원하는 주제의 새로운 소설을 쓰는 일은 현재의 기술로 얼마든지 시도해볼 수 있는 일이다.

실제로 최근에는 인공지능이 대본을 쓴 영화가 처음으로 등장하기도 했다. 이 영화 <(Sunspring)의 대본을 쓴 인공지능 벤저민은 문장 인식에 자주 쓰는 일종의 머신러닝 기법인 엘에스티엠(LSTM, 인공신경망) 방식을 이용해 1980~90년대 공상과학영화 대본 수십개를 학습한 뒤 문장을 만들었다. 벤저민은 문장을 단어 단위로 분해한 뒤 학습을 했고, 여기서 얻은 경향성을 바탕으로 특정 단어 뒤에 나올 만한 단어나 문구 등을 연결해 나가는 식으로 문장을 만들었다. 다만 이 대본에서 배우의 행동을 묘사한 지문 중에는 “그는 별들 속에 서 있었고 바닥에 앉아 있었다”(He is standing in the stars and sitting on the floor)와 같이 말이 되지 않는 문장이 나온다.

물론 기계가 특정 주제에 대한 문장을 쓰게 된다고 해도, 그 글은 의도했던 것과 다르게 읽힐 수도 있다. 하지만 이런 점은 전혀 문제가 되지 않는다. 1957년 콩고라는 이름의 침팬지가 그린 그림에 대한 평가가 대표적이다. 동물행동학자인 프란스 더발은 책 <원숭이와 초밥 요리사>에서 “유인원의 작품을 인간이 그린 것으로 믿었던 전문가들은 작품을 진지하게 비평하고 때로는 절찬하기도 했다”고 설명했다.

그렇다면 인공지능이 쓰는 글은 창의적이란 평가를 받을 수 있을까? 지난 24일 소설가 김영하씨를 만나 이 점에 대해 의견을 들어봤다.

소설가 김영하씨. 그는 인공지능이 특유의 모험심으로 훌륭한 문장을 쓸 수는 있겠지만, 문장을 이어 붙여 좋은 소설을 만들기는 어려울 것으로 봤다. 강재훈 선임기자 khan@hani.co.kr

“수용자들이 받아들일 때 ‘어, 이거 정말 좋은데. 진짜 새로워’라고 느끼는 것은 작가의 의지를 받아들여서 그런 게 아니에요. 굉장히 진부한 걸 쓰려고 했는데도 그 결과가 굉장히 새롭게 느껴질 수도 있거든요. 창조적이란 것은 결과가 만들어주는 겁니다.”

그럼 역시 머신러닝과 딥러닝 기법을 적용한다면 인공지능이 쓴 글도 창조적일 수 있다는 얘기일까? 불가능한 일은 아닌 것 같다. 김영하씨는 기계가 오히려 더 창조적인 문장을 쓸 수도 있을 것이라고 봤다.

“창조성은 일종의 모험심에서 나오는 거예요. 지금까지 존재하지 않는 방식으로 이야기하려면 작가가 모험심이 있어야 하거든요. 하지만 인간의 모험심을 무엇이 제약하느냐. 그건 결국 망할 수 있기 때문이거든요. 3년간 소설을 썼는데 망하면 안 되거든요. 그래서 우리는 클리셰를 받아들이고, 사람들이 받아들일 수 있는 선에서 얘기를 하는 가운데 약간의, 반 발자국 정도 진보하려 하는 거죠. 그런데 인공지능은 모험심으로 가득 찰 수 있어요.”

■ 인공지능은 창의적일 수 있을까

모험심이 가득한 인공지능은 그동안 보지 못했던 새로운 글을 내놓아 인간들을 감동시킬 가능성을 배제할 수는 없다. 대본을 쓴 벤저민이 ‘뱉어낸’ 이상한 문장이 오히려 문학성 짙은 ‘시적 표현’으로 해석될 여지도 있다. 하지만 그 문장들을 엮어 장편소설로 만들어낸다면 그 소설도 인간의 흥미를 끌 수 있을까? 기계가 까다로운 대중의 흥미를 자극하며 여러 문장들을 끝까지 읽을 수 있게 만들 수 있을까? 다시 김영하씨의 설명을 들어보자.

과도한 기대나 두려움 불필요
추리소설처럼 ‘밀당' 능력 쉽지 않아
소설가 김영하씨
“인공지능은 한동안 인간 조력자 그칠 것”

“한 문장 안에서도 정보의 순서를 바꿀 수도 있고, 문장의 순서를 바꿔가며 정보의 순서를 다르게 배치할 수도 있어요. 예컨대 추리소설은 정보를 극단적으로 늦게 주는 식이죠. 정보를 배분하는 감각이 굉장히 중요합니다. 간단한 얘기인데, 누가 ‘얘들아, 내가 어제 누구를 만났는지 알아?’라며 대화를 이끄는 것과 ‘나 어제 부장님 만났어’라고 시작하는 것에 차이가 나는 것과 같아요. 사람들이 흥미를 잃지 않고 계속 읽을 수 있도록 하려면 기계가 사람의 마음을 이해하는 능력이 필요해요. 마음은 우리도 잘 모르잖아요. 이렇게 썼을 때 흥미로워했는데, 똑같이 몇 번만 더 하면 흥미를 잃잖아요. 매번 조금씩 다르게 쓰면서도 너무 이해 못할 정도로 짜증나게 하지도 않는 것은 쉽지 않은 일이에요.”

이렇게 보면 사토 교수의 관점 역시 틀리지 않아 보인다. 결국 기계가 장편소설을 써 인기를 끄는 상황은 근접한 미래에 보기 힘들 것 같다. 소설이라는 분야가 산업적으로 규모가 크지도 않은 점도 걸림돌이다. 돈이 되지 않는 영역이니 기업들도 뛰어들지 않을 테고, 결국 기계가 쓰는 흥미로운 소설은 나오기 쉽지 않다는 뜻이다.

다만, ‘심지어 소설도 썼다’는 식으로 마케팅을 의도로 한 시도는 꾸준히 이뤄질 가능성이 높다. 인터넷 초창기, 바깥에 전혀 나가지 않고 생활할 수 있는지 확인해보려는 ‘인터넷 생존실험’처럼 미래의 삶과는 전혀 관련 없지만 화제성 높은 사례들이 등장할 수 있다. 구글이 바둑을 둔 것도 비슷한 맥락이다. 이런 마케팅과 미래에 대한 과도한 기대가 겹치는 순간 현실은 왜곡될 수 있다. 유신 카이스트 교수(전산학)는 “앞으로 수많은 분야에서 알고리즘과 인공지능이 우리 삶에 영향을 주기 시작할 텐데 그것의 능력과 한계를 정확히 이해하는 것이 필요한 시점”이라고 말했다.

오히려 지금 걱정해야 할 것은 ‘인공지능이 인간보다 더 창의적일까’라는 문제가 아닐 수도 있다. 김영하씨는 “인공지능은 소설을 포함한 여러 분야에서 마치 <아이언맨>의 자비스처럼, 한동안 인간의 조력자로서만 활동할 가능성이 높다. 그런 시대에는 인공지능을 쓸 수 있는 사람과 그렇지 못한 사람 간의 디바이드(격차) 문제가 더 중요하지 않을까”라고 말했다.

나고야/글·사진 음성원 기자 esw@hani.co.kr, 인포그래픽 노수민 기자 bluedahlia@hani.co.kr

<한겨레 인기기사>
“우병우 아들, ‘역대급 빽’ ‘청와대 아들’ 소문 자자”
[성한용의 정치 막전막후] 2개의 폭로전과 맞물린 범여권의 재집권 전략
KBS “성주 외부세력 개입 부각”…원고 4차례 수정 보도
[카드뉴스] 최경환·윤상현 “뒤에 대통령 있다니까~”
[화보] 로이터가 기록한 세상의 모든 드라마

▶ 발랄한 전복을 꿈꾸는 정치 놀이터 [정치BAR]
▶ 콕콕 짚어주는 [한겨레 카드뉴스][사진으로 뉴스 따라잡기]
▶ 지금 여기 [사드 배치 논란][한겨레 그림판][당신에게 꼭 맞는 휴가지는?]
[ⓒ한겨레신문 : 무단전재 및 재배포 금지]

Copyright © 한겨레. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?