이세돌 "알파고, 1-2년 뒤에는 승부 알 수 없을 것"(일문일답)
[한국기원=스포츠투데이 이상필 기자]한국기원과 구글이 22일 서울 홍익동 한국기원 대국장에서 '구글 딥마인드 챌린지 매치 프레스 브리핑'을 개최하고 오는 3월9일부터 서울에서 열리는 '이세돌-알파고' 대국 관련 세부 진행 계획을 발표했다.
이날 브리핑에는 박치문 한국기원 부총재와 이세돌 9단이 참석했다. 또한 데미스 하사비스 구글 딥마인드 CEO가 영국 런던에서 화상 연결을 통해 대국 장소와 시간, 대국 규칙, 생중계 방식 등 대국 진행과 관한 상세 내용을 공개했다.
다음은 이세돌 9단, 하사비스 CEO와의 일문일답이다.
-알파고와의 대국은 인간과 대국을 준비하는 것과는 다를 것 같다. 어떻게 준비하고 있나? 또 이번에는 자신이 이긴다고 생각하는 이유는?
이세돌 : 컨디션을 끌어올리는 중이다. 이번에 이기는 걸로 보는 것은 시간적 한계 때문이다. (판후이와의 대국 이후) 4-5개월 넘는 시간동안 많은 업데이트가 이뤄졌겠지만, 그 시간으로 나와 승부를 한다는 것은 무리가 있다고 본다. 앞으로는 인공지능이 계속 발전한다면 1년 또는 2년 후에 그 때는 정말 알 수가 없는 승부가 될 것이다.
-알파고는 프로로 치면 몇 단 정도
이세돌 : 알파고의 대국을 몇 번 보고, 그것에 맞춰 가상으로 훈련을 하고 있다. 지금 알파고의 기력은 3단 정도에서 왔다 갔다 하지 않을까 생각한다.
-알파고는 어떻게 참여하게 되나? 알파고의 대역과 심판은 누구인가? 알파고의 상대로 이세돌을 타깃으로 한 이유는?
하사비스 : 대국동안 알파고는 구글 클라우드에서 돌린다. 실질적으로 서버 위치는 미국 중서부다. 빠른 속도로 호텔과 연결이 될 것이다. 대국에서는 모니터 상으로 알파고가 두는 수가 나타날 것이고, 대신 놓을 사람은 아자 황이다. 알파고의 연구원이면서 아마추어 바둑 6단이기도 하다. 아자 황은 대국 환경에 익숙하기도 하고, 알파고를 다루는데도 익숙하다.
또한 우리가 이세돌을 타깃으로 한 이유는 워낙 역사적인 대국이 될 것이기 때문이다. 그래서 전설적이고 최고 수준임이 입증된 이세돌 9단을 선택하게 됐다. 가장 적절한 대상이라고 생각한다.
-한국에서 펼쳐지는 대국임에도 중국 룰을 선택한 이유는? 또 제한시간이 2시간으로 정해진 배경은?
하사비스 : 알파고 프로그램이 지난 18개월 동안 개발과 훈련을 거듭한 기본 규칙이 중국룰이었다. 갑자기 한국 규칙을 적용해 따라잡기에는 무리가 될 것으로 봤다. 또한 시간제한은 우리와 이세돌 9단의 상호합의로 결정됐다"
-알파고에 약점이 있다면
하사비스 : 약점이 있긴 하지만 대국 전에 말씀 드리기 어렵다. 대국 이후 소개할 수 있을 것이다. 한 가지 첨언을 하자면, 이러한 이유 때문이라도 이세돌 9단과 대국하고 싶었다. 알파고는 적어도 지금까지 우리가 부여한 임무에 대해서는 잘 대응해왔다. 유효한 대적이 나타나지 않고 있기 때문에 스스로를 이기는 것은 더 이상 의미가 없다. 우리도 제대로 평가를 하기 위해 최고급과 대결하고 싶었다.
-인공지능의 핵심기술을 쉽게 설명 부탁한다.
하사비스 : 바둑의 경우의 수는 워낙 많아 무작위 대입방식으로 계속 처리해서 승리하기 어렵다. 전 세계 가장 큰 규모의 슈퍼컴퓨터가 있거나 더 나아진다고 할지라도 바둑은 경우의 수가 워낙 많아 그것으로 충분하지 않다. 바둑에서 일어날 수 있는 경우의 수를 최대한으로 펼쳐본다고 생각했을 때, 알파고는 2개의 신경계를 활용해 가능한 모든 경우의 수를 줄여나가는 것이다.
먼저 첫 신경계인 폴리시 네트워크를 사용해 어떻게 두는 것이 가장 가능성이 높은지 제안한다. 이후 탐색 트리가 추려져 두 번째 신경계인 밸류 네트워크에서 흑과 백 양 쪽에서 얼마나 좋은 수가 되는지 알려준다.
일례로 체스의 '딥블루'는 한 번 결정을 할 때마다 2억개의 경우의 수를 살펴봤다. 알파고는 한 수를 두기 전에 10만개만 평가하게 돼 있다. 사실 10만은 사람(1000개)보다 많지만 컴퓨터로 보면 훨씬 더 많이 추려졌다. 컴퓨터 프로세싱 시간동안 신경계를 활용하기 때문에 이러한 결과가 나온 것이다.
-이세돌에게는 결과에 따라 커리어에 부정적인 영향이 있을 수 있다. 설득하기 어렵지 않았나?
이세돌 : 솔직히 말씀드리면 설득은 없었다. 알파고 자체가 궁금했다. 결정하는데 많은 시간이 필요하지 않았다. 5분 정도 생각해서 (구글에게 나를) 설득한 기회를 주지 못했다.(웃음)
-물리적인 환경이 어떤 식으로 결정됐는지 궁금하다. 대국에 임하는데는 방의 환경이 중요하다. 현재로서는 크게 우려되는 부분이 없는 것 같지만, 앞으로 인공지능이 더 발전하면 그런 부분도 중요한 요소가 될 것이다. 체스에서도 환경에 따라 결과가 달라진다.
이세돌 : 맞다. 사실 이번에는 자신이 있어서 그런 부분을 많이 신경 쓰지 않았다. 그러나 앞으로 (알파고가) 더 발전해 제대로 된 승부가 펼쳐진다면 (그러한 부분에도) 준비하고 신경을 써야 할 것이다.
하사비스 : 포시즌스호텔은 서울에 있는 호텔 가운데 특히 우수하다. 또 자연광이 많이 들어오는 좋은 방으로 마련했다. 최대한 인간 전문 기사들이 대국하는 환경과 유사하도록 노력했다.
한편 이세돌과 알파고 간의 구글 딥마인드 챌린지 매치는 오는 3월9일(수)부터 15일(화)까지 총 5회 대국으로, 호선으로 진행된다. 우승자에게는 100만 달러(약 12억원)의 상금이 주어지며, 알파고가 승리할 경우, 상금은 유니세프와 STEM(과학, 기술, 공학 및 수학) 교육 및 바둑 관련 자선단체에 기부된다.
구글 딥마인드 챌린지 전 경기는 포시즌스 호텔 서울에 마련된 특별 대국장에서 오후 1시 개최된다. 3월9일 1국을 시작으로 2국은 10일, 3국은 12일, 4국은 13일, 5국은 15일 열린다.
이번 대국은 백을 잡은 기사에게 덤 7.5집을 주는 중국 바둑 규칙에 따라 진행된다. 또한 시간 규정에 있어서는 두 기사가 각각 제한시간 2시간을 갖게 되며, 2시간을 모두 사용한 이후에는 1분 초읽기 3회씩이 주어져, 각 대국 시간은 4-5시간 내외가 될 것으로 예상된다.
이상필 기자 sports@stoo.com
Copyright © 스포츠투데이. 무단전재 및 재배포 금지.