[알파고] (다량의 스포) 구글의 다큐멘터리 알파고를 보고
https://www.rottentomatoes.com/m/alphago/
로튼 토마토를 보면 신선도 100%를 찍고 있는 다큐멘터리인데요. 구글은 다큐멘터리도 잘 만드네요. 아이튠즈에 알파고가 올라와 있어서 처음으로 결제해서 감상하였습니다.
<알파고 예고편>
제가 알고 있는 지식과 영화에서 나오는 내용을 포함하여 아래의 내용을 적었습니다.
영화의 시작은 데미스 하사비스로 시작합니다. 그는 딥마인드의 설립자로 영화가 시작하는 시기에는 구글에 인수되었고 자신감이 넘치며 또 구글에게 무엇을 보여줘야하는 입장이었을 것입니다. 영화에서 그가 유소년기에 세계 체스 2위를 달성했다는 것을 중심으로 보여줍니다. 그는 인지신경과학 박사이기도 하죠.
그의 팀의 중심 인물은 데이비드 실버 박사와 아자 황 박사입니다. 데이비드 실버 박사는 강화학습의 전문가이자 알파고 팀의 리더 역활입니다. 걍화학습은 혼자서 대국을 두면서 스스로 강해지는 것이라고 보시면 됩니다.
아래는 다큐멘터리에 나오는 영상 중 하나인데요. 강화학습을 잘 설명하는 영상입니다. 어떻게 진화하는지를 살펴보세요.
<딥 마인드가 공개한 강화학습 설명 영상>
또 다른 핵심 인물은 아자 황입니다. 많은 사람들이 그를 단순히 알파고 대리인으로 생각하는데 그는 사실 몬테카를로 트리 검색의 전문가입니다. 트리 검색은 우리가 말하는 경우의 수를 헤아려 보는 것을 의미합니다.
딥마인드는 각기 다른 분야(인지신경학, 강화학습, 트리 검색)의 전문가를 모아 최고의 바둑 인공지능을 만드는 것을 시도한 셈이죠.
그들은 최고의 인공지능을 만드는 과정에 판 후이를 초청했습니다. 저는 몰랐는데 그는 바둑으로 도망치기 위해 유럽으로 도망을 갔던 사람이더군요. 그런데 유럽 챔피언을 하고 유럽에서 바둑을 가르치며 생계를 이어갑니다. 그는 초기 버전의 알파고와 싸우면서 여러 감정적인 면을 느끼며 패배한 후에 심리적인 충격까지 받습니다.
하지만 그는 곧 극복해내고 최고의 바둑의 정수를 알기 위해 알파고 팀에 합류합니다. 판 후이는 하루 종일 알파고와 바둑을 두며 알파고의 약점을 찾아내고 딥 마인드 팀은 알파고를 함께 개선해갑니다.
판 후이가 실력이 좋지 못하다는 여론에 휩싸이자 (불쌍한 판 후이 ㅠㅠ) 구글은 세계 최고의 기사와 대국을 준비합니다. 영화에서 판 후이는 알파고 18번째 버전에서 치명적인 약점을 발견했다고 보고를 하며 실버 박사를 주도로 알파고 팀은 심각하게 회의롤 합니다. 18 버전이 치명적인 결함을 가지고 있다는데 크게 우려를 합니다. 3일 밖에 없다는 한계 때문에 그대로 가기로 결정합니다.
그래서인지 한국에 도착한 알파고 팀은 승부에 자신을 가지지는 않으며 여기까지 온 것만 해도 대단하다는 태도를 보이지요. 이세돌과의 한번의 대국을 치르고서는 완전히 다른 상황이 되지만요.
영화의 나레이션은 판 후이가 진행을 하는데요. 굉장히 영리한 아이디어였습니다. 그는 프로 기사이기도 하기 때문에 이세돌의 마음과 플레이를 이해할 수 있었고 또 알파고 팀에 속해 있었고 알파고의 단점도 파악한 상태이기 때문에 거기에 대한 자세한 설명도 할 수 있는 완벽한 사람이었어요.
이세돌은 대국을 반복하며 더더욱 침체기를 겪어가며 그가 밤을 세우며 동료들과 연구한 이후에는 가장 나쁜 플레이를 선 보입니다. 판 후이는 3국을 가장 이세돌 답지 않은 플레이로 설명하며 다른 사람을 따라 플레이해서는 이길 수 없다는 설명을 합니다.
알파고 팀도 이제는 더 이상의 축제의 분위기가 아닙니다. 그들도 기계와 인류의 싸움에서 마지막 인류가 지는 것을 지켜보며 묘한 감정에 빠집니다. 그런 이유 중의 하나는 해설을 하는 사람들이 알파고를 He나 She라고 부르는 까닭도 있습니다. 그들에게도 알파고는 더 이상의 단순한 프로그램 아니게 된것이지요.
여러 사람들이 중간에 철학적인 문제나 윤리적인 문제를 같이 언급합니다. 하지만 그런 시선은 너무 과도한 것이며 어떤 부분에서는 터미네이터등의 미디어가 과장한 부분이 있다는 것을 지적합니다. 현재의 머신러닝 단계는 조금 더 나은 세탁기를 만드는 정도라고 설명합니다.
판은 점점 커져 구글의 회장인 에릭 슈미츠와 창업자 래리 페이지도 한국에 와서 그들의 플레이를 지켜보는 지경에 이릅니다. 그들이 누구인지 영화에서 설명하지는 않고 그냥 지나가지만요.
그리고 영화는 전설이 된 4국으로 갑니다. 모두가 놀랐던 수가 진행이 될 때 아자 황과 판 후이가 놀라며 알파고 팀은 대체 어떻게 된 것이냐는 충격에 빠집니다. 지금까지 수를 기초로 예상 승률을 표시하는 전광판은 점점 상태가 안 좋아집니다. 경기가 끝낸 후에 그들은 알파고에게 이 수가 사람이라면 어느 정도의 확률로 낼 것이냐는 질문을 하고 알파고라면 이 수를 놓겠냐는 질문을 합니다. 알파고는 0.007%라는 답을 합니다. 구글 측도 복잡한 기분에 빠집니다. 그 정도의 확률이면 신수가 문자 그대로 신수라고 평가하며 어떤 이는 심지어 어떤 이는 안도의 표정까지 짓습니다.
그리고 마지막 5수로 갑니다. 그들도 더 이상 5수가 이길 것이라는 확신을 하지 못하며 전광판을 지켜봅니다. 계속 변하는 확률을 지켜보며 우리 중 누구도 그것을 이해할 수 없다는 이야기를 합니다. 실버 박사가 알파고가 패배를 선언했다고 장난을 치자 하사비스의 팀들은 깜짝 놀라는데 5수에서는 그들도 질 수 있다고 생각하고 있기 때문이었죠. 이세돌이 3국의 패배 이후에 엄청난 성장을 한 것을 지켜보며 놀라워합니다. 그리고 그들이 상황을 제대로 인식할 수 있었던 것은 이세돌이 스스로 패배를 순간이었습니다.
당시 알파고는 판 후이가 지적한 분명한 약점이 있었고 이세돌의 4국과 5국의 분위기가 좋지 못했던 점이 있었습니다. 어쩌면 이세돌이 알파고에 대한 파악이 조금 더 빨랐더라면 승부의 방향은 조금 달라졌을 수 있었을 것 같습니다. 이세돌은 그때 분명 점점 성장중이었으니깐요.
여기에서 드라마는 끝이 납니다. 이세돌의 신수와 이세돌과 판 후이가 느꼈던 점과 그들의 성장으로 마무리를 짓지요.
PS:
그러나 우리는 그 뒤의 이야기도 알고 있습니다. 이세돌과 싸운 알파고 리보다 더 강력한 알파고 마스터가 온라인 바둑 사이트에서 등장해서 압도적인 성적을 거두었고 이 알파고 마스터가 커제를 5:0으로 이겼다는 것도 알고 있습니다.
더 나아가 이 알파고 마스터를 압도하는 알파고 제로가 나온 것도 알고 있습니다. 알파고 제로는 인간의 기보를 한번도 보지 않고 바둑을 전혀 모르는 알파고가 강화학습 만으로 바둑을 스스로 터득한 버전입니다. 벽돌깨기 게임과 같이 혼자 깨달은 것이지요. 알파고 제로는 알파고 리와 대결에서 100:0으로 이겼고 알파고 마스터와의 대국에서는 89:11으로 이겼습니다.
그리고 이제 알파고 제로는 더 이상 바둑을 하지 않으며 (최근에는 체스를 했어요.) 알파 제로로 개명했으며 아자황은 알파고팀을 떠났죠.
PS:
알파고가 가르쳐주는 바둑 사이트도 있어요. 바둑에 관심이 있는 분들은 참고하세요.
https://alphagoteach.deepmind.com/ko
후기잘읽고갑니다