알파고 아버지 허사비스 CEO "87번째 수 이후 혼란"

중앙일보

입력

업데이트

기사 이미지

“이세돌 9단이 영리하게 경기하고 있다! 알파고는 87번째 수에서 혼란에 빠졌다. 문제 상황에 직면했다.”

‘알파고의 아버지’라 불리는 딥마인드 최고경영자(CEO) 데미스 허사비스가 이세돌 9단과 알파고의 4번째 대국 도중 트위터에 남긴 글이다.

허사비스는 “알파고는 79번째 수에서 실수했고, 87번째 수 즈음에 실수한 사실을 알게 됐다”고 덧붙였다. 그는 “79번째 수에서 알파고의 가치 네트워크(value net)가 계산한 결과는 (승률) 70% 정도였고, 87번째 수에선 더 내려갔다”고 말했다.

‘가치 네트워크’란 알파고 스스로가 이길지 질지 계산하는 기능이다.  허사비스는 대국이 끝난 뒤 “4번째 대국에서 이세돌 9단이 승리했다”며 “이 9단이 알파고가 회복하기 힘든 실수를 하도록 압박했다”고 평가했다.

본지가 4번째 대국에서 처음 도입한 국내 인공지능 바둑프로그램 ‘돌바람’의 예측 승률 역시 하사비스의 설명과 같은 흐름이었다. 돌바람 개발사인 누리그림 임재범 대표는 “79수 당시 돌바람은 알파고의 승률을 67%로 예상했고 87수에선 63%로 내려갔다”고 말했다.

기사 이미지

이날 본지 디지털 라이브에 참가한 해설단 역시 87수 이후 알파고의 행마에 의문을 제기했다. 본지 바둑 담당인 정아람 기자는 “알파고에 바이러스라도 침투한 듯 명백히 손해인 수를 뒀다”고 평가했다.

그렇다면 알파고가 87번째 이후 나쁜 수를 반복한 이유는 뭘까. 임재범 대표는 “몬테카를로 방식을 쓰는 인공지능(AI) 바둑 프로그램의 특징”이라고 분석했다. “이기고 있을 때는 최적의 수를 찾지만 지고 있을 때는 ‘이기는 수’를 찾기 어려워 터무니없는 수를 두는 경우가 많다”는 거다. 알파고가 자신이 실수를 했다는 걸 깨달은 87수 이후 ‘손해 보는 수’를 연발한 게 인공지능의 특징이라는 얘기다.

몬테카를로 방식은 대부분 AI가 채택하는 시뮬레이션 방식이다. 서울에서 부산까지 간다고 쳤을 때 사람은 경부고속도로를 떠올리지만 AI는 서울에서 부산까지 가는 모든 길의 소요 시간을 다 따져본 뒤 가장 빠른 시간을 택한다. 알파고도, 돌바람도 이 방식을 써 돌을 놓을 수 있는 자리를 검토한다. 차이는 돌을 놓아야 할 자리, 그러니까 서울에서 부산까지 가는 길을 결정하는 방식이다. 돌바람은 자체 개발한 알고리즘을 이용하고, 알파고는 보다 수준 높은 딥러닝 방식을 쓴다.

▶[관련기사] ‘최강의 인공지능’ 알파고가 가진 치명적 약점 2가지.

정선언 기자 jung.sunean@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT