ADVERTISEMENT

개·고양이 구별 못한 AI ‘딥러닝’ 6년 만에 고흐 그림까지

중앙일보

입력

업데이트

지면보기

종합 18면

기사 이미지

때는 바야흐로 2066년 3월 9일. 20만 개의 홀로그램 채널에도, 10억 개가 넘는 가상현실 개인방송에도 볼 만한 게 없어서일까? 정부 증강현실 홍보팀이 식탁에 투사한 ‘2066년 1인당 소득 100만 달러 시대!’라는 소식 역시 그다지 흥미롭지 않다.

[궁금한 화요일] 인공지능 어디까지 왔나

200층짜리 양로원에 살고 있는 나는 오랜만에 OR(Old Reality)이라 불리는 창문 밖 세상을 내다보며 회상해 본다. 건물 사이를 날아다니는 수많은 드론. 하늘이 텅 비어 있었던 시절이 정말 있었던 걸까? 비좁은 도로만을 사용하던 과거. 그것도 사람이 운전을 하며 말이다!

기사 이미지

2036년 ‘유인자동차금지법’이 국회를 통과하기 전 우리는 정말 위험한 세상에 살고 있었다. 인간의 눈과 판단만을 믿고 달리는 고철 덩어리들을 도심 한복판에 허락했으니 말이다! 인공지능의 등장은 이 모든 것을 바꿔 놓았다. 언제였더라? 기계가 인간의 창의성을 능가할 수 있다는 가능성을 처음으로 보여주던 순간? 50년 전, 2016년 3월 9일이었지….

기사 이미지

이달 9일부터 알파고와 다섯 차례 대국을 치르는 이세돌 9단.

2016년 3월 9일. 대한민국 수도 서울에서 역사적인 대결이 벌어진다. 이세돌 9단과 구글 ‘알파고’의 바둑 대결이다. 알파고는 구글사가 2014년 약 6000억원을 들여 인수한 영국 스타트업 ‘딥마인드’가 개발한 프로그램이다.

딥마인드 창업자 데미스 하사비스는 영국 최고의 천재로 유명하다. 체스 챔피언에 비디오게임 해커, 거기다 케임브리지대 컴퓨터공학과 출신에 런던 UCL대 뇌과학 박사. 하사비스는 세계 최고의 기계학습 전문가 중 한 명이다.

‘기계학습’이란 무엇인가? 1956년 다트머스대에 모인 컴퓨터 전문가들은 ‘인공지능’이라는 새로운 기술을 제시한다. 어려운 계산을 너무나도 쉽게 하는 기계. 그렇다면 ‘언어 처리’ ‘얼굴 인식’ 같이 우리에게 쉬운 문제 역시 쉽게 풀 수 있는 ‘인공지능’이 가능하지 않을까?

하지만 인간에게 쉬운 문제는 결코 쉽지 않았다. 50년 넘는 연구에도 불구하고 세계 최고의 수퍼컴퓨터조차 ‘강아지’와 ‘고양이’ 하나 제대로 구별할 수 없었으니 말이다.

지구에는 제타바이트 수준의 데이터가 존재한다. 하지만 그중 컴퓨터로 분석 가능한 것은 10%도 되지 않는, 이미 수식이나 숫자로 표현 가능한 정량적 데이터뿐이다. 나머지 90%는 기계가 분석할 수 없는, 그러나 기하급수적으로 증가하는 비정량적 데이터다.

‘어린아이가 강아지와 산책하는 장면’은 세 살짜리 아이도 알아보지만 기계는 어렵다. 수백 종의 개가 존재하는 것뿐 아니라 뛰어다니고 걸어다니며 꼬리를 1도, 2도, 3도로 흔드는 모습이 모두 다르기 때문이다. 무한에 가까운 다양성을 보편적으로 설명하면 다른 동물들과 혼돈되고, 너무 구체적으로 설명하면 대부분의 개가 포함되지 않는다.

기사 이미지

독일 튀빙겐대 연구팀이 개발한 딥러닝 알고리듬을 통해 튀빙겐의 풍경사진 ①을 고흐②나 뭉크③의 화풍으로 그려 낸 이미지.

그렇다면 인간은 비정량적 정보를 어떻게 인식할까? 구체적인 설명이 아닌 경험과 학습을 통해 인식한다. 기계에도 역시 비슷한 학습 능력을 주자는 것이 바로 기계학습이다.

기계학습의 대표적 기술은 학습을 통해 데이터에 포함돼 있는 확률 규칙을 자율적으로 알아내는 ‘인공신경망’이다. 특히 인공신경망은 다층구조를 가지고 있어 여러 추상적 단계의 규칙을 동시에 학습할 수 있다.

그렇다면 인공신경망 층수가 높을수록 더 고차원적인 규칙을 찾아낼 수 있겠다. 하지만 ‘깊은’ 인공신경망 학습은 수학적으로 쉽지 않다. 2010년도에 들어와서야 드디어 수십 층 구조의 인공신경망 학습에 성공했으니 말이다.

기사 이미지

구글이 지난해 내놓은 스마트 리플라이. 메일 내용을 읽고 자동으로 간단한 답신을 추천하는 기능이다.

기존 인공신경망과 구별하기 위해 깊은 층수 구조를 가진 인공신경망은 ‘딥러닝’이라고 불리기도 한다. 딥러닝이 현실화되며 기계학습은 폭발적인 발전을 한다. 2014·2015년 기계가 사람보다 더 정확히 얼굴과 물체를 인식하기 시작했고, 2015년 2월 딥마인드는 세계 최고의 과학지 ‘네이처’를 통해 인간과 비슷한 수준으로 비디오게임을 하는 기술을 소개한다.

수많은 고양이 사진을 통해 ‘고양이’라는 보편성을 학습하는 기존 딥러닝과는 달리 딥마인드의 ‘깊은 강화학습’은 전문가의 판단을 학습 데이터로 사용해 기계가 스스로 전문가가 돼 가는 방법이다. 그리고 불과 1년 후 딥마인드는 또 한 편의 ‘네이처’ 논문을 통해 프로기사 수준으로 바둑을 둘 수 있는 ‘알파고’를 발표한다.

왜 하필 바둑일까? 가로 19줄, 세로 19줄로 구성된 바둑에서는 우주 전체의 원자 숫자보다 더 많은 조합과 배열이 가능하기에, 단순한 계산만으로는 풀 수 없는 문제다.

그렇다면 이세돌 9단 같은 프로기사들은 어떤 방법으로 이 문제를 푸는 걸까? 바로 구글이 상금 100만 달러(약 12억원)를 걸고 서울에서 대결하길 바라는 이유다.

기사 이미지

캐나다 몬트리올대와 토론토대 연구팀이 딥러닝을 통해 사진의 내용을 언어로 묘사하게 한 사례. ⑤‘테디베어와 침대 위에 앉은 작은 소녀’같은 비교적 정확한 묘사와 ⑥ ‘모자를 쓴 남자와 스케이트보드 위에 있는 모자’같은 엉뚱한 묘사도 나왔다.

이번 경기에서 구글은 지더라도 이기는 것이다. 이세돌 9단 머리 안에만 존재하던 비정량적 데이터를 모두 가져갈 수 있으니 말이다. 아니, 내가 구글이라면 이세돌이 승리하기를 바랄 것이다. 알파고가 이긴다면 더 이상의 발전은 어렵지만 이세돌이 큰 차이로 이긴다면 그만큼 구글이 얻어가는 학습 데이터의 가치는 더 크다.

이세돌 9단을 통해 얻어가게 될 학습 데이터는 구글을 위해 앞으로 수백조원의 가치를 창출해 낼 수 있는 데이터다. 인간의 창의성만 제대로 정량화한다면 대부분의 지적 노동을 자동화·대량생산할 수 있게 된다. 2066년 역사책엔 1200억원도, 120억원도 아닌 단돈 12억원에 인간 창의성의 비밀이 기계에 넘겨졌다고 쓰여 있을지도 모른다.

기사 이미지

김대식
KAIST 전기 및 전자과 교수

김대식 KAIST 전기 및 전자과 교수

딥러닝=컴퓨터가 사람처럼 생각하고 배울 수 있도록 하는 인공지능(AI) 기술. 인간의 두뇌가 데이터 속에서 패턴을 찾아낸 뒤 사물을 인식하는 정보 처리 방식을 모방해 컴퓨터가 사물을 분별하도록 기계를 학습시킨다. 딥러닝 기술을 적용하면 사람이 판단 기준을 정해 주지 않아도 컴퓨터가 스스로 인지·추론·판단할 수 있게 된다.

ADVERTISEMENT
ADVERTISEMENT