[궁금한 화요일] 주입식 교육 받던 AI, 스스로 학습하게 했더니…사람보다 똑똑해졌네

중앙일보

입력

업데이트

바둑 인공지능(AI) 알파고(AlphaGo)가 인간을 꺾고 화려한 데뷔전을 치른 이후 인공지능에 대한 관심도 커지고 있다. 인공지능과 관련한 새로운 용어는 일상까지 파고들었다. 머신러닝(machine learning)과 딥러닝(deep learning)이 대표적이다. 그럼에도 새로운 용어는 아직도 전문가 영역에 머물고 있다. 그만큼 인공지능과 관련한 개념을 이해하기가 쉽지 않다는 얘기다. 국내 인공지능 연구를 선도하는 한국전자통신연구원(ETRI)에서 인공지능 역사와 머신러닝 등 관련 개념을 살펴봤다.

초기 인공지능, 일일이 지식 입력
가르친 것 이상으로 수준 안 올라
80년대부터 ‘머신러닝’ 개념 등장
빅데이터로 원리·개념 혼자 터득
딥러닝은 인간 뇌신경세포 모방
영상 인식에 활용, 얼굴인식률 99%

지난 13일. 대전시 유성구 ETRI 연구동. A연구실 문을 열고 들어가자 검은색 컴퓨터 14대를 쌓아 만든 시각지능 인공지능 ‘딥뷰(deep view)’가 보였다. 딥뷰는 동영상을 분석해 특정한 사건이 발생한 순간을 포착할 수 있다. 이를테면 고속도로 폐쇄회로TV(CCTV) 녹화영상에서 자동차 추돌사고가 발생한 순간만을 콕 집어낼 수 있다. 딥뷰가 상용화하면 일선 경찰관들의 업무를 획기적으로 줄일 수 있다. 딥뷰에 범죄 현장 주변의 CCTV를 입력하면 범죄 발생 순간만을 뽑아낼 수 있어서다.

박종열 ETRI 빅데이터SW연구부 실장은 “영상 빅데이터를 통한 학습을 거친 딥뷰는 동영상에서 자동차와 오토바이 등 서로 다른 사물을 실시간으로 구분할 수 있다”고 말했다. 딥뷰에는 알파고와 같은 딥러닝 학습법이 적용됐다. 딥러닝을 이해하기 위해선 인공지능의 역사를 먼저 들여다봐야 한다.

인공지능이 본격적으로 논의되기 시작한 건 1950년 무렵이다. 현대적인 컴퓨터를 고안한 영국 수학자 앨런 튜링은 50년 ‘컴퓨팅 기계와 지능’이란 제목의 논문에서 “기계도 생각할 수 있을까(Can machines think?)”라는 질문을 던진다. 이후 존 매카시 미국 다트머스대 교수는 56년 세계 최초로 인공지능이란 용어를 만들었다.

▷여기를 누르면 크게 볼 수 있습니다

과학자들은 혼자 생각하는 기계를 만들기 위해 부단히 노력했다. 이윤근 ETRI 자동통역언어지능연구부장은 “초기 인공지능은 인간사회에서 통용되는 다양한 규칙 등을 기계에 심어주는 형태였다”고 말했다. 체스게임 기계가 대표적이다. 체스 머신은 규칙에 어긋나지 않으면서 상대편을 이길 수 있는 수를 계산한다. 바둑의 경우에는 게임 규칙은 간단하지만 경우의 수가 무한대에 가까워 당시의 낮은 컴퓨터 성능으로는 인간과 대적할 수 없었다. 초기 인공지능은 한계도 명확했다. 정해진 규칙만을 강조하다 보니 인간이 주입한 수준을 뛰어넘는 변칙수가 나올 수 없었다.

이렇게 규칙 하나하나를 콕콕 집어 컴퓨터에 주입하는 방식을 지도학습법(supervised learning)이라 부른다. 지도학습법은 초등학교 수업시간을 머릿속에 그리면 쉽게 이해할 수 있다. 칠판 앞에 선 선생님은 학생들에게 덧셈·뺄셈의 원리부터 한글을 쓰고 읽는 법을 가르친다. 학생들은 이런 과정을 통해 사칙연산과 한국어 규칙을 배운다. 이순석 ETRI 커뮤니케이션전략부장은 “지도학습법은 한계가 명확해 과학자들은 새로운 학습법을 고민하게 됐다”고 말했다.

인공지능 연구가 초기의 실패(?)를 극복할 수 있었던 건 80년대부터 본격적인 연구가 진행된 머신러닝 덕분이다. 머신러닝은 지도학습법의 반대 개념인 비지도학습법(unsupervised learning)을 기반으로 한다. 비지도학습법은 선생님과 학생 그리고 칠판으로 상징되는 교실을 뛰어넘어 학생 혼자 책을 읽으면서 스스로 원리와 개념을 깨달아 가는 과정을 말한다.

알파고는 바둑 기보 16만 개를 학습하면서 상대방에게 승리할 수 있는 독자적인 기보를 만들었다. 이 과정에서 핵심적인 역할을 했던 건 바둑기사들의 착점(着點)을 순서대로 기록한 빅데이터였다. 80년대 등장한 머신러닝이 최근 각광을 받고 있는 건 정보기술 (IT) 발전에 따라 다양한 빅데이터가 충분히 확보됐기 때문이다. 기보 빅데이터가 없었다면 알파고는 등장할 수 없었다.

그렇다면 딥러닝은 뭘까. 딥러닝은 머신러닝의 한 종류다. 머신러닝은 딥러닝을 비롯해 분류와 확률학습, 검색과 최적화 등 다양한 기계학습법을 포괄하는 개념이다. 딥러닝은 인간의 뇌신경세포를 모방한 학습법으로 인공신경망(artificial neural network)의 일종이다. 인간의 두뇌는 40억 년에 걸친 생명체 진화의 결과물이다. 뉴런(neuron)이라 불리는 인간의 뇌신경세포는 대략 1000억 개가 있고 시냅스(synapse)를 통해 서로 연결된다. 인간의 뇌신경세포는 학습을 거듭할수록 시냅스를 통한 연결 강도가 강해지는 특징이 있다.

이런 반복을 통해 덧셈과 뺄셈의 원리를 신경세포에 기록한다. 딥러닝 학습법은 이런 신경세포의 작동원리를 컴퓨터 프로그램으로 구현한 것이다. 딥러닝을 통해 만든 인공지능은 학습할 수 있는 빅데이터가 늘어날수록 더욱 정교해진다. 알파고가 분석한 빅데이터가 많아질수록 인간이 알파고를 상대로 승리할 수 있는 확률은 낮아진다.

이윤근 ETRI 부장은 “딥러닝은 인간 두뇌가 지닌 학습·인지·기억 등 다양한 기능 중에서도 학습이란 하나의 기능만을 뽑아 컴퓨터가 이해할 수 있는 프로그램으로 만든 것”이라며 “인간 두뇌의 다양한 기능 중 지극히 일부분이라고 이해하면 된다”고 설명했다.

구글이 2015년 발표한 사진인식 및 캡션 인공지능. 인공신경망을 기반으로 했다. 오토바이 타는 사진을 자동으로 인식해 간단한 영문 문장 ‘A person riding a motorcycle on a dirt road(한 사람이 오토바이를 타고 흙길을 달리고 있다)’로 변환한다. [사진 구글]

◆머신러닝 활용법=딥러닝은 얼굴 등 영상 인식 인공지능에 활용한다. 딥러닝을 적용한 구글의 페이스넷(Face Net)의 얼굴 인식률은 99.96%에 달한다. 페이스북이 딥러닝을 적용해 만든 얼굴 인식 인공지능 딥페이스(Deep Face)도 97.25%의 인식률을 자랑한다. 구글은 사진 분류에 딥러닝 기법을 적용했다. 사용자가 온라인에 사진을 등록하면 구글의 인공지능은 이를 사물과 장소에 따라 분류한다. 사용자가 ‘자동차’라는 검색어를 입력하면 자동차가 포함된 사진만을 뽑아낸다. 얼굴 인식 기술을 확장하면 보안 등에도 활용할 수 있다. 머신러닝과 딥러닝은 새로운 질병 치료법 개발 등에도 활용되고 있다. 투약 횟수와 종류 그리고 투약 시기 등을 기록한 환자 빅데이터를 인공지능이 분석하면 의사들이 놓친 새로운 치료법을 발견할 수 있을 것으로 기대하고 있다.

강기헌 기자 emckk@joongang.co.kr