[톡톡에듀] 프로야구 데이터팀장 “데이터분석가 역할 더 커진다"

중앙일보

입력

업데이트

2000년대 초반, 미국 프로야구(MLB)에서 하위권을 맴돌던 오클랜드 애슬레틱스의 빌리 빈(Billy Bane)단장은 출루율 등 선수 성적 데이터를 분석해 선수를 영입했고 20연승이라는 놀라운 기록을 세웠다. 이 스토리는 영화 ‘머니볼’을 통해 더욱 유명해졌다. 빌리 빈은 세이버메트릭스(sabermetrics)로 선수를 평가했다. 빌 제임스(Bill James)가 설립한 미국야구연구협회에서 야구를 수학적, 통계학적으로 분석하기 위해 만든 통계 방법론이다.

데이터 야구 원조 NC 다이노스 임선남 데이터 팀장 #"데이터는 소통 위한 언어, 눈높이 맞춰 전달 능력이 더 중요"

데이터에 기반한 선수 영입과 구단 운영으로 미 프로야구 최하위팀을 최상위로 끌어 올린 빌리빈 단장 이야기를 다룬 영화 '머니볼'의 한장면.[중앙포토]

데이터에 기반한 선수 영입과 구단 운영으로 미 프로야구 최하위팀을 최상위로 끌어 올린 빌리빈 단장 이야기를 다룬 영화 '머니볼'의 한장면.[중앙포토]

한국 프로야구에도 데이터 바람이 불었다. 세이버메트릭스뿐 아니라 투구 추적 시스템(PTS·Pitch Tracking System) 장비가 도입되면서 쌓인 데이터를 연구하고 분석할 인력이 필요해졌다. 불과 3년 전에만 하더라도 데이터 분석, 투구 추적 장비가 낯설었지만 지금은 분석 장비와 함께 데이터 전문 인력에 대한 관심도 뜨겁다.

한국 데이터 야구의 원조는 NC 다이노스다. 2011년 창단 때부터 데이터를 활용한 구단 운영과 선수 영입 그리고 관객을 위한 서비스(현재 엔씨의 AI 기반야구애플리케이션 ‘페이지(PAIGE)’처럼)를 준비했다. 구단의 모기업인 온라인 게임 기업 엔씨소프트가 창단 당시 데이터정보센터 내에 설립한 야구데이터팀이 그 역할을 맡았다. 임선남 팀장도 이때 야구데이터팀에 합류했다. 2019시즌을 마쳤지만, 내년 시즌 준비에 더 바빠졌다는 임선남 스카우트팀/데이터 팀 팀장을 판교 엔씨소프트 사옥에서 만났다.

임 팀장은 “데이터도 결국 사람이 보는 거다. 데이터는 언어이며 이를 상대방 눈높이에 맞춰 전달해 데이터가 활용되는 것이 중요하다”고 했다.

임선남 NC 다이노스 스카우트팀/ 데이터팀 팀장은 데이터를 활용한 구단 운영 및 선수영입으로 구단 창단때부터 활약했다. [중앙포토]

임선남 NC 다이노스 스카우트팀/ 데이터팀 팀장은 데이터를 활용한 구단 운영 및 선수영입으로 구단 창단때부터 활약했다. [중앙포토]

데이터 분석과 인연을 맺은 계기는?

“메이저리그를 보면서 데이터에 관심을 갖게 됐다. 2005년 정도에 세이버메트릭스를 활용해 야구를 이야기하는 사람이 늘고 인터넷에 분석 글을 올리는 사람들이 생겨났는데 나 역시 마찬가지였다. 아마존에서 데이터 관련 서적을 사서 읽고 글도 올리며 지식을 쌓고 있었다. 그러다 엔씨소프트에서 야구데이터팀을 만드는 시점에 이직하게 됐다. 어쩌면 평범하다고 할 수 있는 대기업 회사원으로 살다 재미난 회사생활을 할 수 있다는 기회라고 생각해 옮겼다.”

야구에서 가장 중요한 기록은 무엇이라 생각하나?

“단일 경기만으로 본다면 아웃이다. 어떤 상황이 되더라도 아웃 3개면 공수가 바뀐다. 아웃당하지 않아야 하고 아웃시켜야 하는 싸움이다. 영원히 볼넷을 얻으면 계속 점수는 난다. 시즌으로 확대해서 생각해보면 출전 수가 제일 의미 있고 또 중요할 것 같다. 결국 실력이 있어야 출전할 수 있고 팀에 기여할 수 있는 거니까. 많이 출전하는 것 자체가 팀에 기여하는 거다. 하지만 우리나라에선 이런 꾸준함이 저평가됐다. 잘하는 선수가 오래 하는 건데.”

NC 다이노스 이동욱 감독이 경기 전 이호준 코치와 전력분석 자료를 살피고 있다. [중앙포토]

NC 다이노스 이동욱 감독이 경기 전 이호준 코치와 전력분석 자료를 살피고 있다. [중앙포토]

데이터가 팀의 성적에 차지하는 비중은 어떤가?

“숫자로 말하긴 어렵다. 활용도에 따라 달라질 수 있으니까. 장기적으로 선수 영입과 평가에 데이터를 활용하는 추세다. 하지만 당일 선수의 컨디션 같은 경우는 감독님의 눈이 가장 정확하더라. 감독님이 “몸이 무겁다”고 하면 실제로 경기력이 좋지 않더라.”

기술 발전과 함께 데이터 역할에도 변화가 있을 텐데?

“예측에서 진단으로 넘어가고 있다. 과거엔 쌓인 데이터를 바탕으로 추정했다. 내년 성적이나 기여도를 예측했다. 지금은 트래킹 장비가 도입되면서 현상을 분석한다. 진단과 함께 처방을 잘하는 시대가 온 것이다. 분명한 건 데이터는 조언자이지 결정자가 아니다. 결국 실제로 뜯어고치고 결정하는 건 사람이다. 데이터 역할만큼 이를 다루는 능력도 요구된다. 과거엔 엑셀 이상의 툴이 필요하지 않았다. 최근엔 영상과 같이 데이터 용량이 커지면서 사용하는 툴도 다양하다. 데이터가 쌓이는 만큼 데이터를 다루는 사람은 좀 더 좋은 전달자가 돼야 한다.”

데이터를 분석하고 해석해서 잘 전달하려면 어떤 노력이 필요할까?

“듣는 사람의 눈높이에서 언어를 사용해야 한다. 분석이 고도화될수록 방법론은 복잡하다. 사람들이 궁금한 건 분석 방법보다는 결론이 뭔지, 어떻게 활용할 수 있을지이다. 이 점을 인식하고 있어야 한다. 또 내 경우엔 야구의 속성을 잘 이해하고 있어야 한다. 그래야 그라운드에서 벌어지는 일을 더 깊이 있게 분석할 수 있다. 무엇보다 데이터를 들여다보기 전 선입견을 갖지 않는 게 중요하다. ‘저럴 것이다’란 결론을 가지고 접근해서 확신으로 이어지면 데이터는 큰 의미가 없다. 대게 그런 경우는 자신이 원하는 데이터를 선택하기 때문이다.”

경기는 데이터에 들어맞지 않을 때 더 재밌지 않나?

“단일 경기로만 보면 운이 좋았다고 표현하는데 사실 길게 보면 잘될 때도 있고 안될 때도 있다. 결국 데이터로 보면 예측하기 힘든 결과는 아니다.

물론 엉뚱한 사건들이 경기를 더 재미나게 하지만 데이터팀장 입장에선 더그아웃에서 감독님이나 선수들이 데이터를 들여다보고 있을 때 희열을 느낀다.”

다이노스 선수 중 예측대로 들어맞았던 선수는?

“찰리 쉬렉. 데이터에 의존해 영입한 선수다. 찰리가 처음 스프링캠프에 왔을 때 다들 반응이 좋지 않았다. 구속이 빠르지도 않았고 화려한 필살기가 있었던 것도 아니다. 하지만 우린 장타를 잘 맞지 않고 주로 땅볼을 유도해 맞춰 잡으며 주자를 내보내지 않는다는 점을 눈여겨봤다. 당시는 강력하고 압도적인 외국인 선수가 아니면 주목하지 않을 때였다. 하지만 우린 그의 마이너리그 데이터를 보고 잘될 거라 생각했다.” (찰리 쉬렉은 2013~14년 NC 다이노스에서 에이스로 활약했고 한국 프로야구 통산 11번째 노히트노런을 기록하기도 했다.)

임선남 팀장은 "강렬한 인상은 없었지만 데이터를 근거로 영입해 성공한 선수 중 찰리쉬렉이 가장 기억에 남는다"고 했다. 사진은 2014년 NC 다이노스 선발 찰리가 용병 최초로 노히트노런을 달성한 당시 모습. [중앙포토]

임선남 팀장은 "강렬한 인상은 없었지만 데이터를 근거로 영입해 성공한 선수 중 찰리쉬렉이 가장 기억에 남는다"고 했다. 사진은 2014년 NC 다이노스 선발 찰리가 용병 최초로 노히트노런을 달성한 당시 모습. [중앙포토]

기록이 습관일 것 같다. 기억하고 있는 강렬한 숫자는?

“오히려 기억하지 않는다. 야구 데이터 경우에 기억하는 숫자가 없다. 필요하면 찾아본다. 데이터베이스를 구축한 것도 그 때문이니까.”

최근 데이터 분석에 관심을 가지는 구단이 는 것 같다.

“최근 1~2년 새 데이터 분석을 전업으로 하는 인력을 뽑기 시작했다. 트래킹 장비 도입도 한몫한 것 같다. 이유는 간단하다. 스포츠엔 승패가 있기 때문이다. 아무리 열심히 해도 그보다 열심히 하는 팀이 있다면 진다. 스포츠야말로 혁신하지 않으면 진다. 잘하고 있다고 성적이 유지되지 않는다. 장기적 전략과 함께 남다른 노력을 해야 한다. 육체적인 노동의 노력엔 한계가 있으니 데이터 분석가의 역할은 더욱 커질 것이다.”

유부혁 기자 yoo.boohyeok@joongang.co.kr

관련기사

ADVERTISEMENT
ADVERTISEMENT