미국선 트럼프 당선 맞힌 인공지능(AI), 한국선 왜 조용할까

중앙일보

입력

업데이트

지난해 11월 치러진 미국 대선은 인공지능(AIㆍArtificial Intelligence)의 잠재력을 일깨운 계기였다. 뉴욕타임즈ㆍ월스트릿저널 등 미국의 거의 모든 주류 언론이 힐러리 클린턴 당시 민주당 후보가 당선될 거란 여론조사를 내놓았다. 그런데 인도의 정보기술(IT) 회사 제닉AI의 AI 프로그램 모그IA(MogIA)는 대선 열흘 전부터 “트럼프가 당선될 것”이라고 예측했다. 트럼프의 당선이 확정되자 언론들은 “이번 대선의 진정한 승자는 AI”라고 평가하기도 했다.

치우침 없는 빅데이터 확보가 중요하지만 #인공지능 기술만 뛰어나면 극복할 수 있어 #반어법 많은 한국어 제대로 이해 못하고 #정치적 오해 두려워 기업들 시도도 적어

한국 대통령선거에서도 이런 인공지능의 예측 역량을 활용할 순 없을까. 결론부터 얘기하자면 '기술적으로 불가능하진 않지만, 현실적으로는 어렵다'이다.

인공지능의 선거 예측은 빅데이터를 수집하는 데서 시작한다. 모그IA는 페이스북ㆍ트위터 등 소셜네트워크서비스(SNS)에서 2000만 건의 데이터를 추출하고 이를 자체 알고리즘으로 분석한 것으로 알려졌다. 관건은 가급적 인구통계학적ㆍ정치적으로 편향되지 않은 데이터를 어떻게 확보하느냐다.

빅데이터 분석을 하는 국내 다음소프트는 과거 트위터와 손잡고 몇몇 지방 선거의 판세를 분석하는 작업을 했다. 하지만 그다지 정확한 결과를 도출하지 못했다. 이유가 뭘까. 익명을 요구한 한 IT업계 관계자는 “트위터는 한국에서 비교적 정치적 편향성이 강한 매체로 발달했는데 이런 편향성을 충분히 거르지 못했던 것 같다”며 “트위터·페이스북 같은 SNS엔 특정 연령대, 특정 성향의 소비자가 몰리는 경향이 있어 실제 인구 분포와는 큰 차이를 보일 수밖에 없다”고 말했다.

물론 한쪽으로 치우친 데이터를 확보했다고 하더라도 인공지능의 분석 역량만 뛰어나면 이를 극복할 수도 있다. 인공지능이 “A란 SNS는 20대의 진보성향의 회원이 유독 많다”거나 “B는 노년층의 보수성향의 회원이 많다”는 것을 파악한다면 스스로 편향성을 보정할 수 있다는 얘기다.
일일이 회원 자료를 뒤질 것도 없다. 과거의 데이터와 선거 결과를 놓고 인공지능을 학습시킬 수도 있다.
신진우 카이스트 전기전자공학부 교수는 “인공지능이 옛날 데이터와 선거 결과를 혼자 분석하다 보면 우리가 눈치채지 못한 특정 경향성이나 법칙을 발견하게 된다”며 “예를 들어 ‘의외로’라는 단어가 많이 언급되는 후보가 당선되는 경향이 있다던가 특정 시간대에 검색률이 올라가면 유리하다던가 하는 식”이라고 설명했다.

최승진 포항공대 컴퓨터공학과 교수도 비슷한 입장이다. 데이터에 특정 경향이 있다는 것만 파악하면 기계가 이를 고려한 분석 값을 내놓을 수 있단 얘기다.
최 교수는 “과거 선거에서 동일하게 발견됐던 패턴을 기계가 찾을 수만 있다면 데이터 자체가 인구통계학적으로 완벽할 필요는 없다”며 “패턴을 파악하는 과정을 사람이 도와주면 정확도가 훨씬 올라갈 것”이라고 말했다.

문제는 이 정도 수준의 인공지능 기술을 확보한 기업이 그리 많지 않다는 현실이다. 국내에선 'AI를 활용한 빅데이터 분석'을 내세운 기업들도 실제론 텍스트 기반의 빅데이터 분석을 주로 하는 경우가 많다. 진정한 의미에서 '스스로 판단하는' AI 기술을 내세울만한 회사는 그리 많지 않다는 것이다.

반어적 표현이 많은 한국어의 특수성이 분석을 더 어렵게 한다는 주장도 나온다. 특정 후보와 자주 언급되는 단어가 긍정적인지 부정적인지를 살펴보는 기본적인 분석조차 쉽지 않다는 얘기다.
인공지능 기반의 검색 서비스를 제공하는 한 스타트업 개발자는 “A당의 B 후보에 대해 ‘웃기고 있다’든가 ‘잘들 한다’는 표현이 많이 나왔을 때 기계가 이 뉘앙스까지 구분하긴 어려운 실정”이라며 “한국어 분석 기술이 더 발달해야 정확한 선거 예측이 가능할 것”이라고 말했다.

정치권의 눈치를 유독 많이 보는 국내의 기업 풍토 상 분석 역량이 있더라도 굳이 나서서 이를 분석하고 예측 결과를 밝히는 기업이 있겠느냐는 지적도 나온다. 빅데이터의 규모나 인공지능 기술이 국내 최고 수준인 네이버가 대표적이다.
네이버 관계자는 "AI 기술로 대선 결과를 예측할 수 있겠느냐"는 질문에 “우리가 가진 데이터나 기술로 대선 예측을 할 이유가 없다. 생각해본 적이 없기 때문에 기술적으로 가능할지도 모르겠다”고 말했다.
신진우 교수는 “역량을 갖춘 IT 기업이 진지하게 매달린다면 여론조사를 뛰어넘는 예측 결과를 낼 수 있겠지만, 기업들로선 정치적 오해를 받을까 두려울 것”이라며 “정치적 분위기 때문에 AI를 활용한 다양한 분석이 시도되지 않는 건 아쉬운 일”이라고 말했다. 임미진 기자 mijin@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT