‘프러포즈용 반지’ 검색 순위 오르면…

중앙일보

입력

지면보기

종합 18면

정하웅 교수의 연구실 이름은 ‘복잡계 및 통계물리 연구실’이다. 복잡계는 세상에 복잡하게 얽혀있는 어려운 문제를 총칭하는 용어다. 우리가 살아가는 사회가 그렇고 인간의 뇌·생명현상 그리고 인터넷도 복잡계에 포함된다.

경기 좋아지니 주식 매수 신호?
검색어 1개로 판단하는 건 위험

정 교수는 ‘복잡계 네트워크’라는 새로운 분야를 개척하고 있다. 복잡한 문제를 풀기 위해서는 기초 연결뼈대인 네트워크를 먼저 연구하는 것이 순서다. 그는 월드 와이드 웹(WWW)·신진대사연결망·단백질연결망 등이 마치 항공망 같은 허브 구조를 가지고 있음을 밝혀낸 바 있다. 1998년 ‘WWW 네트워크 연구’라는 제목의 논문이 세계적 과학잡지 ‘네이처’에 게재되며 유명세를 탔다. 그 이후로 다양한 네트워크들을 연구하면서 수많은 데이터를 접하게 되었고, 그런 과정에 빅데이터에도 관심을 갖게 되었다고 한다.

빅데이터에는 함정이 있다. 검색 데이터는 단지 상관관계를 보여줄 뿐 과학적인 인과관계를 증명하는 것이 아니다. 예컨대 ‘빚’이란 단어 검색이 는 것을 보고 경기가 나빠져 주식이 떨어질 것이라고 섣불리 예단할 수는 없다. 마찬가지로 ‘프러포즈용 반지’라는 검색이 는다고 하여 경기가 좋아져서 주식투자를 해도 좋다고 결정해서는 안 된다. 검색어 하나로 사회적 경향을 판단하는 것은 위험하다.

관련 기사

또 장기예측이 불가능한 것도 주의해야할 점이다. 정 교수는 “빅데이터는 계속 변화하므로 단기적인 예측만 가능하다. 엄밀한 예측에는 반드시 과학적인 인과관계의 증명이 필수적”이라며 “100년 정도의 기간을 갖는 데이터에서 향후 10년 정도를 예측하는 것은 의미가 있을 수 있겠지만, 1년짜리 데이터로 향후 10년을 예측한다는 것은 말도 안 된다”고 했다.

배영대 문화선임기자

ADVERTISEMENT
ADVERTISEMENT