회원전용

네이버가 검색의도를 읽는 의도는?

중앙일보

입력 2021.08.21 18:25

팩플레터 119호, 2021. 07. 15 

Today's Interview
김상범 네이버 검색CIC 책임리더

119호 팩플레터

119호 팩플레터

안녕하세요, 여러분! 🙆 오늘은 ‘목요 팩플’ 인터뷰로 인사드려요.
구글이 세계에서 거의 유일하게 '검색 1위'를 못한 시장, 바로 한국이지요. 시장 점유율로 입증한 네이버 검색의 경쟁력은 누구도 부정하기 어렵습니다. 물론, 그 1위의 비결이 '가두리 양식장'이란 비판도 있었지요. 모든 검색 결과를 다 네이버 안에 묶어둔다는 비판이었습니다.

그러나 네이버 검색이 빠르게 진화하고 있습니다. 구글 방어가 아니라, 자기만의 길을 만들어 간다는 생각도 들어요. 얼마 전엔 사용자의 검색 의도를 파악해 결과를 내놓는 검색기술도 발표했는데요. 팩플팀은 궁금해졌습니다. '응? 내 의도를 네이버가 어찌알고? 근데 네이버가 왜?' 그래서 그 기술 담당하는 네이버 임원을 심서현 기자가 만나 물었습니다. 검색의도를 읽으려는 의도가 무엇이냐고요. 함께 보시죠! 😃

119호 팩플레터

119호 팩플레터

한국인이 초록색 창에 검색한 지도 어언 20년. 네이버 대문은 여전하지만, 검색에 적용되는 기술은 계속 변해 왔다.

지난달 네이버가 입력된 검색어의 의도를 분류한다는 토픽 검색을 내놨다. ‘세계 검색엔진 중 최초’라는 설명과 함께. ‘검색 의도’를 읽는다는 게 뭘까? 네이버 검색은 어떤 길을 가려는 걸까? 개편을 이끈 김상범 검색CIC 책임리더를 지난 9일 화상으로 만나 질문했다. 그는 “검색결과가 ‘아무말 대잔치’가 되는 걸 벗어나려는 것”이라며 “올해 네이버 전체 검색량의 10~15%에 토픽 검색이 적용될 것”이라고 했다.

네가 뭘 찾는지, 너는 몰라도 나는 알지  

토픽 검색은 콘텐츠 검색 결과를 구조화해 보여주는 서비스다. 예를 들어 검색창에 ‘인테리어’를 입력하면, 결과를 ‘#온라인 집들이’, ‘#인테리어 시공 후기’, ‘#인테리어 소품’ 등으로 분류해 보여준다. 사용자에게  ‘그 검색 결과에는 대개 이런 종류가 있다’고 정리해 제공한다는 것. 이는 네이버에 등록한 인플루언서(구 파워블로거)에게 ‘이런 키워드로 글을 쓰면 많이 읽힌다’는 힌트로도 제공된다.

 토픽 검색 예시. '바다낚시'를 검색하면 '#바다낚시 후기', '#바다낚시터 추천', '#바다낚시 장비' 같이 주제별로 묶어서 결과를 보여준다. 네이버 인플루언서들의 콘텐츠가 우선 노출된다. 여행 ·생활 분야 40개 검색어에 우선 적용했다.

토픽 검색 예시. '바다낚시'를 검색하면 '#바다낚시 후기', '#바다낚시터 추천', '#바다낚시 장비' 같이 주제별로 묶어서 결과를 보여준다. 네이버 인플루언서들의 콘텐츠가 우선 노출된다. 여행 ·생활 분야 40개 검색어에 우선 적용했다.

이걸 왜 만든 건가.
“네이버·구글·다음에서 검색해보고 탐탁치 않으니 인스타그램이나 유튜브 검색으로 가는 걸 많이 봤다. 정확히 뭘 찾는다기보다는 트렌드를 읽고 호기심을 충족하기 위해서 하는 검색이다. 그걸 보며 아쉬웠다. 네이버 안에 좋은 콘텐츠가 많은데, 우리가 충분히 잘 구성해서 제공하고 있나 하는 반성에서 시작했다.”
의도를 읽는다고 하면 거부감 들 수도 있다.
사람들이 자기가 뭘 찾는지 모른다. 누가 ‘와인 먹자’고 하면 네이버에 ‘와인’이라고 쳐 본다. 그런데 검색결과는 와인 역사, 가게 같은 게 뒤섞여서 ‘아무말 대잔치’다. 등산·골프·낚시 검색해도 마찬가지인데, 이건 기술 발달로만 해결되지 않는다. 네이버는 사용자가 대충 ‘와인’이라고 검색해도 ‘와인 궁합’, ‘소믈리에 되는 법’ 같이 잘 분류해서 보여주겠다는 거다. 콘텐츠는 네이버 안에 다 있다.”
와인, 등산 같은 특정 소재를 다루는 버티컬 서비스를 네이버가 대체하는 건가?
매거진을 보여주는 것과 같다. 인테리어 잡지를 구독하면 그 주제로 매번 업데이트된 내용을 주지 않나. 네이버가 잡지와 다른 점은 내용이 날마다 바뀔 수 있다는 거다. 판도 깔아준다. 인테리어 인플루언서들에게 ‘이런 키워드로 글 쓰면 사람들이 많이 본다’고 알려줘 참여를 유도한다.”
토픽 검색은 생활 정보에만 적용하나?
“예를 들어 ‘거북이 먹이’를 입력해 ‘이걸 먹는구나’ 찾는 정답형 검색은 논외다. 그 외 검색에는 두루 적용할 수 있다. 예를 들어 ‘목동 3단지’ 검색 결과 중 사람들이 많이 클릭하는 건 ‘목동3단지 인테리어’, ‘목동3단지 임장’, ‘목동3단지 경매’ 같은 것들이다. 이런 식으로 적지 않은 검색어에 토픽 검색을 적용할 수 있다. 올해 목표는 네이버 전체 검색 결과 10~15% 정도를 토픽검색으로 하는 거다. 9월에는 네이버 쇼핑 검색어에도 일부 적용하기 시작한다.”
119호 팩플레터

119호 팩플레터

대형마트보다, 갤러리아처럼 

김 책임리더는 “토픽 검색 결과를 검색한 사람의 성별·연령 등에 따라 맞춤으로 보여줄 것”이라고 했다.

어떤 맞춤형인가?
“과도한 타겟팅은 거부감을 준다. 다만 검색 결과에 대해 원하는 영역을 항상 상단에 볼 수 있게 하는 기능을 준비하고 있다. ‘인테리어’ 검색 결과 토픽 중 ‘온라인 집들이’를 상단 고정하는 식으로. 네이버 검색 결과를 대형마트보다는 갤러리아 백화점 느낌으로, 아기자기하게 만들고 싶다.”
토픽 검색은 연관검색어와는 다른가?
“연관검색어는 사람들이 넣는 검색어를 분석해서 만든다. ‘인테리어’를 검색한 후에는 이 단어를 검색하는구나, 하는. 토픽 검색은 반대다. ‘인테리어’에 대해 사람들이 어떤 문서를 많이 보는지를 분석한다. 이런 기술은 사용자에게 큰 가치를 줄 수 있다.”
어떤 가치?
“파리 여행에 대한 글 중에 소매치기 경험담, 예방법 등이 포함된 글이 많이 있다. 사용자가 먼저 능동적으로  ‘파리 소매치기 안 당하는 법’을 검색하지는 않는다. 하지만 그런 글을 마주치면 꼭 읽는다. 검색된 횟수는 적은데, 클릭 수는 많은 거다. 이걸 포착해 토픽 검색으로 준다. ‘이거부터 보시면 도움 될 거에요’라고.”
네이버는 ‘검색 유저’에게 무엇을 주고 싶은 건가?
“신뢰성과 다양성이다. 믿을만한 출처나 창작자의 콘텐츠를 결과로 내주는 동시에, 사람들의 다양한 생각을 보여줄 때 사용자들이 만족감을 얻는다고 생각한다.”
신뢰성과 다양성은 다소 충돌하지 않나?
“예를 들어 ‘간암 예방’을 검색했다고 하자. 상단에 카페글이 도배되지 않고, 권위 있는 출처의 의학 정보가 나와야 한다. 그런데 그것만으로 사람들이 만족할까? 나만의 방법이나 후기도 검색 결과에 나와야 한다. 상단에는 신뢰성을, 그 아래에는 많은 다양성도 보여줘야 사용자가 만족한다.”
119호 팩플레터

119호 팩플레터

"가두리 양식? 물고기도 키워야지"

네이버는 한동안 ‘가두리 양식장’이라는 비판을 받았다. 구글에서 검색하면 출처에 무관하게 결과가 나오는데, 네이버 검색 결과는 지식인·블로그·카페 같은 네이버 내부 콘텐츠 위주로 나온다는 것. 그래서 2017년부터 웹검색을 개선했고 그 담당자가 김 책임리더였다. 그는 “네이버에서 정보성 검색 결과를 클릭해 외부 사이트로 이동하는 비중이 훨씬 증가했다”고 했다. 그러면서도 “가두리 양식도 필요하다”고 했다.

가두리 양식이 왜 필요한가.
“물고기를 밖에서 못 가져오면 우리가 키워야지. 초기에 좋은 한글 검색결과를 얻기 힘들었던 건 한글 웹문서 자체가 적어서이기도 했다. 한국어 콘텐츠를 만드는 생태계가 필요했다. 당장 돈은 안 되지만, 회사가 블로그용 좋은 웹 에디터를 만드는 데 투자를 많이 했다. 양식 산업을 한 거다. 그게 네이버가 한국인에게 사랑받는 검색엔진이 된 비결이다.”
2010년대 후반부터 웹문서 검색 기술을 강조하지 않았나?
“네이버 안팎의 문서를 균형있게 검색하는 게 목표다. 내 눈높이에 맞는 생활정보 같은 검색은 네이버 맘카페 등을 통해서 잘 되는데, 공식 자료나 전문자료도 네이버에서 잘 검색되도록 하는 거다. 웹 검색은 기술적으로 도전할 거리가 많다.”
네이버는 파워블로거를 키우면서도 상업성을 견제했다. 그런데 최근 인플루언서에 다시 힘을 싣는 것 같다.
“네이버가 인플루언서 검색을 만든 건 블로그에도 ‘신뢰성’이라는 요소를 넣기 위해서다. 같은 블로그 중에서도 누구의 글을 더 신뢰할 수 있는지를 측정하려는 거다. 예를 들어 ‘부산 맛집’에 대한 신뢰도는 ‘부산에 10년 살았다’는 것으로 알 수 있다. 블로거의 신뢰도를 확인할 수 있는 다양한 아이디어를 구상하고 있다. ”
119호 팩플레터

119호 팩플레터

네이버와 구글, 숙명의 대결

네이버와 구글, 몸집(시가총액: 네이버 72조원, 구글 1990조원)은 30배 차이 나지만 한국 검색 시장에서만큼은 서로를 견제하며 컸다. 나만의 장점으로 차별화하기도, 서로의 장점을 배우기도 했다.

네이버는 구글에 비해 여전히 ‘손맛’이 들어간 검색결과를 보여주는 느낌이다.
“초창기에 구글은 깔끔하게 각 웹문서 링크만 주는데, 네이버는 만들어진 답을 준다는 비판을 받았다.  그런데 정작 한국 사용자들의 수요는 다르다. 예를 들어 ‘김대중’이라고 검색하면 그래도 전직 대통령인데 사진도 나오고, 약력도 나와야 한다. 그래서 검색 결과를 반은 자동, 반은 수동으로 한 거다.”
가장 연관성 높은 문서를 찾아오는 기술만으로는 부족하다는 건가.
“기술도 갖춰야 하지만, 콘텐츠 생태계가 중요하다고 본다. 구글도 유튜브를 갖고 있다. 유튜브를 인수할 때 검색 결과에 나올 콘텐츠를 확보하는 목적도 있지 않았을까.”
네이버 검색도 변해오지 않았나.
“네이버는 2010년대 초중반 정도부터 쇼핑에 공을 들였다. 사용자들이 입력하는 검색 질의의 20% 정도가 물건을 사려는 거더라. 각 쇼핑사이트의 링크를 줄까, 쇼핑 검색의 본질인 가격 비교를 해줘야 할까? 고민하면서 진행한 거다. 한국 사용자의 니즈를 포착하는 것은 네이버가 타사들보다 한 발 앞서 있다고 본다. 토픽 검색 같은 것도, 나중에 다른 글로벌 업체들도 도입하지 않을까?”
지난해 데뷰(네이버 개발 컨퍼런스)에서 발표하며 “일본 검색 시장에 세번째 도전하는데, 반드시 성공하겠다”고 말했다.
“한국에서 얻은 노하우가 있고, 일본 라인 사용자들을 대상으로 검색 테스트를 하고 있다. 일본어 웹이 한국의 3.5배 정도다. 문서 양도 많고 언어가 다르니 기술적으로 큰 도전이다. 다만, AI 시대가 되면서 브레이크스루(breakthrough: 기술 돌파구)를 찾는 데 걸리는 시간이 짧아졌고 일순간에 상향평준화가 됐다. AI를 쓰면 갑자기 성능이 확 올라가는, 지름길이 생긴 거다. 우리에게는 기회라고 볼 수 있다.”
얼마 전 클로바(네이버의 AI 조직)에서 네이버 블로그·카페 데이터를 이용해 AI 한국어 언어모델을 만들었더라.
“네이버 안에는 가장 풍부한 한국어 데이터가 있고, 우리는 이게 언제 쓰여졌는지, 믿을만 한 사람이 썼는지 여부도 안다. 이런 게 AI 시대에 글로벌 빅테크와 맞설 경쟁력이라고 생각한다.” 

오늘 한 모든 일이 '검색' 

김상범 책임리더의 2005년 컴퓨터학 박사 논문의 제목은 ‘문맥의존 언어모형에 기반한 정보검색’. 의도를 파악하는 검색을 그때부터 연구했단 얘기다.

‘검색 전문가가 되겠다’ 일찌감치 결정한 건가?  
“대학원 진학 무렵 인기있는 분야는 운영체제(OS)나 데이터베이스, 통신 네트워크였다. 그런데 이런 분야는 기술 트렌드가 빨리 바뀌고, 학교에서 배운 게 금방 소용 없어지기도 한다. 나는 지식이 쌓이는 공부를 하고 싶어서 인공지능과 자연어처리(NLP) 연구실을 택했다. 당시 연구실 출신들끼리 요새 얘기한다. ‘자연어처리가 이렇게 각광받을 줄은 교수님도 우리도 몰랐다’고. 그때 구상했던 것들이 지금 기술로 구현되고 있다.”

그는 이번주 내내 채용 면접으로 바빴다고 했다.

어떤 사람을 뽑나?
검색은 컴퓨터사이언스의 종합예술이다. 머신러닝, 데이터마이닝 등 굉장히 다양한 요소기술이 들어가기 때문에 거의 전 분야 인재를 채용하고 있다. 주변에서 ‘네이버 들어가려면 우리 애 대학원 여기 가야 하냐’ 묻는데, 그런 것 없다. 각각의 요소 기술을 잘 갖추고 문제해결 능력이 우수해야 한다.”

검색의 미래는 뭐라고 생각하나?  
“인간이 뭘 검색하는 행위는 죽을 때까지 안 없어질거 같다. 예를 들어, 앱을 켜서 택시 호출하는 것도 검색이다. 내 위치가 검색어고, 주변에 있는 차가 검색 대상이다.검색과 매칭은 인간의 행위의 본질이다. 이에 대한 기술은 계속 발전하고 수요도 커질 거다.”

Innovation Lab

ADVERTISEMENT