즉답형 검색엔진 lexxe.com 나왔다

중앙일보

입력

업데이트

지면보기

종합 01면

렉시는 검색 질문이 입력되면 원하는 답만 간결하게 제공한다는 점에서 기존 검색엔진과 다르다. 예를 들어 '미국의 수도는 어딘가'라는 질문을 입력하면 구글이나 야후에서는 '미국'이나 '수도'가 들어 있는 자료를 수천 건 보여준다. 그러나 렉시는 '워싱턴'이라는 답과 함께 연관도가 높은 100개의 자료만 제시한다.

렉시를 개발한 호주의 중국계 언어학자 차오훙량(喬鴻亮.렉시사 대표) 박사는 "첨단 자연어 프로세싱 기술(Natural Language Processing Technology)로 이 같은 검색엔진을 개발했다"고 설명했다. 자연어 프로세싱(NLP)은 컴퓨터가 언어의 의미를 이해하도록 프로그래밍하는 기술로, 컴퓨터 언어학으로도 불린다. 차오 박사에 따르면 기존 엔진에선 검색어를 하나의 상징(symbol)으로 인식해 그 단어가 들어 있는 모든 자료를 불러낸다. 그러나 렉시는 문장 속의 단어를 의미(meaning)로 인식해 전체 문장의 뜻을 이해한 뒤 답을 찾아내는 NLP 기술을 이용한다.

초기 단계라 아직 개선할 점이 많다. 무엇보다 지금은 영어만 통한다. 또 질문이 문법적으로 정확해야 하고, 10개 단어를 넘으면 문장의 의미를 인식하는 데 혼란이 생겨 정확한 답을 얻지 못하는 경우도 있다. 질문을 'When(언제)''Where(어디서)' 등 의문사로 시작해야 답을 쉽게 찾는 제약도 있다. 차오 박사는 그러나 "관련 기술을 계속 개발하고 있기 때문에 조만간 중국어와 다른 언어도 사용할 수 있을 것이며, 긴 질문에 대한 답도 찾아낼 것"이라고 말했다.

한편 국내에서도 한국전자통신연구원(ETRI)이 유사한 기술을 연구 중이지만 아직 상용화 수준에는 못 미치고 있다. 받침이 있는 한글 특성상 자연어 검색 엔진을 적용하기 어렵다는 것이다.

NHN의 최병엽 센터장은 "렉시가 문제 없이 상용 서비스를 제공한다면 획기적인 기술이다. 다만 지속적으로 서비스를 제공할 수 있을지는 좀 더 지켜봐야 한다. 왜냐하면 정확한 답 하나만을 검색해 내기 위해서는 서버 부담이 가중되기 때문이다. 현재 이 사이트가 제대로 가동되지 않는 이유도 그것 때문일 것"이라고 말했다.

홍콩=최형규 특파원, 이희성 기자

ADVERTISEMENT
ADVERTISEMENT