렉시는 검색 질문이 입력되면 원하는 답만 간결하게 제공한다는 점에서 기존 검색엔진과 다르다. 예를 들어 '미국의 수도는 어딘가'라는 질문을 입력하면 구글이나 야후에서는 '미국'이나 '수도'가 들어 있는 자료를 수천 건 보여준다. 그러나 렉시는 '워싱턴'이라는 답과 함께 연관도가 높은 100개의 자료만 제시한다.
렉시를 개발한 호주의 중국계 언어학자 차오훙량(喬鴻亮.렉시사 대표) 박사는 "첨단 자연어 프로세싱 기술(Natural Language Processing Technology)로 이 같은 검색엔진을 개발했다"고 설명했다. 자연어 프로세싱(NLP)은 컴퓨터가 언어의 의미를 이해하도록 프로그래밍하는 기술로, 컴퓨터 언어학으로도 불린다. 차오 박사에 따르면 기존 엔진에선 검색어를 하나의 상징(symbol)으로 인식해 그 단어가 들어 있는 모든 자료를 불러낸다. 그러나 렉시는 문장 속의 단어를 의미(meaning)로 인식해 전체 문장의 뜻을 이해한 뒤 답을 찾아내는 NLP 기술을 이용한다.
초기 단계라 아직 개선할 점이 많다. 무엇보다 지금은 영어만 통한다. 또 질문이 문법적으로 정확해야 하고, 10개 단어를 넘으면 문장의 의미를 인식하는 데 혼란이 생겨 정확한 답을 얻지 못하는 경우도 있다. 질문을 'When(언제)''Where(어디서)' 등 의문사로 시작해야 답을 쉽게 찾는 제약도 있다. 차오 박사는 그러나 "관련 기술을 계속 개발하고 있기 때문에 조만간 중국어와 다른 언어도 사용할 수 있을 것이며, 긴 질문에 대한 답도 찾아낼 것"이라고 말했다.
한편 국내에서도 한국전자통신연구원(ETRI)이 유사한 기술을 연구 중이지만 아직 상용화 수준에는 못 미치고 있다. 받침이 있는 한글 특성상 자연어 검색 엔진을 적용하기 어렵다는 것이다.
NHN의 최병엽 센터장은 "렉시가 문제 없이 상용 서비스를 제공한다면 획기적인 기술이다. 다만 지속적으로 서비스를 제공할 수 있을지는 좀 더 지켜봐야 한다. 왜냐하면 정확한 답 하나만을 검색해 내기 위해서는 서버 부담이 가중되기 때문이다. 현재 이 사이트가 제대로 가동되지 않는 이유도 그것 때문일 것"이라고 말했다.
홍콩=최형규 특파원, 이희성 기자