차세대 검색엔진 '원하는 정보만 콕'

중앙일보

입력

''정보의 깊은 바다에서 원하는 알짜만 건져라'' .

현재 전세계에 존재하는 웹페이지는 15억개를 웃도는 것으로 추정된다. 웹페이지는 평균 8개월마다 배로 늘어난다고 한다. 정보량이 이렇게 빨리 늘다 보니 기존 검색엔진으로는 네티즌들이 원하는 정보를 콕 찍어 찾아내지 못하는 경우도 적지 않다. 미국 브라이트플래닛(http://www.brightplanet.com)사에 따르면 전체 웹 중 5천억건에 이르는 콘텐츠는 검색엔진으로 찾아내는 게 불가능하다.

이를 해결하기 위해 새로운 형태의 검색엔진들이 국내외에서 앞다퉈 나오고 있다. 앤써러의 이남 사장은 "검색단어와 관련된 일반 사이트들을 보여주는 1세대 검색엔진, 좀더 근접한 사이트들을 찾아주는 2세대 검색엔진에 이어 인공지능기술을 이용해 해답을 제공하고 근접 사이트들을 보조적으로 보여주는 3세대 검색엔진이 속속 개발되고 있다" 고 말한다.

레피아컴은 웹(html)문서뿐 아니라 hwp파일(아래아한글), doc파일(MS워드), PPT(MS파워포인트), 어도비의 PDF파일을 종류별로 골라 인터넷에서 찾을 수 있는 검색 서비스를 내놨다. 레피아 검색엔진은 또한 네티즌들이 최소한의 네트워크 트래픽으로 원하는 자료를 볼 수 있도록 실제 이미지를 축소한 요약이미지를 검색 결과로 보여준다. 이미지.사운드.동영상 데이터도 골라서 찾을 수 있다.

앤써러 엔진은 ''스탈린은 언제 사망했나'' 같은 문장을 입력하면 ''구 소련 정치가인 스탈린은 1953년 3월 5일 사망했습니다'' 라는 답을 보여주고, 관련 사이트도 찾아준다.

CCR는 텍스트뿐 아니라 사이트 초기화면까지 동시에 찾아줘 시각적 효과를 높인 검색엔진인 ''X2서치'' 를 지난해 12월 컴덱스에 내놨다. 영문 검색사이트를 먼저 오픈했으며 올해 중 한글 검색 사이트를 오픈할 계획이다.

엔타임닷컴은 마법사 기능을 통해 손쉽게 자신만의 검색엔진 사이트를 만들 수 있는 검색엔진을 제공하고 있다. 이 검색엔진은 또 접속하는 네티즌의 성별.연령 등을 감안해 검색엔진 사이트의 디렉토리 구조가 달라진다. 여자들은 생활.건강 분야가 가장 상단에 뜨고 남자들은 뉴스.스포츠등이 상단에 뜨는 식이다.

해외에서도 새로운 검색엔진이 잇따라 선보이고 있다. 1천8백개 온라인 뉴스사이트의 주요 기사를 찾아내는 검색엔진 ''모어오버닷컴'' 은 한달 방문자가 20만명 이상인 뉴스 사이트만 추적한다. 프랑스의 뉴스사이트 ''넷투원'' 은 15분 만에 한번씩 업데이트를 한다.

특수 분야만 집중적으로 찾아내는 검색엔진들도 인기를 끌고 있다. 금융자료를 찾는다면 ''파이낸셜파인드'' , 생명과학 정보나 과학 유머를 찾는다면 ''바이오링크스'' 가 도움이 된다. 2천5백여개 쇼핑사이트의 제품 가격과 정보를 추려내는 ''마이사이먼'' 의 한달 방문자는 5백만명, 법률정보 디렉토리인 ''파인드로'' 의 한달 방문자는 90만명에 이른다.

ADVERTISEMENT
ADVERTISEMENT