ADVERTISEMENT

올해 킬러앱은 바로 'P2P형 검색엔진'

중앙일보

입력

냅스터의 피어 투 피어 네트워킹에 기초한 ‘보급된 검색(distributed search)’은 이미 첫선을 보이고 있다. 하지만 이것이 2001년의 킬러 애플리케이션이 될 수 있을까?

냅스터는 인터넷 표준으로 인해 이제 명실공히 시조(始祖)가 됐다. 게다가 냅스터에 기초한 검색엔진이 냅스터만큼이나 반항적인 것이 될지도 모른다.

숀 패닝(Shawn Fanning)이 개발한 파일 교환 애플리케이션이 음악이 보급되는 방식을 변화시킨 것처럼 차세대 피어 투 피어 프로그램은 사람들의 웹 검색 방식을 변화시킬 것이다.

사실상 사용자들이 MP3 파일을 교환할 수 있도록 해주는 P2P 소프트웨어는 이미 첫선을 보였거나 올해 선보이게 될 몇 가지 새로운 검색엔진들의 기초가 된다. 이로 인해 일부 열성파들은 새로운 기술이 어떤 방법으로 웹이 검색할 수 있는 영역을 30배나 확장시켜주는지에 대해 열심히 선전하고 있다.

차세대 검색엔진은 냅스터같은 컴퓨터 네트워크 멤버들의 하드드라이브를 검색해 MP3 이상의 것들을 찾아낼 것으로 기대된다. 목적은 단 하나, 모든 것을 검색하는 것이다.

포인테라를 주목하라

넷스케이프 공동 창립자인 마크 앤더슨은 검색엔진 중 하나인 포인테라(Pointera)를 ‘브라우저가 등장한 이래 변화시키지 못했던 방식으로 인터넷을 변화시키는 것’이라고 표현했다.

이것은 이른바 최초의 ‘보급된 검색엔진’이다. 2000년 중반에 데뷔한 포인테라 공유 엔진은 포탈 및 컨텐츠 사이트 사용자들이 표준 웹 브라우저를 통해 파일을 공유할 수 있도록 해주는 최초의 엔진이다. 스핀프렌지비잉(Spinfrenzybeing)의 한 부문인 포인테라는 이 검색엔진을 비즈니스 환경에서 기존 검색을 전폭적으로 확장시키는 방법으로서 마케팅할 계획이다.

두 가지 다른 P2P 엔진은 아직도 개발중이다. 곤사일런트(Gonesilent)에서도 검색엔진이 나올 예정인데, 곤사일런트는 그누텔라 개발자였던 진 캔(Gene Kan)이 설립한 회사의 새로운 이름이다. 진 캔은 그누텔라에서 동일한 파일 교환 소프트웨어에 기초한 검색엔진을 개발하고 있다.

이미 운영중인 이 검색엔진은 대부분의 전통 검색엔진들이 처리하지 못하는 일들을 수행한다. 예를 들면 어떤 회사가 검색될 경우는 주가지수를 나타내주고, 사진을 보여주며, 심지어는 수학문제도 풀어준다.

또 다른 검색엔진은 그누텔라 패밀리 자체에서 나온다. 이 팀은 다른 애플리케이션 중에서도 특히 지펄프(gPulp)라고 불리는 향상된 새로운 그누텔라를 개발하고 있는데, 개발자인 세바스챤 램블러는 지펄프가 검색에도 이용될 수 있다고 말한다.

검색엔진 간의 차이점은

전통적 검색엔진과 신세대 검색엔진의 차이는 바로 어떤 곳, 얼마나 많은 자료에 액세스할 수 있느냐하는 점이다.

알타비스타나 구글같은 온라인 검색엔진들은 정보를 찾은 후 사용자들을 위해 그 정보에 색인을 다는 메카니즘을 사용한다. 어떤 사람들은 웹에서 절반 가량의 정보를 놓치며, 검색을 위해 소중한 시간을 소비한다고 말한다. 어떤 경우에는 소비되는 시간이 24시간에서 한 달까지 다양하다.

P2P 검색은 찾기나 검색, 혹은 분류하거나 묶을 필요가 없다. 이것은 검색이 진행되는 순간에 다른 하드드라이브에 있는 것을 찾아낸다.

스패머를 조심하라

업계의 일각에서는 보급된 검색이 올해의 수입원이 될 것으로 확신하는 반면, 보급된 검색의 핵심인 완전한 공개 시스템이 결국은 파멸의 원인이 될 것이라고 여기는 사람들도 있다.

서치 엔진 와치(Search Engine Watch) 편집자인 대니 설리번은 “냅스터의 성공 때문에 이 검색엔진에 대해 흥분하는 사람들이 많지만, P2P 환경이 전통 검색엔진을 대체하진 못할 것”이라고 주장했다.

그는 검색엔진이 스팸 대상도 된다는 것이 밝혀질 것이라고 말했다. 대부분의 사람들이 정보를 제출한 개인 사용자들의 정보를 얻을 수 있기 때문이다.

설리번은 “사람들은 웹에서 검색엔진을 조작하기 위해 엄청나게 애쓰고 있다. 어떤 검색엔진들은 당신을 직접 포르노 사이트로 안내하려 할 것”이라고 언급하고, 또 “모든 사람이 함께 하는 시스템을 사용할 경우, 그 시스템을 조작하려고 애쓰는 사람들도 있게 마련이다”고 말했다.

일례로 알타비스타의 경우 백만 페이지 가량이 가짜 목록이라는 것을 발견했다. 그 당시는 비교적 적은 페이지인 2000만 페이지가 알타비스타 사용자들에게 제공되던 시기였다.

“일부 검색엔진들은 정보 목록의 20분의 1을 쓸모없는 정보로 채우고 있다. 만약 별도의 감시장치를 갖추지 않는다면, 당신의 시스템은 큰 문제에 노출될 것이다.” @

ADVERTISEMENT
ADVERTISEMENT