ADVERTISEMENT

생성형 AI 등장으로 누구나 쉽게 사용하는 ‘기술정보’

중앙일보

입력

이미지 제공 : 워트인텔리전스

이미지 제공 : 워트인텔리전스

ChatGPT 등장 이후 생성형 AI의 근간인 LLM(Large Language Model, 거대언어모델)의 비즈니스 활용이 주목을 받는 와중에 작년 메타의 라마(LLaMA)가 공개되면서 LLM의 한계를 보완한 sLLM(small Large Language Model, 소형언어모델)가 새로운 대안으로 떠오르고 있다.

그러나 기업에서 자체적으로 소형언어모델을 구축하는 것은 쉽지 않다. 기업에 맞는 맞춤형 sLLM을 구축하기 위해서는 우선적으로 생성형 AI를 학습시킬 대량의 데이터가 필수적이다. 또한 기업에 특성에 맞게 데이터를 다루고 학습시킬 수 있는 전문가가 필요하다.

대부분의 경우, 두가지 조건을 모두 갖추기는 쉽지 않다. 따라서 sLLM 도입을 고려하는 기업에서는 자사의 니즈에 적합한 sLLM을 구축할 수 있도록, 거대한 데이터셋과 높은 도메인 이해도를 보유한 업체를 찾는 것이 중요하다.

이에 IP리걸테크 기업 워트인텔리전스에서 기업 특화 sLLM을 위한 신규 프레임워크 출시를 알려 눈길을 끈다. 국내최초 기술정보분야 특화 sLLM인 본 프레임워크는 각 분야에서 주목받는 기업인 워트인텔리전스와 비즈메소드, 시스트란 3사가 함께 한다.

워트인텔리전스는 세계 최초로 특허전용 언어모델 PAT-BERT를 개발한 국내 기업이다. 현재 국내 최대 특허데이터를 기반으로 특허정보검색서비스인 키워트(keywert)를 운영 중이다. 비즈메소드는 데이터 생애주기에 따른 관리솔루션을 제공하며 골드만삭스·IBM·구글 등이 총 1억1600만 달러를 투자한 싱글스토어를 서비스하고 있다. 구글번역을 제공한 세계최초 AI번역솔루션 출시기업, 시스트란에서는 자체 개발한 인공지능 기반 신경망 기계번역(NMT) 기술과 수십 년간 축적한 다국어 처리 기술 노하우를 바탕으로 전문 영역에서도 최적화된 번역을 제공한다.

특허빅데이터는 전세계 최신 기술에 대한 정보를 담고 있는 ‘가치 집약적인’ 데이터이다. 그러나도메인에 대한 이해도가 없다면 그 가치를 제대로 활용하기란 쉽지 않다. 제공업체측은 생성형 AI와 대화를 하는 것만으로도 비즈니스 고도화, 사업전략 수립 및 경쟁사 분석 등 기업에서 필요로 하는 다양한 목적에 특허데이터의 가치를 제대로 활용할 수 있게 될 것이라 기대하고 있다.

워트인텔리전스 윤정호 대표는 “기술정보에는 신규 비즈니스의 검증부터 기술 변화의 예측, 미래 유망기술의 예측까지 비즈니스 인사이트가 모두 담겨있다"라며 “특허 빅데이터는 전세계 기술 트렌드와 흐름을 가장 잘 나타내는 데이터로, 누구나 그 가치를 제대로 활용할 수 있도록 sLLM 구축 사업을 통해 최대한 지원할 예정이다”라고 전했다.

사업 관계자는 “현재 도메인별 특화된 LLM과 결합한 다양한 사례가 다양한 고객사에서 구축 중이며, PoC(Proof of Concept) 진행을 통한 성능 확인 후 구축도 가능하다”라고 밝혔다. 본 프로젝트에 대해 자세히 알고 싶다면 키워트 블로그를 통해 확인할 수 있다.

ADVERTISEMENT
ADVERTISEMENT