4만 원이면 ‘AI 용병’ 만들어준다…몸값 49조 데이터브릭스

  • 카드 발행 일시2023.07.13

Today’s Interview
“모든 기업의 CEO는 AI·데이터 리더여야”
알리 고드시 데이터브릭스 CEO

챗GPT는 기업에 ‘계륵’이다. 안 쓰자니 아쉽고, 그렇다고 쓰자니 챗GPT에 직원들이 기밀 데이터를 입력할까 싶어 걱정이다. 오픈AI처럼 직접 인공지능 거대언어모델(LLM)을 만드는 건 더 비현실적이다. 일반 기업으로선 기술 역량도, 투자 비용도 엄두를 내기 쉽지 않다. 이런 수요를 포착한 글로벌 AI 스타트업들이 발 빠르게 ‘기업용 챗GPT’를 내놓고 있다. 오픈소스 기반의 LLM인 ‘돌리’도 그 중 하나다. 돌리는 데이터 관리 기술로 데카콘(기업가치 100억 달러 이상의 비상장 기업)에 오른 데이터브릭스가 개발한 무료 오픈소스 LLM.

데이터브릭스는 미국 실리콘밸리에서 주목 받는 데이터⋅AI 기술 기업이다. UC버클리 객원교수이던 알리 고드시와 6명이 2013년 공동 창업했다. 누적 투자유치액은 36억 달러(약 4조6000억원), 기업가치는 380억 달러(약 49조원)다. 투자자들의 면면도 화려하다. 아마존, 마이크로소프트(MS), 구글의 모회사인 알파벳이 모두 이 회사의 투자자들. 지난해 매출은 10억 달러(약 1조 3000억원), 골드만삭스·월마트·그랩 등 기업 9000곳이 데이터브릭스의 데이터 관리 솔루션을 쓰고 있다.

지난달 14일 알리 고드시 최고경영자(CEO)를 화상으로 만났다. 국내 매체와는 첫 인터뷰다. 오픈소스 LLM을 내놓은 이유, 데이터가 중요한 이유 등을 그는 차분하고도 자신감 넘치게 말했다. “정보기술(IT) 산업뿐만 아니라 모든 산업에서 AI와 데이터를 잘하는 기업이 승자가 될 것”이라고도 했다. 인터뷰 이후 데이터브릭스는 생성 AI 플랫폼(모자이크ML)을 13억달러(약 1조7000억원)에 인수한다고 발표했다. 관련 질문도 서면 인터뷰로 추가했다.

한호정 디자이너

한호정 디자이너

우리 회사 맞춤형 챗GPT

알리 고드시 CEO는 돌리를 소개하며 “기업은 AI 모델을 학습시킬 비용 30달러만 있으면 된다”고 말했다. 무료로 다운로드한 돌리 모델에 기업 내부 데이터를 넣고, 저렴한 클라우드 서비스를 통해 AI를 맞춤형으로 훈련시키면 된다는 것. 지난 4월 공개한 돌리 2.0의 파라미터(매개변수)는 120억 개로, 구글의 팜2(5300억 개)나 오픈AI의 GPT-3.5(1750억 개)보단 작다. 그러나 오픈소스라 기업이 맞춤형 AI를 만들기 좋다. 데이터브릭스 같은 LLM 개발 기업에 데이터를 내줄 필요도, 기업이 거액을 들여 LLM을 직접 구축할 필요도 없다. 데이터브릭스는 3월 돌리 1.0을 공개하며 세계 최초 복제 포유동물인 ‘복제양 돌리’에서 이름을 따왔다. 스탠퍼드 연구팀의 AI 모델 ‘알파카’ 등 기존 AI 모델을 활용해 만들었다는 의미를 담았다.

돌리라는 오픈소스 LLM을 만든 이유는?