ADVERTISEMENT

月4만원이면 '나만의 챗GPT' 만들어준다…몸값 49조 이 회사

중앙일보

입력

지면보기

종합 02면

알리 고드시 데이터브릭스 CEO

팩플 인터뷰

올 상반기 내내 챗GPT의 충격이었습니다. 영화에서나 보던 미래사회가 이미 스마트폰 안에 들어온 셈이었죠. 하지만 기업들은 냉정합니다. 챗GPT를 외면할 순 없지만 직원들이 기업 기밀을 입력할 우려 등 따져볼 게 많죠. 직접 AI를 만들자니 비용이 비현실적입니다. 그런데 월 4만원에 ‘AI용병’을 부릴 수 있답니다. 무슨 마법일까요? 더중앙플러스(http://joongang.co.kr/article/25176842)에 확인하실 수 있습니다.

챗GPT는 기업에 ‘계륵’이다. 안 쓰자니 아쉽고, 쓰자니 챗GPT에 직원들이 기밀 데이터를 입력할까 걱정이다. 오픈AI처럼 직접 인공지능 거대언어모델(LLM)을 만드는 건 더 비현실적이다. 일반 기업으로선 기술 역량도, 투자 비용도 엄두를 내기가 쉽지 않다. 이런 수요를 포착한 글로벌 AI 스타트업들이 ‘기업용 챗GPT’를 내놓고 있다. 오픈소스 기반의 LLM인 ‘돌리’도 그중 하나다. 돌리는 데이터 관리 기술로 데카콘(기업가치 100억 달러 이상의 비상장 기업)에 오른 데이터브릭스가 개발한 무료 오픈소스 LLM이다.

김영희 디자이너

김영희 디자이너

데이터브릭스는 UC버클리 객원교수이던 알리 고드시와 6명이 2013년 공동 창업한 데이터·AI 기술 기업이다. 누적 투자유치액은 36억 달러(약 4조6000억원), 기업가치는 380억 달러(약 49조원)다. 아마존, 마이크로소프트(MS), 구글의 모회사인 알파벳이 이 회사의 투자자들이다. 지난해 매출은 10억 달러(약 1조3000억원), 골드만삭스·월마트 등 기업 1만 곳이 데이터브릭스의 데이터 관리 솔루션을 쓰고 있다.

지난달 14일 알리 고드시 최고경영자(CEO)를 화상으로 만났다. 국내 매체와는 첫 인터뷰다. 그는 “정보기술(IT) 산업뿐 아니라 모든 산업에서 AI와 데이터를 잘하는 기업이 승자가 될 것”이라고 했다.

돌리라는 오픈소스 LLM을 만든 이유는?
“월 30달러로도 AI 모델을 만들 수 있다는 걸 보여주고 싶었다. 기업들은 자기들만의 AI 모델을 구축하고 싶어 한다. 기업엔 데이터가 굉장히 많은데 그걸 외부에 내주고 싶어 하지는 않는다. 이를 인정하면서도 그들이 고품질 AI 모델을 보유할 수 있도록 하고 싶었다.”
돌리를 써봤는데, 대화에 능숙하진 않은 것 같았다.
“돌리는 일상적인 잡담을 주고받는 용도는 아니다. 기업의 구체적인 문제를 해결하도록 훈련된 모델이다. 예를 들면 의료계 진단 영상을 통해 어디에 종양이 있는지 파악한다든지 등의 일을 할 수 있다. 특정 업무를 훈련시키면 고품질의 결과값을 얻어낼 수 있다.”
생성AI 플랫폼 모자이크ML을 인수한 이유는.
“모자이크ML은 기업의 맞춤형 LLM과 생성AI 앱 개발을 지원할 수 있는 역량을 보여줬다. 비유하자면 우린 테슬라 모델X 차량을 산 게 아니라 테슬라 자동차를 생산할 수 있고 더 많은 자동차를 함께 생산할 수 있는 공장을 산 것이다.”
김영희 디자이너

김영희 디자이너

데이터브릭스의 주요 매출원은 클라우드 기반 데이터 관리 솔루션이다. 핵심 서비스는 ‘데이터브릭스 레이크하우스 플랫폼’. 재무제표 등 숫자로 표현되는 정형 데이터와 텍스트·오디오·비디오 파일 같은 비정형 데이터를 저장하고 활용하도록 하는 데이터 관리 기술이다.

비정형 데이터가 중요한 이유는.
“모든 AI에는 비정형 데이터가 필요하다. 가령 헬스케어 기업의 비정형 데이터인 DNA 정보나 전자의무기록을 활용해 AI를 만들고, 신약 개발을 할 수 있다. 우리 고객사인 한국의 온라인 커머스 무신사는 비정형 데이터로 더 많은 고객을 웹사이트로 끌어오고 있다.”
데이터 플랫폼 기업의 미래는 뭔가. 데이터 관리 서비스부터 AI까지 모두 제공하는 것?
“그렇다. 데이터브릭스 고객들은 레이크하우스를 통해 비정형·정형 데이터를 모으고, 이 데이터로 돌리를 학습시킬 수 있다.”
지난해 한국 사무소를 냈는데.
“한국은 매우 중요한 시장이다. 기술적으로 앞서 있고, 기업들도 AI 혁명에 대한 준비가 돼 있다.”
상장은 언제 계획하나.
“지금은 시장이 준비되지 않았다. 비상장사이기 때문에 AI 같은 분야에 더 자유롭게 투자할 수 있다.”
AI 개발 과정에 쓰인 세부 기술을 공개하지 않는 폐쇄형 AI와 오픈소스 AI, 어느 쪽이 우위를 차지할까.
“오픈소스가 성공할 것이다. 지금도 모든 대학 컴퓨터공학과에서는 오픈소스 AI 연구를 하고 있다. AI를 폐쇄형으로 만드는 기업들이 이런 오픈소스 진영과 경쟁하기는 어렵다.” 
ADVERTISEMENT
ADVERTISEMENT