ADVERTISEMENT

텍스트로 동영상 ‘뚝딱’ 오픈AI·구글 ‘비디오AI’…삼성이 뒤에서 웃는다

중앙일보

입력

업데이트

지면보기

경제 01면

“gg humans(인류는 끝났다).”

15일(현지시간) 일론 머스크 테슬라 최고경영자(CEO)가 챗GPT 개발사 오픈AI의 인공지능(AI) 모델 ‘소라’를 접한 직후 X(옛 트위터)를 통해 보인 첫 반응이었다.

‘Good Game’의 줄임말인 gg는 게임에서 사용하는 단어로, 승부에서 졌을 때 패배를 인정하는 말이다. 이날 오픈AI가 공개한 소라는 사용자가 간단한 명령만 입력하니 수초만에 할리우드 제작사가 수개월 걸려 만들어낼 수준의 영상(1분 길이)을 무한정 만들어냈다.

거대언어모델(LLM) 기반 AI가 텍스트, 음성, 이미지를 넘어 마침내 동영상까지 도달했다. 이제 남은 숙제는 ‘인간의 능력을 모든 면에서 능가하는 일반인공지능(AGI) 뿐’이라는 평가가 나온다.

구글은 지난달 비디오 생성 AI ‘루미에르’를 통해 새로운 AI 학습 모델을 공개했다. 이미지·소리·영상 등 다양한 형태의 데이터를 동시에 이해하고 처리하는 멀티모달 AI 전쟁이 빅테크 기업을 중심으로 시작됐다. 업계에선 “한동안 주춤했던 사용자 AI 경험이 생성형 동영상 서비스를 통해 개화하며 올해 또다시 ‘퀀텀점프’(대도약)할 것”으로 본다.

주목해야 할 점은 대화형 언어모델로 시작된 생성형 AI 서비스가 예측을 벗어나 빠른 속도로 발전하고 있다는 것이다. 생성형 AI 서비스가 도입된 지 2년도 지나지 않아 실제와 구분이 어려운 동영상까지 만들어냈다. 이를 위해서는 반드시 하드웨어 측면에서 더 높은 성능의 그래픽처리장치(GPU)와 메모리 반도체가 필요하다. 동영상 생성에 필요한 데이터 크기와 처리속도는 텍스트의 수천 배 이상이라서다.

비디오AI 시장 열리면 GPU·메모리 대박

상황이 이렇자 전 세계 AI GPU시장을 장악한 엔비디아도 대응에 나섰다. 2년 전 대화형 AI 열풍을 일으켰던 챗GPT의 GPT-3.5의 경우 학습과 추론을 위해 1만여 개의 GPU가 필요했다. 영상·음성까지 동시에 생성할 수 있는 모델을 만들기 위해서는 적어도 5만 개 이상의 GPU가 필요하다는 게 업계의 분석이다.

차준홍 기자

차준홍 기자

엔비디아는 최근 기존 주력 제품(H100)보다 2배 빠른 H200을 공개한 데 이어 차세대 AI 칩을 준비하고 있다. GPU 성능을 높이기 위해 동시에 여러 GPU를 연결해 연산 능력을 극대화한 네트워킹 기술도 선보였다.

짧은 시간 동안 막대한 데이터를 처리해야 하는 만큼 메모리 반도체 수준도 높아져야 한다. 당장 고대역폭메모리(HBM)·더블데이터레이트(DDR)5 같은 고부가가치 AI D램 수요가 폭발적으로 늘고 있다. 김정호 카이스트 전기·전자공학부 교수는 “수십만 명의 이용자가 동시에 생성형 AI로 동영상을 만들기 위해서는 이제 막 도입이 시작된 HBM3E으로도 제대로 된 대응이 어려울 것”이라면서 “지금보다 적어도 4배 이상의 성능이 필요하다”고 말했다.

전 세계 D램 점유율의 70% 이상을 차지하고 있는 삼성전자와 SK하이닉스 입장에선 기회가 찾아온 셈이다. 시장조사업체 옴디아는 D램 시장에서 DDR5 점유율이 2027년 이후 절반을 넘어설 것으로 전망한다. 가트너는 이보다 빠를 것으로 내다봤다. 지난해 466억 달러(약 62조원)로 바닥을 찍었던 D램 매출이 올해 88% 성장해 874억 달러(약 117조원) 규모에 이를 것으로 전망했다.

국내 반도체 업체들의 발걸음도 빨라졌다. SK하이닉스는 올 상반기 최신 제품인 5세대 HBM3E를 엔비디아에 공급한다. 삼성전자와 SK하이닉스는 이미 엔비디아와의 HBM4 공동설계 작업에 돌입한 것으로 알려졌다.

ADVERTISEMENT
ADVERTISEMENT