LLM AI 모델 출시
LG AI연구원이 자체 개발한 인공지능(AI) 모델 ‘엑사원(EXAONE) 3.0’을 국내 최초로 오픈소스로 공개했다. 엑사원은 LG가 국내에서 자체 개발한 초거대 대규모언어모델(LLM)이다. LLM은 챗GPT처럼 스스로 인간의 언어를 학습해 추론·대답하는 AI 모델을 말한다. LG는 2021년 12월 엑사원 1.0을 발표한 뒤 지난해 7월 엑사원 2.0을 공개하는 등 매년 성능을 끌어올리고 있다.
LG그룹은 2026년까지 AI·데이터 연구개발에 3조6000억원을 투입하겠다고 밝힌 바 있다. AI를 중심에 놓고 새로운 고객경험과 혁신을 이뤄내겠다는 게 향후 LG그룹 전략의 핵심인 만큼, 엑사원을 활용한 LG그룹 제품·서비스 출시가 연내 본격화할 것으로 보인다.
오픈소스로 엑사원 3.0을 공개한 LG AI연구원 측은 “AI 연구 생태계 발전에 기여하기 위해 엑사원 3.0 모델 중 성능과 경제성에 있어 가장 활용도가 높은 경량 모델을 연구목적에 쓸 수 있게 공개했다”고 밝혔다. 오픈소스란 AI 모델이나 소프트웨어 등의 개발 소스코드를 공개하는 것을 말한다. 설계 기본이 되는 소스코드를 알면 이를 기초로 변형·응용한 모델을 추가 개발할 수 있다.
최근 AI 업계에서는 오픈소스 AI 모델이 화두로 떠올랐다. 오픈소스 AI 진영을 대표하는 메타(구 페이스북)는 지난달 자사 최신 AI 모델 라마 3.1도 오픈소스로 공개했다. 오픈AI·마이크로소프트(MS) 연합군과 구글 등 빅테크가 AI 모델 개발 주도권을 쥐면서 메타 같은 후발주자는 소스코드를 외부에 공유해 자사의 AI 생태계를 확장하는 전략을 구사하고 있다. 오픈AI·애플 등은 아직 자사 AI 모델을 오픈소스로 공개하지 않는다.
LG AI연구원은 이날 엑사원 3.0의 대화 성능 등을 종합적으로 평가하는 기술보고서도 함께 공개했다. 엑사원 3.0은 코딩과 수학 영역 등 13개 분야에서 1위를 차지하며 라마3.1, 구글 젬마2 등 비슷한 크기의 AI 모델과의 비교에서 밀리지 않았다. 특히 한국어와 영어를 학습하고 이해할 수 있는 이중 언어모델인 엑사원 3.0은 한국어 성능에서 세계 최고를 기록했다. 다만 또 다른 한국어 특화 LLM으로 꼽히는 네이버 하이퍼클로바X는 비교 대상에 없었다.
LG AI연구원은 엑사원 3.0에 특허와 소프트웨어 코드·수학·화학 등 국내외 전문분야 데이터 6000만건 이상을 학습시켰다. 연구원 측은 연말까지 법률·바이오·의료·교육·외국어 등으로 확장해 학습 데이터양을 1억 건 이상으로 늘려 성능을 더 끌어올릴 계획이다.
LG는 엑사원 3.0을 하반기부터 그룹 계열사 제품과 서비스에 본격적으로 도입할 방침이다. 앞선 버전인 엑사원 2.0 역시 LG그룹 계열사에서 업무에 활용했지만 이제 제품·서비스에도 확대 적용하겠다는 것이다. LG그룹은 이날부터 임직원을 대상으로 엑사원 3.0 기반의 생성 AI 서비스 ‘챗엑사원’ 베타 서비스를 시작했다. 검색부터 요약·번역·데이터 분석·보고서 작성·코딩까지 업무 전반에 활용할 수 있다.
LG 계열사들은 각사가 보유한 데이터를 추가 학습시켜 엑사원 3.0을 최적화하고 사업과 제품·서비스 특성에 맞게 이를 적용할 예정이다. LG유플러스의 경우 엑사원에 자체 통신 데이터를 학습시켜 소형언어모델(sLLM) ‘익시젠’을 개발하기도 했다. 배경훈 LG AI연구원장은 “특화된 성능과 경제성을 갖춘 엑사원으로 LG 계열사는 물론, 외부 기업·기관과의 파트너십도 강화해 나갈 계획”이라 말했다.