ADVERTISEMENT

‘데이터메이커’ 고난도 인공지능 학습용 데이터 레이블링 잇따라 수행

중앙일보

입력

업데이트

전문 분야 레이블링을 수행하고 있는 작업자(사진 제공: 알디프로젝트)

전문 분야 레이블링을 수행하고 있는 작업자(사진 제공: 알디프로젝트)

최근 디지털 뉴딜 정책 발표와 함께 공개된 정부의 데이터 댐 구축 구상을 바탕으로 의료, 금융, 법률 등 특수 분야의 난이도 높은 데이터 레이블링이 요구되는 가운데 알디프로젝트의 ‘데이터메이커’ 플랫폼이 각종 기업ㆍ기관들의 이목을 끌고 있다.

데이터 레이블링 플랫폼을 제공하는 알디프로젝트는 최근 ‘신경세포 3D 이미지 데이터 레이블링’도 성공적으로 수행하며 고난이도 특수 분야 데이터 레이블링에 적합한 수준 높은 작업자 양성 능력을 증명했다.

특히 의료 분야의 경우 전문적인 데이터 특성 상 작업자 교육과 관리의 난이도가 높고 프로세스를 세팅하는 기간과 비용이 많이 소요되는 것으로 알려져 있지만, 데이터메이커 플랫폼은 일반인들도 전문 작업에 즉시 투입할 수 있는 전문 교육 시스템과 각 분야별 전문 배경 지식을 보유한 인력풀을 구축한 덕분에 심화된 요구사항이 있어도 양질의 데이터를 빠르게 제공해줄 수 있다는 것이 관계자의 설명이다.

현재 수행 중인 의료 음성 데이터 레이블링의 경우 의료전문 용어로 이루어진 한영 혼용 스크립트와 음성 데이터를 가공하는 높은 난이도에도 불구하고 약 80명의 숙련된 작업자들을 양성해 빠르고 정확한 레이블링을 수행하고 있으며, 지난달부터 수행한 신경세포 레이블링의 경우에도 비정형화된 3차원 이미지 구조로 인해 오랜 기간이 소요될 것으로 예상됐으나 착수 한달 내에 수행을 완료하는 성과를 거두었다.

알디프로젝트의 이민주 이사는 “최근 수요가 늘고 있는 의료나 시설안전 등 특수 산업 분야 데이터 레이블링에 적합한 작업자 교육과 자동화 엔진 개발 등을 계획하고 있다”며 “데이터셋 구축 사업 등 정부 사업을 통해 기존에 발굴되지 않았던 새로운 형태의 특수 데이터 레이블링도 단기간 내 수행할 수 있음을 증명했다”고 전했다.

실제로 알디프로젝트를 통해 가공을 진행한 의료 관련 프로젝트들은 현재까지 100% 재계약율을 보이고 있으며, 앞으로도 각종 전문 분야의 기업과 기관들의 관심이 이어질 것으로 전망된다.

온라인 중앙일보

ADVERTISEMENT
ADVERTISEMENT