ADVERTISEMENT

“100만원은 실장 전결” 사람처럼 문서내용 찾아주는 AI 나왔다

중앙일보

입력

스탠리 큐브릭 감독과 SF소설가 아서 C. 클라크가 함께한 SF영화 '2001 스페이스 오딧세이'(1968)에 나오는 인공지능 컴퓨터 HAL 9000. 사람처럼 묻는 말에 답하고 정보를 찾아준다. [유튜브 화면캡처]

스탠리 큐브릭 감독과 SF소설가 아서 C. 클라크가 함께한 SF영화 '2001 스페이스 오딧세이'(1968)에 나오는 인공지능 컴퓨터 HAL 9000. 사람처럼 묻는 말에 답하고 정보를 찾아준다. [유튜브 화면캡처]

ETRI, 컴퓨터 속 문서 내용 찾아주는 AI 개발

“출장 경비가 100만원 들 때, 결재를 어느 선까지 받아야 할까요?” 직장에서 동료 간 흔히 나눌 수 있는 대화다. 규정집이 컴퓨터 파일이나 종이 문서 형태로 존재하긴 하지만, 쉽게 찾을 수 없을 땐 경험 많은 동료에게 먼저 물어보는 게 현실이다. 컴퓨터 속 문서들도 파일명으로 분류돼 있지 않으면 일일이 파일을 열어보는 수밖에 없다.

사람처럼 질문하면, 컴퓨터 파일 속에서 원하는 문서를 내용까지 일일이 찾아주는 인공지능이 나왔다. 한국전자통신연구원(ETRI)은 질문자의 문장 뜻을 파악해 오피스에서 정답과 근거까지 찾아주는 인공지능 ‘행정문서 질의응답(QA) API’를 개발했다고 7일 밝혔다. 또 이 기술은 ETRI 공공 인공지능 오픈 APIㆍ데이터 서비스 포털(https://aiopen.etri.re.kr)에 공개되어 누구나 쉽게 이용할 수 있다고 ETRI 측은 밝혔다. ETRI가 2013년부터 연구해온 언어기반 인공지능 엑소브레인(Exo-Brain) 연구성과가 적용됐다.

ETRI 연구팀에 따르면 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 문장의 단락뿐 아니라 표까지 인식해 정답과 근거 문장을 인식하는 기술이다. 예를 들어‘출장 경비가 100만원 들 때, 결재를 어느 선까지 받아야 할까요.’라는 질문을 입력하면, ‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아준다. 질문자가 물은 특정 단어만 검색하고 인식하는 것이 아니라, 다양한 문장을 사람처럼 이해하고 원하는 정보를 찾아준다는 의미다.

ETRI 연구진이 개발한 인공지능 ‘행정문서 질의응답(QA) API와 오픈소스의 성능 비교 지표. [자료 ETRI]

ETRI 연구진이 개발한 인공지능 ‘행정문서 질의응답(QA) API와 오픈소스의 성능 비교 지표. [자료 ETRI]

현재는 아래아한글에서만, "추후 확장할 것"

정확도도 높다. ETRI와 함께 공동연구한 한글과컴퓨터에서 정확도를 측정한 결과, 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 문제가 있었다. 예를 들어‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만,‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. ETRI 기술은 이런 한계를 뛰어넘었다. 관련 기술 평가 결과 96.63% 정확도를 보였다.

임준호 책임연구원은 “이번에 개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다”며“현재는 아래아한글 문서 대상으로만 서비스를 제공하지만, 앞으로 추가 연구개발을 통해 MS워드나 PDF 등 다른 문서에도 쓰일 수 있도록 할 계획”이라고 말했다.

ADVERTISEMENT
ADVERTISEMENT