컴퓨터정보 한글·한자와 본격추진

중앙일보

입력

지면보기

종합 04면

한국과학기술정보 「센터」는 우리말의 「컴퓨터」를 위한 기초작업인 한글·영자정보처리 「시스팀」Ⅱ(KIPS-3)를 개발하고 좀더 진보된 KIPS-3에 도전하고 있다.
「컴퓨터」 정보의 우리말화는 그동안 우리말 정보량이 급격히 늘어남에 따라 이의 처리와 이용을 위해 꼭 해결되어야 할 과제였다.
정보 「센터」는 75년부터 유경희전산실장·유자경차강을 중심으로 TK70소형「컴퓨터」를 중앙제어장치로 하여 우리말처리「시스팀」의 개발을 추진해왔다.
서구문명의 산물인 「컴퓨터」는 입·출력이 영자에 적합하도록 설계되어 있어 우리나라도 대부분 영자로 운영하고 있다.
따라서 현 상황아래서는 수많은 우리말 정보를 입력시키기 위해서는 영자화해야 하며 여기서 나은 자료도 영문이라 큰 불편이 따르게 된다.
앞으로 일반인들도 「컴퓨터」를 이용하게되고 우리나라 각분야의 수준이 높아지면 우리말정보의 효용성은 크게 증대된다.
전문가들은 80년대에는 정보홍수시대에 직면할 것이라고 말하고 이에 대처하는 장치와 「프로그램」의 개발을 역설하고 있다.
현재 정보 「센터」가 추진하고 있는 이 작업은 크게 3단계로 구분된다.
우선 한글만 처리할수있는 KIPS-1, 한글·한자의 입·출력이 가능한 KIPS-2, 한글·한자가 서로 자동적으로 변환되는 KIPS-3이다.
KIPS-1에서는 한글의 풀어쓰기와 모아쓰기를 병용한다.
이때 입력을 위한 건반장치에는 모아쓴 한글, 풀어쓴 한글자모 2천1백여자가 배열되어있다.
KIPS-2의 입력장치에는 48개의 한글자모와 한자건반을 배열, 2천여자의 한자가 입력가능하게 되어있다.
그러나 연구진은 한건반에 배열할수 있는 한글·한자가 제한되기 때문에 「플로팅·시스팀」(부동「시스팀」)이라는 부수적「프로그램」을 개발해 건반에 없는 자형도 처리할수 있게했다.
그러나 아직도 입력때 해당문자를 3천여개의 건반상에서 찾아내야하는 불편과 시간적 낭비를 없애지는 못했다.
이 난점을 완전히 제거하자는 것이 KIPS-3의 개발이다.
이것은 한글로만 입력해주면 내부에서 자동으로 한자로 변환되어 출력은 한자로 나오도록하는 「시스팀」이다.
이렇게 되면 3천여개에 달하는 입력건반은 필요없게 된다.
따라서 미리 한자의 자전을 「컴퓨터」에 입력시켜놓은후 필요한 글자만 불러내어 사용하는 방식을 채택한다.
이 「시스팀」을 개발하기위해서는 여러 기초조사가 필요하다.
이중 필수적인 것으로 ▲한글·한자사용빈도조사 ▲한글자음·모음의 초·중·종성별통계 ▲글자의 배열 조직등이 있다.
한글·한자 전산화과정에서 중요한 것은 입력의 쉬움과 출력문자의 품위, 정보의 축적과 검색(어떤정보가 어디에 얼마만큼 수록되어있는가를 알아보는것)에 적합해야 한다는 점이다.
정보 「센터」는 이미 국회도서관이 소장하고 있는 77년도 정기간행물의 기사색인을 「컴퓨터」에 수록해 자동편집으로 『정기간행물 기사색인』을 펴냈다.
이책은 1천여 「페이지」에 2만3천4백여건의 기사가 분야별로 수록되어있다.
정보 「센터」는 이와같은 간행물의 기사색인을 계속 「컴퓨터」에 입력시켜 국내정보자료로 활용할 방침이다.

ADVERTISEMENT
ADVERTISEMENT