[Insight] ChatGPT시대, 업무 자동화 실현을 앞당기는 AI 문서 이해 기술
👀 Insight
디지털 전환, 업무 자동화를 실현하는 문서 이해(Document Understanding) 기술
최근 저출산, 고령화로 인한 생산인구 감소, 법정 노동시간 단축 등으로 인한 기업의 인력 부족과 고용 비용 부담이 높아져 고민이 깊어지고 있습니다. 이에 주로 대기업을 중심으로 몇 년 전부터 업무 처리 자동화(Robotic Process Automation(RPA), 이하 RPA) 솔루션 도입이 활발하게 추진되고 있는데요. RPA는 소프트웨어 봇(Bot)이 수행할 일련의 지침을 알고리즘화해 단순 반복적 업무를 자동화해주고, 고용 인력이 더 생산적인 업무에 집중할 수 있게 해 주는데요. 대체로 규칙 기반 작업을 자동화하는데 사용하며, 이를 구현하기 위해서는 작업을 위한 데이터가 준비되어 있어야 합니다. 기업이 보유하고 있는 데이터는 각종 전자문서, 이메일, 이미지뿐 아니라 다량의 종이 문서를 포함하고 있는데요. 이러한 문서들을 활용가능한 데이터로 변환해야 비로소 업무 자동화 구현이 가능합니다.
특히 최근 ChatGPT 가 주목받고 있는데요. 문서이해 기술을 통해 추출된 데이터에 ChatGPT와 같은 대규모언어모델(LLM)을 접목하면 사내 지식관리 시스템, 문서 자동생성, 번역, 요약 및 리포트 생성 등 다양한 내부 서비스로도 활용이 가능합니다.
문서이해 플랫폼 '텍스트스코프 스튜디오' x ChatGPT 활용 예시
📑비정형 문서 활용의 어려움
문서는 형태에 따라 정형문서, 비정형문서, 반정형 문서로 나누어지는데, 형식이 고정되어 있고 고정된 필드에 유사한 형태의 값이 저장되어 있는 정형문서는 비교적 디지털화(Digitization)하여 활용하기에 용이합니다.
반면, 형태가 정해져 있지만 값과 형식에 일관성이 없는 반정형 문서와 형태와 구조가 가변적이고 복잡한 비정형 문서는 사람이 읽고 이해하기에는 어렵지 않지만, 로봇이나 ‘봇’이 자동으로 문서의 의미를 파악하고 분류 및 분석하기에는 매우 까다로운데요. 문서의 대부분을 차지하는 반정형 및 비정형 문서는 업무 프로세스 자동화를 위한 데이터로 즉각 활용하기 어려운 경우가 많습니다. 이를 해결하기 위해 최근 공공,금융분야 뿐 아니라 산업 전반에서 관심이 높아지고 있는 기술이 바로, 문서 이해(Document Understanding) 기술입니다.
Textscope® Studio가 지원하는 다양한 비정형문서 데이터 추출 AI 모델
📑문서 이해 기술의 부상
지금까지 문서 이해 기술은 금융, 무역 및 법률 등 다량의 문서를 다루는 분야에 주로 검토되고 도입되어 왔습니다. 그러나 최근 기업의 데이터 보유량이 크게 증가하고, 데이터의 활용 능력이 기업의 경쟁력을 좌우하게 되면서, 산업 전 분야에서 문서 이해 기술에 대한 관심이 높아지고 있습니다.
문서는 대부분의 비즈니스에서 빼놓을 수 없는 커뮤니케이션 도구입니다. 기업에서 문서는 비즈니스를 효율적으로 만들기도 하지만, 관리 방법에 따라 시간과 비용을 낭비하게 하는 핵심 요인이 되기도 하죠. 전문가들은 앞으로 데이터를 효과적으로 활용하고, 변화하는 시장에 빠르게 대응할 수 있는 민첩성을 지닌 기업만이 살아남을 것이라고 예측하고 있습니다. 문서에 숨어있는 가치 있는 데이터를 활용하기 위해 빠르게 움직여야 할 때입니다.