학습환경 | Windows 또는 Linux, GPU 또는 CPU 학습, 64bit |
---|---|
비정형 양식문서 | 일관된 양식을 갖고 있는 비정형 문자(예: 동의서 등) |
데이터 셋 필요 | 지정한 비정형 양식 문서의 다양한 방법(팩스, 복사, 사진, 촬영 등)으로 재생성된 문서를 대량으로 수집한 문서 집합(최소 1만건 이상 필요) |
GUI도구 | 데이처 셋의 각 요소(문서)의 IMR영역 라벨링과 어노테이션을 위한 도구 |
학습 | GUI 도구를 사용하여 생성된 어노테이션 정보와 이미지(데이터 셋)를 포함하여 적절한 모델(Samll, Middle, Large)을 선택하고 학습 |
학습결과물 | 학습 결과물은 WEIGHT파일로 생성되며 인식(탐지)시에 사용 |
인식환경 | Windows 또는 Linux, GPU 또는 CPU 학습, 64bit |
---|---|
비정형 문서 | 지정된 원본 문서가 팩스, 복사, 사진 등을 통하여 재생성된 데이터 |
학습결과물 | 사전에 수집한 데이터 셋으로 학습된 모델 인식 및 탐지 |
인식 및 탐지 | 비정형 문서(이미지)를 인식, 탐지하여 IMR 영역을 검출 |
IMR 검출 | 인식 및 탐지가 끝나고 검출된 IMR의 상태 정보를 포함하여 저장 |