공민철, 노명일, 김기수, 이정렬, 김종오, 이갑헌 "딥 러닝을 이용한 도면 내 객체 및 문자 추출 방법", 2020년도 대한조선학회 춘계학술발표회, 부산, pp. 166, 2020.07.22-23
Abstract | 이미지 형식의 도면 내에 존재하는 객체 (기자재, 장소 표지 등) 및 문자 (수량 및 사양 등)의 정보를 디지털화 하기 위해서는 많은 노력과 오랜 시간이 소모된다. 이의 효율성을 제고하기 위해 도면 내 객체 및 문자의 위치와 정보를 자동으로 추출하여 디지털화 하기 위한 필요성이 제기되고 있다. 그러나 선박 도면의 특성 상, 도면 내의 객체 및 문자가 도형, 문자 등에 의해 겹치는 사례가 빈번하게 존재한다. 이로 인해 객체 및 문자의 인식률을 낮아 자동화/디지털화하는 것에 어려움이 존재한다. 따라서 본 연구에서는 이와 같은 상황에서도 효율적으로 동작할 수 있도록, 딥 러닝 모델을 이용한 객체 및 문자 정보 추출 모델을 개발하였다. 우선, 객체 추출을 위한 딥 러닝 모델로 이미지 분석에 쓰이는 다양한 CNN (Convolutional Neural Network) 모델을 적용 및 비교하였으며, 문자 추출을 위하여 딥 러닝 기반의 OCR (Optical Character Recognition) 모델을 활용하였다. 학습을 위한 데이터는 실제 도면의 환경과 유사한 학습용 데이터셋 (도면 및 라벨링 파일)을 생성해주는 모델을 개발해 확보하였다. 학습용 데이터셋의 크기를 고정하여 모델 학습 시 발생하는 이미지의 왜곡을 최소화하였고, 생성하는 이미지에 노이즈를 추가하여 over-fitting 문제를 고려하였다. 또한, 객체 추출 모델의 정확도를 높이기 위하여 객체 탐지 결과에 특별한 알고리즘을 사용하여 중복 인식된 객체의 결과를 제거하였다. 본 연구에서는 객체 및 문자 추출 딥 러닝 모델을 선박 도면 내 정보를 디지털화 하는데 사용했으며, 실제 도면 데이터의 객체와 문자를 인식하는데 적용해, 그 효용성을 확인하였다. |
---|---|
Publication Date | 2020-07-22 |
공민철, 노명일, 김기수, 이정렬, 김종오, 이갑헌 "딥 러닝을 이용한 도면 내 객체 및 문자 추출 방법", 2020년도 대한조선학회 춘계학술발표회, 부산, pp. 166, 2020.07.22-23