한인수, 노명일, 공민철, 이정렬, 박서윤, "의미 유사도 기반의 선박 규정 검색 알고리즘", 2024년도 한국CDE학회 동계학술발표회, 평창, pp. 126, 2024.01.29-02.01
Domestic Conference
2024.01.11 11:24
한인수, 노명일, 공민철, 이정렬, 박서윤, "의미 유사도 기반의 선박 규정 검색 알고리즘", 2024년도 한국CDE학회 동계학술발표회, 평창, pp. 126, 2024.01.29-02.01
조회 수 1353
첨부 '1' |
---|
Abstract | 세계 각국의 선급 기관은 선박의 안전한 운용을 위한 다양한 규정을 마련하고 있고, 최근에는 선박의 종류에 따라 이러한 상세 규정이 강화되고 있다. 선급 규정은 다양하고 방대하기 때문에 일치하는 단어를 찾아주는 키워드 검색만으로는 원하는 정보를 찾기 어려우며, 전체 규정 분석에 많은 시간이 소요된다. 또한, 규정 용어에 익숙하지 않은 사용자는 정확한 키워드를 알지 못해 정보를 효과적으로 검색하기 어렵다. 이와 같은 어려움을 해소하기 위해, 본 연구에서는 선급 규정집에 대해 효과적인 검색이 가능하도록 하는 일련의 알고리즘을 제안하였다. 선급 규정집을 검색에 효과적인 형태로 전처리 및 변환하였고, 사용자의 검색 문장과 의미적 유사도를 계산하여 높은 유사도를 가진 규정을 답변으로 제공하는 방법을 제안하였다. 일반적으로 규정집은 높은 호환성을 갖는 PDF 형식으로 변환되어 배포된다. 이 과정에서 계층 구조 등 원본 문서가 지닌 정보가 손실되기에 단순 열람 외의 응용 작업이 어려운 편이다. 본 연구에서는 PDF 내에서 문자열 등의 기본 요소를 추출하여 문서 내 계층 구조 관계를 반영할 수 있는 데이터셋을 구축하였다. 데이터셋과 검색 문장의 의미 유사도 기반 검색을 위해 자연어 처리 모델들을 비교 및 분석하여 최종 모델을 선정하였다. 본 연구에서 제안한 방법을 한국선급의 규정집 (KR-Rules)에 적용하였고, 검색 문장과 높은 의미적 유사도를 보이는 규정을 사용자에게 단시간에 제공하여 그 효용성을 확인하였다. |
---|---|
Publication Date | 2024-01-30 |