전도현, 노명일, 이혜원, 하지상, "선박 충돌 회피 문제에 대한 강화 학습의 효용성", 2020년도 대한조선학회 춘계학술발표회, 부산, pp. 167, 2020.07.22-23
Abstract | 최근 발생한 다수의 선박 충돌 사고에서 항해사의 미숙이나 부주의 등 사람의 실수가 주요 원인으로 지적되고 있다. 인적 요인에 의해 선박이 적절한 회피 시점을 놓쳐 치명적인 사고로 이어지는 경우가 발생하면서, 다수의 선박이 운항하는 복잡한 해상 환경에서 운항 중 충돌 위험에 대한 정량적 예측과 충돌 회피 자동화 시스템에 대한 연구이 필요성이 대두되고 있다. 선박은 여러 조우 상황에서 충돌 회피를 규정하는 국제 해상 충돌 예방 규칙 (COLREGs: International Regulations for Preventing Collisions at Sea)을 준수해야 한다. 따라서, 이러한 충돌 회피 관련 규정을 만족하면서 안전하게 운항 경로를 따라 이동하는 충돌 회피 방법을 구현하기 위해 본 연구에서는 전통적인 길 찾기 알고리즘을 기반으로 한 충돌 회피 방법과 최근 각광받고 있는 강화 학습 기법을 기반으로 한 충돌 회피 방법을 비교해 보았다. 먼저, 전통적인 길 찾기 알고리즘으로는 A* 알고리즘 등을 활용하였으며, 강화 학습 기법으로는 딥 러닝 기법을 접목한 actor-critic 방법 중 하나인 PPO (Proximal Policy Optimization) 방법을 활용하였다. 두 방법의 우수성을 비교하기 위해 다양한 예제에 적용해 보았다. 그 결과, 길 찾기 알고리즘을 기반으로 한 충돌 회피 방법의 경우 빠르게 충돌 회피 경로를 찾을 수 있고 더 효율적인 길 찾기 성능을 보여주지만, 실시간으로 변화하는 타선 및 해상 상태의 변화를 빠르게 적용하기가 힘들고, 해역이 복잡해질수록 충돌 회피 성능이 낮아지는 것을 확인하였다. 반면, 강화 학습 기법을 기반으로 한 충돌 회피 방법의 경우 각 선박의 제원에 따라 그것을 사전에 학습할 필요가 있다는 단점이 있지만, 실시간으로 타선 및 해상 상태의 변화를 빠르게 적용할 수 있기 때문에 해역이 복잡해질수록 더 뛰어난 충돌 회피 성능을 보였다. |
---|---|
Publication Date | 2020-07-22 |
전도현, 노명일, 이혜원, 하지상, "선박 충돌 회피 문제에 대한 강화 학습의 효용성", 2020년도 대한조선학회 춘계학술발표회, 부산, pp. 167, 2020.07.22-23