김성훈, 노명일, 김기수, "하둡과 R 언어를 이용한 조선 해양 분야에서의 빅데이터 활용 연구", 2016년도 대한조선학회 춘계학술발표회, 부산, pp. 323, 2016.05.19-20
Abstract | 최근 정보통신 기술의 발전으로 인해 처리해야할 데이터의 양과 그 복잡성이 증가해 빅데이터에 대해 산업계가 많은 관심을 가지고 있다. 조선해양 분야에서도 마찬가지로 축적된 데이터 양이 증가했고, 이 데이터를 활용해 시장경쟁력을 갖출 필요성이 생겨 빅데이터의 중요성이 점차 대두되었다. 조선해양 분야에 빅데이터를 적용하기 위해서는 방대한 양의 데이터를 저장하고 처리할 수 있어야한다. 이를 위해 빅데이터에서 가장 많이 사용되는 하둡과 R을 적용하는 것이 효율적이다. 하둡은 빅데이터의 저장과 처리를 위한 프레임워크로 빅데이터의 저장을 위한 하둡 파일 분산 시스템(HDFS)과 처리를 위한 맵리듀스(MapReduce) 기능을 제공해주고 R은 통계 계산과 그래픽을 위한 언어와 환경으로 다양한 통계 기법을 제공해준다. 하둡은 빅데이터의 핸들링이 용이한 반면 데이터의 정교한 처리가 힘들고 R은 고급 분석 능력을 가지고 있는 반면 빅데이터를 처리하기 힘들다. 따라서 서로의 약점을 상쇄하고 장점만을 취하기 위해 하둡 기반으로 R을 사용할 수 있게 해주는 Rhadoop이 등장했다. 본 연구에서는 조선해양 분야 빅데이터 적용을 위해 Rhadoop을 이용한 해양플랜트 상부 중량 추정을 실행해 보았다. 기존의 FPSO 데이터를 하둡 기반의 HDP(Hortonworks Data Platform)에 저장하고 이를 Rhadoop을 사용해 회귀분석을 실행했다. 회귀분석 결과와 처리 시간을 기존의 중량 추정 프로그램과 비교해 빅데이터 적용 가능성을 확인했다. |
---|---|
Publication Date | 2016-05-20 |
김성훈, 노명일, 김기수, "하둡과 R 언어를 이용한 조선 해양 분야에서의 빅데이터 활용 연구", 2016년도 대한조선학회 춘계학술발표회, 부산, pp. 323, 2016.05.19-20