CSS
 
Last update : 20-08-21 11:50
   B3-1이정연.pdf (305.8K)
2020-11-12 14:30-14:50 [B3-1] AI 및 머신러닝

DME 펄스형태 개발을 위한 심층 강화학습 framework 연구
이정연*, 김의호


Distance Measuring Equipment (DME)는 지상 기반 항공기 항법 시스템으로, GNSS(Global Navigation Satellite System) 정전 시 탄력적인 항공기 항법 기능을 보장하는 인프라로 평가받고 있다. GNSS 백업 시스템으로 DME의 주 요 문제는 100m 이상에 이르는 낮은 위치 정확도이다. 본 논문에서는 현재 DME 규격을 준수하는 다중경로성 DME 펄 스를 개발하기 위해 DME 펄스 설계에 심층 강화 학습을 적용하여 거리 측정 정확도를 향상시키는 새로운 접근법을 도 입하였다. 연구에서 DME 펄스 설계에 대한 Markov Decision Process (MDP)는 DME 펄스 형태 조건과 time error 측정 을 이용하여 설정되었다. 펄스 형상을 나타내는 agent는 seed point로 표현되며 cubic spline interpolation으로 펄스 형 태가 완성된다. 본 논문에서 제안된 강화학습 알고리즘은 연속적인 공간을 탐색할 수 있는 정책 기반 알고리즘이며 확 률적으로 다양한 노이즈 환경을 만들어 내는 다중 경로 효과에 대해 어떻게 펄스 형태가 디자인 되는지를 보여준다.


A Study on Deep Reinforcement Learning Framework for DME Pulse Design

Jungyeon Lee*, Euiho Kim


The Distance Measuring Equipment (DME) is a ground-based aircraft navigation system and is considered as an infrastructure that ensures resilient aircraft navigation capability during the event of a Global Navigation Satellite System (GNSS) outage. The main problem of DME as a GNSS back up is a poor positioning accuracy that often reaches over 100 m. In this paper, a novel approach of applying deep reinforcement learning to a DME pulse design is introduced to improve DME distance measuring accuracy. This method is designed to develop multipath-resistant DME pulses that comply with current DME specifications. In the research, a Markov Decision Process (MDP) for DME pulse design is set using pulse shape requirements and a time error. The pulse shape agent is represented by some of seed points and completed by cubic spline interpolation. The reinforcement algorithms implemented are policy-based algorithms which can cover continuous spaces. The proposed pulse shape was developed by using reinforcement learning algorithms and is robust to various multipath effects depending on stochastic noise environment.


profile_image Speaker
이정연*
홍익대학교