2020-11-12 14:30-14:50 [B3-1] AI 및 머신러닝
DME 펄스형태 개발을 위한 심층 강화학습 framework 연구
이정연*, 김의호
Distance Measuring Equipment (DME)는 지상 기반 항공기 항법 시스템으로, GNSS(Global Navigation Satellite
System) 정전 시 탄력적인 항공기 항법 기능을 보장하는 인프라로 평가받고 있다. GNSS 백업 시스템으로 DME의 주
요 문제는 100m 이상에 이르는 낮은 위치 정확도이다. 본 논문에서는 현재 DME 규격을 준수하는 다중경로성 DME 펄
스를 개발하기 위해 DME 펄스 설계에 심층 강화 학습을 적용하여 거리 측정 정확도를 향상시키는 새로운 접근법을 도
입하였다. 연구에서 DME 펄스 설계에 대한 Markov Decision Process (MDP)는 DME 펄스 형태 조건과 time error 측정
을 이용하여 설정되었다. 펄스 형상을 나타내는 agent는 seed point로 표현되며 cubic spline interpolation으로 펄스 형
태가 완성된다. 본 논문에서 제안된 강화학습 알고리즘은 연속적인 공간을 탐색할 수 있는 정책 기반 알고리즘이며 확
률적으로 다양한 노이즈 환경을 만들어 내는 다중 경로 효과에 대해 어떻게 펄스 형태가 디자인 되는지를 보여준다.
A Study on Deep Reinforcement Learning Framework for DME Pulse Design
Jungyeon Lee*, Euiho Kim
The Distance Measuring Equipment (DME) is a ground-based aircraft navigation system and is considered as an infrastructure that ensures resilient aircraft navigation capability during the event of a Global Navigation Satellite System (GNSS) outage. The main problem of DME as a GNSS back up is a poor positioning accuracy that often reaches over 100 m. In this paper, a novel approach of applying deep reinforcement learning to a DME pulse design is introduced to improve DME distance measuring accuracy. This method is designed to develop multipath-resistant DME pulses that comply with current DME specifications. In the research, a Markov Decision Process (MDP) for DME pulse design is set using pulse shape requirements and a time error. The pulse shape agent is represented by some of seed points and completed by cubic spline interpolation. The reinforcement algorithms implemented are policy-based algorithms which can cover continuous spaces. The proposed pulse shape was developed by using reinforcement learning algorithms and is robust to various multipath effects depending on stochastic noise environment.
|
Speaker 이정연* 홍익대학교 |
|