A multi-robot path-planning algorithm for autonomous navigation using meta-reinforcement learning based on transfer learning

Shuhuan Wen,Zeteng Wen,Di Zhang,Hong Zhang,Tao Wang

doi:10.1016/j.asoc.2021.107605

Abstract

The adaptability of multi-robot systems in complex environments is a hot topic. Aiming at static and dynamic obstacles in complex environments, this paper presents dynamic proximal meta policy optimization with covariance matrix adaptation evolutionary strategies (dynamic-PMPO-CMA) to avoid obstacles and realize autonomous navigation. Firstly, we propose dynamic proximal policy optimization with covariance matrix adaptation evolutionary strategies (dynamic-PPO-CMA) based on original proximal policy optimization (PPO) to obtain a valid policy of obstacles avoidance. The simulation results show that the proposed dynamic-PPO-CMA can avoid obstacles and reach the designated target position successfully. Secondly, in order to improve the adaptability of multi-robot systems in different environments, we integrate meta-learning with dynamic-PPO-CMA to form the dynamic-PMPO-CMA algorithm. In training process, we use the proposed dynamic-PMPO-CMA to train robots to learn multi-task policy. Finally, in testing process, transfer learning is introduced to the proposed dynamic-PMPO-CMA algorithm. The trained parameters of meta policy are transferred to new environments and regarded as the initial parameters. The simulation results show that the proposed algorithm can have faster convergence rate and arrive the destination more quickly than PPO, PMPO and dynamic-PPO-CMA.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

A multi-robot path-planning algorithm for autonomous navigation using meta-reinforcement learning based on transfer learning

Abstract

Talk to us

Similar Papers

More From: Applied Soft Computing

Lead the way for us

Journal: Applied Soft Computing	Publication Date: Jun 21, 2021
Citations: 37

Similar Papers

Monitoring scheme against local oscillator attacks for practical continuous-variable quantum-key-distribution systems in complex communication environments
Yi Zheng ... Weiqi Liu
Physical Review A | VOL. 101
Yi Zheng, et. al.Yi Zheng ... Weiqi Liu
18 Feb 2020
Physical Review A | VOL. 101

An Empirical Comparison of CMA-ES in Dynamic Environments
Chun-Kit Au ... Ho-Fung Leung
-
Chun-Kit Au, et. al.Chun-Kit Au ... Ho-Fung Leung
01 Jan 2012
01 Jan 2012

PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation
Perttu Hamalainen ... Xiaoxiao Ma
-
Perttu Hamalainen, et. al.Perttu Hamalainen ... Xiaoxiao Ma
21 Dec 2018
21 Dec 2018

Self-organizing migrating algorithm using covariance matrix adaptation evolution strategy for dynamic constrained optimization
Lenka Skanderova ... Tomas Fabian
Swarm and Evolutionary Computation | VOL. 65
Lenka Skanderova, et. al.Lenka Skanderova ... Tomas Fabian
01 Aug 2021
Swarm and Evolutionary Computation | VOL. 65

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

A multi-robot path-planning algorithm for autonomous navigation using meta-reinforcement learning based on transfer learning

Abstract

Talk to us

Similar Papers

More From: Applied Soft Computing