基于深度确定性策略梯度的船舶自主航行避碰方法
针对不同会遇态势下的船舶自主航行避碰决策问题,在DDPG(Deep Deterministic Policy Gradient)算法基础上,以国际航行规则(COLREGS)为基准设计相应的奖励函数,通过引入势能回报塑形的思想来引导智能体学习最佳策略,...
指挥控制与仿真
2024年05期
立即查看 >
图书推荐
相关工具书