通知公告

友情链接

专利信息

一种基于强化学习的空战博弈机动策略交替冻结训练方法

http://www.gxyqy.com/ 2020-5-18 14:37:21 成都川大技术转移集团有限公司阅读次数：215次

本发明公开了一种基于强化学习的空战博弈机动策略交替冻结训练方法，包括下述步骤：首先设置空战区域，以及双方飞行器的动态模型；然后，设置交替冻结训练的迭代次数，训练一方时，训练方采用随机参数的神经网络作为初始策略，另一方策略采用上一轮迭代保存的策略；之后，按敌我双方交替冻结的方法，采用深度强化学习算法训练，直至满足单次迭代终止条件，并保存训练完成的策略；最后，采用联赛制的方法，选择表现最佳的我方策略，在应用模式下，使用最优策略对我方飞行器进行机动引导，与敌方进行博弈。本发明的方法可以应用在现有飞行器空战机动引导系统中，根据空战博弈的态势，采用实时控制的方式，引导飞行器在空战中占据有利态势位置。

上一篇：苯氧基-N-苯基苯胺衍生物及其应用
下一篇：一种甲基化核酸的检测方法
返回列表