
网站首页 > 专利信息
本发明公开了一种基于强化学习的空战博弈机动策略交替冻结训练方法,包括下述步骤:首先设置空战区域,以及双方飞行器的动态模型;然后,设置交替冻结训练的迭代次数,训练一方时,训练方采用随机参数的神经网络作为初始策略,另一方策略采用上一轮迭代保存的策略;之后,按敌我双方交替冻结的方法,采用深度强化学习算法训练,直至满足单次迭代终止条件,并保存训练完成的策略;最后,采用联赛制的方法,选择表现最佳的我方策略,在应用模式下,使用最优策略对我方飞行器进行机动引导,与敌方进行博弈。本发明的方法可以应用在现有飞行器空战机动引导系统中,根据空战博弈的态势,采用实时控制的方式,引导飞行器在空战中占据有利态势位置。
联系电话:028-87659663 028-85404682 028-85460925 邮箱:cdjz617@126.com
办公地址:四川省成都市武侯区科华街10号四川大学国家高新技术孵化平台609
成都川大技术转移集团有限公司
蜀ICP备11025552号-1
Copyright © 2007-2011 技术支持:成都网络公司-三以网络