基于动态示教数据和行为克隆的深度Q学习网络优化方法 | |
李小双1,2; 王晓2; 王飞跃2; 金峻臣2; 陈薏竹1,2 | |
2021-06-29 | |
著作权人 | 李小双 ; 王晓 ; 王飞跃 ; 金峻臣 ; 陈薏竹 |
专利号 | ZL202011338992.0 |
国家 | 中国 |
文献子类 | 发明专利 |
语种 | 中文 |
内容类型 | 专利 |
源URL | [http://ir.ia.ac.cn/handle/173211/48852] |
专题 | 自动化研究所_复杂系统管理与控制国家重点实验室_先进控制与自动化团队 |
作者单位 | 1.中国科学院大学人工智能学院 2.中国科学院自动化研究所复杂系统管理与控制国家重点实验室 |
推荐引用方式 GB/T 7714 | 李小双,王晓,王飞跃,等. 基于动态示教数据和行为克隆的深度Q学习网络优化方法. ZL202011338992.0. 2021-06-29. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论