基于动态示教数据和行为克隆的深度Q学习网络优化方法

	基于动态示教数据和行为克隆的深度Q学习网络优化方法
	李小双 1,2; 王晓 2; 王飞跃 2; 金峻臣 2; 陈薏竹 1,2
	2021-06-29
著作权人	李小双 ; 王晓 ; 王飞跃 ; 金峻臣 ; 陈薏竹
专利号	ZL202011338992.0
国家	中国
文献子类	发明专利
语种	中文
内容类型	专利
源URL	[http://ir.ia.ac.cn/handle/173211/48852]
专题	自动化研究所_复杂系统管理与控制国家重点实验室_先进控制与自动化团队
作者单位	1.中国科学院大学人工智能学院 2.中国科学院自动化研究所复杂系统管理与控制国家重点实验室
推荐引用方式 GB/T 7714	李小双,王晓,王飞跃,等. 基于动态示教数据和行为克隆的深度Q学习网络优化方法. ZL202011338992.0. 2021-06-29.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

暂无评论

评注功能仅针对注册用户开放，请您登录

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接