×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [5]
沈阳自动化研究所 [2]
内容类型
期刊论文 [5]
会议论文 [2]
发表日期
2021 [7]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共7条,第1-7条
帮助
限定条件
发表日期:2021
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
DIMSAN: Fast Exploration with the Synergy between Density-based Intrinsic Motivation and Self-adaptive Action Noise
会议论文
西安, 2021.5.30-2021.6.5
作者:
Li, Jiayi
;
Li, Boyao
;
Lu, Tao
;
Lu, Ning
;
Cai, Yinghao
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2022/06/14
Traffic Signal Control Using Offline Reinforcement Learning
会议论文
Beijing, 2021-10
作者:
Dai, Xingyuan
;
Zhao, Chen
;
Li, Xiaoshuang
;
Wang, Xiao
;
Wang, Fei-Yue
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2022/10/11
Discrete-Time Non-Zero-Sum Games With Completely Unknown Dynamics
期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2021, 卷号: 51, 期号: 6, 页码: 2929-2943
作者:
Song, Ruizhuo
;
Wei, Qinglai
;
Zhang, Huaguang
;
Lewis, Frank L.
收藏
  |  
浏览/下载:45/0
  |  
提交时间:2021/08/15
Adaptive critic designs
adaptive dynamic programming
approximate dynamic programming
discrete-time
nonzero-sum (NZS)
off-policy
reinforcement learning (RL)
Multiagent Reinforcement Learning:Rollout and Policy Iteration
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2021, 卷号: 8, 期号: 2, 页码: 249-272
作者:
Dimitri Bertsekas
收藏
  |  
浏览/下载:20/0
  |  
提交时间:2021/04/09
Dynamic programming
multiagent problems
neuro-dynamic programming
policy iteration
reinforcement learning, rollout
A Novel Heterogeneous Actor-critic Algorithm with Recent Emphasizing Replay Memory
期刊论文
International Journal of Automation and Computing, 2021, 卷号: 18, 期号: 4, 页码: 619-631
作者:
Bao Xi
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2021/07/20
Reinforcement learning (RL)
actor-critic
experience replay
training efficiency
manipulation skill learning
Quantum-enhanced reinforcement learning for control: a preliminary study
期刊论文
Control Theory and Technology, 2021, 卷号: 19, 期号: 4, 页码: 455-464
作者:
Hu YZ(胡亚洲)
;
Tang FZ(唐凤珍)
;
Chen, Jun
;
Wang WX(王文学)
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2021/12/20
Quantum theory
Reinforcement learning
Quantum computation
State superposition
Optimal control
A control algorithm for sea–air cooperative observation tasks based on a data-driven algorithm
期刊论文
Journal of Marine Science and Engineering, 2021, 卷号: 9, 期号: 11, 页码: 1-26
作者:
Hu K(胡凯)
;
Chen X(陈旭)
;
Xia QF(夏庆峰)
;
Jin JL(金俊岚)
;
Weng LG(翁理国)
收藏
  |  
浏览/下载:35/0
  |  
提交时间:2021/11/18
Data-driven
Deep reinforcement learning
Multi-agent collaboration
Sea and air observation
©版权所有 ©2017 CSpace - Powered by
CSpace