×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [17]
内容类型
会议论文 [8]
期刊论文 [7]
学位论文 [2]
发表日期
2023 [2]
2022 [1]
2021 [5]
2020 [4]
2019 [4]
2017 [1]
更多...
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共17条,第1-10条
帮助
限定条件
专题:自动化研究所
第一署名单位
第一作者单位
通讯作者单位
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Privacy Preserving Demand Side Management Method via Multi-Agent Reinforcement Learning
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 10, 页码: 1984-1999
作者:
Feiye Zhang
;
Qingyu Yang
;
Dou An
收藏
  |  
浏览/下载:8/0
  |  
提交时间:2023/09/07
Centralized training and decentralized execution
demand side management
multi-agent reinforcement learning
privacy preserving
MUTS-Based Cooperative Target Stalking for A Multi-USV System
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 7, 页码: 1582-1592
作者:
Chengcheng Wang
;
Yulong Wang
;
Qing-Long Han
;
Yunkai Wu
收藏
  |  
浏览/下载:7/0
  |  
提交时间:2023/06/14
Cooperative target stalking
improved deep reinforcement learning
multi-unmanned surface vehicle (multi-USV) systems
V-type probabilistic data extraction
面向连续控制任务的深度强化学习值函数估计研究
学位论文
中国科学院自动化研究所: 中国科学院大学, 2022
作者:
何强
收藏
  |  
浏览/下载:22/0
  |  
提交时间:2022/06/17
深度强化学习
值函数估计
值函数表示
集成强化学习
Efficient Cooperative Structured Control for a Multijoint Biomimetic Robotic Fish
期刊论文
IEEE-ASME TRANSACTIONS ON MECHATRONICS, 2021, 卷号: 26, 期号: 5, 页码: 2506-2516
作者:
Yan, Shuaizheng
;
Wu, Zhengxing
;
Wang, Jian
;
Tan, Min
;
Yu, Junzhi
收藏
  |  
浏览/下载:28/0
  |  
提交时间:2021/12/28
Robots
Robot kinematics
Optimization
Biomimetics
Sports
Training
Task analysis
Deep reinforcement learning
evolutionary strategy
robotic fish
structured control
Deep Deterministic Policy Gradient for High-Speed Train Trajectory Optimization
期刊论文
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2021, 页码: 13
作者:
Ning, Lingbin
;
Zhou, Min
;
Hou, Zhuopu
;
Goverde, Rob M. P.
;
Wang, Fei-Yue
收藏
  |  
浏览/下载:44/0
  |  
提交时间:2022/01/27
Rail transportation
Training
Heuristic algorithms
Resistance
Optimal control
Trajectory optimization
Switches
High-speed railway
train trajectory optimization
deep deterministic policy gradient
energy efficiency
Wide-Sense Stationary Policy Optimization with Bellman Residual on Video Games
会议论文
Shenzhen, China, 05-09 July 2021
作者:
Gong C(龚晨)
;
He Q(何强)
;
Bai YP(白云鹏)
;
Hou XW(侯新文)
;
Fan GL(范国梁)
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2022/06/27
Video Game
Reinforcement Learning
Quantile Regression
Bellman residual
Wasserstein Distance
Omnidirectional Drift Control of an Underwater Biomimetic Vehicle-Manipulator System via Reinforcement Learning
会议论文
Suzhou, China, May 14-16, 2021
作者:
Ma, Ruichen
;
Wang, Yu
;
Wang, Rui
;
Wang, Shuo
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/08/02
Omnidirectional Drift Control
Undulating Fin
Underwater Biomimetic Vehicle-manipulator System (UBVMS)
Reinforcement Learning
Twin Delayed Deep Deterministic policy gradient (TD3)
Target Tracking Control of a Biomimetic Underwater Vehicle Through Deep Reinforcement Learning
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 页码: 12
作者:
Wang, Yu
;
Tang, Chong
;
Wang, Shuo
;
Cheng, Long
;
Wang, Rui
收藏
  |  
浏览/下载:36/0
  |  
提交时间:2022/01/27
Reinforcement learning
Target tracking
Robots
Sports
Aerospace electronics
Mobile robots
Underwater vehicles
Biomimetic underwater vehicle (BUV)
reinforcement learning
target tracking control
Wd3: Taming the estimation bias in deep reinforcement learning
会议论文
Baltimore, MD, USA, 2020-12
作者:
He Q(何强)
;
Hou XW(侯新文)
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2022/06/27
deep reinforcement learning
estimation bias
neural networks
Efficient cooperative structured control for a multi-joint biomimetic robotic fish
期刊论文
IEEE/ASME Transactions on Mechatronics, 2020, 卷号: 26, 期号: 5, 页码: 2506-2516
作者:
Yan Shuaizheng
;
Wu Zhengxing
;
Wang Jian
;
Tan Min
;
Yu Junzhi
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/05/31
©版权所有 ©2017 CSpace - Powered by
CSpace