×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [52]
沈阳自动化研究所 [10]
计算技术研究所 [3]
长春光学精密机械与物... [3]
兰州理工大学 [2]
合肥物质科学研究院 [2]
更多...
内容类型
期刊论文 [50]
会议论文 [23]
专利 [2]
学位论文 [1]
发表日期
2020 [76]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共76条,第1-10条
帮助
限定条件
发表日期:2020
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
提交时间升序
提交时间降序
题名升序
题名降序
作者升序
作者降序
Optimal Elevator Group Control via Deep Asynchronous Actor-Critic Learning
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 12, 页码: 5245-5256
作者:
Wei, Qinglai
;
Wang, Lingxiao
;
Liu, Yu
;
Polycarpou, Marios M.
收藏
  |  
浏览/下载:19/0
  |  
提交时间:2021/03/08
Elevators
Optimal control
Backpropagation
Machine learning
Neural networks
Learning (artificial intelligence)
Actor
–critic
adaptive dynamic programming
deep learning (DL)
elevator group control (EGC)
optimal control
reinforcement learning (RL)
Device Placement Optimization for Deep Neural Networks via One-shot Model and Reinforcement Learning
会议论文
Canberra, Australia, December 1-4
作者:
Zixiang Ding
;
Yaran Chen
;
Nannan Li
;
Dongbin Zhao
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2020/10/19
Wd3: Taming the estimation bias in deep reinforcement learning
会议论文
Baltimore, MD, USA, 2020-12
作者:
He Q(何强)
;
Hou XW(侯新文)
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2022/06/27
deep reinforcement learning
estimation bias
neural networks
面向机械臂控制的强化学习方法研究
学位论文
沈阳: 中国科学院沈阳自动化研究所, 2020
作者:
胡亚洲
收藏
  |  
浏览/下载:25/0
  |  
提交时间:2020/12/18
机器人控制
强化学习
值函数近似
优势函数
自由能原理
Efficient cooperative structured control for a multi-joint biomimetic robotic fish
期刊论文
IEEE/ASME Transactions on Mechatronics, 2020, 卷号: 26, 期号: 5, 页码: 2506-2516
作者:
Yan Shuaizheng
;
Wu Zhengxing
;
Wang Jian
;
Tan Min
;
Yu Junzhi
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/05/31
Dynamic Context Selection for Document-level Neural Machine Translation via Reinforcement Learning
会议论文
Online, November 16–20, 2020
作者:
Kang, Xiaomian
;
Zhao, Yang
;
Zhang, Jiajun
;
Zong, Chengqing
收藏
  |  
浏览/下载:13/0
  |  
提交时间:2021/05/26
Docment-level NMT
Neural Machine Translation
Reinforcement Learning
Context Selection
Special Issue on Adaptive Dynamic Programming and Reinforcement Learning
期刊论文
IEEE TRANSACTIONS ON SYSTEMS MAN CYBERNETICS-SYSTEMS, 2020, 卷号: 50, 期号: 11, 页码: 3944-3947
作者:
Liu, Derong
;
Lewis, Frank L.
;
Wei, Qinglai
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2021/01/07
Accelerating Minibatch Stochastic Gradient Descent Using Typicality Sampling
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 11, 页码: 4649-4659
作者:
Peng, Xinyu
;
Li, Li
;
Wang, Fei-Yue
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2021/01/06
Training
Convergence
Approximation algorithms
Stochastic processes
Estimation
Optimization
Acceleration
Batch selection
machine learning
minibatch stochastic gradient descent (SGD)
speed of convergence
Multi-Agent Cooperation and Competition with Two-Level Ggraph Attention Network
会议论文
线上, 2020-11
作者:
Shiguang, Wu
;
Zhiqiang, Pu
;
Jianqiang, Yi
;
Huimu, Wang
收藏
  |  
浏览/下载:8/0
  |  
提交时间:2021/06/24
Stable Training of Bellman Error in Reinforcement Learning
会议论文
Thailand, November 18–22
作者:
Gong C(龚晨)
;
Bai YP(白云鹏)
;
Hou XW(侯新文)
;
Ji XH(季晓慧)
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/06/27
©版权所有 ©2017 CSpace - Powered by
CSpace