中国开放科研知识云: 检索

验证码:

换一张

忘记密码？记住我

取消登录

CORC

首页
科研机构
检索
知识图谱
申请加入
托管服务

在结果中检索

科研机构

自动化研究所 [52]

沈阳自动化研究所 [10]

计算技术研究所 [3]

长春光学精密机械与物... [3]

兰州理工大学 [2]

合肥物质科学研究院 [2]

内容类型

期刊论文 [50]

会议论文 [23]

学位论文 [1]

发表日期

2020 [76]

知识图谱

CORC

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共76条，第1-10条

帮助

限定条件

发表日期：2020

已选(0)清除条数/页：排序方式：
	Optimal Elevator Group Control via Deep Asynchronous Actor-Critic Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 12, 页码: 5245-5256 作者: Wei, Qinglai; Wang, Lingxiao; Liu, Yu; Polycarpou, Marios M. 收藏 \| 浏览/下载：19/0 \| 提交时间：2021/03/08 Elevators Optimal control Backpropagation Machine learning Neural networks Learning (artificial intelligence) Actor –critic adaptive dynamic programming deep learning (DL) elevator group control (EGC) optimal control reinforcement learning (RL)
	Device Placement Optimization for Deep Neural Networks via One-shot Model and Reinforcement Learning 会议论文 Canberra, Australia, December 1-4 作者: Zixiang Ding; Yaran Chen; Nannan Li; Dongbin Zhao 收藏 \| 浏览/下载：10/0 \| 提交时间：2020/10/19
	Wd3: Taming the estimation bias in deep reinforcement learning 会议论文 Baltimore, MD, USA, 2020-12 作者: He Q(何强); Hou XW(侯新文) 收藏 \| 浏览/下载：2/0 \| 提交时间：2022/06/27 deep reinforcement learning estimation bias neural networks
	面向机械臂控制的强化学习方法研究学位论文沈阳: 中国科学院沈阳自动化研究所, 2020 作者: 胡亚洲收藏 \| 浏览/下载：25/0 \| 提交时间：2020/12/18 机器人控制强化学习值函数近似优势函数自由能原理
	Efficient cooperative structured control for a multi-joint biomimetic robotic fish 期刊论文 IEEE/ASME Transactions on Mechatronics, 2020, 卷号: 26, 期号: 5, 页码: 2506-2516 作者: Yan Shuaizheng; Wu Zhengxing; Wang Jian; Tan Min; Yu Junzhi 收藏 \| 浏览/下载：0/0 \| 提交时间：2023/05/31
	Dynamic Context Selection for Document-level Neural Machine Translation via Reinforcement Learning 会议论文 Online, November 16–20, 2020 作者: Kang, Xiaomian; Zhao, Yang; Zhang, Jiajun; Zong, Chengqing 收藏 \| 浏览/下载：13/0 \| 提交时间：2021/05/26 Docment-level NMT Neural Machine Translation Reinforcement Learning Context Selection
	Special Issue on Adaptive Dynamic Programming and Reinforcement Learning 期刊论文 IEEE TRANSACTIONS ON SYSTEMS MAN CYBERNETICS-SYSTEMS, 2020, 卷号: 50, 期号: 11, 页码: 3944-3947 作者: Liu, Derong; Lewis, Frank L.; Wei, Qinglai 收藏 \| 浏览/下载：2/0 \| 提交时间：2021/01/07
	Accelerating Minibatch Stochastic Gradient Descent Using Typicality Sampling 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 11, 页码: 4649-4659 作者: Peng, Xinyu; Li, Li; Wang, Fei-Yue 收藏 \| 浏览/下载：14/0 \| 提交时间：2021/01/06 Training Convergence Approximation algorithms Stochastic processes Estimation Optimization Acceleration Batch selection machine learning minibatch stochastic gradient descent (SGD) speed of convergence
	Multi-Agent Cooperation and Competition with Two-Level Ggraph Attention Network 会议论文线上, 2020-11 作者: Shiguang, Wu; Zhiqiang, Pu; Jianqiang, Yi; Huimu, Wang 收藏 \| 浏览/下载：8/0 \| 提交时间：2021/06/24
	Stable Training of Bellman Error in Reinforcement Learning 会议论文 Thailand, November 18–22 作者: Gong C(龚晨); Bai YP(白云鹏); Hou XW(侯新文); Ji XH(季晓慧) 收藏 \| 浏览/下载：0/0 \| 提交时间：2023/06/27

相关链接
欧盟学术资源开放存取平台
CALIS高校机构知识库
台湾学术机构典藏
香港机构知识库整合系统
中国科学院机构知识库网格系统

CORC
关于我们
服务条款
隐私条款

联系我们
0931-8270076
cspace@llas.ac.cn
China-OR

中文简体

©版权所有 ©2017 CSpace - Powered by CSpace