已选(0)清除
条数/页: 排序方式:
|
| Greedy feature replacement for online value function approximation 期刊论文 2016, 2016 Feng-fei ZHAO; Zheng QIN; Zhuo SHAO; Jun FANG; Bo-yan REN; Feng-fei ZHAO; Zheng QIN; Zhuo SHAO; Jun FANG; Bo-yan REN 收藏  |  浏览/下载:4/0 |
| 基于自校正方法的多机电力系统稳定器设计 期刊论文 2010, 2010 乔嘉赓; 闵勇; 吴小林; Qiao Jiageng; Min Yong; Wu Xiaolin 收藏  |  浏览/下载:2/0 |
| 基于群体Agent合作求解的测试床——MAS-Soccer 期刊论文 2010, 2010 张双民; 石纯一; ZHANG Shuangmin; SHI Chunyi 收藏  |  浏览/下载:4/0 |
| 递阶再励学习中Option的自动发现与生成 期刊论文 2010, 2010 孟江华; 朱纪洪; 孙增圻; MENG Jiang-hua; ZHU Ji-hong; SUN Zeng-qi 收藏  |  浏览/下载:2/0 |
| 优化策略模型下的匹配律算法 期刊论文 2010, 2010 程振波; 邓志东; Cheng Zhenbo; Deng Zhidong 收藏  |  浏览/下载:1/0 |
| 一种基于角色跟踪的群体Agent再励学习算法 期刊论文 2010, 2010 张双民; 石纯一; Zhang Shuangmin; Shi Chunyi 收藏  |  浏览/下载:5/0 |
| 基于探索密度的Option子目标发现算法 期刊论文 2010, 2010 孟江华; 朱纪洪; 孙增圻; MENG Jiang-Hua; ZHU Ji-Hong; SUN Zeng-Qi 收藏  |  浏览/下载:2/0 |
| 固定长度经验回放对Q学习效率的影响 期刊论文 2010, 2010 林明; 朱纪洪; 孙增圻; LIN Ming; ZHU Jihong; SUN Zengqi 收藏  |  浏览/下载:2/0 |
| 一种基于特征向量提取的FMDP模型求解方法 期刊论文 2010, 2010 张双民; 石纯一; ZHANG Shuang-Min; SHI Chun-Yi 收藏  |  浏览/下载:3/0 |
| 对称和非对称的启发式多Agent再励学习方法 期刊论文 2010, 2010 张新良; 石纯一; ZHANG Xinliang; SHI Chunyi 收藏  |  浏览/下载:3/0 |