CORC  > 自动化研究所  > 中国科学院自动化研究所
题名基于演示示教的机器人技能模仿学习
作者夏鹏程
答辩日期2021-05-27
文献子类硕士
授予单位中科院自动化所
授予地点智能化大厦
导师张大朋
关键词演示示教 域自适应 轨迹模仿 深度强化学习
学位专业控制工程
英文摘要

       具有自主识别和决策能力的微装配机器人可以显著减少对人工编程开发与调试的依赖,有效提升机器人的自主性和智能性。本文将域自适应、动态运动基元和深度强化学习引入微装配机器人研究领域,重点研究微零件识别定位、趋近轨迹模仿、力/位协调装配控制关键技术,论文主要内容如下:

       一、针对人工标注零件特征成本较高且模型适应性较差的问题,本文提出基于域自适应的零件特征提取方法,实现不同风格和纹理背景下微零件的特征提取。本文首先创建微零件合成语义分割数据集,自动生成微零件图像标注;然后采用风格迁移的方法生成不同纹理背景的微零件图像,提升微零件训练图像数据的多样性;最后采用域自适应语义分割和逐像素对抗训练相结合的方法实现微零件特征的自动提取。

       二、针对常规微零件示教趋近轨迹的起点和终点位置固定的问题,本文提出基于动态运动基元的微零件趋近轨迹模仿学习方法,可实现微零件起始点变化时的趋近轨迹的自主生成。本文首先采用虚拟现实设备采集微零件趋近示教数据,并通过 DTW 算法进行数据对齐;然后采用 GMM 和 GMR 算法学习并生成最优示教轨迹;最后通过 DMP 模型学习并泛化微零件趋近轨迹,实现微零件起始位置变化时趋近轨迹的自主生成。
       三、针对过渡配合的微零件装配时无法兼顾装配力和位置的问题,本文首先建立基于深度强化学习的机器人装配控制模型,并通过演示示教数据缩短模型训练时间;然后采用连续性控制策略 TD3 算法确定当前装配状态下的最优装配动作,实现兼顾微零件装配力和位置的应用目标。
 

语种中文
页码75
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/44822]  
专题中国科学院自动化研究所
推荐引用方式
GB/T 7714
夏鹏程. 基于演示示教的机器人技能模仿学习[D]. 智能化大厦. 中科院自动化所. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace