基于演示示教的机器人技能模仿学习

题名	基于演示示教的机器人技能模仿学习
作者	夏鹏程
答辩日期	2021-05-27
文献子类	硕士
授予单位	中科院自动化所
授予地点	智能化大厦
导师	张大朋
关键词	演示示教域自适应轨迹模仿深度强化学习
学位专业	控制工程
英文摘要	具有自主识别和决策能力的微装配机器人可以显著减少对人工编程开发与调试的依赖，有效提升机器人的自主性和智能性。本文将域自适应、动态运动基元和深度强化学习引入微装配机器人研究领域，重点研究微零件识别定位、趋近轨迹模仿、力/位协调装配控制关键技术，论文主要内容如下：一、针对人工标注零件特征成本较高且模型适应性较差的问题，本文提出基于域自适应的零件特征提取方法，实现不同风格和纹理背景下微零件的特征提取。本文首先创建微零件合成语义分割数据集，自动生成微零件图像标注；然后采用风格迁移的方法生成不同纹理背景的微零件图像，提升微零件训练图像数据的多样性；最后采用域自适应语义分割和逐像素对抗训练相结合的方法实现微零件特征的自动提取。二、针对常规微零件示教趋近轨迹的起点和终点位置固定的问题，本文提出基于动态运动基元的微零件趋近轨迹模仿学习方法，可实现微零件起始点变化时的趋近轨迹的自主生成。本文首先采用虚拟现实设备采集微零件趋近示教数据，并通过 DTW 算法进行数据对齐；然后采用 GMM 和 GMR 算法学习并生成最优示教轨迹；最后通过 DMP 模型学习并泛化微零件趋近轨迹，实现微零件起始位置变化时趋近轨迹的自主生成。三、针对过渡配合的微零件装配时无法兼顾装配力和位置的问题，本文首先建立基于深度强化学习的机器人装配控制模型，并通过演示示教数据缩短模型训练时间；然后采用连续性控制策略 TD3 算法确定当前装配状态下的最优装配动作，实现兼顾微零件装配力和位置的应用目标。
语种	中文
页码	75
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/44822]
专题	中国科学院自动化研究所
推荐引用方式 GB/T 7714	夏鹏程. 基于演示示教的机器人技能模仿学习[D]. 智能化大厦. 中科院自动化所. 2021.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们