题名 | 中文手写字符图像的笔划分析方法研究 |
作者 | 王铁强 |
答辩日期 | 2021-06 |
文献子类 | 博士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所智能化大厦三楼第五会议室 |
导师 | 刘成林 |
关键词 | 中文手写字符图像骨架化 笔划交叠区域检测 笔划提取 笔划匹配 书写轨迹恢复 |
学位名称 | 工学博士 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 中文手写字符图像的笔划提取和分析对书写效果评价、个性化手写字体合成以及书写教育等应用具有重要的作用。然而,虽然当前手写汉字识别取得了很大进展,但笔划提取和分析的自动化程度依然较低,且因数据匮乏、建模困难、评价模糊等问题而极具挑战性。本文研究中文手写字符图像的笔划分析方法,内容包括字符图像骨架化、笔划提取、不规范笔划检测、书写轨迹恢复,旨在为基于笔划的笔迹分析应用提供支撑。本文的主要创新性工作和成果如下: 一、提出了一种基于全卷积网络的中文手写字符图像骨架化方法。字符图像经骨架化后为后续的笔划提取提供便利。针对过去的骨架化方法容易产生交叠区域变形和分叉等问题,本文提出了一种基于全卷积神经网络(fully convolutional network,FCN)的中文手写字符图像骨架化方法。为了支撑网络训练和性能评价,本文提出了一种以联机中文手写字符合成图像的策略来克服样本的像素级标注难题,并将由合成数据训练所得的模型成功推广到真实图像。实验表明本文的骨架化方法面临笔划形状复杂、笔划宽度多变、笔划边缘非平滑等情况时,在量化评估和视觉效果上均明显优于现有方法。 二、提出了一种基于查询点引导和启发式搜索的笔划提取与匹配方法。该方法首先基于全卷积神经网络检测笔划间的交叠区域,并进一步将骨架态笔划切分为笔划段;然后基于查询点引导通路网络(PathNet)评价笔划段合并的一致度,并采用笔划段子集表构建出的候选笔划与字符模板笔划进行动态匹配,通过启发式搜索得到最优的笔划提取与匹配结果。实验结果证明了本方法的有效性,表明模板匹配对于提升笔划提取性能有显著作用,并且本文方法给相关研究提供了标准数据集和一系列基准结果。 三、提出了基于字符分类器可解释性的不规范笔划检测方法。据实验观测,手写字符中不规范笔划,会对卷积神经网络字符分类器在真值类别上的置信度造成负面影响。因此,本文从字符分类器的可解释性入手,首先,通过保留和移除像素的手段,衡量该像素对正确类别上的分类置信度有何种影响;然后聚合字符图像中对真值类别上的置信度产生负面影响的连通像素,检测出不规范笔划或笔划段。实验结果证明了本文方法的有效性,并且也为相关研究提供了标准数据集和基准结果。 四、提出了一种基于卷积指针网络和启发式搜索的书写轨迹恢复方法。本方法将书写轨迹恢复定义为笔划段排列和笔划段起点检测这两者的混合任务,采用卷积指针网络(convolutional pointer network,Conv-Ptr-Net)对前者进行建模,采用FCN对后者进行建模,并将二者统一到启发式搜索框架中通过组合优化得到最优书写轨迹。实验表明,本方法在大类别集中文手写字符数据上获得了优良的书写轨迹恢复效果,并且可成功推广到其他语种。 |
语种 | 中文 |
页码 | 150 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/45023] |
专题 | 自动化研究所_模式识别国家重点实验室_模式分析与学习团队 |
推荐引用方式 GB/T 7714 | 王铁强. 中文手写字符图像的笔划分析方法研究[D]. 中国科学院自动化研究所智能化大厦三楼第五会议室. 中国科学院自动化研究所. 2021. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论