题名面向领域智能问答的知识库构建与应用研究
作者仇瑜
答辩日期2019-05-24
授予单位中国科学院大学
授予地点中国科学院新疆理化技术研究所
导师程力
关键词本体 知识图谱 知识库 问答系统 实体链接 语义标注
学位名称博士
学位专业计算机应用技术
英文摘要

近年来,随着全球人工智能(Artificial Intelligence)技术的飞速发展,相关技术在各个领域的应用也逐渐深入。智能问答作为典型的应用案例在学术界及工业界获得了广泛关注,并且已经在互联网、医疗、金融等领域进行了应用尝试。智能问答系统依赖于一个优质的知识来源。目前关于事实型问题(Factoid)的答案获取研究已经比较成熟,通常采用大规模知识库作为答案来源。对于非事实型问题(Non-Factoid),由于答案较为复杂(通常为较长的句子或段落),目前答案获取主要依赖于纯文本,传统方法难以有效利用领域背景知识和领域相关资源。 本文重点研究了针对特定领域的知识库构建方法及基于知识的答案获取方法,基于领域背景知识和领域相关资源提高智能问答系统性能。具体而言,本文开展了以下研究工作,主要贡献和创新点有: (1)在领域知识库构建研究中, 针对目前知识库构建方法中准确率和效率难以协调的问题,提出领域知识库构建的“三步法”,平衡自动化与人工参与。按照领域核心本体构建、本体学习和实体学习的步骤以半自动化的方式实现财税领域知识库的构建。针对本体学习过程中概念抽取和关系抽取相关算法的不足,提出了改进方案,并通过实验证明了改进算法的有效性。(2)在领域文本语义理解研究中, 根据财税领域实体特征难有手工提取的问题,研究了基于深度神经网络的命名实体识别方法。并根据中文汉字特点,对基于传统基于词向量的方法进行了改进,提出一种字符特征与词向量相结合的方法构建神经网络模型提高领域实体的识别的效果。根据领域实体类型多样结构复杂的特点,提出了一种基于集成学习的层次分类算法进行实体类别标注。不同于传统的实体标注方式,该方法对领域实体进行了更细粒度的标注,同时解决了训练数据不平衡问题,提高了标注模型的泛化能力。(3)在基于知识的智能问答研究中。针对领域问句中的事实型问题,使用基于浅层句法分析的方法将事实型问句转化为结构化的查询语句,并使用SPARQL查询方法对知识库进行检索。针对非事实型问题中用户问题表述不规范,查询匹配不准确问题,提出一种基于语义检索的方法,利用多种语义特征提高答案获取的准确性。 通过本文的研究,探索了针对特定领域的知识获取,表示及应用的方法,利用“三步法”构建了财税领域知识图谱,并对基于知识的财税智能问答系统进行了测试,实验证实了本文方法的可行性。该研究的意义在于在对构建基于领域知识的智能应用的全过程提供了知识储备和技术支持,让现在的方法从基于字符匹配的层次提升至基于语义理解层次,整个方法体系可以规范化推广应用到其它领域。

页码97
内容类型学位论文
源URL[http://ir.xjipc.cas.cn/handle/365002/6016]  
专题新疆理化技术研究所_多语种信息技术研究室
推荐引用方式
GB/T 7714
仇瑜. 面向领域智能问答的知识库构建与应用研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2019.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace