题名面向知识图谱的关系抽取与知识表示方法研究
作者孟小艳
答辩日期2021-05-25
授予单位中国科学院大学
授予地点中国科学院新疆理化技术研究所
导师蒋同海
关键词知识图谱 知识表示 关系抽取
学位名称博士
学位专业计算机应用技术
英文摘要

随着互联网技术的不断演进,带来了数据爆发式的增长,人们已经迈向了知识互联的web3.0时代,但这些每天新产生的大量的非结构化的数据中蕴含着丰富但无法直接使用的信息,因此价值高且质量好的数据的获取、处理和整合就显得尤为重要。知识图谱(knowledge Graph,KG)作为一种能够从海量数据中提取出结构化知识的有效技术,引起了学术界和产业界的高度关注。与此同时,人工智能的再度崛起,也从另一个方向推进了知识工程的研究,作为人工智能2.0时代高效的知识表示方式之一的知识图谱技术,以其广阔的研究前景和旺盛的应用需求再度成为了研究热点。本文面向知识图谱构建中的关系抽取和知识表示两大关键技术问题展开研究与实验验证。其中,如何从开放域中自动抽取实体间的关系是构建知识图谱的基础;如何通过知识表示学习实现知识图谱的向量化表示,更好地完成知识加工和计算,是贯穿知识图谱构建的关键;在应用领域如何设计合理的知识图谱架构来贴合应用需求是知识图谱应用落地的首要环节。围绕以上问题,本文聚焦面向知识图谱的关系抽取和知识表示方法,设计了可以同时缓解示例级和包级噪声的降噪策略,以提升关系抽取性能的方法;提出了从局部结构特性出发,利用融合自适应方法的嵌入式表示模型提升大规模复杂关系知识图谱的表示学习性能;提出了基于多关系路径,可以捕捉上下文信息的知识表示学习模型;最后探索了自然资源领域知识图谱的构建思路。本文的具体研究内容和相关成果如下:(1)基于噪声检测策略的关系抽取方法研究。现有的关系抽取模型中不可避免地存在噪声问题,本文对关系抽取中的降噪问题展开研究,基于多示例学习框架,构建出一个新的关系抽取模型NDRE。模型中引入新的噪声检测策略,利用实体信息自动检测噪声标签并对其进行动态校正,该策略可以同时缓解示例级和包级的噪声问题,也可以避免结合外部引入的Web表扩展数据集时,不会引入更多的噪声。本文提出的基于噪声检测策略的关系抽取模型在公共数据集上的实验效果,比选定的基线方法在性能上有明显的改进,可以有效降低噪声问题,提升关系抽取质量。(2)知识图谱复杂关系的知识表示研究。面向知识图谱的表示学习可以将知识图谱中的实体与关系映射到低维稠密的向量空间中,便于数值化计算和推理。现有的研究中基于翻译的知识表示模型性能突出,但针对复杂关系的表示和模型的适用性上仍然有待提升。针对上述问题,本文提出了一种改进的自适应知识图谱嵌入式表示方法,首先对实体与关系通过动态映射矩阵分别建立空间投影,实现向量转化,增强该模型处理复杂关系时的表示能力。在此基础上,引入自适应的度量方法,利用对角权重矩阵,通过为每个特征维度赋予优化调整的权重来增加模型的表示能力。最后将这两种优化集成在一个新模型TransAD中。本文提出的TransAD模型在实验中表现出一定的先进性,更适合大规模复杂关系知识图谱的表示。(3)基于多关系路径的语境化知识表示学习研究。知识图谱的表示学习中还有一种方法是从全局出发,考虑到多步关系形成的路径,从图的思路去考虑,从而突破现有知识表示学习的模型中对每个三元组只是孤立学习的局限。本文在基于路径的知识表示学习的研究基础上,提出一种多关系路径的语境化知识表示学习模型。模型采用路径排序算法PRA评估关系路径的可靠性,避免不可靠的关系路径对表示模型产生不好的影响;采用叠加的Transformer对关系路径进行编码,捕捉关系路径的上下文信息,得到实体关系的动态上下文表示;对同一头尾实体之间的多个关系路径进行聚合,获取关系路径之间隐藏的相互信息。本文所提模型在在标准数据集上的链接预测和路径查询问答两个推理任务上取得了不错的结果,证明了其有效性。(4)提出了一个面向领域的知识图谱构建方案。自然资源领域数字化转型过程中要求,要通过知识图谱等新一代信息技术促进自然资源的数据治理和业务治理的科学化、智能化。本文在分析自然资源领域的数据特点的基础上,首先设计出自然资源领域知识图谱构建的技术实施方案,然后阐述自然资源领域的业务数据(规范文本)和现状数据(遥感数据及衍生产品)的信息抽取、知识融合、知识加工的工作内容和步骤,对知识图谱的应用进行一定的探索。最后,对下一步的工作内容进行描述,以期将知识图谱技术更好地应用到行业领域中。

页码103
内容类型学位论文
源URL[http://ir.xjipc.cas.cn/handle/365002/7912]  
专题新疆理化技术研究所_多语种信息技术研究室
推荐引用方式
GB/T 7714
孟小艳. 面向知识图谱的关系抽取与知识表示方法研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace