面向中文微博的情绪-原因对抽取数据集构建及分析研究
陈仲豪2,3; 朱军楠2,3; 向露2,3; 周玉1,2,3; 宗成庆2,3
刊名中文信息学报
2022-12
页码0
关键词情绪-原因对抽取 中文社交媒体 微博数据集
英文摘要

情绪-原因对抽取(ECPE)任务旨在从给定文档中同步抽取情绪子句及其对应的原因子句,该任务在新闻领域得到了广泛研究。然而,社交媒体领域ECPE任务的研究相对较少,主要原因在于缺少适用的数据集。与新闻领域相比,该领域更具挑战性和实用性:(a)在社交媒体领域,情绪表达更加多样化、非规范化;(b)以往的研究忽略了情绪造成的主观意图,它对于决策分析有很重要的价值。针对以上问题,该文首先构建了一个面向中文微博的情绪原因抽取数据集,并对其中5 009条数据进行了人工标注。该数据集具备以下特点:(1)收录了隐喻、反讽等形式的情绪表达,标注了细粒度的情绪类别;(2)定义了三种类型的意图,并标注了意图子句;(3)当前规模最大的中文情绪-原因对抽取数据集。结合数据集特点,该文提出一种融合情绪类别和意图信息的情绪-原因对抽取方法,并将该方法与多个ECPE主流方法进行了比较分析。实验结果表明,该文所提方法可以更有效地提升社交媒体领域情绪-原因对抽取的效果。

语种中文
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/48727]  
专题模式识别国家重点实验室_自然语言处理
通讯作者周玉
作者单位1.北京中科凡语科技有限公司 凡语AI研究院
2.中国科学院大学 人工智能学院
3.中国科学院自动化研究所 模式识别国家重点实验室
推荐引用方式
GB/T 7714
陈仲豪,朱军楠,向露,等. 面向中文微博的情绪-原因对抽取数据集构建及分析研究[J]. 中文信息学报,2022:0.
APA 陈仲豪,朱军楠,向露,周玉,&宗成庆.(2022).面向中文微博的情绪-原因对抽取数据集构建及分析研究.中文信息学报,0.
MLA 陈仲豪,et al."面向中文微博的情绪-原因对抽取数据集构建及分析研究".中文信息学报 (2022):0.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace