面向中文微博的情绪-原因对抽取数据集构建及分析研究 | |
陈仲豪2,3; 朱军楠2,3; 向露2,3; 周玉1,2,3; 宗成庆2,3 | |
刊名 | 中文信息学报 |
2022-12 | |
页码 | 0 |
关键词 | 情绪-原因对抽取 中文社交媒体 微博数据集 |
英文摘要 | 情绪-原因对抽取(ECPE)任务旨在从给定文档中同步抽取情绪子句及其对应的原因子句,该任务在新闻领域得到了广泛研究。然而,社交媒体领域ECPE任务的研究相对较少,主要原因在于缺少适用的数据集。与新闻领域相比,该领域更具挑战性和实用性:(a)在社交媒体领域,情绪表达更加多样化、非规范化;(b)以往的研究忽略了情绪造成的主观意图,它对于决策分析有很重要的价值。针对以上问题,该文首先构建了一个面向中文微博的情绪原因抽取数据集,并对其中5 009条数据进行了人工标注。该数据集具备以下特点:(1)收录了隐喻、反讽等形式的情绪表达,标注了细粒度的情绪类别;(2)定义了三种类型的意图,并标注了意图子句;(3)当前规模最大的中文情绪-原因对抽取数据集。结合数据集特点,该文提出一种融合情绪类别和意图信息的情绪-原因对抽取方法,并将该方法与多个ECPE主流方法进行了比较分析。实验结果表明,该文所提方法可以更有效地提升社交媒体领域情绪-原因对抽取的效果。 |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/48727] |
专题 | 模式识别国家重点实验室_自然语言处理 |
通讯作者 | 周玉 |
作者单位 | 1.北京中科凡语科技有限公司 凡语AI研究院 2.中国科学院大学 人工智能学院 3.中国科学院自动化研究所 模式识别国家重点实验室 |
推荐引用方式 GB/T 7714 | 陈仲豪,朱军楠,向露,等. 面向中文微博的情绪-原因对抽取数据集构建及分析研究[J]. 中文信息学报,2022:0. |
APA | 陈仲豪,朱军楠,向露,周玉,&宗成庆.(2022).面向中文微博的情绪-原因对抽取数据集构建及分析研究.中文信息学报,0. |
MLA | 陈仲豪,et al."面向中文微博的情绪-原因对抽取数据集构建及分析研究".中文信息学报 (2022):0. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论