CORC  > 厦门大学  > 信息技术-已发表论文
基于同义词词林和《知网》的短语主题提取; Phrase Subject Extraction Based on Synonyms and HowNet
曾聪 ; 张东站
2015-03-28
关键词短语主题 主题抽取 同义词词林 知网 phrase subject subject extraction synonyms HowNet
英文摘要提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进k最近邻分类算法(knn)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提出一种根据中文表达习惯的基于加权主题词的短语主题抽取算法.实验结果表明,后两种算法对短语主题抽取效果良好,平均查全率分别达到78.88%和83.39%,平均查准率达99.06%和99.70%.; Key word phrase subject extraction algorithm(KWPSE),which is based on the judgment whether phrases include the topic words is constructed.On the basis of KWPSE,by using a WordsSet of social knowledge as classified information,the word similarity as distance weight,and the improved KNN method the word similarity based on HowNet phrase subject extraction algorithm(WSPSE)is presented.Finally,on this basis of WSPSE and with the addition of the weight to the words′position that is based on Chinese custom,the WKWPSE algorithm is proposed.The average recall rates reach 78.88% and 83.39%,and average precision rates increase to 99.06% and 99.70%.; 国家自然科学基金(61303004); 福建省自然科学基金(2013J05099)
语种zh_CN
内容类型期刊论文
源URL[http://dspace.xmu.edu.cn/handle/2288/123245]  
专题信息技术-已发表论文
推荐引用方式
GB/T 7714
曾聪,张东站. 基于同义词词林和《知网》的短语主题提取, Phrase Subject Extraction Based on Synonyms and HowNet[J],2015.
APA 曾聪,&张东站.(2015).基于同义词词林和《知网》的短语主题提取..
MLA 曾聪,et al."基于同义词词林和《知网》的短语主题提取".(2015).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace