基于同义词词林和《知网》的短语主题提取; Phrase Subject Extraction Based on Synonyms and HowNet | |
曾聪 ; 张东站 | |
2015-03-28 | |
关键词 | 短语主题 主题抽取 同义词词林 知网 phrase subject subject extraction synonyms HowNet |
英文摘要 | 提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进k最近邻分类算法(knn)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提出一种根据中文表达习惯的基于加权主题词的短语主题抽取算法.实验结果表明,后两种算法对短语主题抽取效果良好,平均查全率分别达到78.88%和83.39%,平均查准率达99.06%和99.70%.; Key word phrase subject extraction algorithm(KWPSE),which is based on the judgment whether phrases include the topic words is constructed.On the basis of KWPSE,by using a WordsSet of social knowledge as classified information,the word similarity as distance weight,and the improved KNN method the word similarity based on HowNet phrase subject extraction algorithm(WSPSE)is presented.Finally,on this basis of WSPSE and with the addition of the weight to the words′position that is based on Chinese custom,the WKWPSE algorithm is proposed.The average recall rates reach 78.88% and 83.39%,and average precision rates increase to 99.06% and 99.70%.; 国家自然科学基金(61303004); 福建省自然科学基金(2013J05099) |
语种 | zh_CN |
内容类型 | 期刊论文 |
源URL | [http://dspace.xmu.edu.cn/handle/2288/123245] |
专题 | 信息技术-已发表论文 |
推荐引用方式 GB/T 7714 | 曾聪,张东站. 基于同义词词林和《知网》的短语主题提取, Phrase Subject Extraction Based on Synonyms and HowNet[J],2015. |
APA | 曾聪,&张东站.(2015).基于同义词词林和《知网》的短语主题提取.. |
MLA | 曾聪,et al."基于同义词词林和《知网》的短语主题提取".(2015). |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论