多特征关键词提取算法研究

doi:10.15888/j.cnki.csa.006450

AIPUB归智期刊联盟

微信公众号

网站二维码

2025年4月23日 19:15 星期三

首页 > 过刊浏览>2018年第27卷第7期 >162-166. DOI:10.15888/j.cnki.csa.006450

PDF HTML阅读 XML下载导出引用引用提醒

多特征关键词提取算法研究
DOI:
                        10.15888/j.cnki.csa.006450
                    
CSTR:
                        
                    
作者:
                        王洁王洁
云南大学 信息学院, 昆明 650223
在期刊界中查找
在百度中查找
在本站中查找
王丽清王丽清
云南大学 信息学院, 昆明 650223
在期刊界中查找
在百度中查找
在本站中查找

                    
作者单位:
作者简介:
通讯作者:
中图分类号:
基金项目:云南省教育厅产业化扶持项目（2016CYH03）；云南省科技创新强省计划项目（2014AB021）；云南省创新团队项目

Research on Multi-Feature Keyword Extraction Algorithm

Author:

WANG Jie
WANG Jie
School of Information Science & Engineering, Yunnan University, Kunming 650223, China
在期刊界中查找
在百度中查找
在本站中查找
WANG Li-Qing
WANG Li-Qing
School of Information Science & Engineering, Yunnan University, Kunming 650223, China
在期刊界中查找
在百度中查找
在本站中查找

Affiliation:

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

关键词提取技术是语料库构建、文本分析处理、信息检索的基础.采用传统的TFIDF算法提取关键词时，主要依据词频计算权重，而未考虑文本特征项的影响，由于对词频的过度依赖，导致其提取关键词的准确性不高.针对这个问题，本文根据关键词的特性，引入位置和词性作为影响因子，对TFIDF算法权重重新进行了计算和排序，从而改进该算法，并利用Python语言完成了实现.实验结果表明，采用该改进方法提取关键词，其召回率、准确率、F因子与传统方法相比均得到明显提升.

关键词:多特征;TFIDF;关键词提取;Python

Abstract:

Keyword extraction technology is the foundation of corpus construction, text analysis, and information retrieval. The traditional TFIDF algorithm is mainly based on word frequency weighting to extract keywords without considering the influence of text features. The excessive reliance on word frequency leads to the inaccuracy of extract keywords. To solve this problem, an improved algorithm has been proposed, which use the word position and the word information as factors to recalculate the weight, then we implement it in Python. Experiment shows that using this method to extract keywords can improve the recall rate, accuracy, and F-measure.

Key words:multi-feature;TFIDF;keyword extraction;Python

引用本文

王洁,王丽清.多特征关键词提取算法研究.计算机系统应用,2018,27(7):162-166

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2017-11-23
最后修改日期:2017-12-15
录用日期:
在线发布日期: 2018-06-27
出版日期:

微信公众号

网站二维码

引用本文

分享

文章指标

历史

文章二维码

微信公众号

网站二维码

引用本文

分享

微信扫一扫：分享

文章指标

历史

文章二维码