###
DOI:
计算机系统应用英文版:2008,17(4):65-68
本文二维码信息
码上扫一扫!
基于LSA和PLSA的网页聚类算法研究
(1.中国石油大学计通学院 山东东营 257061;2.中国石化胜利油田分公司物探研究院信息技术研究室 山东东营 257022)
Research of Web Page Clustering Algorithm Based on LSA and PLSA
摘要
图/表
参考文献
相似文献
本文已被:浏览 1638次   下载 3033
    
中文摘要: 文章介绍一种网页聚类算法利用潜在语义分析LSA(Latent Semantic Analysis)降低词-文档矩阵的秩,在聚类分析中,采用概率潜在语义分析改善聚类精度。首先利用潜在语义分析对词-文档矩阵进行奇异值分解,达到降秩和去噪的目的;然后在聚类分析中,采用概率潜在语义分析设计文档相似度计算函数,实验结果表明该算法的有效性。
Abstract:
keywords:
文章编号:     中图分类号:    文献标志码:
基金项目:
引用文本:
俞辉,赵玉国.基于LSA和PLSA的网页聚类算法研究.计算机系统应用,2008,17(4):65-68
.Research of Web Page Clustering Algorithm Based on LSA and PLSA.COMPUTER SYSTEMS APPLICATIONS,2008,17(4):65-68