本文已被:浏览 1638次 下载 3033次
中文摘要: 文章介绍一种网页聚类算法利用潜在语义分析LSA(Latent Semantic Analysis)降低词-文档矩阵的秩,在聚类分析中,采用概率潜在语义分析改善聚类精度。首先利用潜在语义分析对词-文档矩阵进行奇异值分解,达到降秩和去噪的目的;然后在聚类分析中,采用概率潜在语义分析设计文档相似度计算函数,实验结果表明该算法的有效性。
中文关键词: 网页 聚类 潜在语义分析 概率潜在语义分析 相似度
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
俞辉 | 中国石油大学计通学院 山东东营 257061 |
赵玉国 | 中国石化胜利油田分公司物探研究院信息技术研究室 山东东营 257022 |
Author Name | Affiliation |
俞辉 | 中国石油大学计通学院 山东东营 257061 |
赵玉国 | 中国石化胜利油田分公司物探研究院信息技术研究室 山东东营 257022 |
引用文本:
俞辉,赵玉国.基于LSA和PLSA的网页聚类算法研究.计算机系统应用,2008,17(4):65-68
.Research of Web Page Clustering Algorithm Based on LSA and PLSA.COMPUTER SYSTEMS APPLICATIONS,2008,17(4):65-68
俞辉,赵玉国.基于LSA和PLSA的网页聚类算法研究.计算机系统应用,2008,17(4):65-68
.Research of Web Page Clustering Algorithm Based on LSA and PLSA.COMPUTER SYSTEMS APPLICATIONS,2008,17(4):65-68