基于深度学习的网站权威性预测
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家重点研发计划(2017YFB0203704)


Website Authority Prediction Based on Deep Learning
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    网站权威性一般是由外部链接来衡量,高质量的外部链接越多,网站的权威性就越高;常用的评价网站权威性的算法有PageRank等,然而该类算法对网站权威性的影响是有选择性的,使得这种方法具有一定的弊端.本文利用深度学习的方法,通过将搜索词和网址映射为向量,计算两个向量之间的相似度来评判在某个搜索词下不同网址的权威性,把计算结果相似度高对应的网站称为在该搜索词下权威性高的网站,从而从另一种角度去衡量网站的权威性.通过对比使用Word2vec和LSTM两种不同的模型实验,在对公开的数据集上的实验结果表明使用这两种模型是有效的,其中LSTM模型比Word2vec模型的效果要好.

    Abstract:

    Website authority is generally measured by external links. The more high-quality external links are, the more authoritative the website or web page itself is. Evaluation website authoritative algorithm has PageRank and so on. However, the impact of such algorithms on the authority of the website is selective, making this method has some drawbacks. This study uses the method of deep learning, by mapping search terms and URLs into vectors, and then calculates the similarity between two vectors to judge the authority of different websites under a certain search term. The website with high similarity of calculation results is referred to as an authoritative site under the search term, so we can use another view to measure the authority of website. By comparing two different model experiments using Word2vec and LSTM, the experimental results on open datasets show that it is effective to use both models, and LSTM model is better than Word2vec model.

    参考文献
    相似文献
    引证文献
引用本文

杨海华,冯仰德,王珏,聂宁明,刘芳,张博尧.基于深度学习的网站权威性预测.计算机系统应用,2018,27(8):164-169

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-12-18
  • 最后修改日期:2018-01-04
  • 录用日期:
  • 在线发布日期: 2018-08-04
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号