在线社交网络的UNI64采样方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

北京高等学校青年英才计划(YETP0506)


UNI64 Sampling Method on Online Social Networks
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在对社交网络采样方法进行研究时, 常以拒绝-接受采样法得到的样本作为对照来评价其他采样方法的优劣. 由于各种在线社交网络陆续将其用户ID系统由32位升级为64位, 导致拒绝-接受采样法的采样命中率近乎为零. 本文根据在线社交网络的特点, 以新浪微博为例, 对其用户ID分布情况进行分析, 提出了一种改进的拒绝-接受采样法UNI64. 该方法通过分析网络有效ID样本的分布情况, 结合聚类的方法将整个样本空间划分为有效区间和无效区间, 并使采样算法避开无效区间, 仅在有效区间内生成待测样本, 从而有效提高了拒绝-接受采样法在有效样本极为稀疏的样本空间内采样的命中率.

    Abstract:

    When studying the sampling methods on online social networks, samples collected by acceptance-rejection method are usually used as the "ground truth" to estimate the pros and cons of other sampling methods. The acceptance rate of the original acceptance-rejection method slumps dramatically since OSN sites updated their user ID from 32bit to 64bit. According to the characteristics of online social networks and taking Sina Weibo for example, we analyzed the distribution of user IDs in Sina Weibo, and proposed an improved acceptance-rejection method called UNI64. In this method, the user ID space is divided into valid intervals and vacant intervals by analyzing the distribution of valid sample IDs and utilizing cluster method. The sampling method generates candidate IDs only in valid intervals, so that the acceptance rate could be effectively improved even in a sparse-distributed user ID space.

    参考文献
    相似文献
    引证文献
引用本文

许南山,李浩,卢罡.在线社交网络的UNI64采样方法.计算机系统应用,2014,23(12):206-212

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2014-04-10
  • 最后修改日期:2014-05-09
  • 录用日期:
  • 在线发布日期: 2014-12-15
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号