国家863计划(2006AA10Z23702) ;国家科技支撑计划(2006BAD10A0502) ;国家科技支撑计划(2006BAD10A1410) ;国家自然科学基金(60774096)
垂直搜索引擎的数据来源于各大相关网站。随着互联网用户越来越多,相互转载,重复发布的数据也越来越多,由于这些重复及相似数据的存在,严重影响了搜索引擎的检索结果。针对这一问题本文提出了一种解决方法,即利用MD5算法在数据处理阶段有效的消除冗余数据。结果表明该方法很好的提高了检索质量。
刘峰,王儒敬. MD5算法在农业数据消重中的应用.计算机系统应用,2009,18(1):104-106
京公网安备 11040202500063号