本文已被:浏览 1751次 下载 2990次
中文摘要: 垂直搜索引擎的数据来源于各大相关网站。随着互联网用户越来越多,相互转载,重复发布的数据也越来越多,由于这些重复及相似数据的存在,严重影响了搜索引擎的检索结果。针对这一问题本文提出了一种解决方法,即利用MD5算法在数据处理阶段有效的消除冗余数据。结果表明该方法很好的提高了检索质量。
中文关键词: 垂直搜索引擎 检索结果 MD5算法 冗余数据
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:国家863计划(2006AA10Z23702) ;国家科技支撑计划(2006BAD10A0502) ;国家科技支撑计划(2006BAD10A1410) ;国家自然科学基金(60774096)
Author Name | Affiliation |
刘峰 | 中国科学院 合肥智能机械研究所 安徽 合肥 230031 中国科学技术大学 自动化系 安徽 合肥 230027 |
王儒敬 | 中国科学院 合肥智能机械研究所 安徽 合肥 230031 |
Author Name | Affiliation |
刘峰 | 中国科学院 合肥智能机械研究所 安徽 合肥 230031 中国科学技术大学 自动化系 安徽 合肥 230027 |
王儒敬 | 中国科学院 合肥智能机械研究所 安徽 合肥 230031 |
引用文本:
刘峰,王儒敬.MD5算法在农业数据消重中的应用.计算机系统应用,2009,18(1):104-106
.Application of MD5 in Agricultural Data Cleaning.COMPUTER SYSTEMS APPLICATIONS,2009,18(1):104-106
刘峰,王儒敬.MD5算法在农业数据消重中的应用.计算机系统应用,2009,18(1):104-106
.Application of MD5 in Agricultural Data Cleaning.COMPUTER SYSTEMS APPLICATIONS,2009,18(1):104-106