一种基于HBase的数据持久性和可用性研究
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

江苏省产学研前瞻性联合研究(BY2009128);江苏省自然科学基金(BK2012194);国家自然科学基金(61272131)


Research of Data Durable and Available Base on Hbase
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    HBase(Hadoop DataBase)是Apache Hadoop项目下的一款非关系型数据库, 它是一个基于列簇的开源数据存储系统, 关于HBase的研究和应用越来越受到关注. 由于HBase会在内存缓存数据后写文件系统, 所以缓存的大小成为影响系统性能的一个重要因素. 本文提出一种基于备份日志的持久性、可用性方案Remote Log Process, 使得HBase能够在不同的缓存规模获得更好的写性能. 实验证明, 在保证数据的持久性和可用性前提下, RLP能够在不同的缓存大小下获得稳定的性能, 并且在缓存不超过默认设置时明显提高写操作时间性能.

    Abstract:

    HBase, a NoSql database under Apache Hadoop, is an open source data storage system based on column family. Researches and applications based on HBase is more and more popular. But the size of memory buffer become a key factor to influence system performance as HBase will buffer data in memory before store them on file system. In this paper, we provide a new method based on copied log named Remote Log Process to make HBase perform better on write operation with different buffer size while keeping data durable and available. Experiments result indicates RLP can get a steady performance with different buffer size under the condition to guarantee durable and available of input data, while perform much better than pristine systems if the buffer isn't larger then default value.

    参考文献
    相似文献
    引证文献
引用本文

唐长城,杨峰,代栋,孙明明,周学海.一种基于HBase的数据持久性和可用性研究.计算机系统应用,2013,22(10):175-180

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-03-18
  • 最后修改日期:2013-05-02
  • 录用日期:
  • 在线发布日期: 2013-10-18
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号