基于Hive的高可用双引擎数据仓库

doi:10.15888/j.cnki.csa.007040

AIPUB归智期刊联盟

微信公众号

网站二维码

2025年4月1日 10:47 星期二

首页 > 过刊浏览>2019年第28卷第9期 >65-71. DOI:10.15888/j.cnki.csa.007040

PDF HTML阅读 XML下载导出引用引用提醒

基于Hive的高可用双引擎数据仓库
DOI:
                        10.15888/j.cnki.csa.007040
                    
CSTR:
                        
                    
作者:
                        李翀李翀
中国科学院 计算机网络信息中心, 北京 100190
在期刊界中查找
在百度中查找
在本站中查找
张彤彤张彤彤
中国科学院 计算机网络信息中心, 北京 100190;中国科学院大学, 北京 100190
在期刊界中查找
在百度中查找
在本站中查找
杜伟静杜伟静
中国科学院 计算机网络信息中心, 北京 100190;中国科学院大学, 北京 100190
在期刊界中查找
在百度中查找
在本站中查找
刘学敏刘学敏
中国科学院 计算机网络信息中心, 北京 100190
在期刊界中查找
在百度中查找
在本站中查找

                    
作者单位:
作者简介:
通讯作者:
中图分类号:
基金项目:中国科学院"十三五"信息化专项（XXH13504-03）

High Availability Dual Engine Data Warehouse Based on Hive

Author:

LI Chong
LI Chong
Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China
在期刊界中查找
在百度中查找
在本站中查找
ZHANG Tong-Tong
ZHANG Tong-Tong
Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China;University of Chinese Academy of Sciences, Beijing 100190, China
在期刊界中查找
在百度中查找
在本站中查找
DU Wei-Jing
DU Wei-Jing
Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China;University of Chinese Academy of Sciences, Beijing 100190, China
在期刊界中查找
在百度中查找
在本站中查找
LIU Xue-Min
LIU Xue-Min
Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China
在期刊界中查找
在百度中查找
在本站中查找

Affiliation:

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

打破信息孤岛，整合异构数据，汇聚共享交换，深度分析挖掘，提供行业领域辅助决策和态势分析具有深远的理论和应用价值.本文以中国科学院教育科研态势感知服务的实际需求为牵引，设计并实现了一套基于Hive的Hadoop/Spark双计算引擎大数据仓库，支持多种方式OLAP分析，进行了可用性、负载均衡、资源管理的优化设计，为后续进行全院数据汇聚挖掘、知识图谱构建、学科态势分析提供了平台支撑.实验表明，系统灵活高效，高可用可扩展，资源调度科学，负载均衡效果明显.

关键词:数据仓库;Hive;高可用;OLAP;Hadoop

Abstract:

Breaking isolated information island, integrating heterogeneous data, gathering and sharing exchanges, conducting in-depth analysis and mining, and providing industry-side decision-making and situation analysis have far-reaching theoretical and applied value. Based on the actual demand of the situational awareness service of the Chinese Academy of Sciences, this study designs and implements a Hive-based Hadoop/Spark dual computing engine big data warehouse supporting OLAP analysis in multiple ways, and carries out an optimization design of usability, load balancing, and resource management, which provides platform support for the subsequent data aggregation and mining, knowledge map construction and discipline situation analysis. Experimental results show that the system is flexible, efficient, available, and scalable, the resource scheduling is scientific, and the load balancing effect is obvious.

Key words:data warehouse;Hive;high availability;OLAP;Hadoop

引用本文

李翀,张彤彤,杜伟静,刘学敏.基于Hive的高可用双引擎数据仓库.计算机系统应用,2019,28(9):65-71

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2019-02-28
最后修改日期:2019-03-14
录用日期:
在线发布日期: 2019-09-09
出版日期: 2019-09-15

微信公众号

网站二维码

引用本文

分享

文章指标

历史

文章二维码

微信公众号

网站二维码

引用本文

分享

微信扫一扫：分享

文章指标

历史

文章二维码