【PDF】Hive架构原理 - 资源下载

编辑：

ACcyL

2019-08-26

www.

2015 华为技术有限公司目标 ? 学完本课程后,您将能够: ? 了解Hive应用场景与基本原理;

? 了解FusionInsight中Hive增强特性;

? 熟悉常用Hive SQL语句;

? 学会常见Hive故障分析、日志收集;

2015 华为技术有限公司 Hive的优点及缺点 ?HiveServer采用主备模式 ?双MetaStore ?超时重试高可靠、高容错

1 类SQL

2 可扩展

3 多接口

2015 华为技术有限公司 Hive的优点及缺点 ?默认M/R为执行引擎 ?M/R启动有延迟延迟较高

1 不支持物化视图

2 不适用OLTP

3 暂不支持存储过程

4 Hive的缺点 ?Hive虽然也提供了视图的概念;

2015 华为技术有限公司 Hive与传统数据仓库比较 Hive 传统数据仓库存储 HDFS,理论上有无限拓展的可能. 集群存储,存在容量上限,而且伴随容量的增长,计算速度急剧下降.只能适应于数据量比较小的商业应用,对于超大规模数据无能为力. 执行引擎依赖于MapReduce框架,可进行的各类优化较少,但是比较简单. 可以选择更加高效的算法来执行查询,也可以进行更多的优化措施来提高速度. 使用方式 HQL(类似SQL). SQL. 灵活性元数据存储独立于数据存储之外, 从而解耦合元数据和数据. 低,数据用途单一. 分析速度计算依赖于MapReduce和集群规模,易拓展,在大数据量情况下, 远远快于普通数据仓库. 在数据容量较小时非常快速,数据量较大时, 急剧下降. 第10页版权所有?

2015 华为技术有限公司 Hive与传统数据仓库比较 Hive 传统数据仓库分析速度计算依赖于MapReduce和集群规模,易拓展,在大数据量情况下, 远远快于普通数据仓库. 在数据容量较小时非常快速,数据量较大时, 急剧下降. 索引低效,目前还不完善. 高效. 易用性需要自行开发应用模型,灵活度较高,但是易用性较低. 集成一整套成熟的的报表解决方案,可以较为方便的进行数据的分析. 可靠性数据存储在HDFS,可靠性高,容错性高. 可靠性较低,一次查询失败需要重新开始. 数据容错依赖于硬件Raid. 依赖环境依赖硬件较低,可适应一般的普通机器. 依赖于高性能的商业服务器. 价格开源产品. 商用比较昂贵,开源的性能较低. 第11页版权所有?

2015 华为技术有限公司 MetaStore : 存储表,列和Partition等元数据,为关系型数据库. Driver : 管理HiveQL执行的生命周期并贯穿Hive任务整个执行期间. Compiler : 编译HiveQL并将其转化为一系列相互依赖的 Map/Reduce任务. Optimizer : 优化器,分为逻辑优化器和物理优化器,分别对 HiveQL生成的执行计划和MapReduce任务进行优化. Executor : 按照任务的依赖关系分别执行Map/Reduce任务. ThriftServer : 提供thrift接口,作为JDBC和ODBC的服务端,并将Hive和其他应用程序集成起来. Clients : 包含命令行接口(CLI/Beeline) 和JDBC/ODBC 接口,为用户访问提供接口. Hive CLI/Beeline JDBC/ODBC Thrift Server Driver (Compiler,Optimizer,Executor) MetaStore MapReduce HDFS HBase Hive的架构第14页版权所有?

2015 华为技术有限公司 FusionInsight HD中Hive的架构 ? 在C50版本中HiveServer使用集群模式,即可同时有两个HiveServer提供服务 ? MetaStore进程可以启一个或两个来提供元数据服务 Hiveserver (Active) Hiveserver (Active) Metas tore Meta store DBservice ZooK eep er HDFS Yarn ? Hive分为两个角色HiveServer、MetaStore.HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果,MetaStore提供元数据服务. 第15页版权所有?

2015 华为技术有限公司 ? HCatalog包括HCatalog Client和HCatalog Server. ? HCatalog Client 包括命令行工具CLI和Client jar包(用于给Pig,M/R提供元数据读写支持). ?HCatalog通过Hive提供的HiveMetaStoreClient 对象来间接访问MetaStore. ?HCatalog对外提供Hcatloader, HCatInputFormat来读取数据;

2015 华为技术有限公司 ? WebHCat提供Rest接口,使用户能够通过安全的HTTPS协议执行以下操作: ?执行Hive DDL操作;

?运行Hive HQL任务;

?运行MapReduce任务;

2015 华为技术有限公司 Hive权限管理 ? 权限模型 ? Pricinpal Specification--用户对象:Hive中的用户对象包括:USER|GROUP ? Object--数据........

注：以上内容是本站开源项目的机器提供的预览内容，更完整和更好的阅读体验请直接免费下载资源后阅读

下载（注：源文件不在本站服务器，都将跳转到源网站下载）

备用下载

下一篇: 基片对交替溅射制备的！＂#＂铁氧体薄膜结构和磁性的影...
上一篇: 金相显微镜的结构、原理及应用解析

PDF《Hive架构原理》