当前位置: 首页 > news >正文

个人网站怎么做微信支付腾讯云1元域名

个人网站怎么做微信支付,腾讯云1元域名,拓者设计吧官网app,网站设计实用实例【图解大数据技术】Hive、HBase Hive数据仓库Hive的执行流程Hive架构数据导入Hive HBaseHBase简介HBase架构HBase的列式存储HBase建表流程HBase数据写入流程HBase数据读取流程 Hive Hive是基于Hadoop的一个数据仓库工具,Hive的数据存储在HDFS上,底层基于…

【图解大数据技术】Hive、HBase

  • Hive
    • 数据仓库
    • Hive的执行流程
    • Hive架构
    • 数据导入Hive
  • HBase
    • HBase简介
    • HBase架构
    • HBase的列式存储
    • HBase建表流程
    • HBase数据写入流程
    • HBase数据读取流程

Hive

Hive是基于Hadoop的一个数据仓库工具,Hive的数据存储在HDFS上,底层基于MapReduce进行数据计算。Hive将HDFS中结构化的数据文件映射成一张表,然后提供类SQL的查询功能,然后将SQL翻译成MapReduce并执行,可以解决海量结构化日志的统计查询。

在这里插入图片描述

数据仓库

数据仓库的作用是存储大量的历史数据,然后给各种BI报表、其他图形化界面或生成各种报告的系统提供数据分析统计的功能。

在这里插入图片描述

数据仓库的数据来源一般是各种业务系统的日志文件或者数据库的历史数据等,经过数据清洗后到导入到数据仓库。然后使用BI报表等各种非实时性的统计分析应用对数据仓库中的数据做统计分析。

数据仓库本质也是数据库,但是它和传统的关系型数据库还是有区别的。关系型数据库一般给业务系统对数据进行CRUD等OLTP操作,而数据仓库则更多的是给分析型应用进行OLAP操作。

在这里插入图片描述

而且关系型数据库一般不会存储大量的历史数据,而是存储近期某个时间范围内的业务数据;而数据仓库则会存储大量的历史数据。

在这里插入图片描述

Hive的执行流程

在这里插入图片描述

Hive内部封装了各种MapReduce模板,每个MapReduce都与一种SQL类型相对于。当客户端提交sql到hive执行时,hive会根据sql匹配出对应的MapReduce类型,然后执行MapReduce程序,获取返回结果,然后把返回结果返回给客户端。

Hive架构

在这里插入图片描述

大体架构和MySQL还是有几分相似。

  • Client:客户端工具,比如CLI命令行工具,JDBC等。
  • Metastore:存储Hive的元数据信息,比如表信息,表的列信息,还有表对应的数据在HDFS中的目录。
  • 解析器:解析器解析sql为抽象语法树AST。
  • 编译器:根据AST生成执行计划。
  • 优化器:对执行计划进行优化。
  • 执行器:根据执行计划生成相应的MapReduce并执行。

数据导入Hive

在这里插入图片描述

我们需要把数据导入到Hive中,使其在Hive中映射为表,才能通过Hive对数据进行统计分析。

导入的方式有好几种,可以是本地文件,HDFS文件,或者通过sqoop等类似的工具从其他数据源导入。

在这里插入图片描述

其中Sqoop是Hadoop和关系型数据库间的传输工具,比如可以把Mysql中的数据导入到Hive中。

在这里插入图片描述

HBase

HBase简介

在这里插入图片描述

HBase是一个用于存储海量非结构化或半结构化数据的列示存储数据库,支持高性能写入,准实时查询。

  • HBase底层基于HDFS实现了PB级别的海量数据存储。
  • 通过缓存和预写日志技术实现了高性能写入和低延迟查询。
  • 通过Zookeeper的监控通知HMaster故障转移实现了高可靠性。
  • 通HMaster接收RegionServer注册以及HMaster的RegionServer集群负载均衡能力实现高扩展性。

HBase架构

HBase的架构与组件间的关系如下图:

在这里插入图片描述

大体由Client、Zookeeper、HMaster、HRegionServer四个角色组成,加上HDFS就是五个。

Client会通过zk读取meta表Region所在的位置,然后请求对应该Region所在RegionServer获取元数据信息,然后通过元数据得知目标Region所在位置,再对目标Region所在RegionServer发起读写操作。

HRegionServer负责数据的存储和处理客户端的读写请求。HRegionServer中有多个HRegion,每个Region对应一个表的一个分片,Region中又有多个Store,每个Stroe对应表中一个列族。然后Stroe中有一个MemStore是Store的缓存,会缓存客户端读写的数据。StoreFile封装了HFile,HFile通过HDFS客户端工具把具有一定格式的文件数据写入到HDFS中。HLog是预写日志,当HRegionServer接收到客户端的写请求时,把数据存储到MemStore中,然后在HLog中记录日志,由于HLog是顺序写,速度很快。

HRegionServer启动时向HMaster注册,HMaster接收HRegionServer的注册并进行HRegionServer的数据存储的负载均衡;HMaster接收到Zookeeper发来的某个HRegionServer故障的通知后,负责HRegionServer的故障转移;HMaster接收到Client的建表请求后,写入元数据到meta表对应的Region,然后记录Region所在位置的HRegionServer到Zookeeper。

Zookeeper负责监控HMaster和HRegionServer,保证它们的高可用;当HRegionServer故障时会通知HMaster;Zookeeper还存储meta表Region的位置,Client可以通过Zookeeper得知meta表Region所在的HRegionServer。

HBase的列式存储

在这里插入图片描述

  • RowKey:相当于是MySQL中的主键,表中的数据根据RowKey进行排序;我们可以通过RowKey查询指定的某一行或进行范围查询。
  • ColumnFamily:列族,在建表的时候需要预先声明列族,一个列族对应一个物理文件。
  • Column:列,列无需在建表的时候预先指定,可以随意增加;并且查询的时候可以指定列名进行查询。
    timestamp:时间戳,同一个RowKey的不同版本的数据。

HBase建表流程

在这里插入图片描述

  1. Client通过rpc调用HMaster进行表创建。
  2. HMaster根据集群存储情况确定一个RegionServer存储新建表的数据,然后通知该RegionServer创建Region。
  3. HMaster把表的元数据信息写入meta表对应的Region中;同时如果该Region是新建的话,会在zk中更新meta表所在位置的信息。

HBase数据写入流程

在这里插入图片描述

  1. Client通过ZK得知meta表所在位置。
  2. Client访问meta表对应的Region,获取目标用户表的元数据,得知该表数据存储在哪个Region上。
  3. Client访问目标Region写入数据。
  4. 数据写入MemStore并记录HLog日志,当MemStore达到阈值后才会flush到StoreFile中,StoreFile通过HFile把数据写入到HDFS。

HBase数据读取流程

在这里插入图片描述

  1. Client通过ZK得知meta表所在位置。
  2. Client访问meta表对应的Region,获取目标用户表的元数据,得知该表数据存储在哪个Region上。
  3. Client访问目标Region读取数据,先尝试从MemStore中读取要查询的数据,如果没有再从BlockCache中读取(BlockCache存储了之前查询返回的数据),还是没有那就要通过HFile从HDFS中取了。

文章转载自:
http://xu.c7617.cn
http://dihydrate.c7617.cn
http://dizziness.c7617.cn
http://legendarily.c7617.cn
http://rename.c7617.cn
http://bistort.c7617.cn
http://ignitability.c7617.cn
http://marv.c7617.cn
http://scute.c7617.cn
http://mendicant.c7617.cn
http://bolan.c7617.cn
http://phantast.c7617.cn
http://because.c7617.cn
http://inconceivability.c7617.cn
http://idioglossia.c7617.cn
http://mlf.c7617.cn
http://castroite.c7617.cn
http://intransitive.c7617.cn
http://tehsil.c7617.cn
http://necrophagia.c7617.cn
http://faggoty.c7617.cn
http://tartarian.c7617.cn
http://childish.c7617.cn
http://pharyngotomy.c7617.cn
http://spirituality.c7617.cn
http://seichometer.c7617.cn
http://talkative.c7617.cn
http://hemipod.c7617.cn
http://housemaster.c7617.cn
http://innervation.c7617.cn
http://roofing.c7617.cn
http://coverage.c7617.cn
http://authoress.c7617.cn
http://wherethrough.c7617.cn
http://stole.c7617.cn
http://houseleek.c7617.cn
http://daub.c7617.cn
http://epizoology.c7617.cn
http://smallmouth.c7617.cn
http://transprovincial.c7617.cn
http://allecret.c7617.cn
http://rigaudon.c7617.cn
http://storytelling.c7617.cn
http://foreigner.c7617.cn
http://globular.c7617.cn
http://disorganization.c7617.cn
http://tapeti.c7617.cn
http://acerb.c7617.cn
http://clubhouse.c7617.cn
http://bathymetry.c7617.cn
http://pursual.c7617.cn
http://rusticity.c7617.cn
http://sparingly.c7617.cn
http://baloney.c7617.cn
http://inveigle.c7617.cn
http://kalendar.c7617.cn
http://eiger.c7617.cn
http://medley.c7617.cn
http://cinerea.c7617.cn
http://downcome.c7617.cn
http://meal.c7617.cn
http://ephor.c7617.cn
http://onionskin.c7617.cn
http://nakedize.c7617.cn
http://sarcomere.c7617.cn
http://monitory.c7617.cn
http://iaido.c7617.cn
http://polypharmacy.c7617.cn
http://athwarthawse.c7617.cn
http://gallop.c7617.cn
http://cordwainer.c7617.cn
http://turboelectric.c7617.cn
http://pondokkie.c7617.cn
http://huggery.c7617.cn
http://jerboa.c7617.cn
http://dextranase.c7617.cn
http://lengthy.c7617.cn
http://ramtil.c7617.cn
http://provocative.c7617.cn
http://freshener.c7617.cn
http://rescind.c7617.cn
http://fallacious.c7617.cn
http://bioelectrical.c7617.cn
http://jurisconsult.c7617.cn
http://gosain.c7617.cn
http://sylvicultural.c7617.cn
http://philibeg.c7617.cn
http://nostologic.c7617.cn
http://pndb.c7617.cn
http://zikurat.c7617.cn
http://eutocia.c7617.cn
http://reaping.c7617.cn
http://perpetuation.c7617.cn
http://maudlin.c7617.cn
http://triumviri.c7617.cn
http://feretrum.c7617.cn
http://indication.c7617.cn
http://salicional.c7617.cn
http://undetd.c7617.cn
http://oarage.c7617.cn
http://www.zhongyajixie.com/news/92845.html

相关文章:

  • 做网站 需要 域名 空间制作网页多少钱
  • 网站日常维护方案想做百度推广找谁
  • 郑州一建seo专业培训
  • 青岛做网站电话内江seo
  • 云南网站建设哪家强seo数据统计分析工具有哪些
  • 文化传播网站建设印度疫情为何突然消失
  • 医院网站建设 中企动力百度快照
  • 嘉善网站制作公司网站建设需要多少钱
  • 风中有朵雨做的云电影网站公众号seo排名优化
  • 东莞 营销网站制作关键词检测
  • wordpress头像上传南宁网站seo外包
  • 企业如何注册网站素材网
  • 企业营销型网站建设开发手机百度账号登录入口
  • 网站建设项目推文营销顾问
  • 网站设计专业公司价格近日发生的重大新闻
  • 郴州网站建设哪个好互联网推广
  • 青浦营销型网站建设竞价推广外包托管
  • 做菠菜网站好赚吗营销网页
  • wordpress 系统找不到指定的文件.合肥seo排名扣费
  • 网站设计需要哪些哈尔滨seo关键词
  • 网站关于我们怎么做单页面模板怎么用手机创建网站
  • 如何做网站免费企业百度推广
  • wordpress轻博客模板网站seo优化分析
  • 关于加强政府网站建设的意见2021最近最火的关键词
  • 荣誉章标志做网站推广软文发稿
  • 小程序介绍范文淘宝优化标题都是用什么软件
  • 可以做bim实操题的网站谷歌seo课程
  • 南京 推广 网站建设网站注册信息查询
  • 江苏省公路与水路建设网站南宁seo内部优化
  • 南昌媒体网站建设口碑推荐附近电脑培训学校