当前位置: 首页 > news >正文

网站建设询价文件关键词首页排名代发

网站建设询价文件,关键词首页排名代发,浙江建设集团网站,自己装修怎么出设计图一、Hadoop HDFS的架构 HDFS:Hadoop Distributed File System,分布式文件系统 1,NameNode 存储文件的metadata,运行时所有数据都保存到内存,整个HDFS可存储的文件数受限于NameNode的内存大小一个Block在…

一、Hadoop HDFS的架构

HDFS:Hadoop Distributed File System,分布式文件系统
在这里插入图片描述

1,NameNode

  1. 存储文件的metadata,运行时所有数据都保存到内存,整个HDFS可存储的文件数受限于NameNode的内存大小
  2. 一个Block在NameNode中对应一条记录(一般一个block占用150字节),如果是大量的小文件,会消耗大量内存。同时map task的数量是由splits来决定的,所以用MapReduce处理大量的小文件时,就会产生过多的map task,线程管理开销将会增加作业时间。处理大量小文件的速度远远小于处理同等大小的大文件的速度。因此Hadoop建议存储大文件
  3. 数据会定时保存到本地磁盘,但不保存block的位置信息,而是由DataNode注册时上报和运行时维护(NameNode中与DataNode相关的信息并不保存到NameNode的文件系统中,而是NameNode每次重启后,动态重建)
  4. NameNode失效则整个HDFS都失效了,所以要保证NameNode的可用性

2,Secondary NameNode

定时与NameNode进行同步(定期合并文件系统镜像和编辑日志,然后把合并后的传给NameNode,替换其镜像,并清空编辑日志,类似于CheckPoint机制),但NameNode失效后仍需要手工将其设置成主机.

3,DataNode

  1. 保存具体的block数据
  2. 负责数据的读写操作和复制操作
  3. DataNode启动时会向NameNode报告当前存储的数据块信息,后续也会定时报告修改信息
  4. DataNode之间会进行通信,复制数据块,保证数据的冗余性

4,Block数据块

  1. 基本存储单位,一般大小为64M(配置大的块主要是因为:
    1)减少搜寻时间,一般硬盘传输速率比寻道时间要快,大的块可以减少寻道时间;
    2)减少管理块的数据开销,每个块都需要在NameNode上有对应的记录;
    3)对数据块进行读写,减少建立网络的连接成本)
  2. 一个大文件会被拆分成一个个的块,然后存储于不同的机器。如果一个文件少于Block大小,那么实际占用的空间为其文件的大小
  3. 基本的读写单位,类似于磁盘的页,每次都是读写一个块
  4. 每个块都会被复制到多台机器,默认复制3份
  5. HDFS2.x以后的block默认128M

二、Hadoop 读文件

在这里插入图片描述
1,客户端向NameNode发送读取请求
2,NameNode返回文件的所有block和这些block所在的DataNodes(包括复制节点)
3,客户端直接从DataNode中读取数据,如果该DataNode读取失败(DataNode失效或校验码不对),则从复制节点中读取(如果读取的数据就在本机,则直接读取,否则通过网络读取)

三、Hadoop 写文件

在这里插入图片描述

1,客户端将文件写入本地磁盘的 HDFS Client 文件中
2,当临时文件大小达到一个 block 大小时,HDFS client 通知 NameNode,申请写入文件
3,NameNode 在 HDFS 的文件系统中创建一个文件,并把该 block id 和要写入的 DataNode 的列表返回给客户端
4,客户端收到这些信息后,将临时文件写入 DataNodes
(1) 客户端将文件内容写入第一个 DataNode(一般以 4kb 为单位进行传输)
(2) 第一个 DataNode 接收后,将数据写入本地磁盘,同时也传输给第二个 DataNode
(3)依此类推到最后一个 DataNode,数据在 DataNode 之间是通过 pipeline 的方式进行复制的
(4)后面的 DataNode 接收完数据后,都会发送一个确认给前一个 DataNode,最终第一个 DataNode 返回确认给客户端
(5)当客户端接收到整个 block 的确认后,会向 NameNode 发送一个最终的确认信息
(6)如果写入某个 DataNode 失败,数据会继续写入其他的 DataNode。然后 NameNode 会找另外一个好的 DataNode 继续复制,以保证冗余性
(6) 每个 block 都会有一个校验码,并存放到独立的文件中,以便读的时候来验证其完整性
5,文件写完后(客户端关闭),NameNode 提交文件(这时文件才可见,如果提交前,NameNode 垮掉,那文件也就丢失了。只保证数据的信息写到 NameNode 上,但并不保证数据已经被写到DataNode 中)

http://www.zhongyajixie.com/news/27735.html

相关文章:

  • 免费建网站代码餐饮营销策划与运营
  • 网络维护公司排名南京seo网络优化公司
  • 平台网站如何做推广方案设计百度热搜榜排名今日p2p
  • 房产信息网网站北京网站seo优化推广
  • 做网站作业网站权重怎么提高
  • 中文wordpress模版合肥百度快照优化排名
  • 免费的网站推广怎么做效果好百度指数下载手机版
  • 银川建立网站效果好的关键词如何优化
  • 双桥网站建设微信推广文案
  • 网站制作 推荐新鸿儒免费公司网址怎么注册
  • 做网站推广的方法有哪些竞价推广怎么样
  • 网站开发功能报价表云南今日头条新闻
  • hyper cache wordpressseo营销策划
  • wordpress著名网站济南seo顾问
  • 网站中qq跳转怎么做的深圳短视频推广
  • 微信视频网站怎么做的好处长尾关键词挖掘工具
  • 一个空间可以绑定几个网站百度推广账户登录首页
  • 开发公司建酒店科目aso优化
  • 适合学生做的网站类型网站一般怎么推广
  • 东莞室内设计培训一个企业seo网站的优化流程
  • 典当行网站第三方平台推广
  • 衡水市做网站中国企业培训网
  • 武汉建网公司网站建设南昌网站建设
  • 对于新公司如何让其做网站推广什么是搜索引擎优化seo
  • 在线A视频网站l一级A做爰片一个关键词要刷多久
  • 东莞寮步网站设计中国十大互联网公司排名
  • 聊城做网站最好的网络公司信息流广告代运营
  • 无锡网站制作哪家好上海网站制作开发
  • 陕西建站事件营销的概念
  • 怎么通过淘宝优惠券做网站赚钱今天株洲最新消息