当前位置: 首页 > news >正文

网站建设一条龙磁力猫最佳搜索引擎入口

网站建设一条龙,磁力猫最佳搜索引擎入口,亿联网络 网站,网站如何做视频教程Hive是工作中常用的数据仓库工具,提供存储在HDFS文件系统,将结构化数据映射为一张张表以及提供查询和分析功能。 Hive可以存储大规模数据,但是在运行效率上不如传统数据库,这时需要懂得常见场景下提升存储或查询效率的方法&#x…

Hive是工作中常用的数据仓库工具,提供存储在HDFS文件系统,将结构化数据映射为一张张表以及提供查询和分析功能。
Hive可以存储大规模数据,但是在运行效率上不如传统数据库,这时需要懂得常见场景下提升存储或查询效率的方法,本文记录工作中常见的情形。

map阶段优化

map阶段主要是把文件拆分成一个个文件块。正常情况下,一个map任务的启动和初始化时间远远大于逻辑处理时间,所以可以增大max参数值减少map数;但在计算逻辑较为复杂(字段少记录过多)时可以减少max参数值增大map数,控制map数来协调启动和逻辑处理时间。

-- 减少map数
set hive.hadoop.supports.splittable.combineinputformat=true;
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; -- 执行前进行小文件合并,进而减少map数目
-- 文件小于1M的会单独产生一个map,文件在1M-256M之间大小的会合并,文件大于256M的拆分为多个
set mapred.min.split.size=1000000;
set mapred.max.split.size=256000000;
set mapred.min.split.size.per.node=256000000;
set mapred.min.split.size.per.rack=256000000;
-- set hive.exec.reducers.bytes.per.reducer=1073741824; -- 控制reduce个数,超过文件大小会产生多个reduce任务-- 增大map数
-- 一般使用情况是文件不是特别大,但是计算逻辑复杂,计算比较耗时,那么可以强制指定一个map任务个数提高执行效率
set mapred.reduce.tasks=10;
reduce阶段优化

reduce个数决定了最终输出文件的个数。增大reduce的个数会增加输出文件数量,减小reduce个数会减少输出文件数量。reduce个数过多会产生很多小文件影响以后计算效率,reduce个数过少会造成单个reduce处理数据量过大影响效率。

-- 1、Hive自动计算reduce个数
set hive.exec.reducers.bytes.per.reducer=500000000; -- 每个reduce任务最多处理500M的数据
set hive.exec.reducers.max=1009; -- 每个任务的最大reduce个数-- 2、认为指定reduce个数
set mapred.reduce.tasks=10; -- 人为指定10个reduce,会产生10个文件

注意,会产生只有一个reduce的情况:

  1. 查询时使用了order by 全局排序
  2. 表关联join时产生笛卡尔积情况
源头建表优化

建表时可以指定文件压缩格式,不要使用textfile,一般可以使用parquet+snappy格式

-- 为了提高计算和存储效率
ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
TBLPROPERTIES('parquet.compression'='SNAPPY')
http://www.zhongyajixie.com/news/32621.html

相关文章:

  • 阿里巴巴吧网站建设网站的seo
  • 建网站需要什么语言百度大数据官网
  • 域名交易网站源代码下载武汉竞价托管公司
  • 怎么直接做免费网站徐州百度seo排名
  • 酷站是什么网站广告接单平台有哪些
  • 网站开发app开发培训百度关键词
  • 新手做网站视频教程深圳龙岗区优化防控措施
  • 企业做网站有用么品牌推广营销
  • 广告发布合同模板seo外包是什么意思
  • 北京网站改版公司企业网站推广的形式有哪些
  • 温州住房与城乡建设部网站营销软文
  • 知名的网站设计公司深圳外包网络推广
  • php网站怎么做的如何在百度上做广告宣传
  • 郑州网站公司排名百度商城
  • 高端网站建设工作室谷歌优化师
  • 迅捷流程图在线制作网站域名注册商怎么查
  • 织梦html网站地图网络营销广告
  • 网站模板生成做公司网站需要多少钱
  • 做网站 服务器关键词排名监控批量查询
  • 公司网站建设应注意什么台州seo优化公司
  • 成都当地一日游北京seo包年
  • 网站建设设计外包公司论坛seo设置
  • 启航网站建设网络推广渠道分类
  • 搜索wordpress百度搜索关键词排名优化
  • 网站备案的规划方案新seo排名点击软件
  • 网站SEO优化托管新闻实时报道
  • 炫酷的网站400个成品短视频
  • 武汉建站费用信息流优化师前景
  • 精准营销数据曲靖seo建站
  • 哪个网站有学做内帐的视频seo成功案例分析