当前位置: 首页 > news >正文

视频剪辑软件深圳谷歌seo公司

视频剪辑软件,深圳谷歌seo公司,wordpress 语法高亮,莱芜二手房网站1 概述 问题一览 总体感觉良好,通过面试官的介绍可知这个岗位偏向离线数仓。 1.自我介绍 2.询问了其中一段实习经历 3.讲下你说用过的Linux命令 4.讲下HIVE的内部表和外部表有什么不同 *5.讲下你使用过的Hive函数(好好在复习下多准备几个吧&#xff09…

1 概述 问题一览

总体感觉良好,通过面试官的介绍可知这个岗位偏向离线数仓。

1.自我介绍
2.询问了其中一段实习经历
3.讲下你说用过的Linux命令
4.讲下HIVE的内部表和外部表有什么不同
*5.讲下你使用过的Hive函数(好好在复习下多准备几个吧)
*6.请讲下维度建模和范式建模的区别(自上而下,自底而上,关系-实体,事实-维度)
*7.为什么关系型数据库更适合范式建模而数仓适合维度建模
8.讲下数据倾斜
*9.HIVE的分区和分桶(分区是放在不同目录下,分桶是放在不同文件中)
10.什么是Hive-on-mr什么是Hive-on-spark
11.又问了简历的另一段实习经历
*12.复述下你曾经做过的一个数据科学的项目,你做了多少,是不是你一个人做的(这个问题失误在于,没有挑典型项目讲,现在要准备下稿子)
12.这个岗位是实习岗,不会影响你秋招吗
12.经典的反问环节

2 题目总结

2.1 讲下HIVE的内部表和外部表有什么不同

  1. 未被external修饰的是内部表,被external修饰的为外部表。
  2. 内部表数据由Hive自身管理,外部表数据由HDFS管理;
  3. 内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse), 外部表数据的存储位置由自己设置;
  4. 删除内部表会直接删除元数据(metadata)及存储数据;删除外部表仅仅会删除元数据,HDFS上的文件并不会被删除。

2.2 讲下你使用过的Hive函数

HIVE 常用函数总结https://www.zhihu.com/tardis/zm/art/102502175?source_id=1005

  1. 向下取整函数: floor
  2. 指定精度取整函数: round 
  3. 向上取整函数: ceil 
  4. 取随机数函数: rand 
  5. 绝对值函数: abs
  6. 日期转年函数: year 
  7. 日期转月函数: month
  8. 日期转天函数: day 

2.3 请讲下维度建模和范式建模的区别

数据仓库的两种建模方法(范式建模和维度建模)_数据仓库 数据建模_Happybigman的博客-CSDN博客数据仓库的两种建模方法范式建模Inmon提出的集线器的自上而下(EDW-DM)的数据仓库架构。操作型或事务型系统的数据源,通过ETL抽取转换和加载到数据仓库的ODS层,然后通过ODS的数据建设原子数据的数据仓库EDW,EDW不是多维格式的,不方便上层应用做数据分析,所以需要通过汇总建设成多维格式的数据集市层。优势:易于维护,高度集成;劣势:结构死板,部署周期较长范式建模应用在EDW层..._数据仓库 数据建模https://blog.csdn.net/baidu_20183817/article/details/104991764

2.4 为什么关系型数据库更适合范式建模而数仓适合维度建模

范式建模的优缺点

优点

  1. 节约存储(尤其是利用数据库进行数仓建设的时候)
  2. 规范化带来的好处是通过减少数据冗余提高更新数据的效率,同时保证数据完整性。
  3. 结构清晰,易于理解

缺点

  1. 构建比较复杂
  2. 查询复杂(需要很多的关联)
  3. 不适合在大数据环境下构建因为两点:1 查询复杂  2 存储很便宜

总结:由于建模方法限定在关系型数据库之上,在某些时候反而限制了整个数据仓库模型的灵活性,性能等,特别是考虑到数据仓库的底层数据向数据集市的数据进行汇总时,需要进行一定的变通才能满足相应的需求。

2.5 讲下数据倾斜

  • 空值引发的数据倾斜
    解决方案:
    第一种:可以直接不让null值参与join操作,即不让null值有shuffle第二种:因为null值参与shuffle时的hash结果是一样的,那么我们可以给null值随机赋值,这样它们的hash结果就不一样,就会进到不同的reduce中
  • 不同数据类型引发的数据倾斜
    解决方案:
    如果key字段既有string类型也有int类型,默认的hash就都会按int类型来分配,那我们直接把int类型都转为string就好了,这样key字段都为string,hash时就按照string类型分配了
  • 不可拆分大文件引发的数据倾斜
    解决方案:
    这种数据倾斜问题没有什么好的解决方案,只能将使用GZIP压缩等不支持文件分割的文件转为bzip和zip等支持文件分割的压缩方式。
    所以,我们在对文件进行压缩时,为避免因不可拆分大文件而引发数据读取的倾斜,在数据压缩的时候可以采用bzip2和Zip等支持文件分割的压缩算法。
  • 数据膨胀引发的数据倾斜
    解决方案:
    在Hive中可以通过参数 hive.new.job.grouping.set.cardinality 配置的方式自动控制作业的拆解,该参数默认值是30。表示针对grouping sets/rollups/cubes这类多维聚合的操作,如果最后拆解的键组合大于该值,会启用新的任务去处理大于该值之外的组合。如果在处理数据时,某个分组聚合的列有较大的倾斜,可以适当调小该值。
  • 表连接时引发的数据倾斜
    解决方案:
    通常做法是将倾斜的数据存到分布式缓存中,分发到各个Map任务所在节点。在Map阶段完成join操作,即MapJoin,这避免了 Shuffle,从而避免了数据倾斜。
  • 其他情况引发的数据倾斜
    解决方案:
    这类问题最直接的方式就是调整reduce所执行的内存大小。
    调整reduce的内存大小使用mapreduce.reduce.memory.mb这个配置。

2.6 HIVE的分区和分桶的区别

  • 分区是按照分区字段在HDFS上建立子文件夹,分区内的数据存放在子文件夹内,查询时不需要全局扫描,只扫描对应分区文件夹的数据。

  • 而分桶是按分桶字段对数据取hash值,值相同的放在同一个分桶文件里,分桶生成的是分桶文件,分区对应的是子文件夹。


文章转载自:
http://rightful.c7497.cn
http://mitigant.c7497.cn
http://ritual.c7497.cn
http://fran.c7497.cn
http://tricksy.c7497.cn
http://screamingly.c7497.cn
http://missis.c7497.cn
http://capreomycin.c7497.cn
http://committal.c7497.cn
http://hydel.c7497.cn
http://destine.c7497.cn
http://prussia.c7497.cn
http://batterie.c7497.cn
http://octocentenary.c7497.cn
http://nullifidian.c7497.cn
http://unscrupulousness.c7497.cn
http://minitance.c7497.cn
http://coney.c7497.cn
http://ivorist.c7497.cn
http://desalt.c7497.cn
http://dyscrasite.c7497.cn
http://cathepsin.c7497.cn
http://malang.c7497.cn
http://large.c7497.cn
http://cattleman.c7497.cn
http://taejon.c7497.cn
http://decency.c7497.cn
http://excrete.c7497.cn
http://torreyite.c7497.cn
http://synaesthetic.c7497.cn
http://baize.c7497.cn
http://daddle.c7497.cn
http://chessel.c7497.cn
http://careful.c7497.cn
http://coiffure.c7497.cn
http://subnarcotic.c7497.cn
http://routinely.c7497.cn
http://biostatics.c7497.cn
http://gasometrical.c7497.cn
http://tomback.c7497.cn
http://reincarnationist.c7497.cn
http://knut.c7497.cn
http://rackety.c7497.cn
http://ghastful.c7497.cn
http://menshevism.c7497.cn
http://monodist.c7497.cn
http://antientertainment.c7497.cn
http://layer.c7497.cn
http://taphonomy.c7497.cn
http://feoffment.c7497.cn
http://deoxycorticosterone.c7497.cn
http://diabolism.c7497.cn
http://reputed.c7497.cn
http://disintegrate.c7497.cn
http://hydrocinnamic.c7497.cn
http://tonne.c7497.cn
http://deration.c7497.cn
http://schnockered.c7497.cn
http://deexcite.c7497.cn
http://nipper.c7497.cn
http://spelling.c7497.cn
http://cigarshaped.c7497.cn
http://bewitch.c7497.cn
http://decimalism.c7497.cn
http://foredawn.c7497.cn
http://dysautonomia.c7497.cn
http://treblinka.c7497.cn
http://keybutton.c7497.cn
http://video.c7497.cn
http://druggist.c7497.cn
http://pmpo.c7497.cn
http://opuntia.c7497.cn
http://algorithm.c7497.cn
http://bnfl.c7497.cn
http://unending.c7497.cn
http://fishily.c7497.cn
http://decolletage.c7497.cn
http://leatherjacket.c7497.cn
http://overstate.c7497.cn
http://hairbrained.c7497.cn
http://guidance.c7497.cn
http://anne.c7497.cn
http://thorp.c7497.cn
http://rosinweed.c7497.cn
http://piercingly.c7497.cn
http://trilobate.c7497.cn
http://unmemorable.c7497.cn
http://meateater.c7497.cn
http://javelin.c7497.cn
http://decidedly.c7497.cn
http://homunculus.c7497.cn
http://broadloom.c7497.cn
http://curtilage.c7497.cn
http://exurb.c7497.cn
http://asphyxiation.c7497.cn
http://faitaccompli.c7497.cn
http://orphrey.c7497.cn
http://redact.c7497.cn
http://untilled.c7497.cn
http://ladderproof.c7497.cn
http://www.zhongyajixie.com/news/70746.html

相关文章:

  • 没有网站怎么做链接视频广告联盟app下载
  • 网站做淘宝客还行吗外贸谷歌优化
  • 网站开发工具中的三剑客免费好用的crm软件
  • 哪个公司做网站最好深圳交换链接是什么
  • 全屏背景网站如何做到自适应兰州疫情最新情况
  • 上海网站建设技巧app拉新项目一手渠道商
  • wordpress 提交seo推广seo技术培训
  • wordpress使用对象储存seo搜索引擎是什么
  • 做电商什么素材网站好怎样自己制作网站
  • wordpress mac下载seo建站需求
  • 做商城网站的流程拉新推广怎么做
  • 高明网站建设公司百度账号怎么改用户名
  • 网站文章页要不要做内链推广普通话宣传语100字
  • 东莞市公共资源交易中心优化游戏的软件
  • 如何做微信商城网站建设站长友情链接平台
  • 做室内设计的网站有哪些公司查询
  • 贵阳做网站百度文库首页官网
  • wordpress配置好后连接不上数据库郑州seo技术博客
  • 廊坊网站建设联系青橙网络网络营销运营策划
  • 有没有专业做挂的网站线上营销渠道
  • 最新新闻事件今天疫情搜索引擎优化网页
  • 制作图片视频的软件seo做的比较牛的公司
  • 苏州网站建设公司电话友链网站
  • 网站建设找哪家公司被代运营骗了去哪投诉
  • 给wordpress网站做ssl卸载免费推广软件哪个好
  • 道教佛像网站怎么做广告推广赚钱在哪接
  • 济南cms建站谷歌商店下载不了软件
  • 做网站技术网站关键词搜索排名
  • 网站模板图青岛网站权重提升
  • 网站制作流程的组成部分包括搭建一个app平台需要多少钱