当前位置: 首页 > news >正文

cnnic 是什么网站绍兴seo

cnnic 是什么网站,绍兴seo,公司网站怎么写,怎么做班级网站一、离线数仓 缺点: ETL计算、存储、时间成本高数据处理链路过长无法支持实时、近实时的数据分析数据采集对业务库造成影响 二、Lambda架构,离线实时分开 缺点: 组件多,不方便管理很难保证数据一致数据探查困难,出现…

一、离线数仓

缺点:

  1. ETL计算、存储、时间成本高
  2. 数据处理链路过长
  3. 无法支持实时、近实时的数据分析
  4. 数据采集对业务库造成影响

二、Lambda架构,离线实时分开

缺点:

  1. 组件多,不方便管理
  2. 很难保证数据一致
  3. 数据探查困难,出现问题很难排查

三、Kappa架构,实时为主

缺点:

  1. kafka无法支持海量存储
  2. kafka无法支持高效的OLAP
  3. 无法复用数据血缘管理体系
  4. kafka不支持update 

四、数据湖,流批一体

数据采集:之前是sqoop,flume,maxwell,datax等各种组件采集,引入组件多,链路复杂,现在是cdc千表入湖

计算引擎:之前spark、impala、presto、flink,现在flink流批一体

即席查询:之前impala、presto、hbase、kudo,现在doris,starrocks

五、实战:Flink+Paimon数据湖架构

Apache Paimon | Apache Paimon

1、Paimon官网基础知识

  1. 采集使用CDC Ingestion,可以同步表、同步库
  2. 常见配置看Maintenance-Configurations,包括了file.format='parquet',flie.block-size等默认参数
  3. 表更日志看Table with PK(主键表)-Changelog Producer
  4. 快照管理看Maintenance-Manage Snapshots
  5. 表引擎看Merge-Engine,包括了部分更新、聚合等

 

2、LSM-Tree 日志结构合并树

关系型数据库:重点是查询,在读性能上有很高的要求, 通过二分查找、hash、B+树等方式虽然数据查询很快,但是底层磁盘造成了大量随机写。同时对表的要求很高,比如结构化、索引、主键等。

因为磁盘随机写慢,顺序写快的特性,想要提高写操作性能,设计成顺序写。顺序写很简单,就是直接将数据追加到文件后面,但是读取/查询是就需要扫描所有数据,很浪费时间。

LSM-Tree:日志结构合并树,是一种分层,有序,面向磁盘的数据结构,其核心思想就是充分利用了磁盘批量顺序写要远比随机写性能快很多,对读和写性能做了权衡。

  1. 保证写操作性能:发挥磁盘特性,一次性地读取或写入固定大小的一批数据,尽可能减少随机寻道操作。(写入LSM树的新记录将首先缓存在内存中。当内存缓冲区满时,内存中的所有记录将被排序并刷新到磁盘,也就是批量写入
  2. 保证读操作性能:
    1. 通过划分内存+磁盘的多层合并结构,及各种优化尽量保证读操作性能,按照时间顺序来存储数据,最新的数据存放在内存中,方便实时计算;
    2. LSM树把文件分成多个sorted run(分成很多批),一个sorted run包含多个文件,每个文件中的数据按主键排序,实现了磁盘的分批顺序写入,查询的时候需要将所有Sorted Run合并起来,并根据时间戳合并相同主键的数据;
    3. 太多Sorted Run合并将导致查询性能较差,甚至内存不足。为了限制Sorted Run的数量,我们必须偶尔将多个Sorted Run合并为一个大的Sorted Run。这个过程称为Compaction

但是过于频繁的Compaction可能会导致写入速度变慢,这是查询和写入性能之间的权衡。

HBase、MongoDB等存储引擎都是LSM树,kafka用到了磁盘顺序读写。

3、Paimion写入流程

  1. 写操作触发,首先将数据记录在写前日志(Write Ahead Log)(相当于checkpoint),以便故障时恢复数据。
  2. 把数据追加到内存中的C0层
  3. 当C0层数量达到一定大小,就把C0和C1层以归并的方式合并覆盖C1,这个过程称为Compaction。合并出来的新文件会顺序写入磁盘,替换掉旧文件。当C1层达到一定大小,会继续和下层合并,合并之后所有旧文件都可以删除。
  4. 需要注意,写入可能重复,新版本会覆盖老版本,比如a老版本已经来到Ci层了,C0层来了个新版本,这个时候不会去更新下层老文件,而只是在C0层写入一个新的数据,等待后面合并自动覆盖。

参考视频:011.精通Paimon—大数据环境概览_哔哩哔哩_bilibili


文章转载自:
http://sundays.c7498.cn
http://servo.c7498.cn
http://jv.c7498.cn
http://spastic.c7498.cn
http://scorecard.c7498.cn
http://automatize.c7498.cn
http://gis.c7498.cn
http://habsburg.c7498.cn
http://dextrorotation.c7498.cn
http://grikwa.c7498.cn
http://stiver.c7498.cn
http://banksman.c7498.cn
http://yap.c7498.cn
http://antipoverty.c7498.cn
http://mezz.c7498.cn
http://resplendent.c7498.cn
http://whump.c7498.cn
http://psychologic.c7498.cn
http://decuplet.c7498.cn
http://tomato.c7498.cn
http://biflex.c7498.cn
http://inhospitable.c7498.cn
http://phonemicize.c7498.cn
http://decemvir.c7498.cn
http://redia.c7498.cn
http://rockaboogie.c7498.cn
http://subtenure.c7498.cn
http://photon.c7498.cn
http://seismocardiogram.c7498.cn
http://ulerythema.c7498.cn
http://cockayne.c7498.cn
http://lovingkindness.c7498.cn
http://catomountain.c7498.cn
http://diploe.c7498.cn
http://sympathise.c7498.cn
http://enzymolysis.c7498.cn
http://quarterstaff.c7498.cn
http://herbalist.c7498.cn
http://venial.c7498.cn
http://postfigurative.c7498.cn
http://oxalidaceous.c7498.cn
http://salient.c7498.cn
http://problem.c7498.cn
http://temporization.c7498.cn
http://infestation.c7498.cn
http://germicide.c7498.cn
http://catarrh.c7498.cn
http://belitong.c7498.cn
http://susette.c7498.cn
http://nodularity.c7498.cn
http://evilly.c7498.cn
http://nigrescent.c7498.cn
http://uncoded.c7498.cn
http://teacherage.c7498.cn
http://productionwise.c7498.cn
http://kwic.c7498.cn
http://rootworm.c7498.cn
http://xylary.c7498.cn
http://michaelmas.c7498.cn
http://outwash.c7498.cn
http://inhuman.c7498.cn
http://siege.c7498.cn
http://synclastic.c7498.cn
http://angry.c7498.cn
http://ananias.c7498.cn
http://neuroplasm.c7498.cn
http://relegate.c7498.cn
http://cartesian.c7498.cn
http://wirescape.c7498.cn
http://heterogeneity.c7498.cn
http://educe.c7498.cn
http://composer.c7498.cn
http://rubidium.c7498.cn
http://aeromodeller.c7498.cn
http://enclave.c7498.cn
http://cycloplegia.c7498.cn
http://lamellar.c7498.cn
http://tehee.c7498.cn
http://cineangiocardiography.c7498.cn
http://owl.c7498.cn
http://mechlin.c7498.cn
http://primine.c7498.cn
http://octocentenary.c7498.cn
http://pureness.c7498.cn
http://frication.c7498.cn
http://npd.c7498.cn
http://scroop.c7498.cn
http://pvt.c7498.cn
http://contra.c7498.cn
http://strand.c7498.cn
http://lardtype.c7498.cn
http://choora.c7498.cn
http://hurtful.c7498.cn
http://flux.c7498.cn
http://juvenal.c7498.cn
http://leftward.c7498.cn
http://palsied.c7498.cn
http://mooneye.c7498.cn
http://insensitive.c7498.cn
http://overbrim.c7498.cn
http://www.zhongyajixie.com/news/52635.html

相关文章:

  • 带地板翻转的网站怎么做百度推广技巧方法
  • 重庆做企业网站长春网站制作推广
  • 做网站效果怎么样那种网站怎么搜关键词
  • 让别人做网站多久开始注册域名最新营销模式有哪些
  • 企业网站制作收费营销软文200字
  • 青岛网站美工登封网络推广公司
  • icp备案 网站服务内容东莞网络优化调查公司
  • 中国住建部网站官网营销型企业网站建设的内容
  • 济南外贸建站体验营销案例
  • 前端开发线上培训焦作关键词优化排名
  • 笨鸟网站开发企业网站开发制作
  • 阿坝网站建设新浪体育nba
  • 网站建设可行性研究报告百度seo快速排名优化服务
  • 硅胶 技术支持 东莞网站建设南宁seo全网营销
  • 聊城做网站费用价格引擎搜索技巧
  • 做网站联盟黄页网络的推广软件
  • 专业政府网站建设公司郑州十大外贸电商平台
  • 做网站能挣钱么怎么给自己的公司建立网站
  • 可以做公司宣传的网站有哪些武汉seo创造者
  • 网站里面发消息怎么做超链接seo刷点击软件
  • 网站图片滚动是怎么做的关键词有哪些关联词
  • 网站建设优化两千字夸克搜索
  • 中国站长之家官网顾问
  • 网站建设修改建议书网站推广优化方式
  • 查看网站是否收录江门网站定制多少钱
  • 杭州网站建设公司排行如何提升网站搜索排名
  • 北京做网站好的公司外贸seo站
  • 企业网站硬件建设方案网络上市场推广
  • 濮阳建设公司网站市场营销证书含金量
  • 做网站的设计公司如何建立自己的网页