当前位置: 首页 > news >正文

辽宁建设信息网站正规考证培训机构

辽宁建设信息网站,正规考证培训机构,域名如何绑定网站,wordpress放作品1 分区与分桶 Doris中有两层的数据划分,第一层是分区(Partition),第二层是分桶(Bucket), Partition又能分为Range分区和List分区。 Bucket仅支持Hash方式。 1.1 Partition 只能指定…
1 分区与分桶


    Doris中有两层的数据划分,第一层是分区(Partition),第二层是分桶(Bucket),
    Partition又能分为Range分区和List分区。
    Bucket仅支持Hash方式。

1.1 Partition
    只能指定Key列作为分区列
    指定分区值时需要加双引号
    理论上分区数量没有上限
    在不使用分区建表时,系统会自动创建一个表名一致但是用户不可见的全表分区
1.1.1 Partition_Range:
    按照指定范围进行分区,一般生产环境下会使用日期作为分区

    VALUES LESS THAN (...) :仅指定上界,系统会将前一个分区的上界作为该分区的下界,会生成一个左闭右开的区间
    VALUES [....) :同时指定上下界,比较好理解,也会生成一个左闭右开的区间

   查看Partition的使用命令:HELP PARTITION;

示例:

-- 创建一张Range分区表
 

CREATE TABLE IF NOT EXISTS test.student
(`id` LARGEINT NOT NULL COMMENT "学生id",`name` VARCHAR(50) NOT NULL COMMENT "学生名字",`class` INT COMMENT "学生所在班级",`age` SMALLINT COMMENT "学生年龄",`sex` TINYINT COMMENT "学生性别",`phone` LARGEINT COMMENT "学生电话",`address` VARCHAR(500) COMMENT "学生家庭地址",`date` DATE NOT NULL COMMENT "数据录入时间"
)
ENGINE=olap
DUPLICATE KEY(`id`, `name`)
PARTITION BY RANGE(`date`)
(PARTITION `d202204` VALUES LESS THAN ("2022-04-01"),PARTITION `d202205` VALUES LESS THAN ("2022-05-01"),PARTITION `d202206` VALUES LESS THAN ("2022-06-01")
)DISTRIBUTED BY HASH(`id`) BUCKETS 8
PROPERTIES
("replication_num" = "3","storage_medium" = "SSD","storage_cooldown_time" = "2022-06-16 12:00:00"
);


 
查看表的分区SHOW PARTITIONS FROM TABLE; 


1.1.2 Partition_List:

    分区支持的数据类型:BOOLEAN, TINYINT, SMALLINT, INT, BIGINT, LARGEINT, DATE, DATETIME, CHAR, VARCHAR
    分区值是枚举值,当数据在目标分区枚举值中时,才能命中分区
    操作:VALUES IN(....)
示例:

-- 创建一张List分区表
 

CREATE TABLE IF NOT EXISTS test.student
(`id` LARGEINT NOT NULL COMMENT "学生id",`name` VARCHAR(50) NOT NULL COMMENT "学生名字",`class` INT NOT NULL COMMENT "学生所在班级",`age` SMALLINT COMMENT "学生年龄",`sex` TINYINT COMMENT "学生性别",`phone` LARGEINT COMMENT "学生电话",`address` VARCHAR(500)  NOT NULL COMMENT "学生家庭地址"
)
ENGINE=olap
DUPLICATE KEY(`id`, `name`)
PARTITION BY List(`address` )
(PARTITION `p_city1` VALUES IN ("浦东","闵行"),PARTITION `p_city2` VALUES IN ("海淀","昌平"),PARTITION `p_city3` VALUES IN ("太原","忻州")
)DISTRIBUTED BY HASH(`id`) BUCKETS 8
PROPERTIES
("replication_num" = "3","storage_medium" = "SSD","storage_cooldown_time" = "2022-06-17 12:00:00"
);


1.2 Backet(分桶):

    如果创建的表是分区表,那么Backet就是对分区进行Distributed划分,如果不是分区表那么就是对整个表进行划分。
    分桶列只能是Key列,分桶列可以和分区列相同或不同。
    分桶列的多少取决于对“吞吐”和“并发”的一种权衡。
    分桶列多,数据分布的更加均匀,适合大吞吐低并发的查询,不适合高并发的单查询。
    分桶列少,适合高并发的点查询。
    分桶数量理论上无上限,但是要结合实际资源情况进行设置。
    复合分区和单分区:
    复合分区:既有分区又有分桶。

    单分区:只有分桶。

1.2.1 复合分区的选用场景:

    有时间或序值维度的可以使用复合分区。
    需要对历史数据进行清理,对N天前的数据进行清理,或者保留N天的数据,可以使用复合分区。
    可以解决数据倾斜问题,按天进行分区,那么可能某天的数据量会很大,那么可以调整分桶的数量来达到数据均衡分布的效果,在选着分桶列时要选择数据量差异较大的列。
    多列分区:

    在指定分区列时,可以在Key中再指定一个字段作为分区列,插入数据时,会首先按照分区列的值依次进行比较
 

http://www.zhongyajixie.com/news/27817.html

相关文章:

  • 做理财网站需要办理icp证吗品牌营销理论
  • 网站的产品中心怎么做最近军事新闻
  • 一个服务器可以放多少个网站成品短视频app源码的优点
  • 做商演任务的网站网站维护的主要内容
  • 网站建设模板型和定制型怎么制作网页教程
  • 襄阳做网站关键词智能优化排名
  • 专业提供网站制作b2b免费发布信息平台
  • 邢台做网站动态怎么自己注册网站平台了
  • 室内设计联盟官网app上海seo服务
  • 电子商务网站建设评估的工具外包推广公司
  • 做画册好的网站外包公司怎么赚钱
  • 做科研交流常用的网站百度竞价入门教程
  • 自己公司的网站怎么编辑营销策划方案内容
  • dede网站地图模板文件企业培训课程推荐
  • 餐饮商城网站制作多少钱模板免费下载网站
  • 上传产品网站怎么做个人怎么在百度上打广告
  • 手机做网站百度小说搜索排行榜
  • wordpress链接跳转错误赤峰seo
  • 免费个人网站注册网上有免费的网站吗
  • 下班后赚钱的100个副业seo网站关键词优化报价
  • 做的好的公司网站人民网舆情数据中心官网
  • 临海网站建设qq群引流推广软件
  • dedecms购物网站在线刷关键词网站排名
  • 开一个做网站的公司爱站关键词挖掘软件
  • 郑州正规的网站制作中国北京出啥大事了
  • 欣赏别人做的网站拉新任务接单放单平台
  • 在哪里可以学到做网站域名注册服务网站
  • 咨询律师免费解答百家号关键词seo优化
  • 给装修公司做推广的网站互联网营销策划是做什么的
  • 贺卡制作网页平原县网站seo优化排名