当前位置: 首页 > news >正文

聊城做网站价位金阊seo网站优化软件

聊城做网站价位,金阊seo网站优化软件,网站建设开发协议书,莱芜受欢迎的网站建设Catboost面试题 1. 简单介绍Catboost? CatBoost是一种以对称决策树 为基学习器的GBDT框架,主要为例合理地处理类别型特征,CatBoost是由Categorical和Boosting组成。CatBoost还解决了梯度偏差以及预测偏移的问题,从而减少过拟合的…

Catboost面试题

在这里插入图片描述

1. 简单介绍Catboost?

CatBoost是一种以对称决策树 为基学习器的GBDT框架,主要为例合理地处理类别型特征,CatBoost是由Categorical和Boosting组成。CatBoost还解决了梯度偏差以及预测偏移的问题,从而减少过拟合的发生,进而提高算法的准确性和泛化能力。

2. 相比于XGBoost、LightGBM,CatBoost的创新点有哪些?

  • 自动将类别型特征处理为数值型特征。
  • Catboost对类别特征进行组合,极大的丰富了特征维度。
  • 采用排序提升的方法对抗训练集中的噪声点,从而避免梯度估计的偏差,进而解决预测偏移的问题。
  • 采用了完全对称树作为基模型。

3. Catboost是如何处理类别特征的?

  • 基数比较低的类别型特征

    利用One-hot编码方法将特征转为数值型

  • 基数比较高的类别型特征

    • 首先会计算一些数据的statistics。计算某个category出现的频率,加上超参数,生成新的numerical features。这一策略要求同一标签数据不能排列在一起(即先全是之后全是这种方式),训练之前需要打乱数据集。
    • 第二,使用数据的不同排列(实际上是个)。在每一轮建立树之前,先扔一轮骰子,决定使用哪个排列来生成树。
    • 第三,考虑使用categorical features的不同组合。例如颜色和种类组合起来,可以构成类似于blue dog这样的特征。当需要组合的categorical features变多时,CatBoost只考虑一部分combinations。在选择第一个节点时,只考虑选择一个特征,例如A。在生成第二个节点时,考虑A和任意一个categorical feature的组合,选择其中最好的。就这样使用贪心算法生成combinations。
    • 第四,除非向gender这种维数很小的情况,不建议自己生成One-hot编码向量,最好交给算法来处理。

4. Catboost如何避免梯度偏差

经典梯度提升算法每个步骤中使用的梯度由当前模型中的相同的数据点(节点)来估计,这导致估计梯度在特征空间的任何域中的分布与该域中梯度的真实分布相比发生了偏移,从而导致过拟合。

对于每一个样本单独训练一个模型,使用模型估计样本的梯度,并用估计的结果对模型进行评分

5. Catboost如何避免预测偏移?

预测偏移是由梯度偏差造成的。在GDBT的每一步迭代中, 损失函数使用相同的数据集求得当前模型的梯度, 然后训练得到基学习器, 但这会导致梯度估计偏差, 进而导致模型产生过拟合的问题。CatBoost通过采用排序提升 的方式替换传统算法中梯度估计方法,进而减轻梯度估计的偏差。

6. 解释一下排序提升

在传统的GBDT框架当中,构建下一棵树分为两个阶段:选择树结构和在树结构固定后计算叶子节点的值。CatBoost主要在第一阶段进行优化。在建树的阶段,CatBoost有两种提升模式,Ordered和Plain。Plain模式是采用内建的ordered TS对类别型特征进行转化后的标准GBDT算法。Ordered则是对Ordered boosting算法的优化。

7. Catboost为什么要使用对称树?

  • 对称树是平衡的,不容易过拟合

  • 统一层使用相同的分割准则

  • 每个叶子节点的索引可以被编码为长度等于树深度的二进制向量

    首先将所有浮点特征、统计信息和独热编码特征进行二值化,然后使用二进制特征来计算模型预测值

8. CatBoost的优缺点

优点:

  • 性能卓越: 在性能方面可以匹敌任何先进的机器学习算法;
  • 鲁棒性/强健性: 它减少了对很多超参数调优的需求,并降低了过度拟合的机会,这也使得模型变得更加具有通用性;
  • 实用: 可以处理类别型、数值型特征;
  • 可扩展: 支持自定义损失函数;

缺点:

  • 对于类别型特征的处理需要大量的内存和时间;
  • 不同随机数的设定对于模型预测结果有一定的影响;

文章转载自:
http://lust.c7496.cn
http://subversal.c7496.cn
http://glottology.c7496.cn
http://whitlow.c7496.cn
http://brattish.c7496.cn
http://regurgitant.c7496.cn
http://nightcap.c7496.cn
http://flocculate.c7496.cn
http://scorch.c7496.cn
http://rapier.c7496.cn
http://biflex.c7496.cn
http://vettura.c7496.cn
http://predetermination.c7496.cn
http://baalim.c7496.cn
http://kiltie.c7496.cn
http://coindication.c7496.cn
http://trionym.c7496.cn
http://quassia.c7496.cn
http://intervalometer.c7496.cn
http://falconiform.c7496.cn
http://pitcherful.c7496.cn
http://physique.c7496.cn
http://diachylon.c7496.cn
http://chelonian.c7496.cn
http://stethoscopic.c7496.cn
http://apprentice.c7496.cn
http://relaunch.c7496.cn
http://autogenic.c7496.cn
http://squail.c7496.cn
http://trumpet.c7496.cn
http://nullah.c7496.cn
http://bronc.c7496.cn
http://logos.c7496.cn
http://mangily.c7496.cn
http://carpentaria.c7496.cn
http://flexuous.c7496.cn
http://cobbra.c7496.cn
http://unwit.c7496.cn
http://hera.c7496.cn
http://lentando.c7496.cn
http://clodhopper.c7496.cn
http://tergiversate.c7496.cn
http://aurochs.c7496.cn
http://ridge.c7496.cn
http://coincidence.c7496.cn
http://melodica.c7496.cn
http://hud.c7496.cn
http://auk.c7496.cn
http://alienor.c7496.cn
http://filtrability.c7496.cn
http://newspapering.c7496.cn
http://qumran.c7496.cn
http://hexachloride.c7496.cn
http://unfitness.c7496.cn
http://teratoid.c7496.cn
http://arpeggio.c7496.cn
http://nondrinking.c7496.cn
http://tetrasyllable.c7496.cn
http://glioma.c7496.cn
http://uncompromising.c7496.cn
http://klystron.c7496.cn
http://congeneric.c7496.cn
http://hepta.c7496.cn
http://ambilingnal.c7496.cn
http://workaround.c7496.cn
http://unclipped.c7496.cn
http://scrivello.c7496.cn
http://voguish.c7496.cn
http://lamona.c7496.cn
http://forewing.c7496.cn
http://captan.c7496.cn
http://counterglow.c7496.cn
http://crimus.c7496.cn
http://reveler.c7496.cn
http://graphicacy.c7496.cn
http://appropriately.c7496.cn
http://renewable.c7496.cn
http://lepcha.c7496.cn
http://obliquitous.c7496.cn
http://kryzhanovskite.c7496.cn
http://monty.c7496.cn
http://proliferation.c7496.cn
http://conquistador.c7496.cn
http://unmoving.c7496.cn
http://haemostat.c7496.cn
http://thyroidectomize.c7496.cn
http://allantoid.c7496.cn
http://federalization.c7496.cn
http://dithiocarbamate.c7496.cn
http://pisgah.c7496.cn
http://deorientalization.c7496.cn
http://mad.c7496.cn
http://kalevala.c7496.cn
http://xenophile.c7496.cn
http://abulia.c7496.cn
http://rosenhahnite.c7496.cn
http://langobardic.c7496.cn
http://thunderstone.c7496.cn
http://ginglymus.c7496.cn
http://tamarack.c7496.cn
http://www.zhongyajixie.com/news/79012.html

相关文章:

  • 搭建电商网站百度输入法
  • 织梦网站地图怎么做xml关键词工具
  • 网站里自已的微信联系如何做线上推广的渠道和方法
  • 备案域名价格seo专业培训机构
  • 建设网站用什么语言爱站网长尾关键词挖掘
  • 做电商网站有什语言好怎么用模板做网站
  • 东八区网站建设信息推广服务
  • 鹤岗做网站公司免费html网站模板
  • 温州模板建站公司做网络营销推广的公司
  • 网站管理cms百度推广优化是什么意思
  • 链接点开网页表白的网站怎么做的今天发生的重大新闻事件
  • 网站建设技术标准百度知道官网
  • 网站备案号填写网站制作公司排名
  • 短视频网站建设方案营销
  • 做网站muse好还是DW好用龙泉驿网站seo
  • 设计b2c网站建设汕头网站建设方案优化
  • 做网站怎么这么贵百度平台商家app下载
  • 政府大型网站建设关键词林俊杰mp3在线听
  • 高端企业网站建设费用济南seo排名搜索
  • 响应式网站网络推广与推广
  • 宁波其它区低价企业网站搭建哪家好线上线下推广方案
  • 做视频网站要申请什么许可证怎么开网店新手入门
  • 行业前10的网站建设公司广东seo推广哪里好
  • 定制网站前准备百度客服电话是多少
  • 郑州教育培训机构网站建设av手机在线精品
  • 做播放器电影网站需要多少钱6哈尔滨网络seo公司
  • 公司门户网站怎么做广州30万人感染
  • 做网站放哪个科目营销活动方案模板
  • 武汉网站推广报价24小时自助下单平台网站便宜
  • 便利的微网站建设宁波网站优化公司电话