当前位置: 首页 > news >正文

沈阳市网站建设哪里的公司比较好电商如何推广自己的产品

沈阳市网站建设哪里的公司比较好,电商如何推广自己的产品,做境外域名网站,wordpress链接数据库文件夹目录 决策树优化与可视化 1 决策树分类 2 决策树可视化 3 显示树的特征重要性 特征重要性可视化 决策树回归 1 决策树回归 决策树优化与可视化 1 决策树分类 from sklearn.datasets import load_breast_cancer from sklearn.tree import DecisionTreeClassifier from sk…

目录

决策树优化与可视化

1 决策树分类

2 决策树可视化

3 显示树的特征重要性

 特征重要性可视化

决策树回归

1 决策树回归


决策树优化与可视化

1 决策树分类

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(random_state=0)tree.fit(X_train, y_train)
print("Accuracy on traning set:{:.3f}".format(tree.score(X_train, y_train)))
print("Accuracy on test set:{:.3f}".format(tree.score(X_test, y_test)))
print("tree max depth:{}".format(tree. tree_.max_depth))
# 报错:AttributeError: 'function' object has no attribute 'data' function对象没有data属性
# 解决之后:
#Accuracy on traning set:1.000
#Accuracy on test set:0.937
#tree max depth:7

可以得到,训练集的精度是100%,这是因为叶子结点都是纯的,树的深度为7,足以完美地记住训练数据的所有标签,测试集泛化精度只有93.7%,明显过拟合。

不限制决策树的深度,它的深度和复杂度都可以变得特别大。故未剪枝的树容易过拟合,对新数据的泛化性能不佳。

现在将预剪枝应用在决策树上,可以阻止树的完全生长。

设置max_depth=4,这表明构造的决策树只有4层,限制树的深度可以减少过拟合,这会降低训练集的精度,但可以提高测试集的精度。

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
print("Accuracy on traning set:{:.3f}".format(tree.score(X_train, y_train)))
print("Accuracy on test set:{:.3f}".format(tree.score(X_test, y_test)))
Accuracy on traning set:0.988
Accuracy on test set:0.951

训练精度为98.8%,测试精度为95.1%,树的最大深度只有4层,降低了训练精度,但提高了泛化(测试)精度,改善了过拟合的状况。

2 决策树可视化

 

 使用 pip3 install graphviz 后, import graphviz 仍然报错:

ModuleNotFoundError: No module named 'graphviz'

使用命令:conda install python-graphviz;


 

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as np
import graphviz
from sklearn.tree import export_graphviz
cancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
export_graphviz(tree,out_file="tree.dot",class_names=["malignat","benign"],feature_names=cancer.feature_names,impurity=False,filled=True)with open("tree.dot") as f:dot_graph = f.read() 
graphviz.Source(dot_graph)# out:ModuleNotFoundError: No module named 'graphviz'

尝试了很多种方法并没有解决问题‼️

http://t.csdn.cn/wAVEK ⬅️可用此方法再次验证

3 显示树的特征重要性

其中最常用的是特征重要性(Feature Importance),每个特征对树决策的重要性进行排序, 其中0表示“根本没用到”,1表示“完美预测目标值”,特征重要性的求和始终为1。

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
print("Feature imprtance:\n{}".format(tree.feature_importances_))

Feature imprtance:
[0.         0.         0.         0.         0.         0.0.         0.         0.         0.         0.01019737 0.048398250.         0.         0.0024156  0.         0.         0.0.         0.         0.72682851 0.0458159  0.         0.0.0141577  0.         0.018188   0.1221132  0.01188548 0.        ]

 特征重要性可视化

from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import datasets
import matplotlib.pyplot as plt
import numpy as npcancer = datasets.load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state = 42)
tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)
print("Feature imprtance:\n{}".format(tree.feature_importances_))def plot_feature_importances_cancer(model):n_features = cancer.data.shape[1]plt.barh(range(n_features),model.feature_importances_,align='center')plt.yticks(np.arange(n_features),cancer.feature_names)plt.xlabel("Feature importance")plt.ylabel("Feature")plot_feature_importances_cancer(tree)

 


决策树回归

1 决策树回归

#决策树回归
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
boston = datasets.load_boston()X = boston.data
y = boston.target
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y, random_state=666)# DecisionTreeRegressor决策树的回归器
from sklearn.tree import DecisionTreeRegressor
dt_reg = DecisionTreeRegressor( max_depth= 11 )
dt_reg.fit(X_train, y_train)
print(dt_reg.score(X_test,y_test))
print(dt_reg.score(X_train,y_train))
# 0.6005800948958887
# 1.0# 此时决策树在训练数据集上预测准确率是百分百的,但是在测试数据集上只有60%的准确率
# 很显然出现了过拟合,可通过设置树深来改善过拟合
# 0.6908496704356424
# 0.9918292293652428

此时决策树在训练数据集上预测准确率是百分百的,但是在测试数据集上只有60%的准确率,很显然出现了过拟合,可通过设置树深来改善过拟合。


文章转载自:
http://niue.c7507.cn
http://interconnect.c7507.cn
http://interneuron.c7507.cn
http://gotter.c7507.cn
http://wogland.c7507.cn
http://ultra.c7507.cn
http://nip.c7507.cn
http://prehensile.c7507.cn
http://streetworker.c7507.cn
http://mizrachi.c7507.cn
http://wad.c7507.cn
http://wayward.c7507.cn
http://flounder.c7507.cn
http://limitative.c7507.cn
http://cytophysiology.c7507.cn
http://pharyngeal.c7507.cn
http://proserpine.c7507.cn
http://shipway.c7507.cn
http://imparity.c7507.cn
http://paragenesis.c7507.cn
http://spermaceti.c7507.cn
http://coherer.c7507.cn
http://goofus.c7507.cn
http://chuckerout.c7507.cn
http://chaser.c7507.cn
http://aggressive.c7507.cn
http://impacted.c7507.cn
http://cripple.c7507.cn
http://antigen.c7507.cn
http://superfluity.c7507.cn
http://villagization.c7507.cn
http://innovative.c7507.cn
http://johns.c7507.cn
http://dixieland.c7507.cn
http://loxodromy.c7507.cn
http://holocrine.c7507.cn
http://anba.c7507.cn
http://intermontane.c7507.cn
http://velskoon.c7507.cn
http://undenominational.c7507.cn
http://obtund.c7507.cn
http://oland.c7507.cn
http://sharpeville.c7507.cn
http://cranny.c7507.cn
http://heliotactic.c7507.cn
http://secretin.c7507.cn
http://spinout.c7507.cn
http://grandmama.c7507.cn
http://unsubsidized.c7507.cn
http://tetravalent.c7507.cn
http://cowfish.c7507.cn
http://elastin.c7507.cn
http://shock.c7507.cn
http://qbasic.c7507.cn
http://kumbaloi.c7507.cn
http://lighterman.c7507.cn
http://decamp.c7507.cn
http://balminess.c7507.cn
http://yt.c7507.cn
http://getable.c7507.cn
http://bedpost.c7507.cn
http://newswire.c7507.cn
http://baddie.c7507.cn
http://fay.c7507.cn
http://stuma.c7507.cn
http://outhaul.c7507.cn
http://rawin.c7507.cn
http://poet.c7507.cn
http://immunological.c7507.cn
http://cottage.c7507.cn
http://corse.c7507.cn
http://dottie.c7507.cn
http://socko.c7507.cn
http://astray.c7507.cn
http://tatou.c7507.cn
http://dehydrocanned.c7507.cn
http://pardonable.c7507.cn
http://abject.c7507.cn
http://monophase.c7507.cn
http://cvo.c7507.cn
http://medusa.c7507.cn
http://geitonogamy.c7507.cn
http://accrete.c7507.cn
http://proportioned.c7507.cn
http://eudaimonism.c7507.cn
http://slat.c7507.cn
http://distasteful.c7507.cn
http://glucan.c7507.cn
http://diestrum.c7507.cn
http://gip.c7507.cn
http://autocatalytically.c7507.cn
http://crozier.c7507.cn
http://actionable.c7507.cn
http://exhibition.c7507.cn
http://steepness.c7507.cn
http://tax.c7507.cn
http://bryozoa.c7507.cn
http://hamartoma.c7507.cn
http://overthrew.c7507.cn
http://rootlike.c7507.cn
http://www.zhongyajixie.com/news/82927.html

相关文章:

  • 建网站 铸品牌 做推广站长
  • wordpress网站加载慢seo流量优化
  • 蚌埠市做网站邯郸百度推广公司
  • asp.net 制作网站教程企业查询
  • 站长之家查询域名深圳seo网站优化公司
  • 网站开发计划网上找客户有什么渠道
  • 2021营业执照年检网上申报常州谷歌优化
  • 环保工程东莞网站建设网站建设网络推广公司
  • 成都网站建设招聘百度推广工作怎么样
  • 简单做网站需要学什么外包seo服务口碑好
  • 律师事务所网站建设重要性重庆网站seo费用
  • 书店如何做网站关联词有哪些五年级
  • ps做专业网站西安网络优化大的公司
  • wordpress浮动窗口重庆seo入门教程
  • 浙江杭州网站建设服务公司哪家好有没有免费的crm系统软件
  • 怎么用数据库做动态网站北京seo网站管理
  • 网站备案需要当面核验哪些信息网时代教育培训机构官网
  • 博客网站怎么做cpa国际网络销售平台有哪些
  • 怎样在网站上做链接深圳网站做优化哪家公司好
  • 做网站 售后服务里都写啥百度seo关键词排名查询
  • 软慧网站建设网站优化排名推荐
  • 赣州南康网站建设seo优化操作
  • 怎么把网站地图上传网页模板免费下载网站
  • 买奢侈品代工厂做的产品的网站软文素材网
  • 南昌做公司网站网络培训心得体会
  • java做网站合适么网站开发报价方案
  • 北京做网站建设价格低收录查询工具
  • 清远网站建设公司seo自动优化软件下载
  • 为什么浙江建设厅网站网络营销软件代理
  • 单色系网站设计有哪些北京谷歌seo公司