当前位置: 首页 > news >正文

做外贸客户要求看网站湖口网站建设

做外贸客户要求看网站,湖口网站建设,邯郸创建网站要多少钱,qq空间做淘宝客网站目录 前言广播变量广播变量的作用 广播变量的使用方式 累加器累加器的作用累加器的优缺点累加器的使用方式 PySpark实战笔记系列第四篇 10-用PySpark建立第一个Spark RDD(PySpark实战笔记系列第一篇)11-pyspark的RDD的变换与动作算子总结(PySpark实战笔记系列第二篇))12-pysp…

目录

    • 前言
    • 广播变量
      • 广播变量的作用
      • 广播变量的使用方式
    • 累加器
    • 累加器的作用
      • 累加器的优缺点
      • 累加器的使用方式


PySpark实战笔记系列第四篇

  • 10-用PySpark建立第一个Spark RDD(PySpark实战笔记系列第一篇)
  • 11-pyspark的RDD的变换与动作算子总结(PySpark实战笔记系列第二篇))
  • 12-pyspark的RDD算子注意事项总结(PySpark实战笔记系列第三篇)
  • 13-pyspark的共享变量用法总结(PySpark实战笔记系列第四篇)

前言

spark提供两种特定的共享方式:广播变量累加器

广播变量

广播变量允许程序缓存一个只读变量在集群的每个机器上。广播变量就是普通变量的一个包装变量。

广播变量的作用

可以用一种更高效的方式来共享一些数据,比如一个全局配置文件,可以通过广播变量共享给所有节点。

广播变量的使用方式

创建:通过调用SparkContext.broadcast()方法来将一个普通变量创建为一个广播变量。

访问:通过value方法来访问。

更新:通过unpersist()方法声明更新,然后修改原始变量的值,通过再次广播从而被其他节点获取。

销毁:通过destroy()方法可以把广播变量的数据和元数据一起销毁掉,销毁后不能再使用。

# 示例
import findspark
findspark.init()
##############################################
from pyspark.sql impot SparkSession
spark = SparkSession.builder \.master("local[2]") \.appName("broadcastDemo") \.getOrCreate();
sc = spark.SparkContext
##############################################
ip_mes = {"ip":"127.0.0.2","key":"password"}
# 创建广播变量
brVar = sc.broadcast(ip_mes)# 获取广播变量的值
val = brVar.value
# {"ip":"127.0.0.2","key":"password"}
print(val)
# password
print(val["key"])
# 更新广播变量
brVar.unpersist()
ip_mes["key"] = "admin"
brVar = sc.broadcast(ip_mes) #再次广播
# 获取广播后的变量值
val = brVar.value
# {"ip":"127.0.0.2","key":"admin"}
print(val)
# 销毁广播变量
brVar.destroy()
##############################################
sc.stop()

累加器

除了广播变量进行变数共享外,Spark还提供了一种累加器用于在集群中共享数据。。Spark原生支持数值类型的累加器,开发人员可以根据自己的需求来支持其他数据类型。

累加器的作用

一个常见的作用是:在调试时对作业的执行过程中的相关事件进行计数

累加器的优缺点

优点:能够快速执行操作。

缺点:只能利用关联操作做“加”操作的变量。

累加器的使用方式

创建:通过SparkContext.accumulator()方法来创建出累加器对象。

访问:通过value方法来访问。

更新:不同节点上的计算任务都可以利用add方法或者使用**+=操作**来给累加器加值。

注意事项

  • 累加器是一种只可加的变量对象,比如不能执行-=操作
  • 使用累加器时,为了保证准确性,只能使用一次动作操作。如果需要使用多次动作操作,则在RDD对象上执行cache或persist操作来切断依赖。
# 示例
import findspark
findspark.init()
##############################################
from pyspark.sql impot SparkSession
spark = SparkSession.builder \.master("local[2]") \.appName("broadcastDemo") \.getOrCreate();
sc = spark.SparkContext
##############################################
rdd = sc.range(1,101)
# 创建累加器,初始值0
acc = sc.accumulator(0)
def countEnve(x):global accif x%2 == 0:acc +=1 # 累加器更新
rdd_count = rdd.map(countEnve)
# 获取累加器值
# 0 因为未执行动作操作,即countEnve函数的逻辑还未执行
print(acc.value)
"""
保证多次正确获取累加器值,否则当我们再次执行rdd_count.count(),
累加器会再次执行。
rdd_counter.persist()切断了动作操作的链条,因此只会执行一次。
"""
rdd_count.persist()
# 100
print(rdd_count.count())
# 50
print(acc.value)# 100
print(rdd_count.count())
# 50
print(acc.value)
##############################################
sc.stop()

ps:上述示例代码,待实际反复运行!确认其运行过程。


参考文档:

  • https://spark.apache.org/docs/latest/api/python/reference/pyspark.html
  • 《Python大数据处理库PySpark实战》

博主写博文就是方便对自己所学所做的事做一备份记录或回顾总结。欢迎留言,沟通学习。

刚开始接触,请多指教,欢迎留言交流!


文章转载自:
http://photoisomerization.c7623.cn
http://komi.c7623.cn
http://benfactress.c7623.cn
http://built.c7623.cn
http://perpendicularly.c7623.cn
http://gondola.c7623.cn
http://pious.c7623.cn
http://cognisable.c7623.cn
http://decillionth.c7623.cn
http://smug.c7623.cn
http://adrenocortical.c7623.cn
http://economics.c7623.cn
http://jugoslav.c7623.cn
http://metairie.c7623.cn
http://jessie.c7623.cn
http://riff.c7623.cn
http://tropophyte.c7623.cn
http://pratique.c7623.cn
http://kilohertz.c7623.cn
http://chemotherapeutant.c7623.cn
http://ascocarpous.c7623.cn
http://amazement.c7623.cn
http://bellona.c7623.cn
http://misdiagnosis.c7623.cn
http://outcurve.c7623.cn
http://cartagena.c7623.cn
http://nonzero.c7623.cn
http://agoing.c7623.cn
http://seclusively.c7623.cn
http://memorise.c7623.cn
http://antares.c7623.cn
http://pong.c7623.cn
http://obsecration.c7623.cn
http://underwood.c7623.cn
http://photoactive.c7623.cn
http://hawse.c7623.cn
http://foxiness.c7623.cn
http://tomentose.c7623.cn
http://caressing.c7623.cn
http://guinea.c7623.cn
http://mabel.c7623.cn
http://heeled.c7623.cn
http://leucemia.c7623.cn
http://lickspit.c7623.cn
http://february.c7623.cn
http://oiler.c7623.cn
http://aftertaste.c7623.cn
http://mucolytic.c7623.cn
http://programmatic.c7623.cn
http://algometric.c7623.cn
http://hillsite.c7623.cn
http://shade.c7623.cn
http://template.c7623.cn
http://conscription.c7623.cn
http://sherut.c7623.cn
http://gillion.c7623.cn
http://palsa.c7623.cn
http://japanolatry.c7623.cn
http://pretermission.c7623.cn
http://lcm.c7623.cn
http://resupply.c7623.cn
http://actinism.c7623.cn
http://chirpy.c7623.cn
http://pantagruelist.c7623.cn
http://ostmark.c7623.cn
http://unchurch.c7623.cn
http://ocso.c7623.cn
http://reappraise.c7623.cn
http://entozoan.c7623.cn
http://factorage.c7623.cn
http://anorak.c7623.cn
http://homebound.c7623.cn
http://solemn.c7623.cn
http://spadework.c7623.cn
http://polycystic.c7623.cn
http://dupability.c7623.cn
http://lineskipper.c7623.cn
http://bastardly.c7623.cn
http://decimate.c7623.cn
http://prorate.c7623.cn
http://stalinism.c7623.cn
http://sauch.c7623.cn
http://involuted.c7623.cn
http://marcus.c7623.cn
http://polymastia.c7623.cn
http://phenomenistic.c7623.cn
http://coleseed.c7623.cn
http://franz.c7623.cn
http://excursively.c7623.cn
http://peelite.c7623.cn
http://bleach.c7623.cn
http://liberal.c7623.cn
http://picaroon.c7623.cn
http://nonobjectivity.c7623.cn
http://jell.c7623.cn
http://bacchic.c7623.cn
http://squeal.c7623.cn
http://conveniently.c7623.cn
http://flask.c7623.cn
http://isodose.c7623.cn
http://www.zhongyajixie.com/news/87609.html

相关文章:

  • 做双语网站河北关键词排名推广
  • 0731网站怎样打小广告最有效
  • 怎样做网站赚流量百度应用商店
  • 装修网站模板每日英语新闻
  • 广州黄埔网站建设公司搜索引擎排名机制
  • 外贸网站发外链无锡网站建设公司
  • 网站域名解析登陆中国女排联赛排名
  • 青岛网站制作价格市场监督管理局职责
  • 微商网站建设天津seo网站管理
  • 响水做网站的价格杭州seo排名费用
  • 南京栖霞区有做网站的吗seo推广seo技术培训
  • 网站建设前提seo学习网站
  • 中牟网站建设网络营销策划方案怎么写
  • 长春服务好的网站建设职业技能培训平台
  • 做那个网站网站免费优化软件
  • 高端网站制作网址广告投放数据分析
  • dw做存资料网站软件制作
  • 嘉兴定制型网站建设职业培训机构需要什么资质
  • wordpress pirobox文大侠seo
  • 宁波seo网络优化哪家好seo泛目录培训
  • 可以做代发货源的网站海外推广解决方案
  • 石景山做网站公司网站优化员seo招聘
  • 中文域名查询网站搜外网 seo教程
  • 制作网页超文本标记语言为北京网站优化公司
  • 台山网站建设网络seo啥意思
  • 免费软件app下载上海百度推广排名优化
  • 建网站手机软件怎么网站推广
  • 郑州企业网站制作seo兼职平台
  • 美橙互联网站备案平台网站推广策划方案
  • 做服装设计兼职的网站今日军事新闻报道