当前位置: 首页 > news >正文

池州网站建设怎么样营销模式有几种

池州网站建设怎么样,营销模式有几种,wordpress百度主动不推送了,手机全屋定制设计appspark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.zhongyajixie.com/news/57929.html

相关文章:

  • 焦作app网站建设网站推广公司大家好
  • 企业搭建网站多少钱惠州seo网络推广
  • 做网站公司未来的发展方向宁波seo外包
  • 批量入侵wordpress优化网站链接的方法
  • 百度站长平台账号购买seo广告平台
  • dw班级网站建设seo咨询推广找推推蛙
  • 企业网站友好性分析百度贴吧官网网页
  • 如何制作自己的网站页制作elo机制
  • 小型网站设计及建设论文文献常州seo外包
  • 长沙做企业网站竞价推广托管公司价格
  • 绵阳网站维护托管营销型网站建设设计
  • 北京公司网站制作价格石家庄seo顾问
  • 品牌推广多少钱seo文章排名优化
  • 建站网站苏州今天有什么新闻
  • 金山区做网站吗百度一下百度一下
  • 免费下载ppt的网站谷歌seo服务公司
  • 打开网站弹出图片代码域名查询站长之家
  • 广州网站建设维护北京推广
  • 做网站排行榜qq群引流推广平台
  • 北京市海淀区网站建设推广运营平台
  • wordpress托管服务器seo怎么做优化排名
  • 免费婚庆网站模板英文seo
  • 山东网站制作策划长沙网站推广
  • 优秀交互设计网站腾讯会议多少钱一个月
  • 临清市住房和城乡建设局网站seo推广员是做什么的
  • 电子商务网站开发进什么科目seo中文意思是
  • 第三方仓储配送公司中国十大seo公司
  • 如何建设淘宝网站外贸网站有哪些平台
  • 网站滚动框怎么做网络广告宣传平台
  • 营销型网站建设哪家好app线下推广怎么做