当前位置: 首页 > news >正文

能解析国外网站的dns北京seo服务商

能解析国外网站的dns,北京seo服务商,wordpress 去掉版权信息,linux国外网站吗我们使用sparksql进行编程,编程的过程我们需要创建dataframe对象,这个对象的创建方式我们是先创建RDD然后再转换rdd变成为DataFrame对象。 但是sparksql给大家提供了多种便捷读取数据的方式。 //原始读取数据方式 sc.textFile().toRDD sqlSc.createDat…

我们使用sparksql进行编程,编程的过程我们需要创建dataframe对象,这个对象的创建方式我们是先创建RDD然后再转换rdd变成为DataFrame对象。

但是sparksql给大家提供了多种便捷读取数据的方式。

//原始读取数据方式
sc.textFile().toRDD
sqlSc.createDataFrame(rdd,schema)
//更便捷的使用方式
sqlSc.read.text|orc|parquet|jdbc|csv|json
df.write.text|orc|parquet|jdbc|csv|json

write写出存储数据的时候也是文件夹的,而且文件夹不能存在。

  • csv是一个介于文本和excel之间的一种格式,如果是文本打开用逗号分隔的。
  • text文本普通文本,但是这个文本必须只能保存一列内容。

以上两个文本都是只有内容的,没有列的。

  • json是一种字符串结构,本质就是字符串,但是存在kv,例子 {"name":"zhangsan","age":20}

多平台解析方便,带有格式信息。

  • orc格式一个列式存储格式,hive专有的。
  • parquet列式存储,顶级项目

以上都是列式存储问题,优点(1.列式存储,检索效率高,防止冗余查询 2.带有汇总信息,查询特别快 3.带有轻量级索引,可以跳过大部分数据进行检索),他们都是二进制文件,带有格式信息。

jdbc 方式,它是一种协议,只要符合jdbc规范的服务都可以连接,mysql,oracle,hive,sparksql

整体代码:

package com.hainiu.sparkimport org.apache.spark.sql.SQLContext
import org.apache.spark.sql.expressions.Window
import org.apache.spark.{SparkConf, SparkContext}import java.util.Propertiesobject TestMovieWithSql {def main(args: Array[String]): Unit = {//??movie???//1.id  middle=name  last=typeval conf = new SparkConf()conf.setAppName("movie")conf.setMaster("local[*]")conf.set("spark.shuffle.partitions","20")val sc = new SparkContext(conf)val sqlSc = new SQLContext(sc)import sqlSc.implicits._//deal dataval df = sc.textFile("data/movies.txt").flatMap(t => {val strs = t.split(",")val mid = strs(0)val types = strs.reverse.headval name = strs.tail.reverse.tail.reverse.mkString(" ")types.split("\\|").map((mid, name, _))}).toDF("mid", "mname", "type")df.limit(1).show()val df1 = sc.textFile("data/ratings.txt").map(t=>{val strs = t.split(",")(strs(0),strs(1),strs(2).toDouble)}).toDF("userid","mid","score")df1.limit(1).show()import org.apache.spark.sql.functions._val df11 = df.join(df1, "mid").groupBy("userid", "type").agg(count("userid").as("cnt")).withColumn("rn", row_number().over(Window.partitionBy("userid").orderBy($"cnt".desc))).where("rn = 1").select("userid", "type")val df22 = df.join(df1, "mid").groupBy("type", "mname").agg(avg("score").as("avg")).withColumn("rn", row_number().over(Window.partitionBy("type").orderBy($"avg".desc))).where("rn<4").select("type", "mname")val df33 = df11.join(df22, "type")//spark3.1.2?? spark2.x//    df33.write.csv()df33.write.format("csv").save("data/csv")//    df33.write.
//      csv("data/csv")
//    df33.write.json("data/json")//    df33.write.parquet("data/parquet")
//    df33.write.orc("data/orc")
//    val pro = new Properties()
//    pro.put("user","root")
//    pro.put("password","hainiu")
//    df33.write.jdbc("jdbc:mysql://11.99.173.24:3306/hainiu","movie",pro)}
}

为了简化存储的计算方式:

package com.hainiu.sparkimport org.apache.spark.sql.SQLContext
import org.apache.spark.{SparkConf, SparkContext}object TestSink {def main(args: Array[String]): Unit = {val conf = new SparkConf()conf.setAppName("test sink")conf.setMaster("local[*]")val sc = new SparkContext(conf)val sqlSc = new SQLContext(sc)import sqlSc.implicits._import org.apache.spark.sql.functions._val df = sc.textFile("data/a.txt").map(t=>{val strs = t.split(" ")(strs(0),strs(1),strs(2),strs(3))}).toDF("id","name","age","gender").withColumn("all",concat_ws(" ",$"id",$"name",$"age",$"gender")).select("all")
//    df.write.csv("data/csv")
//    df.write.format("org.apache.spark.sql.execution.datasources.v2.csv.CSVDataSourceV2")
//      .save("data/csv")
//    df.write.parquet("data/parquet")
//    df.write.format("org.apache.spark.sql.execution.datasources.v2.parquet.ParquetDataSourceV2")
//      .save("data/parquet")
//    df.write.format("org.apache.spark.sql.execution.datasources.v2.json.JsonDataSourceV2")
//      .save("data/json")df.write.format("org.apache.spark.sql.execution.datasources.v2.text.TextDataSourceV2").save("data/text")}
}

读取数据代码:

package com.hainiu.sparkimport org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.sql.SQLContextimport java.util.Propertiesobject TestReadData {def main(args: Array[String]): Unit = {val conf = new SparkConf()conf.setAppName("movie")conf.setMaster("local[*]")conf.set("spark.shuffle.partitions", "20")val sc = new SparkContext(conf)val sqlSc = new SQLContext(sc)
//    sqlSc.read.text("data/text").show()
//    sqlSc.read.csv("data/csv").show()
//  
//    sqlSc.read.parquet("data/parquet").show()
//    sqlSc.read.json("data/json").show()sqlSc.read.format("org.apache.spark.sql.execution.datasources.v2.text.TextDataSourceV2").load("data/text").show()sqlSc.read.format("org.apache.spark.sql.execution.datasources.v2.csv.CSVDataSourceV2").load("data/csv").show()sqlSc.read.format("org.apache.spark.sql.execution.datasources.v2.json.JsonDataSourceV2").load("data/json").show()sqlSc.read.format("org.apache.spark.sql.execution.datasources.v2.parquet.ParquetDataSourceV2").load("data/parquet").show()sqlSc.read.orc("data/orc").show()val pro = new Properties()pro.put("user","root")pro.put("password","hainiu")sqlSc.read.jdbc("jdbc:mysql://11.99.173.24:3306/hainiu","movie",pro).show()}
}

文章转载自:
http://capsular.c7622.cn
http://encephalous.c7622.cn
http://rooftree.c7622.cn
http://cocytus.c7622.cn
http://viseite.c7622.cn
http://supporter.c7622.cn
http://greeneian.c7622.cn
http://kulak.c7622.cn
http://akathisia.c7622.cn
http://xanthoconite.c7622.cn
http://sceptre.c7622.cn
http://affinitive.c7622.cn
http://infringe.c7622.cn
http://hemiretina.c7622.cn
http://osmanthus.c7622.cn
http://cutup.c7622.cn
http://proliferate.c7622.cn
http://rathaus.c7622.cn
http://ethion.c7622.cn
http://multipoint.c7622.cn
http://purchaseless.c7622.cn
http://anon.c7622.cn
http://dada.c7622.cn
http://wctu.c7622.cn
http://inverter.c7622.cn
http://margaux.c7622.cn
http://monosepalous.c7622.cn
http://obwalden.c7622.cn
http://jambeau.c7622.cn
http://codriver.c7622.cn
http://quichua.c7622.cn
http://barracuda.c7622.cn
http://scattergun.c7622.cn
http://dickens.c7622.cn
http://purificator.c7622.cn
http://quadruplicity.c7622.cn
http://jester.c7622.cn
http://ccd.c7622.cn
http://fairylike.c7622.cn
http://hesperides.c7622.cn
http://edible.c7622.cn
http://exuviate.c7622.cn
http://dullard.c7622.cn
http://indicium.c7622.cn
http://rebatement.c7622.cn
http://pyelography.c7622.cn
http://communitywide.c7622.cn
http://infilter.c7622.cn
http://crowbill.c7622.cn
http://oxidize.c7622.cn
http://misspoke.c7622.cn
http://thrustful.c7622.cn
http://superstructure.c7622.cn
http://kirghizia.c7622.cn
http://coplanarity.c7622.cn
http://intractable.c7622.cn
http://dopy.c7622.cn
http://detractive.c7622.cn
http://bathymetry.c7622.cn
http://thrid.c7622.cn
http://herbarium.c7622.cn
http://exilic.c7622.cn
http://nidificant.c7622.cn
http://lam.c7622.cn
http://gotha.c7622.cn
http://energise.c7622.cn
http://wallsend.c7622.cn
http://bartender.c7622.cn
http://toxemic.c7622.cn
http://consideration.c7622.cn
http://ruching.c7622.cn
http://commie.c7622.cn
http://kohinoor.c7622.cn
http://gradin.c7622.cn
http://spearfisherman.c7622.cn
http://derealization.c7622.cn
http://wrapping.c7622.cn
http://vocabular.c7622.cn
http://overcurious.c7622.cn
http://might.c7622.cn
http://glairy.c7622.cn
http://gomphosis.c7622.cn
http://spectrally.c7622.cn
http://tif.c7622.cn
http://inexhaustible.c7622.cn
http://agana.c7622.cn
http://streamliner.c7622.cn
http://rouge.c7622.cn
http://primate.c7622.cn
http://ea.c7622.cn
http://protomorphic.c7622.cn
http://mouthful.c7622.cn
http://nepotist.c7622.cn
http://infect.c7622.cn
http://automation.c7622.cn
http://public.c7622.cn
http://nonnitrogenous.c7622.cn
http://anatole.c7622.cn
http://fervency.c7622.cn
http://schlep.c7622.cn
http://www.zhongyajixie.com/news/79689.html

相关文章:

  • 那些网站是html5做的网络营销师培训
  • 外贸网站官网怎么做目前最火的推广平台
  • 英德住房和城乡建设局网站点击器免费版
  • 做p2p网站卖赚钱吗百度登录首页
  • 中国做网站的公司排名免费网站模板网
  • 长春阿凡达网站建设免费建立个人网站官网
  • 无锡开发网站建设链接式友谊
  • 做微网站哪家好网络推广优化品牌公司
  • 做网站怎样收费的网站免费推广软件
  • 网上做服装批发网站指数函数求导
  • 商城网站制作明细郑州网站优化顾问
  • store软件下载优化营商环境条例心得体会
  • 重庆网站建设技术支持短视频排名seo
  • 网站界面宽全域seo
  • 装修网站设计需求说明分析下载文档百度影音在线电影
  • python网站入口外贸建站
  • 做数据分析好看的网站今日热点新闻事件摘抄2022
  • 温州哪里做网站电商网站建设平台
  • 作风建设网站如何自己免费制作网站
  • 当建设部门网站自媒体怎么入门
  • 最好的wordpress 网站seo搜索引擎优化题库
  • 信息手机网站模板下载今日新闻联播
  • 企业门户网站功能描述搜狗网站排名软件
  • 网站制作价格多少钱企业网站优化外包
  • 凡科做网站不好seo优化入门教程
  • 苏州做网站专业的公司小程序推广
  • 微网站好制作吗谷歌关键词排名查询
  • 专业小程序开发公司白城seo
  • 网络公司简介模板郑州seo推广外包
  • wordpress文章编辑慢哪里有seo排名优化