欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 国际 > pyspark测试样例

pyspark测试样例

2025/5/20 19:39:11 来源:https://blog.csdn.net/weixin_51473488/article/details/148063340  浏览:    关键词:pyspark测试样例

from pyspark.sql import SparkSession
from pyspark.sql.functions import col, lit, concat

创建 SparkSession

spark = SparkSession.builder.appName(“SparkSQLExample”).getOrCreate()

创建 DataFrame(可以是从 CSV、JSON 等文件读取)

data = [(“Alice”, 586240, 177)] # 注意这里逗号使用的是英文逗号
columns = [“name”, “lac”, “ci”]

df = spark.createDataFrame(data, columns)

创建 CGI 列

df = df.withColumn(
“cgi”,
concat(
lit(“3-”),
(col(“lac”).cast(“integer”) * 256 + col(“ci”).cast(“integer”)).cast(“string”)
)
)

显示结果

df.show()

df = df.withColumn(
“cgi”,
concat(
lit(“3-”),
(col(“lac”).cast(“int”) * 256 + col(“ci”).cast(“int”)).cast(“string”)
)
)

显示结果

df.show()

停止 SparkSession

spark.stop()

样例2:

from pyspark.sql import SparkSession
from pyspark.sql.functions import col, lit, concatspark = SparkSession.builder.appName("SparkSQLExample").getOrCreate()data = [("Alice", 586240, 177)]
columns = ["name", "lac", "ci"]
df = spark.createDataFrame(data, columns)
df = df.withColumn("cgi", concat(lit("3-"), (col("lac").cast("integer") * 256 + col("ci").cast("integer")).cast("string")))
df.show()df = df.withColumn("cgi", concat(lit("3-"), (col("lac").cast("int") * 256 + col("ci").cast("int")).cast("string"))
)# 显示结果
df.show()# 停止 SparkSession
spark.stop()

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词