写spark程序数据计算（数据库的计算，求和，汇总之类的）连接mysql数据库，写入计算结果

2025/11/30 12:43:00 来源：https://blog.csdn.net/2301_80936715/article/details/148049984 浏览: 次关键词：写spark程序数据计算（数据库的计算，求和，汇总之类的）连接mysql数据库，写入计算结果

1. 添加依赖

在项目的 `pom.xml`（Maven）中添加以下依赖：

```xml

<groupId>org.apache.spark</groupId>

<artifactId>spark-sql_2.12</artifactId>

</dependency>

<groupId>mysql</groupId>

<artifactId>mysql-connector-java</artifactId>

</dependency>

代码

import org.apache.spark.sql.{SparkSession, SaveMode}

object SparkMySQLDemo {
def main(args: Array[String]): Unit = {
// 创建 SparkSession
val spark = SparkSession.builder()
.appName("SparkMySQLDemo")
.master("local[*]") // 生产环境需改为集群模式，如 yarn
.config("spark.sql.shuffle.partitions", "5") // 优化分区数
.getOrCreate()

// 设置 MySQL 连接参数
val jdbcUrl = "jdbc:mysql://localhost:3306/your_database"
val jdbcUsername = "your_username"
val jdbcPassword = "your_password"

try {
// 从 MySQL 读取数据
val df = spark.read
.format("jdbc")
.option("url", jdbcUrl)
.option("dbtable", "source_table") // 要读取的表名
.option("user", jdbcUsername)
.option("password", jdbcPassword)
.load()

// 执行计算（示例：按 category 分组求和）
val resultDF = df.groupBy("category")
.agg(
sum("amount").alias("total_amount"),
count("*").alias("record_count")
)

// 打印计算结果（调试用）
resultDF.show()

// 将结果写入 MySQL
resultDF.write
.format("jdbc")
.option("url", jdbcUrl)
.option("dbtable", "result_table") // 目标表名
.option("user", jdbcUsername)
.option("password", jdbcPassword)
.mode(SaveMode.Append) // 写入模式：覆盖/追加
.save()

println("数据写入 MySQL 成功！")
} catch {
case e: Exception => e.printStackTrace()
} finally {
spark.stop()
}
}
}

写spark程序数据计算（数据库的计算，求和，汇总之类的）连接mysql数据库，写入计算结果

相关资讯

热文排行

最新新闻

推荐新闻

热搜词

写spark程序数据计算（ 数据库的计算，求和，汇总之类的）连接mysql数据库，写入计算结果

相关资讯

热文排行

最新新闻

推荐新闻

热搜词

写spark程序数据计算（数据库的计算，求和，汇总之类的）连接mysql数据库，写入计算结果