set hive.execution.engine=spark;
set spark.app.name=test9999;
set spark.executor.cores=5;
set spark.executor.memory=20G;
set spark.executor.instances=5;
set spark.driver.memory=5G;
set spark.memory.fraction=0.9;
–定义了 Spark 作业中每个 stage 的默认 task 数量。 Spark 官方建议的设置原则是,将spark.default.parallelism 设置为 num-executors * executor-cores 的 2 到 3 倍。
spark.default.parallelism=50;
set hive.merge.sparkfiles=true;
–是否自动转换为mapjoin
set hive.auto.convert.join=true;
–小表的最大文件大小,默认为25000000,即25M
set hive.mapjoin.smalltable.filesize=25000000;
–是否将多个mapjoin合并为一个
set hive.auto.convert.join.noconditionaltask=true;
–多个mapjoin转换为1个时,所有小表的文件大小总和的最大值。
set hive.auto.convert.join.noconditionaltask.size=25000000;
spark on hive 参数
2025/5/15 2:13:25
来源:https://blog.csdn.net/sunxunyong/article/details/144982046
浏览:
次
关键词:spark on hive 参数
版权声明:
本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。
我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com
-
新书速览|纯血鸿蒙HarmonyOS NEXT原生开发之旅
-
WebSocket (连接前验证token)
-
【计算机视觉】Car-Plate-Detection-OpenCV-TesseractOCR:车牌检测与识别
热文排行
- 华为 海思22AP10(SS524)H.265 编解码处理器用户指南
- 数据库物理结构设计
- 基于重要抽样的主动学习不平衡分类方法ALIS
- 《缺失MRI模态下的脑肿瘤分割的潜在相关表示学习》| 文献速递-深度学习肿瘤自动分割
- npm install puppeteer 报错 npm ERR! PUPPETEER_DOWNLOAD_HOST is deprecated解决办法
- 如何在 Mac 上清空硬盘后恢复丢失的数据?
- (2)Django生产环境数据库的切换以及环境配置python-dotenv方案
- 【微信小程序】自定义组件 - 组件的生命周期
- 开源模型时代的 AI 开发革命:Dify 技术深度解析
- 大模型分离架构学习记录