`
字母哥
  • 浏览: 69032 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

spark参数设置

 
阅读更多
//設置sparkconf參數
    val sparkConf = new SparkConf() //.setAppName("DirectKafka").set("spark.task.maxFailures", "1")
    sparkConf.set("spark.rpc.askTimeout", "1200") //设置20分钟
    //spark.network.timeout
    sparkConf.set("spark.network.timeout", "1200")
    //spark.core.connection.ack.wait.timeout
    sparkConf.set("spark.core.connection.ack.wait.timeout", "1200")
    sparkConf.set("spark.core.connection.auth.wait.timeout", "1200")
    //spark.yarn.max.executor.failures
    sparkConf.set("spark.yarn.max.executor.failures", "300")
    //spark.akka.timeout
    sparkConf.set("spark.akka.timeout", "1200")
    //spark.rpc.lookupTimeout
    sparkConf.set("spark.rpc.lookupTimeout", "1200")

    //confs.set("spark.driver.memory", "5g")
    sparkConf.set("spark.speculation", "true")
    sparkConf.set("spark.shuffle.consolidateFiles", "true")

    sparkConf.set("spark.rdd.compress", "true")
    sparkConf.set("spark.storage.memoryFraction", "1")
    sparkConf.set("spark.core.connection.ack.wait.timeout", "6000")
    sparkConf.set("spark.akka.frameSize", "50")


    sparkConf.set("dfs.client.slow.io.warning.threshold.ms", "100000")
    sparkConf.set("yarn.resourcemanager.connect.max-wait.ms", Integer.MAX_VALUE.toString())
    sparkConf.set("mapred.task.timeout", "1800000")
    sparkConf.set("dfs.socket.timeout", "6000000")
分享到:
评论

相关推荐

    learn-pyspark

    用于将各种Spark参数设置为键值对。 pyspark.SparkContext pyspark.SparkContext 类提供了应用与 Spark 交互的主入口点,表示应用与 Spark 集群的连接,基于这个连接,应用可以在该集群上创建 RDD 和 广播变量 ...

    spark调优介绍

    spark开发代码调优、资源参数设置优化、数据倾斜调优、shuffle调优

    Spark 2.0.2 Spark 2.2 中文文档 本资源为网页,不是PDF

    ML Tuning: model selection and hyperparameter tuning(ML调优:模型选择和超参数调整) Advanced topics(高级主题) MLlib:基于RDD的API Data Types - RDD-based API(数据类型) Basic Statistics - RDD-...

    Spark性能优化:资源调优篇

    Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些参数,最后就只能胡乱设置,甚至压根儿不设置。资源参数设置的不合理,可能会...

    trace-analysis:分析Spark性能的脚本

    为了使用这些工具,您首先需要通过将Spark配置参数spark.eventLog.enabled为true ,将Spark配置为在作业运行时记录性能数据。 此配置参数使Spark主数据库将包含有关每个已完成任务的信息的日志写入主数据库中的文件...

    apache-spark-benchmark:Apache Spark 框架的测试基准

    项目设置 下面列出并简要说明了项目的一般配置参数。 全局配置属性。 这些配置参数是通用的,会影响项目中开发的所有测试。 apache.benchmark.config.global.master :我们想要运行基准的模式。 如果我们想要在...

    spark-hpc:通过 PBS 批处理系统在 Linux 集群上运行 SPARK 应用程序

    发展设置开发环境使用定义如何设置特定环境的文件作为 spark-hpc 根目录中的参数set-dev-env.sh 。 对于CSIRO谝整群抽样的环境定义文件中的可用env目录。 例如: source set-dev-env.sh env/bragg_1.8_1.1.0环境定义...

    基于Scala与Spark的数字仓库推荐系统源码

    - Properties配置文件:2个,设置系统参数和属性。 - Gitignore文件:1个,定义版本控制的忽略项。 - LICENSE文件:1个,明确项目许可协议。 - Markdown文档:1个,包含项目说明和操作指南。 - PNG图像文件:1个,...

    Spark三种属性配置方式详解

    随着Spark项目的逐渐成熟, 越来越多的可配置参数被添加到Spark中来。在Spark中提供了三个地方用于配置:  1、Spark properties:这个可以控制应用程序的绝大部分属性。并且可以通过 SparkConf对象或者Java 系统...

    邮电学院Scala大数据实时处理——基于Lambda架构的Spark源码

    - 配置文件(.xml):10个,用于配置系统的各种参数和环境设置。 - Scala脚本文件(.scala):5个,实现了具体的Spark数据处理逻辑。 - 属性文件(.properties):4个,存储了项目相关的配置属性。 - 文档文件(.doc...

    基于Django2.2+MySQL+spark的在线电影推荐系统设计与实现.zip

    注意需要使用`pip3 install distance`安装依赖,并将MySQL账号密码的参数设置正确。 到这里我们已经计算好了`movies_movieinfo`表和`movies_moviesimilar`表,主页已经能显示。 ## 算法说明 本项目计算两张电影...

    java8看不到源码-docker-apache-spark:docker-apache-spark

    java8 看不到源码Apache Spark 作为 Docker 容器 在docker-compose.yml您可以看到在主从模式下使用此图像的示例。 本图支持Java8和Python3的使用 ...配置参数都可以通过简单的环境变量设置。 用它!

    Spark MLlib协同过滤电影推荐系统Scala源码

    - XML配置:12个,用于配置系统设置和参数; - 地图数据:4个map文件,可能用于数据可视化或地理信息处理; - 数据格式文件:csv文件3个,json文件3个,用于数据交换和存储。 项目核心功能:基于Spark MLlib强大的...

    java8看不到源码-Spark-Cassandra-Collabfiltering:基于Cassandra中的数据在Spark上与MLLib

    提供数据,并且有一个合成的训练/验证集以及随附的电子表格,可让您调整参数。 以下是如何让它工作: 设置(在 Ubuntu 14.04 上测试): 安装 JDK Java8。 sudo apt-get install oracle-java8-installer 得到 。 为 ...

    Schedulis安装文档.pdf

    Schedulis 是一个基于 LinkedIn 的开源项目 Azkaban 开发的工作流任务调度系统。该调度系统具备高性能,高可用(去中心化多调度中心和多执行器)和多租户资源...提供多种类型的参数设置,动态全局变量和简单易用的 UI。

    Scriptis:Scriptis用于交互式数据分析,包括脚本开发(SQL,Pyspark,HiveQL),任务提交(Spark,Hive),UDF,功能,资源管理和智能诊断

    控制台:引擎参数,任务/引擎管理和资源隔离/显示的自定义设置。快速开始阅读快速入门与类似调度系统的比较文件资料社区如果您希望立即得到答复,请向我们提出问题,或通过微信和QQ扫描以下QR码加入我们的小组:...

    逸雨清风读秀批量下载 V2.4.5

    5、完成后选择合成PDF直接点开始转换(转换参数已经设置好 如果想按照自己意愿修改可选择参数设置)。 批量下载软件注意事项: 1、如果程序启动不成功,打开任务管理器的进程结束“逸雨清风读秀”进程后重新打开。 ...

    ansible-mesos-spark

    此角色的可设置变量的描述应放在此处,包括 defaults/main.yml、vars/main.yml 中的任何变量,以及可以/应该通过角色参数设置的任何变量。 从其他角色和/或全局范围(即主机变量、组变量等)读取的任何变量也应在...

    hadoop2.2.0部署

    4.4 配置spark的启动参数 21 4.5 启动并验证spark是否配置 21 5 搭建zookeeper集群 23 5.1 下载解压 23 5.2 参数配置 23 5.2.1 23 5.2.2 23 5.2.3 24 5.2.4 24 5.2.5 24 5.2.6 启动验证 24 6 KAFKA安装 25 6.1 下载 ...

Global site tag (gtag.js) - Google Analytics