🌀 技术人生
凡事有交代,件件有着落,事事有回音
Spark集群安装搭建

1.下载Spark

Spark是一个独立的内存计算框架,如果不考虑存储的话,可以完全独立运行,因此这里就只安装Spark集群

Spark下载地址: http://spark.apache.org/downloads.html

选择好Spark和Hadoop的版本之后就可以下载了,从2.0版本开始,Spark默认使用Scala2.11

2.上传解压

将Spark的压缩包上传到集群的某一台机器上,然后解压缩

3.进行Spark的配置文件的配置

进入到Spark的目录下 cd conf mv spark-env.sh.template spark-env.sh vi spark-env.sh

在该配置文件中添加如下配置

export JAVA_HOME=你的jdk所在目录

配置slaves文件

mv slaves.template slaves vi slaves

在slaves中添加你的Spark集群子节点机器的主机名或者ip

4.将配置好的Spark传输到集群的其他机器上

使用scp命令,如果集群机器特别多的话,可以使用shell编程来循环自动传输,这里不在详细说明

5.启动Spark

进入到Spark的主目录下 sbin/start-all.sh

使用jps命令可以看出,该Spark集群有一个Master,三个Work

Spark集群的WEBUI界面: Master所在的主机ip:8080


最后修改于 2018-10-08

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。