Spark集群安装搭建
1.下载Spark
Spark是一个独立的内存计算框架,如果不考虑存储的话,可以完全独立运行,因此这里就只安装Spark集群
Spark下载地址: http://spark.apache.org/downloads.html
选择好Spark和Hadoop的版本之后就可以下载了,从2.0版本开始,Spark默认使用Scala2.11
2.上传解压
将Spark的压缩包上传到集群的某一台机器上,然后解压缩
3.进行Spark的配置文件的配置
进入到Spark的目录下 cd conf mv spark-env.sh.template spark-env.sh vi spark-env.sh
在该配置文件中添加如下配置
export JAVA_HOME=你的jdk所在目录
配置slaves文件
mv slaves.template slaves vi slaves
在slaves中添加你的Spark集群子节点机器的主机名或者ip
4.将配置好的Spark传输到集群的其他机器上
使用scp命令,如果集群机器特别多的话,可以使用shell编程来循环自动传输,这里不在详细说明
5.启动Spark
进入到Spark的主目录下 sbin/start-all.sh
使用jps命令可以看出,该Spark集群有一个Master,三个Work
Spark集群的WEBUI界面: Master所在的主机ip:8080
最后修改于 2018-10-08

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。