本指南詳細(xì)介紹如何在Debian系統(tǒng)上搭建hadoop集成開發(fā)環(huán)境。 以下步驟將引導(dǎo)您完成整個(gè)過程:
第一步:安裝JDK
首先,需要在Debian系統(tǒng)上安裝Java開發(fā)工具包(JDK)。執(zhí)行以下命令:
sudo apt-get update sudo apt-get install -y wget wget -O - https://packages.adoptium.net/artifactory/api/gpg/key/public | sudo tee /etc/apt/keyrings/adoptium.asc echo "deb [signed-by=/etc/apt/keyrings/adoptium.asc] https://mirrors.tuna.tsinghua.edu.cn/Adoptium/deb $(lsb_release -rs) main" | sudo tee /etc/apt/sources.list.d/adoptium.list sudo apt-get update sudo apt-get install -y temurin-8-jdk
第二步:配置Java環(huán)境變量
編輯.bashrc文件,添加以下環(huán)境變量:
export JAVA_HOME=/usr/lib/jvm/temurin-8-jdk-amd64 export PATH=$JAVA_HOME/bin:$PATH
運(yùn)行source ~/.bashrc使配置生效。
第三步:下載并解壓Hadoop
創(chuàng)建目錄并下載Hadoop安裝包:
mkdir -p /root/packages wget -P /root/packages https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-aarch64.tar.gz
解壓到/usr/local目錄:
tar -zxvf /root/packages/hadoop-3.3.6-aarch64.tar.gz -C /usr/local
第四步:配置Hadoop環(huán)境變量
編輯$HADOOP_HOME/etc/hadoop/hadoop-env.sh文件,設(shè)置JAVA_HOME:
export JAVA_HOME=/usr/lib/jvm/temurin-8-jdk-amd64 export HADOOP_HOME=/usr/local/hadoop-3.3.6 export PATH=$HADOOP_HOME/bin:$PATH
第五步:配置Hadoop核心配置文件
編輯$HADOOP_HOME/etc/hadoop/core-site.xml、hdfs-site.xml和mapred-site.xml文件,配置HDFS和mapreduce參數(shù)。 例如,在core-site.xml中配置fs.defaultFS:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration>
(請(qǐng)根據(jù)您的實(shí)際需求調(diào)整其他配置文件)
第六步:格式化NameNode
在Hadoop的主目錄下執(zhí)行以下命令格式化NameNode:
hdfs namenode -format
第七步:?jiǎn)?dòng)Hadoop集群
啟動(dòng)Hadoop集群:
start-dfs.sh start-yarn.sh
第八步:驗(yàn)證安裝
在瀏覽器中訪問http://localhost:9000驗(yàn)證Hadoop是否成功安裝并運(yùn)行。
本指南提供了一個(gè)基本的Hadoop在Debian上的搭建步驟。 您可能需要根據(jù)實(shí)際情況進(jìn)行進(jìn)一步的配置和優(yōu)化。