首頁 > 軟體

linux下安裝Hadoop的詳細教學

2023-03-31 06:02:33

一:安裝JDK

1.執行以下命令,下載JDK1.8安裝包。

wget --no-check-certificate https://repo.huaweicloud.com/java/jdk/8u151-b12/jdk-8u151-linux-x64.tar.gz

2.執行以下命令,解壓下載的JDK1.8安裝包。

tar -zxvf jdk-8u151-linux-x64.tar.gz

3.移動並重新命名JDK包。

mv jdk1.8.0_151/ /usr/java8

4.設定Java環境變數。

echo 'export JAVA_HOME=/usr/java8' >> /etc/profile
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profile
source /etc/profile

5.檢視Java是否成功安裝。

java -version

二:安裝Hadoop

注:下載Hadoop安裝包可以選擇華為源(速度中等,可以接受,重點是版本全)、清華源(3.0.0以上版本下載速度太慢,版本也少)、北京外國語大學源(下載速度特快,但是版本比較少)——本人親測

1. 執行以下命令,下載Hadoop安裝包。

wget --no-check-certificate https://repo.huaweicloud.com/apache/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gz

2. 執行以下命令,解壓Hadoop安裝包至/opt/hadoop。

tar -zxvf hadoop-3.1.3.tar.gz -C /opt/
mv /opt/hadoop-3.1.3 /opt/hadoop

3. 執行以下命令,設定Hadoop環境變數。

echo 'export HADOOP_HOME=/opt/hadoop/' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/bin' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/sbin' >> /etc/profile
source /etc/profile    

4. 執行以下命令,修改組態檔yarn-env.sh和hadoop-env.sh。

echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/yarn-env.sh
echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/hadoop-env.sh

5. 執行以下命令,測試Hadoop是否安裝成功。

hadoop version

如果返回版本資訊,則表示安裝成功。

三:設定Hadoop

1. 修改Hadoop組態檔 core-site.xml。

a. 執行以下命令開始進入編輯頁面。

vim /opt/hadoop/etc/hadoop/core-site.xml

b. 輸入i進入編輯模式。c. 在<configuration></configuration>節點內插入如下內容。

 <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/opt/hadoop/tmp</value>
        <description>location to store temporary files</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>

d. 按Esc鍵退出編輯模式,輸入:wq儲存退出。

2. 修改Hadoop組態檔 hdfs-site.xml。

a. 執行以下命令開始進入編輯頁面。

vim /opt/hadoop/etc/hadoop/hdfs-site.xml

b. 輸入i進入編輯模式。c. 在<configuration></configuration>節點內插入如下內容。

 <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/data</value>
    </property>

d. 按Esc鍵退出編輯模式,輸入:wq儲存退出。

四:設定SSH免密登入

1. 執行以下命令,建立公鑰和私鑰。

ssh-keygen -t rsa

2. 執行以下命令,將公鑰新增到authorized_keys檔案中。

cd ~
cd .ssh
cat id_rsa.pub >> authorized_keys

若報錯,執行下面操作後重新執行上面兩句命令;若沒有報錯直接進入第五步:

參考 解決hadoop啟動報錯ERROR: Attempting to operate on hdfs namenode as root的方法

輸入如下命令,在環境變數中新增下面的設定

vi /etc/profile

然後向裡面加入如下的內容

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

輸入如下命令使改動生效

source /etc/profile

五:啟動Hadoop

1.

執行以下命令,初始化namenode 。

hadoop namenode -format

2.

依次執行以下命令,啟動Hadoop。

start-dfs.sh

若有選擇Y/N的,選擇Y;其他直接回車

start-yarn.sh

3.

啟動成功後,執行以下命令,檢視已成功啟動的程序。

jps

正常會有6個程序;
若缺了DataNode程序,參考jps命令檢視DataNode程序不見了(hadoop3.0親測可用)

4.

開啟瀏覽器存取http://<ECS公網地址>:8088和http://<ECS公網地址>:50070,顯示如下介面則表示Hadoop偽分散式環境搭建完成。

到此這篇關於linux下安裝Hadoop的詳細教學的文章就介紹到這了,更多相關linux安裝Hadoop內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com