<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
在生產環境中,叢集節點磁碟大小不同,其使用率也會不同,HDFS雖有均衡策略,但也會有資料不平衡的情況,有些節點磁碟就會被打滿,然後這個節點就不健康了(Unhealthy Nodes),Yarn的磁碟閾值檢查(yarn.nodemanager.disk-health-checker.min-healthy-disks),預設是90%,超過這個值就會不健康,叢集有個節點不健康,就會導致任務執行緩慢,之後任務再擠壓,Yarn資源被集中佔用,最終影響上層服務。
磁碟空間不足,待擴容,可動態增刪磁碟
yarn資源不足,待優化,可動態調整
本篇內容只新增新磁碟,yarn資源優化我們在另一篇文章再專門詳解。
DataNode Hot Swap Drive
Datanode supports hot swappable drives. The user can add or replace HDFS data volumes without shutting down the DataNode. The following briefly describes the typical hot swapping drive procedure:
If there are new storage directories, the user should format them and mount them appropriately.
The user updates the DataNode configuration
dfs.datanode.data.dir
to reflect the data volume directories that will be actively in use.The user runs
dfsadmin -reconfig datanode HOST:PORT start
to start the reconfiguration process. The user can usedfsadmin -reconfig datanode HOST:PORT status
to query the running status of the reconfiguration task.Once the reconfiguration task has completed, the user can safely
umount
the removed data volume directories and physically remove the disks.
經過谷歌翻譯如下:
DataNode 熱插拔驅動器
Datanode 支援熱插拔驅動器。使用者可以在不關閉 DataNode 的情況下新增或替換 HDFS 資料卷。下面簡要介紹典型的熱插拔驅動器過程:
如果有新的儲存目錄,使用者應該格式化它們並適當地掛載它們。
使用者更新 DataNode 設定
dfs.datanode.data.dir
以反映將被積極使用的資料卷目錄。使用者執行
dfsadmin -reconfig datanode HOST:PORT start
來啟動重新設定過程。使用者可以使用dfsadmin -reconfig datanode HOST:PORT status
查詢重設定任務的執行狀態。重新設定任務完成後,使用者可以安全地解除安裝已移除的資料卷目錄並物理移除磁碟。
我們先說新增新的磁碟,大意就是不需要重啟任何節點,在需要新增磁碟的節點上,新增好磁碟,這個需要運維操作,就是掛載一個新目錄,檔案中是說要設定DataNode的目錄,這裡我們建議加上NameNode的目錄dfs.namenode.name.dir
,然後再執行一個使設定生效的命令,最後檢視設定狀態。
這裡假設已有叢集,需要加磁碟的節點為node2。運維也已經幫我們掛載好磁碟,新磁碟目錄為/data2
。
在node2上新增新目錄,資料目錄和後設資料目錄
mkdir -p /data2/soft/hadoop/tmp/dfs/data
mkdir -p /data2/soft/hadoop/tmp/dfs/name
修改節點node2的組態檔hdfs-site.xml,主要兩個屬性
修改前
<!--指定hdfs中namenode的儲存位置--> <property> <name>dfs.namenode.name.dir</name> <value>/data/soft/hadoop/tmp/dfs/name</value> </property> <!--指定hdfs中datanode的儲存位置--> <property> <name>dfs.datanode.data.dir</name> <value>/data/soft/hadoop/tmp/dfs/data</value> </property>
修改後
<!--指定hdfs中namenode的儲存位置--> <property> <name>dfs.namenode.name.dir</name> <value>/data/soft/hadoop/tmp/dfs/name,/data2/soft/hadoop/tmp/dfs/name</value> </property> <!--指定hdfs中datanode的儲存位置--> <property> <name>dfs.datanode.data.dir</name> <value>/data/soft/hadoop/tmp/dfs/data,/data2/soft/hadoop/tmp/dfs/data</value> </property>
重新設定DataNode的設定,使設定生效。
hdfs dfsadmin -reconfig datanode node2:50020 start
hdfs dfsadmin -reconfig datanode node2:50020 status
HDFS資料本身並不總是均勻的放置在DataNode中,在新增新磁碟後,我們需要重新平衡下資料,HDFS為我們提供了一個工具,可以分析資料塊放的位置和跨 DataNode 重新平衡資料:balancer
hdfs balancer [-threshold <threshold>]:磁碟容量百分百,判斷叢集是否平衡的目標引數,每一個 datanode 儲存使用率和叢集總儲存使用率的差值都應該小於這個閥值,越小越平衡,預設10,越大平衡越快。 [-policy <policy>]:datanode(預設):如果每個資料節點都是平衡的,則叢集是平衡的。blockpool:如果每個資料節點中的每個塊池都是平衡的,則叢集是平衡的。 [-exclude [-f <hosts-file> | <comma-separated list of hosts>]]:將指定的資料節點排除在平衡器的平衡之外。 [-include [-f <hosts-file> | <comma-separated list of hosts>]]:僅包括要由平衡器平衡的指定資料節點。 [-idleiterations <idleiterations>]:rebalanecing server啟動的執行緒數,預設5。
在平衡時受頻寬影響,每個資料節點每秒使用的最大位元組數是有限的,所以我們先臨時設定這個值,此值會覆蓋hdfs-site.xml中dfs.datanode.balance.bandwidthPerSec
的值,預設是1M,本操作命令不會持久,命令如下:
hdfs dfsadmin -setBalancerBandwidth 104857600
其他值:1024*1024=1M(1048576),52428800=50M,104857600=100M
本次執行平衡命令,磁碟平衡目標數為20 nohup hdfs balancer -threshold 20 > balancer.log &
平衡所有節點 nohup hdfs balancer > balancer.log &
平衡指定節點,磁碟平衡目標數為10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 > balancer.log &
平衡指定節點,磁碟平衡目標數,啟動執行緒數為10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 -idleiterations 10 > balancer.log &
注(可選):一般在平衡時,可以先停止儲存比較高的節點上的NodeManager,這樣在該節點上就不會受本地NodeManager落資料到本地,使得本地儲存迅速增加的影響。
yarn-daemon.sh stop nodemanager
yarn-daemon.sh start nodemanager
更多關於HDFS免重啟掛載新磁碟的文章請檢視下面的相關連結
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45