吃雞、捉迷藏都難不倒！Deepmind推出最新泛用型遊戲AI「XLand」

2021-07-29 03:22:47

#人工智慧AI技術#吃雞、捉迷藏都難不倒它！Deepmind推出最新泛用型遊戲 AI「XLand」

XLand特殊在於能在多人遊戲中建立 3D第一人稱化身，通過第一人稱視角去感知遊戲中環境，並且不斷嘗試、碰撞遊戲規則，從中累積龐大資料來訓練自己完成遊戲目標。

還記得 AlphaGo圍棋下贏柯潔、李世乭的震撼時刻嗎？從 AlphaGo之後，Google母公司 Alphabet旗下的英國 AI企業Deepmind一直在通過強化學習（Reinforcement learning，RL）技術挑戰各種遊戲，有星海爭霸 2的AlphaStar、能通學西洋棋、將棋、圍棋的AlphaZero、MuZero技術上也越往「無監督學習」的方向走去。

但最近他們則把觸角放到更廣泛的領域，推出泛用度極高、可以零樣本，而且不需要事先知道規則的通用型新遊戲學習 AI：XLand。

我們知道機器學習（Machine Learning，ML）、RL都需要足夠的資料來訓練模型，反過來說只要資料不夠，RL學習的成效就不好。之前 AlphaGo Zero能震撼世人不只是它能下贏世界棋王柯潔，更重要的是它能不需要任何人類資料，就能從零開始自我學習、自我對戰。

而今天的主角XLand的特殊點在於，它能在多人遊戲環境中建立一個 3D的第一人稱化身，這個化身會通過第一人稱視角去感知遊戲中環境，並且不斷嘗試、碰撞遊戲規則，從中累積龐大資料來訓練自己完成遊戲目標。要舉例的話，AlphaGo Zero化身的只是「下棋的那隻手」，但XLand是把整個人都模擬出來了！

目前Deepmind讓XLand去玩奪旗、捉迷藏或 King of the Hill等遊戲，Deepmind官方說明，XLand只要平均訓練五個世代之後，那個 AI化身的遊戲表現就能有飛躍式的進步。Deepmind通過動作特徵發現這些 AI每次訓練都能幫助理解自己動作的基本原理、時間條件與遊戲規則。Deepmind還表示在吃雞型遊戲中，XLand的 AI化身甚至可以彼此間展現出很好的合作行為。

Deepmind說明XLand訓練出來的模型若再加上些許的監督式學習進行微調，其原理類似於OpenAI的 Text-KI GPT-3可以針對某些特定文字任務進行微調一樣，XLand再經過約 30分鐘或多 1億次的再訓練後，AI化身完成任務的成效就能再增加 340%，並且還具有解決先前無法成功任務的能力。

從 AlphaGo走到現在XLand，Deepmind展示了無監督式機器學習的高度潛力，也向世界證明未來訓練 AI的成本跟門檻將會越來越低、越來越普羅。

科技改變世界，知識改變命運！歡迎點贊、關注「新千萬個為什麼」，第一時間瞭解電腦、手機、相機、數碼、3C等科技資訊！

吃雞、捉迷藏都難不倒！Deepmind推出最新泛用型遊戲AI「XLand」

熱門文章