#人工智慧AI技術#吃雞、捉迷藏都難不倒它!Deepmind推出最新泛用型遊戲 AI「XLand」XLand特殊在於能在多人遊戲中建立 3D第一人稱化身,通過第一人稱視角去感知遊戲中環境,並且不
2021-07-29 03:22:47
#人工智慧AI技術#吃雞、捉迷藏都難不倒它!Deepmind推出最新泛用型遊戲 AI「XLand」
XLand特殊在於能在多人遊戲中建立 3D第一人稱化身,通過第一人稱視角去感知遊戲中環境,並且不斷嘗試、碰撞遊戲規則,從中累積龐大資料來訓練自己完成遊戲目標。
還記得 AlphaGo圍棋下贏柯潔、李世乭的震撼時刻嗎?從 AlphaGo之後,Google母公司 Alphabet旗下的英國 AI企業Deepmind一直在通過強化學習(Reinforcement learning,RL)技術挑戰各種遊戲,有星海爭霸 2的AlphaStar、能通學西洋棋、將棋、圍棋的AlphaZero、MuZero技術上也越往「無監督學習」的方向走去。
但最近他們則把觸角放到更廣泛的領域,推出泛用度極高、可以零樣本,而且不需要事先知道規則的通用型新遊戲學習 AI:XLand。
我們知道機器學習(Machine Learning,ML)、RL都需要足夠的資料來訓練模型,反過來說只要資料不夠,RL學習的成效就不好。之前 AlphaGo Zero能震撼世人不只是它能下贏世界棋王柯潔,更重要的是它能不需要任何人類資料,就能從零開始自我學習、自我對戰。
而今天的主角XLand的特殊點在於,它能在多人遊戲環境中建立一個 3D的第一人稱化身,這個化身會通過第一人稱視角去感知遊戲中環境,並且不斷嘗試、碰撞遊戲規則,從中累積龐大資料來訓練自己完成遊戲目標。要舉例的話,AlphaGo Zero化身的只是「下棋的那隻手」,但XLand是把整個人都模擬出來了!
目前Deepmind讓XLand去玩奪旗、捉迷藏或 King of the Hill等遊戲,Deepmind官方說明,XLand只要平均訓練五個世代之後,那個 AI化身的遊戲表現就能有飛躍式的進步。Deepmind通過動作特徵發現這些 AI每次訓練都能幫助理解自己動作的基本原理、時間條件與遊戲規則。Deepmind還表示在吃雞型遊戲中,XLand的 AI化身甚至可以彼此間展現出很好的合作行為。
Deepmind說明XLand訓練出來的模型若再加上些許的監督式學習進行微調,其原理類似於OpenAI的 Text-KI GPT-3可以針對某些特定文字任務進行微調一樣,XLand再經過約 30分鐘或多 1億次的再訓練後,AI化身完成任務的成效就能再增加 340%,並且還具有解決先前無法成功任務的能力。
從 AlphaGo走到現在XLand,Deepmind展示了無監督式機器學習的高度潛力,也向世界證明未來訓練 AI的成本跟門檻將會越來越低、越來越普羅。
科技改變世界,知識改變命運!歡迎點贊、關注「新千萬個為什麼」,第一時間瞭解電腦、手機、相機、數碼、3C等科技資訊!
相關文章
#人工智慧AI技術#吃雞、捉迷藏都難不倒它!Deepmind推出最新泛用型遊戲 AI「XLand」XLand特殊在於能在多人遊戲中建立 3D第一人稱化身,通過第一人稱視角去感知遊戲中環境,並且不
2021-07-29 03:22:47
榮耀在近日宣佈,旗下智慧手機在中國市場的份額達到了14.6%,位居第三名;雖然榮耀沒有公佈第一和第二的廠商名稱,但從之前的資料不難猜測,這兩個廠商大概率是vivo和OPPO;今年第一季
2021-07-29 03:22:41
開篇問大家一句,你們願意花時間去搶購手機嗎?作為三次搶購Mate40 Pro無功而返的人,筆者認為搶手機還是蠻無奈的一件事,手機又不是什麼稀缺性很高的產品,價格也都是公開透明的,應該
2021-07-29 03:22:33
作為一個資深的玩機黨,近日有朋友問我:2021年釋出了這麼多安卓機型,哪一款最讓你佩服?說實話,像小米11、vivi X60 Pro+、三星S21 Ultra亮相時,都讓人眼前一亮,不過到目前為止我只看
2021-07-29 03:22:27
去年,OPPO 帶來了 Reno5 Pro+ 藝術家限定版。這款產品採用了獨特的電致變色技術,所以後蓋可以在藍色與銀色之間切換。結合手機背部的漫畫風格,OPPO Reno5 Pro+ 藝術家限定版不
2021-07-29 03:22:02
華為nova8SE活力版搭載的麒麟710A處理器,由中芯國際14nm工藝製造,整合四核A732.0GHz、四核A531.7GHzCPU,整合Mali-G51MP41GHzGPU,整合LTECat.124G基帶,支援雙卡雙待。麒麟710晶片
2021-07-29 03:21:57