您好,登錄后才能下訂單哦!
大數據文摘出品
作者:魏子敏、蔣寶尚
半年前,OpenAI Five在Ti8賽事中與人類職業選手大戰DOTA的盛況還歷歷在目,年前,DeepMind AI也要在游戲界搞大事情了。
這次,AI要挑戰的是暴雪的經典游戲——星際爭霸II。
DeepMind今天在twitter上公開發布了“戰帖”,表示要在兩天后當地時間周四下午6點,也就是北京時間周五凌晨2點,直播打星際II。
這不是一次簡單的直播,更像是一場特別的“發布會”,DeepMind想要通過這場比賽,公開展示AI“學到的新戰術”。
本次的將要出戰的AI是由DeepMind和暴雪聯合培養的,經過了“特別的訓練方式”,似乎對這次比賽的勝利很有信心。
比賽將會在星際的Twitch頻道和DeepMind的Youtube頻道同步直播,先給出網址,星際II的玩家們,你們準備好對抗AI了嗎?
Twitch
https://www.twitch.tv/starcraft
YouTube:
https://www.youtube.com/c/deepmind
暴雪:“所有AI都在以幾何速度學習進步”
暴雪在最近的BlizzCon上,總結了自己2018年的工作,并相當低調地發布了“與DeepMind合作正在繼續 ”的更新:
DeepMind一直在努力訓練他們的AI更好地了解星際爭霸II。一旦它開始掌握游戲的基本規則,它開始展示“有趣”的行為,例如立即沖向對手。目前,即時在“瘋狂”難度下的星際爭霸II,AI的成功率已經可以達到50%!
而且它還在學習:“在向它提供了更多真實玩家的游戲回放之后,AI開始執行標準的宏觀策略,以及防御諸如加農炮沖擊等激進戰術。”
暴雪的新年總結
經過三個月的訓練,顯然這只AI取得了不錯的進展,而DeepMind和暴雪都認為現在已經到了將其公諸于眾的時候。
暴雪今天也發布聲明稱,這場比賽將提醒我們,所有AI都在以幾何速度學習。“星際爭霸游戲已經成為人工智能社區的“巨大挑戰”,因為它們是針對諸如規劃,處理不確定性和空間推理等問題的進展基準的完美環境。”
其實早在2016年,Deepmind已經立下Flag要教會AI玩兒星際爭霸II,也已經有包括facebook、阿里巴巴等不少科技公司或者研究機構開拓過“星際”這片競技場,但DeepMind這樣專治人類各種不服的公司正式宣布與暴雪合作,還是讓一票星際玩家大呼“熱血”。 暴雪承諾將持續發布從“星際爭霸II”天梯中收集的數十萬個匿名錄像,這會將訓練變得更加容易。
2017年7月份,DeepMind已經官宣正式與暴雪娛樂合作,共同開發可以在星際爭霸II中與人類玩家對抗的AI,并且發布了SC2LE,一個旨在加速即時戰略游戲當中AI應用的工具集。
這次訓練的AI所采用的數據,很可能是暴雪承諾過的“星際爭霸II”天梯中收集的數十萬個匿名錄像。有了這些數據,相信AI的能力也會有突飛猛進的提升。
后臺回復“星際爭霸”,即可獲得DeepMind相關論文
搞定星際爭霸可能需要十只升級版阿爾法狗
不要以為有了優質數據就能訓練出來超強的AI。其實這并不是一項輕松的任務,因為視頻游戲的復雜性和更多可能性也讓AI戰勝人類要遠比在棋盤游戲上復雜。
星際爭霸和星際爭霸II是史上最大和最成功的游戲之一,它們見證了許多玩家從青蔥歲月到為人父母的20多年。其原始游戲早已被AI和ML研究人員使用,并在每年的AIIDE機器人大賽中進行角逐。
AIIDE機器人大賽:
http://www.cs.mun.ca/~dchurchill/starcraftaicomp/
使用AI在星際爭霸中對戰人類玩家會比圍棋艱難得多,對于AI來說,最大的難點在于,每一場對決都存在大量可能的方式。
據估計,每場對決有101685種可能的配置,為了給大家一個直觀感受,阿爾法狗的配置層是10170。
此外,不同于棋類游戲的輪流依次進行走步,并且擁有決策的時間,在星際爭霸中,玩家會同時出招,且不能看到對方玩家的狀態,也就是說,所有決定需要在“不完整信息”的情況下做出。所有這些都意味著,你不能僅靠邏輯和一些步驟找到贏得對決的最優方式,玩家更需要的是策略和直覺。
PySC2助力AI訓練
星際爭霸II的玩家在同一時間可能有300多種基本行動可以選擇,因此策略集及策略選擇也對AI構成了巨大的挑戰。與此形成鮮明對比的是雅達利游戲,大概只有10種選擇(例如,下,左,右等)。除此之外,星際爭霸中的很多操作是分級的,可以進行修改和擴充,其中很多都需要操作屏幕上的一個點進行。即使一個小84X84的屏幕也會產生大約1億種可能的行動選擇。
之前發布的PySC2可以幫助研究人員利用暴雪自己的工具來解決這些挑戰,并且構建自己的任務和模型。
PySC2環境提供了一個靈活的,易于使用的RL代理游戲界面。在最初的版本中,游戲被分解為‘特征層’,其中的游戲元素,如單元類型、單位的健康度和地圖的可見性彼此隔離,同時保留游戲的核心視覺和空間元素。
之前發布的PySC2還包括一系列的迷你游戲,一種將游戲分解成小模塊的技術,可以用來測試特定任務的代理,比如移動視角、收集礦物碎片或選擇單位。DeepMind希望研究人員可以測試他們的技術,并且開發新的迷你游戲,以供其他研究人員進行使用和評估。
簡單的RL迷你游戲可以讓研究者測試代理在一些特定任務上的表現
訓練過和未訓練過的代理在玩迷你游戲
從棋牌游戲到實時對戰,AI不斷挑戰自己
1997年,國際象棋AI第一次打敗頂尖的人類;2006年,人類最后一次打敗頂尖的國際象棋AI。
在2016年年底,一個名為“Master”的神秘在線圍棋玩家出現在了熱門的亞洲游戲服務器Tygem上。在接下來的幾天里,這個神秘的玩家橫掃世界范圍內的許多一流玩家。
2017年5月,AlphaGo“Master”在對戰世界排名最高的圍棋選手柯潔中屢屢得分。在三場比賽中,人工智能穩操勝券。
2017年12月,DeepMind發布了一個更新版本的系統。這款名為“AlphaZero”的新人工智能可以在短短幾個小時內掌握各種游戲。經過僅僅8個小時的自我訓練,這個系統不僅能打敗AlphaGo Zero的早期版本,而且還可以成為象棋大師和將棋(shogi,又稱日本象棋,一種流行于日本的棋盤游戲)的冠軍。
在拿到棋牌類的王者之后,人工智能向更復雜的實時對戰游戲領域進發。
2018年,OpenAI Five與DOTA2半職業玩家團隊交手,比賽結果是2:1,人類輸掉了比賽。在2017年,比較原始版本的AI在1v1戰斗中就擊敗了人類職業玩家Dendi。
2018年8月份,人工智能在Ti8賽事中與職業玩家交手,比賽結果是兩場比賽,人類玩家守住了DOTA這一高地。其中,第二場與中國玩家交手,在第45分鐘的時候,AI直接認輸。
2018年9月,騰訊AI Lab發布論文稱,他們構建的AI首次在完整的蟲族VS蟲族比賽中擊敗了星際2的內置機器人Bot。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。