您的位置：首頁(yè) > 智能 >

AI在又一個(gè)游戲中虐哭人類！團(tuán)體游戲紛紛淪陷！

來(lái)源：網(wǎng)易智能 ? 2019-06-04 13:42:16

“奪旗”既是一款兒童在夏令營(yíng)活動(dòng)上常玩的一款游戲，也是《雷神之錘3》(Quake III)和《守望先鋒》(Overwatch)等熱門(mén)游戲的一部分。

不管它作為兒童的夏令營(yíng)游戲還是電子游戲，它都是一項(xiàng)團(tuán)隊(duì)運(yùn)動(dòng)。每一方都守衛(wèi)著一面旗幟，同時(shí)也在計(jì)劃奪取另一方的旗幟并將其帶回基地。贏得比賽需要良好的傳統(tǒng)團(tuán)隊(duì)合作，并且在防守和進(jìn)攻之間取得協(xié)調(diào)平衡。

換句話說(shuō)，“奪旗”這一游戲需要一系列看起來(lái)非常人性化的技能。但倫敦人工智能實(shí)驗(yàn)室的研究人員表示，至少在虛擬世界中，機(jī)器也能掌握這款游戲。

在周四發(fā)表在《科學(xué)》(Science)雜志上的一篇論文中，研究人員的報(bào)告稱，他們?cè)O(shè)計(jì)了一種自動(dòng)虛擬程序，當(dāng)玩家在《雷神之震3》中玩“奪旗”(capture the flag)游戲模式時(shí)，該程序會(huì)表現(xiàn)出類似人類的行為。這些程序能夠與人類玩家組隊(duì)，與人類玩家并肩作戰(zhàn)，從而相應(yīng)地調(diào)整它們的行為。

與谷歌同屬一家母公司的DeepMind實(shí)驗(yàn)室的研究員沃伊切赫·扎爾內(nèi)基(Wojciech Czarnecki)說(shuō)：“這些程序可以適應(yīng)具有任意技能的隊(duì)友。”

通過(guò)數(shù)千小時(shí)的比賽，這些虛擬程序?qū)W會(huì)了非常特殊的技能。比如當(dāng)隊(duì)友快要抓到一面旗子時(shí)，它們會(huì)沖向敵方的大本營(yíng)。正如人類玩家所知道的，當(dāng)對(duì)方的旗幟被帶到自己的基地時(shí)，新的旗幟就會(huì)出現(xiàn)在對(duì)方的基地，等待著玩家們?nèi)Z取。

DeepMind的項(xiàng)目是構(gòu)建人工智能的廣泛努力的一部分，這種人工智能可以玩極其復(fù)雜的三維視頻游戲，包括《雷神之錘3》、《Dota 2》和《星際爭(zhēng)霸2》。許多研究人員認(rèn)為，虛擬領(lǐng)域的成功最終將改進(jìn)現(xiàn)實(shí)世界中的自動(dòng)化系統(tǒng)。

例如，這些技能可以讓倉(cāng)庫(kù)機(jī)器人受益，因?yàn)樗鼈兛梢酝ㄟ^(guò)團(tuán)隊(duì)合作把貨物從一個(gè)地方搬到另一個(gè)地方，或者幫助自動(dòng)駕駛汽車在擁擠的交通中進(jìn)行集體導(dǎo)航。“游戲一直是人工智能的基準(zhǔn)，”位于舊金山的OpenAI實(shí)驗(yàn)室負(fù)責(zé)類似研究的格雷格·布羅克曼(Greg Brockman)說(shuō)。“如果你不能用人工智能解決游戲中的難題，你就不能指望解決任何其他問(wèn)題。”

就算在現(xiàn)在，在像《雷神之錘3》這樣的游戲中建立一個(gè)能夠與人類玩家相匹配的人工智能系統(tǒng)似乎還是不可能的。但在過(guò)去幾年里，DeepMind、OpenAI和其他實(shí)驗(yàn)室取得了重大進(jìn)展，這要?dú)w功于一種名為“強(qiáng)化學(xué)習(xí)”的數(shù)學(xué)技術(shù)，這種技術(shù)允許機(jī)器通過(guò)反復(fù)試驗(yàn)來(lái)學(xué)習(xí)任務(wù)。

通過(guò)一遍又一遍地玩游戲，一個(gè)自動(dòng)化的程序可以學(xué)習(xí)哪些策略能帶來(lái)成功，哪些不能。如果這個(gè)程序在隊(duì)友準(zhǔn)備奪取一面旗子時(shí)向?qū)κ值幕匾苿?dòng)，能夠不斷地贏得更多的分?jǐn)?shù)的話，那么該程序就會(huì)把這種戰(zhàn)術(shù)添加到自己的算法庫(kù)中。

2016年，DeepMind的研究人員使用同樣的基本技術(shù)，建立了一個(gè)系統(tǒng)，讓人工智能可以在圍棋中擊敗世界頂級(jí)棋手。許多專家曾認(rèn)為，考慮到《雷神之錘3》的巨大復(fù)雜性，讓人工智能在這一游戲中擊敗對(duì)手這一目標(biāo)要再過(guò)10年才能實(shí)現(xiàn)。

第一人稱的自主電子游戲要復(fù)雜得多，尤其是當(dāng)它們涉及到隊(duì)友之間的協(xié)調(diào)時(shí)。DeepMind的程序需要通過(guò)玩大約45萬(wàn)回合才能學(xué)會(huì)如何奪取這面旗幟，他們?cè)跀?shù)周的訓(xùn)練中積累了大約人類四年的游戲經(jīng)驗(yàn)。起初，程序們慘敗。但他們逐漸學(xué)會(huì)了游戲的微妙之處，比如當(dāng)隊(duì)友突襲對(duì)手的大本營(yíng)時(shí)，它們知道該如何輔助隊(duì)友。

自從完成這個(gè)項(xiàng)目后，DeepMind的研究人員還設(shè)計(jì)了另外一個(gè)系統(tǒng)，可以打敗一款以太空為背景的戰(zhàn)略游戲《星際爭(zhēng)霸2》(StarCraft II)中的專業(yè)玩家。在OpenAI，研究人員建立了一個(gè)系統(tǒng)，可以控制《Dota2》，這款游戲就像“奪旗”的升級(jí)版。今年4月，一支由5個(gè)虛擬的人工智能程序組成的隊(duì)伍擊敗了一支由5名世界上最優(yōu)秀的人類玩家組成的隊(duì)伍。

去年，有“閃電戰(zhàn)”之稱的職業(yè)Dota 2玩家兼評(píng)論員威廉·李(William Lee)與一種早期版本的人工智能打了一場(chǎng)比賽，這一人工智能程序只能進(jìn)行一對(duì)一的比賽，打不了團(tuán)隊(duì)比賽，因此威廉·李對(duì)此并不感興趣。但隨著這些程序的深入學(xué)習(xí)，威廉·李開(kāi)始慢慢地被這些虛擬的程序所震撼到了。

“我認(rèn)為這臺(tái)機(jī)器不可能打出五人團(tuán)體戰(zhàn)，更不用說(shuō)贏了，”他說(shuō)。“但是我完全驚呆了。”

盡管這類技術(shù)讓許多游戲玩家感到驚訝與佩服，但許多人工智能專家質(zhì)疑它最終能否解決現(xiàn)實(shí)問(wèn)題。專門(mén)研究人工智能的佐治亞理工學(xué)院(Georgia Tech College of Computing)教授馬克·里德?tīng)?Mark Riedl)說(shuō)，DeepMind的虛擬程序?qū)嶋H上并沒(méi)有團(tuán)隊(duì)中的合作，它們只是對(duì)游戲中發(fā)生的事情做出反應(yīng)，而不是像人類玩家那樣彼此交換信息。(即使只是螞蟻也可以通過(guò)交換化學(xué)信號(hào)來(lái)合作。)

雖然結(jié)果看起來(lái)像是團(tuán)隊(duì)合作，但這些程序之所以能夠?qū)崿F(xiàn)這一點(diǎn)，是因?yàn)樗鼈兡軌颡?dú)立地完全理解游戲中所發(fā)生的一切。

“如何定義團(tuán)隊(duì)合作不是我想解決的問(wèn)題，”DeepMind的另一位研究人員馬克斯·加德伯格(Max Jaderberg)說(shuō)。“但只有在依靠隊(duì)友的情況下，才有可能有一位虛擬“玩家”出現(xiàn)在對(duì)手的大本營(yíng)里，伺機(jī)奪取旗幟”

這樣的游戲并不像現(xiàn)實(shí)世界那么復(fù)雜。“三維環(huán)境的設(shè)計(jì)是為了讓導(dǎo)航變得容易，”里德博士說(shuō)。“《雷神之錘》的策略和協(xié)調(diào)很簡(jiǎn)單。”

強(qiáng)化學(xué)習(xí)非常適合這種游戲。在電子游戲中，程序能夠很容易就確定成功的衡量標(biāo)準(zhǔn)——更多的分?jǐn)?shù)。(在“奪旗這一游戲”中，玩家根據(jù)奪旗數(shù)量獲得點(diǎn)數(shù)。)但在現(xiàn)實(shí)世界中，沒(méi)有人記分。研究人員必須用其他方式來(lái)定義成功。

這是可以做到的，至少在簡(jiǎn)單的任務(wù)上是沒(méi)問(wèn)題的。在OpenAI，研究人員已經(jīng)訓(xùn)練了一只機(jī)械手，可以像孩子一樣擺弄字母塊。如果你告訴這只機(jī)械手展示字母A，它就會(huì)拿起字母A的方塊。

在谷歌機(jī)器人實(shí)驗(yàn)室，研究人員已經(jīng)證明，機(jī)器人可以學(xué)會(huì)撿起隨機(jī)的物品，比如乒乓球和塑料香蕉，然后把它們?nèi)拥綆子⒊咄獾睦淅?。這種技術(shù)可以幫助亞馬遜(Amazon)、聯(lián)邦快遞(FedEx)等公司運(yùn)營(yíng)的大型倉(cāng)庫(kù)和配送中心對(duì)物品進(jìn)行分類。如今這些任務(wù)仍然是由人工處理的。

當(dāng)像DeepMind和OpenAI這樣的實(shí)驗(yàn)室處理更大的問(wèn)題時(shí)，他們可能開(kāi)始需要非常大的計(jì)算能力。OpenAI的系統(tǒng)在幾個(gè)月的時(shí)間里(超過(guò)4.5萬(wàn)年的游戲時(shí)間)學(xué)會(huì)了玩《dota2》，但是它開(kāi)始依賴于成千上萬(wàn)的電腦芯片。布羅克曼說(shuō)，僅僅租用所有這些芯片的使用權(quán)就花費(fèi)了實(shí)驗(yàn)室數(shù)百萬(wàn)美元。

DeepMind和OpenAI能夠負(fù)擔(dān)得起所有這些計(jì)算能力所帶來(lái)的資金壓力。OpenAI的資金來(lái)自硅谷的各種巨頭，包括科斯拉風(fēng)投(Khosla Ventures)和科技業(yè)億萬(wàn)富翁里德·霍夫曼(Reid Hoffman)。但卡耐基·梅隆大學(xué)(Carnegie Mellon University)的人工智能研究員戴文德拉·查普勞德(Devendra Chaplot)說(shuō)，學(xué)術(shù)實(shí)驗(yàn)室和其他小型機(jī)構(gòu)做不到這一點(diǎn)。對(duì)一些人來(lái)說(shuō)，他們擔(dān)心一些資金充足的實(shí)驗(yàn)室將主導(dǎo)人工智能的未來(lái)。

但是，即使是大型實(shí)驗(yàn)室也可能沒(méi)有足夠的計(jì)算能力將這些技術(shù)應(yīng)用到復(fù)雜的現(xiàn)實(shí)世界中，這可能需要更強(qiáng)大的人工智能形式，它們可以更快地學(xué)習(xí)。盡管這些人工智能程序現(xiàn)在可以在虛擬世界中贏得勝利，但它們?cè)谙牧顮I(yíng)的空地上(現(xiàn)實(shí)世界)想要戰(zhàn)勝人類還是毫無(wú)希望的——而且在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)都將是如此。

(選自：NYTimes原作者：Cade Metz)

色翁荡息又大又硬又粗又视频软件,人人妻人人爽.,人人妻人人狠人人爽天天综合网,欧美精品亚洲精品日韩已满十八 ,欧美激情猛片xxxⅹ大3

AI在又一個(gè)游戲中虐哭人類！ 團(tuán)體游戲紛紛淪陷！

相關(guān)推薦

AI在又一個(gè)游戲中虐哭人類！團(tuán)體游戲紛紛淪陷！