新时时彩号码走势图|新疆新时时彩往期开奖
| 加入桌面
 
 
當前位置: 江門企業網 » 資訊 » 市場行情 » 德撲AI明日挑戰華人戰隊 李開復:人類還有10%的獲勝機會

德撲AI明日挑戰華人戰隊 李開復:人類還有10%的獲勝機會

放大字體  縮小字體 發布日期:2017-04-05  來源:江門企業網  瀏覽次數:1

  但是,這或許是人類最后一次戰勝人工智能的機會了。

  AlphaGo戰勝了人類圍棋國手。今年1月,AI程序擊敗了德撲人類頂級職業玩家。面對人工智能,人類還有多少次可以戰勝的機會?

  明天,亞洲的頂尖德撲牌手將再次迎戰人工智能。這次出戰的人工智能“冷撲大師”,是基于卡內基梅隆大學開發的Libratus,就是在1月在美國賓夕法尼亞,擊敗了四名頂尖人類高手,一舉獲得了20萬美元將近和177萬美元籌碼的德州撲克人工智能系統。

  它將面對的是,是華人牌手“龍之隊”,由2016年世界德州撲克大賽WSOP金手鏈冠軍得主、常春藤資本合伙人杜悅領軍,戰隊成員由許朝軍、張淮、童舟、朱亞希、王天建六位撲克玩家圈內熟知的高手組成。這次比賽由創新工場、海南生態軟件園聯合主辦。

  “勝率大約有10%。”杜悅在出征前坦承,“我希望中國龍之隊是最后一支能夠戰勝人工智能的團隊。”

  “如果人類還有戰勝AI的可能,也許就是這次。”創新工場CEO李開復說。“當下次AlphaGo對戰柯潔,我認為,人類的勝出概率,基本為零。”

  這次賽事,將在海南進行5天,長達45小時。獲勝一方,將獲得200萬元的獎金。而當人類面對機器已然勝算逐步下降的今天,這場人機對戰,又將代表什么樣的意義?

  “不完美信息”游戲

  創新工場之所以參與主辦這一賽事,或許與李開復的“人機對弈”情結息息相關。1988年,李開復在母校卡內基梅隆大學開發了“奧賽羅”,成為第一個擊敗黑白棋世界冠軍的人機對弈系統。而這次,他不僅為活動牽線,更為Libratus專門起了一個中文名“冷撲大師”。

  2016年,卡耐基梅隆大學的Tuomas Sandholm教授曾領導開發了一個打撲克的程序Claudico,但是在一場面對數位高手的比賽中慘敗。這也是Libratus的前身。2017年,Sandholm 教授聯同Noam Brown博士開發完成了Libratus。

  德撲和AlphaGo所擅長的圍棋不同。此前的20年里,被人工智能所攻克的圍棋、國際象棋和西洋雙陸,都是“完美信息”游戲。也即是,所有玩家在游戲中,能夠獲得公開和對稱的確定信息。游戲中需要作出的決策點的數量,決定了機器的計算量。

  而與之相比,德撲則是“不完美信息”游戲。其中包含了更多的隱藏信息,每個玩家掌握的信息都是不對稱的,他只能看到自己的牌,卻不知道對手的牌,需要根據直覺推測對手手牌,選擇下注和放棄,并判斷對手的打法,想得到理想化的戰略,是非常困難的。因此,“不完整信息”博弈,就成為難以攻克的計算機難題。

  冷撲大師Libratus,基于在匹茲堡超級計算中心大約1500萬核心小時的計算,用算法分析德撲規則,預測所有步驟的勝率,來進行自己的下一步。和AlphaGo用大量棋局做訓練不同,它的策略并非基于專業玩家的經驗,沒有用專業牌局進行神經網絡訓練,而是用隨機生成的牌局(隨機產生公共牌、底池籌碼、玩家拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩家跟牌后的結果)來作為訓練數據。Libratus還采用了博弈論,它通過納什均衡來計算如何應對對手的招數,通過平衡風險和收益,對自身的下一步進行修正,以期達到收益最大化。其程序名Libratus,就是來源于拉丁文“制衡”。

  也因此,德撲被認為是人類博弈心理、智商和情商的高度體現,其中信息具有不透明性和不確定性,可以“詐唬”,甚至還帶有一定的運氣成分。打德撲所需的推理能力和心理戰術,是機器很難模仿的。也正因此,Libratus之前取得的成績,才在人工智能領域引起了巨大關注。

  而在李開復看來,現實中,這種“不完整信息”才是常態。“世界上大部分的決策問題、商業問題,都不是單純靠強力的搜索和人工智能就可以解決的。”

  高“情商”的AI

  “人工智能從AlPhaGo和冷撲大師所提煉出來的想法、技術和先進已經遠遠超過人類。”李開復說。截止到今天,創新工場已經投資了Face++、馭勢科技、小魚兒科技等大量人工智能領域創業公司,而人工智能在垂直領域內的應用,則是李開復最為看重的。他認為,在以下三個前提之下,機器是完全可以替代人類的:

  第一,有海量的數據;

  第二,數據有標準;

  第三,單一領域。

  “我們可以把AlphaGo理解為高‘智商’,但是冷撲大師是高‘情商’的。而且這樣的技術可以在很多商業的領域里面應用,因為大部分人類的信息都不是彼此公開的。”李開復表示,“另外一點就是,冷撲大師并非運用深度學習,而我們會由此認識到,未來會有更多的科學家發明更多的技術,讓AI給人類帶來更多的價值。”他預計,現今這套人工智能撲克程序背后的模型,將適用于需要用到戰略推理和多方談判的場景,從企業談判、商務談判、外交談判、甚至到生活面的房屋買賣談判,十年內都將會部分或全面被人工智能所取代。

  根據賽制,在4月6日-10日巔峰表演賽期間,中國龍之隊的六位牌手每人同時打兩手牌,進行每天上下午兩場共10小時的人機對戰,全程估計長達45小時達到36,000手牌。

  表演賽為求降低發牌中的運氣因素,機器人將采用復式對稱發牌,兩兩成對的牌手其中一人將拿到與配對牌手對打的機器人底牌,因此六名牌手將拆分于兩個房間和冷撲大師對陣,比賽過程中還必須確保配對牌手彼此不能碰面交流。4月10日完賽時,將以人機各自積累的總計分牌數計算成績,決定最終200萬元獎勵花落誰家。

  值得一提的是,這次表演賽,將在海南生態軟件園落地。而海南也將借此啟動人工智能產業基地。據了解,騰訊、樂視、360等1500家企業,也已經在海南生態軟件園落戶。助理總經理唐堯表示,人工智能產業得到了海南省的高度重視和扶持,海南生態軟件園也配套專項政策、政務及服務,積極布局人工智能產業。看來,業界對海南的認知,也在重構。

分享與收藏: 關閉窗口 打印本文 本文關鍵字:
 
推薦圖文
推薦資訊
熱點文章
 
新时时彩号码走势图