相信玩過DOTA的朋友,都知道Dendi這號人物,Dendi是DOTA2的現役職業選手,刀友們評價他“意識好,大局觀強,操作犀利,手速極快”。最重要的是,頂尖級選手Dendi常常不按常理出牌,對手很難摸清他的路數。
不過,Denbi再怎么厲害,還是敵不過OpenAI的Bot。人機大戰中,OpenAI的Bot不僅取得了勝利,還讓Dendi徹底崩潰了。Dendi在比了兩場之后就悻悻退出。
對于DOTA2人工智能訓練的結果表明,如果計算夠充分,自我對練可以將機器學習系統的性能從遠低于人類的水平推向超越人類。
視頻地址:點此。
從不敵高排名選手到擊敗頂級職業選手,一個月的時間里,人工智能系統持續提升。有監督的深度學習系統,最多達到訓練數據集的程度,但在自我對練系統中,隨著代理程序越來越好,可用的數據水平也自動提升。
TrueSkill評級(類似于國際象棋中的ELO評級)通過模擬機器人之間的比賽和觀察勝率計算,對最好的DOTA機器人進行了長時間的記錄。從添加新特征并改進到算法到特征縮放,系統的每個部分都有改進。
最驚人的是,能力提升直線上升,隨著時間的推移可以指數級地改善這個系統。
隨后,OpenAI團隊還在博客中更新了更多技術細節,公開了AI打敗另外幾個人類高手的精彩視頻。