阿法狗退休后,“阿法星”又在《星际争霸》中比肩顶尖人类玩家
阿法狗退休后,“阿法星”又在《星际争霸》中比肩顶尖人类玩家
“阿法狗”是个令人印象深刻的名字,因为它是目前为止AI领域的最强王者。2016年,谷歌旗下人工智能团队DeepMind(深度思维)研发的AI程序AlphaGo(阿法狗),先后击败了李世石、聂卫平、柯洁在内的围棋高手,经过围棋规则深度学习的AlphaGo拥有了比人类棋手更强的计算能力,在比赛中大获全胜并一举成名。
之后该程序升级为“阿法元”(AlphaGo Zero),从空白状态零起点起,不再需要输入任何人类棋谱就可以自学围棋。新一代的“阿法零”接连击败了国际象棋、将棋、围棋三个世界冠军级的电脑程序,成了全能棋王。随后公司宣布这一程序不再主攻棋法,而是“投身”医疗、能源以及新材料等领域。“深度思维”在人工智能领域已经声名大噪, 最近又推出了一款主体增强学习算法的“阿法星”(AlphaStar)。
目前这款人工智能程序已进入战略游戏《星际争霸II》前0.2%排名的人类玩家之列。据英国《自然》杂志发表的一篇论文上来说,该算法代表了机器学习的一大重要成就,经过改造后将有助于解决其他应用领域的复杂问题。《星际争霸II》游戏成为了人工智能研究领域的一项巨大挑战。这是一款科幻主题的策略游戏,有全球性的专业比赛,也是全球最赚钱的专业电子竞技之一。该游戏中有三个特征和能力截然不同的种族,玩家控制其中一个种族来相互对抗。而在之前的比赛中,即使简化了游戏规则,人工编制特定动作序列或依赖超人类的功能,也无法与顶尖的人类玩家相抗衡。
于是这次 “深度思维”公司奥里奥·维亚尔斯和同事们展现了最新的多主体增强学习算法——“阿法星”。在该算法中,若干深度神经网络主体相互竞争,生成大量的持续适应性策略和对策。之后“阿法星”在一系列在线游戏中与人类玩家比赛,无论玩《星际争霸II》的哪一个种族,“阿法星”都达到了大师级水平。这标志着人工智能体首次在没有简化游戏的情况下,在专业电子竞技中达到了顶尖人类玩家的水平。“深度思维”公司该程序妙手迭出,刷新了不少世界纪录。但再厉害的AI算法还是要落地于应用。“深度思维”早已宣布将重心从人机大战中抽出来,转而投向能“提供疾病治疗方案”的AI、能“降低能源消耗”的AI、能“发明出革命性新材料”的AI……但AI的逐渐强大并不意味着人类将要被取代,AI仍无法应对随机突发事件等,要走的路还很遥远,况且AI是改善人类生活的技术而被创造,终究是要为造福人类而工作。(内容及图片来源于网络,如有侵权请联系删除)
标签: