AI预测的2018年世界杯为什么不靠谱?
以下是我们从人工智能预测2018年世界杯结果的失败中学到的东西。
2018年世界杯于7月15日周日结束。法国成为世界冠军,随后是克罗地亚和比利时。就像之前的2014年世界杯一样,许多研究人员试图提前预测俄罗斯比赛的结果。今年,国际足联的2018年世界杯也不例外。研究人员和科学家正试图使用人工智能和统计数据来预测64场世界杯比赛的结果,但是它有多可靠呢?
在这篇文章中,我将讨论人工智能在预测2018年世界杯结果方面的表现。不管你是否是人工智能专家,我都会尽最大努力让这篇文章易读。
有许多方法可以预测世界杯的结果。一种方法是根据队伍的能力和获胜的机会来模拟和比较所有成对的比赛。蔡利斯、莱特纳和霍尼克(2018)使用了相同的技术。他们预测巴西以16.6%的概率赢得2018年世界杯,其次是德国(15.8%)和西班牙(12.5%)。
瑞银还预测了三个团队的排名,但顺序不同。他们预测德国(24.0%)是冠军,其次是巴西(19.80%)和西班牙(16.1%)。该模型基于四个因素:一是Elo评分系统的评分;第二是该队在世界杯前的表现。第三,该队在前几届世界杯比赛中取得的成绩;第四,主场优势。
该模型通过10,000个蒙特卡洛模拟来校准,以确定该队的获胜概率和最近五场比赛的结果。
2018年6月8日,来自德国多特蒙德科技大学、比利时根特大学和德国慕尼黑科技大学的四名研究人员(A. Groll等人)发表了一篇关于2018年世界杯结果预测的研究论文。他们使用著名的人工智能算法:随机森林和泊松排序算法。6月14日,这篇文章在俄罗斯和沙特阿拉伯之间的世界杯开幕赛之前发表在网上。他们使用的数据集可以涵盖过去四届世界杯(2002-2014)的所有比赛。他们预测西班牙将成为冠军,其次是德国和巴西。三项研究都提到西班牙、德国和巴西是顶尖球队,但顺序不同。他们使用了三种不同的方法,数据和数据特征,但预测结果几乎相同。现在世界杯已经结束,我们可以看到,所有这些模型都没有正确预测世界杯的结果,也没有任何预测实际发生。
在这些研究中,格罗尔等人的研究方法是我最喜欢的。首先,他们使用了一个很好的数据源。其次,他们考虑了许多训练特征和参数。第三,他们采用了随机森林算法。在本文的其余部分,我将讨论它的数据特征、错误以及在这方面失败的原因。
数据特征
A.Groll等人考虑了与团队本身相关的各种特征,例如:经济因素(人均国内生产总值、人口);体育因素(奥多塞特概率、国际足联排名);主场优势(东道主、洲、联盟);团队的结构因素(每个团队的最大成员数量、平均年龄、冠军联赛球员数量);团队的教练因素(年龄、任期、国籍)。总的来说,他们总结了每支球队和每届世界杯的16个数据特征作为考虑因素。
分类模型
正如我前面提到的,他们使用了“随机森林”的方法,这是人工智能和数据挖掘中众所周知的算法之一。该算法基于“决策树”。在许多情况下,决策树在数据分类方面表现出更高的性能。他们还使用泊松模型根据团队当前的能力对团队进行排名。
预报
在完成100,000场模拟比赛后,西班牙有望以28.9%的几率成为冠军,其次是德国(26.3%)和巴西(21.9%)。
错误
正如我们在2018年世界杯上观察到的那样,预测领先地位的球队都没有进入半决赛,更不用说决赛了。根据世界杯的实际结果和预测,模型的均方根误差(RMSE)和平均绝对误差(MAE)计算如下:
RMSE:8.052
MAE:6.468
这两个指标显示了模型的误差和它能准确预测团队排名的程度。RMSE和MAE都有很高的价值,这使得模型不可靠。尽管该团队使用了16个特征和大数据集(从过去4届世界杯收集的数据),人工智能机器学习(尤其是随机森林)仍然不能可靠地预测结果。在本届世界杯上,俄罗斯、日本和伊朗的表现明显好于预期,而德国则未能晋级。
为什么人工智能会失败?
在人工智能和机器学习中,拥有合适的数据用于训练和建模是非常重要的。然而,在这种情况下,尽管有适当的数据、相对较大的数据、良好的算法和正确的参数,训练模型仍然表现不佳。失败的原因在于我们预测的事物的性质。
像任何其他以人为基础的事件一样,国际足联世界杯依赖于比赛前(不仅仅是16分钟)和比赛中(至少90分钟)太多的因素,这些因素被称为混杂变量。为了正确预测结果,每场比赛的每一分钟都应该被模拟。每个状态的结果取决于之前的状态。这也被称为马尔可夫链过程。
不正确的模拟状态很容易导致比赛状态中不可靠的结果。
除了内部因素,足球比赛的结果也可能受到一些外部因素的影响,如裁判不公、天气、政治形势、球员个人问题等。这些重要特征通常很难测量和收集。此外,勘探总是有机会和不确定性。例如,一个关键的错误或自己的目标是不容易预测的。简而言之,随机和动态的环境,如国际足联世界杯或人类活动是人工智能技术今天不能很好工作的领域。这是一个很好的例子。我们必须注意人工智能在类似动态领域的适用性。此外,由于非常复杂的数据结构,很难检查训练过的模型是否有任何潜在的偏差。人工智能中的偏见会导致针对特定群体的歧视性决策。把这种预测系统作为唯一标准的决策者可能对个人和公司有很大的影响。建议*和企业只使用人工智能作为随机动态环境预测的辅助决策平台。