道奇队赢了!人工智能主导着世界棒球大赛的决策过程。毫无疑问,棒球在这32年里发生了翻天覆地的变化。随着海量数据、高级计算和分析的出现,基于数字的战略制定现已成为体育运动的核心。具体来说,AI(人工智能)在其中主导决策过程。在今年世界大赛的第六场比赛中,这种决策影响力再次得到体现。当时,坦帕湾光芒队的主教练凯文·卡什毅然换下了当时在场上表现完美的投手布莱克·斯内尔。卡什的决策似乎确实来自于数据,但他的判断并没有奏效。最终,道奇队在这场比赛中以3-1战胜了光芒队。从这个角度看,数据分析带来的不仅仅是惊喜,也有风险和挑战。带着这个问题,我采访了几位AI领域的顶尖人物,且看他们的回答:AI公司CEOSheldonFernandez:事后才能100%命中,但Cash临时决定更换斯内尔确实表明,分析结果时可能会出现凌驾于常识判断之上的问题。在人工智能领域,我们有时会谈到“混杂变量”。此类变量掩盖了影响因素之间的正确关系,导致纯粹数据驱动的决策效果的影响。以本场比赛为例,数据本身可能显示斯内尔的自责分率高于替补安德森,但还有一些样本量或其他趋势因素没有充分考虑。当然,“直觉”本身也有严重的缺陷。在2015年世界系列赛第5场的第9局中,特里柯林斯也做出了一个错误的决定,即坚持与马特哈维搭档。此后多年,大都会队的球迷对此一直抱怨不已,认为将冠军拱手让给堪萨斯城是错误的决定。话又说回来,即使从纯粹的分析角度来看,这个决定也同样令人费解:斯内尔打得很好,而这位替补队员在过去五场比赛中表现不佳。事实上,当卡什回到替补席时,道奇队的替补席明显松了一口气。这让我想起一句格言:“分析的意义在于指导决策,而不是为你做出决策。》AcumenAnalytics创始人KathyBrunner:击球手CoreySeager整个赛季对左撇子的得分为.218。球技不错的人。但仅从过去两周来看,他连续6次安打都未能得分。这两项数据中的哪一项哪个更准确?其实两者都不准确,可以说两者都准确。棒球比赛充满变数,随着数据的不断积累,本赛季的表现会逐渐被稀释。面对类似的情况来看,坦帕湾光芒队显然认为整个赛季的数据比前几场比赛的数据更重要,事实证明他们的判断是错误的,相信他们会在新的一年里重新调整自己的模式,努力做出更准确的预测TimBaumgartner,AnalysisVP,LaughlinConstable:MagicBallTheoryRevolutionizedBaseball。拥有自己的优势,用科学的阵容与各大传统球队抗衡。但棒球本身既是科学又是艺术。体育比赛不是冷冰冰的电子表格,坦帕湾队的数据策略告诉他们,首发投手在第三次面对对方击球手时往往表现不佳。美国职业棒球大联盟的统计数据支持这一结论,不少球队也将其视为不争的事实。但在第6场冠军的争夺中,这支数据驱动的球队无疑过于依赖了这种策略。他们的顽固和僵化最终使他们失去了领先优势和冠军希望。教训是团队应该反思如何以及何时使用它。定性和定量方法结合使用。更重要的是,传统强队也在利用自身丰富的资源进行同样的分析,所以未来的交锋,不仅仅体现在球员自身,更在于谁对数据趋势的理解更透彻一方面。LuminatiNetworks北美区总经理OmriOrgad:就像《回到未来》中的场景,我们在现实中只能看到一个结果。但必须承认,数据分析本身仍然只是一种统计工具。这些决定虽然有些看似增加了雷霆队的胜算,但从来都不是100%有保障的。我们不应该粗鲁地忽略其他选择:(1)斯内尔留在场上,光线队仍然输球;(2)斯内尔留在场上,光芒队获胜。数据和分析是高管的工具,但如何让它们发挥作用——包括将光芒送入冠军赛——是一个严峻的挑战。毕竟,唯一能赢得比赛的是球员,而不是数据。KNIME联合创始人兼首席执行官MichaelBerthold:这一轮的教训其实很简单:使用大量数据点做出的决策不适合预测独立赛事的未来走向,尤其是棒球世界大赛。班级要么赢要么输的有限结果场景。这样的预测指向的是机会,而不是确定的结果。卡什先生可能有很多统计数据,所以他的决定会提高球队的胜算,但仅此而已。可惜,事情并没有像他预想的那样发展,也并不顺利。但如果你继续看统计数据,他在整个职业生涯中赢得的比赛肯定比任何仅依靠直觉的人都要多。如果放眼未来十年,我相信他还是一位非常成功的职业经理人。SaifAhmed,Kinetica机器学习产品负责人:当我们将分析应用于更多真实场景??时,我们必须消除对数据科学中可预测性问题的常见误解。与其他科学方法一样,数据分析涉及通过可重复的实验检验自己的假设,然后生成有关概率的统计数据。请注意,这只是一个概率,而不是一个统一的结果。如果凯文·卡什仅根据数据模型做出决策,即使影响因素与他的模型完美匹配,成功的概率也只是一个统计——也就是说,即使高达99%,实际结果也是如此很可能会落入剩下的1%。.归根结底,每个人之所以热爱运动,都是因为喜欢其变幻莫测的魅力。数据科学在这方面不能起到决定性的作用,但这并不妨碍我们让它成为一个好的、可靠的合作伙伴。我们可以质疑任何一个单一的决策模型,但只要模型中的特征是合理的,能够准确反映过去,就应该被纳入置信区间。此外,模型的透明度是关键,我们应该能够观察模型使用了哪些变量。如果单一模型做出的决策有问题,那么我们应该借此机会重新审视模型本身,并引入更多变量以准确捕捉决定性因素。与任何其他科学实验一样,数据科学应该是一个动态的、迭代的过程。Qlik首席数据官JoeDosSantos:我们的行业很难仅仅依靠数据分析,而体育行业似乎在这条路上走得太远太快了。Cash对BlakeSnell的举动只是体育界“神奇”决定的另一个例子。美式橄榄球联盟球队陷入“盘口”魔咒,AWS商业广告的决策过程难以理解……这一切都让数据分析逐渐沦为一种玄学。魔球理论确实存在,但只适用于162场比赛这样大的样本空间。统计数据很重要,但心理学也很重要。斯内尔的粗暴移除虽然在数字层面上有意义,但对球迷和球员都造成了严重的心理伤害。过度依赖数字,不仅可能会输掉比赛,还会失去人们的理解和支持。
