近日,据外媒报道,数学家发现了一个与机器学习相关的计算机问题,他们无法解决。不是他们不够聪明,而是这个问题根本没有答案。这个问题与机器学习有关。机器学习是一些计算机用来“学习”如何执行特定任务的人工智能模型。当Facebook或谷歌识别出你的照片并建议你标记自己时,它正在使用机器学习。当自动驾驶汽车在繁忙的十字路口行驶时,这就是机器学习。神经科学家使用机器学习来“读懂”某人的思想。机器学习的关键是基于数学。因此,数学家可以从理论上研究和理解它。他们可以写出机器学习如何工作的绝对证据,并将其应用于各种情况。在此背景下,一些数学家设计了一个称为“估计最大值”或“EMX”的机器学习问题。要了解EMX的工作原理,请想象一下:您想要在您的网站上投放广告并最大限度地增加这些广告的目标受众数量。您有针对体育迷、猫迷、汽车迷、运动爱好者等的广告,但您不知道谁会访问该网站。您如何选择一组能够最大化目标受众的广告?EMX必须找出答案。研究人员随后提出了一个问题:EMX何时解决问题?与其他机器学习问题一样,数学家通常可以根据他们拥有的数据集判断学习问题是否可以在给定情况下得到解决。谷歌用来识别人脸的基本方法能否应用于预测股市趋势?数学家不知道,但人们可能会这么认为。问题是,数学有点不对劲。自从逻辑学家库尔特·格德尔在1931年发表了他著名的不完备性定理后,它就被打破了。他们表明,在任何数学系统中,都存在某些无法回答的问题。不是真的很难,而是因为有些问题是不可知的。数学家已经了解到,他们理解宇宙的能力从根本上是有限的。Gdel和另一位数学家PaulCohen找到了一个例子:连续统假设。连续统假设是这样的:数学家已经知道有无数个不同大小的数。例如,有无穷多个整数(如1、2、3、4、5等);数字)。但即使有无限多个整数和无限多个实数,实数显然比整数多。这就引出了一个问题:是否存在大于整数集但小于实数集的无穷大?连续统假说认为存在。Gdel和Cohen表明,不可能证明连续统假设是正确的,但也不可能证明它是错误的。“连续统假说是真的吗?”是一个悬而未决的问题。1月7日发表在网络期刊《自然》上的一篇论文指出,EMX与连续统假说有着千丝万缕的联系。事实证明,只有连续统假设成立,EMX才能解决问题。这意味着,“EMX可以学习解决这个问题吗?”这个问题的答案就像连续统假设本身一样不可知。好消息是连续统假设的解对大多数数学来说并不是很重要。同样,这个绝对的谜团可能不会对机器学习构成主要障碍。“由于EMX是机器学习中的一种新模型,我们还不知道它在开发现实世界算法中的用处,”芝加哥伊利诺伊大学数学教授LevReyzin说。Reyzin在《自然》在线期刊上发表的一篇文章中写道:“所以这些结果可能没有实际意义。”Reyzin写道,遇到无法解决的问题是机器学习研究人员的标志。根据Reyzin的说法,这证明机器学习已经“成熟为一门数学学科”。Reyzin还表示,也许像这样的结果会给机器学习领域提供一种谦逊。尽管机器学习算法不断地改变着我们周围的世界,但机器学习并不完美。
