你有没有想过如何描述颜色?新的研究表明,人类使用离散的符号来记录一个区域的颜色,在提炼颜色的过程中添加额外的信息。这背后有什么道理吗?Facebook用神经网络的两个实验现象来告诉你。人类世界虽然有成千上万种语言,但是用文字来表示不同颜色的方式却是非常一致的。例如,许多语言都有红色和橙色这两个截然不同的词,但没有一种语言对橙色的各种色调(tangerineorange和tangerineorange)有许多截然不同的常用词。比如口红的编号那么多,如果给每一个都分配一个唯一的颜色名称,可能就很难记住了。语言学研究人员使用数学工具表明,颜色名称的这种一致性是因为人类优化语言以平衡精确交流的需要和最小化记忆的需要。使用额外的颜色词会增加复杂性,但不会显着改善人与人之间的交流。Facebook最近的AI研究表明,当两个人工神经网络被要求创建一种方式来相互交流它们所看到的颜色时,AI也会像人类一样平衡复杂性和准确性。此外,Facebook研究团队还发现,要想准确描述连续的色彩空间,只能使用离散的“色彩语言”。这导致了一个关于如何沟通的有趣猜测。“离散”的手语是否比动物“连续”的叫声更适合交流?模型实现过程首先建立两个神经网络,一个负责说话(speaker),一个负责听(listener),并建立一个“交流游戏”:在每一轮游戏中,说话者从一个连续的颜色空间中看到A颜色,然后输出一个符号(可以认为是一个“字”)。收听者可能会看到与噪声输入相同或不同的颜色。听者接收到说话者输出的单词,然后尝试输出正确的颜色段。最初,说话者随机生成单词,到训练结束时,每个单词代表颜色空间的一个连续片段。研究团队多次重复实验,同时通过改变目标颜色和噪声颜色之间的相似度来改变任务的难度。这些变化导致了许多不同的颜色名称“词汇表”。在训练结束时,研究人员分析了词汇,发现AI生成的颜色词在本质上与人类语言相似。此外,两种类型的语言都接近正式定义复杂性和准确性之间可能的最佳平衡集的边界(图中的黑线)。在后续实验中,研究人员发现,至关重要的是,当允许神经网络使用连续而非离散符号进行通信时,复杂性和准确性之间的最佳平衡就失去了。两个神经网络仍然可以通信,但是它们的通信变得非常低效。语言可能是人类最独特的特征,我们在日常生活中经常使用它却不理解它。Facebook的研究表明,先进的AI模型不仅对实际应用有用,而且还可以用作实验工具来回答有关人类语言(以及一般认知)的科学问题。
