人类的决策有时很复杂,而且看似武断——即便如此,心理学家希望更好地理解这一过程,以便更好地预测人们在复杂情况下可能做出的决策种类。随着人机交互越来越频繁,预测人类如何做出风险决策不仅成为认知科学的目标,而且具有现实意义和价值。6月发表在《科学》杂志上的一篇论文通过大规模实验和机器学习挖掘了人类决策的理论。本研究利用神经网络学习海量风险决策数据,不仅再现了风险决策领域的已有研究,而且在此基础上发现了更准确的风险决策模型。该研究可以通过分析人类行为进行自动建模,为复杂性科学、认知科学和社会科学的结合指明了方向。论文题目:利用大规模实验和机器学习发现人类决策理论论文地址:https://science.sciencemag.org/content/372/6547/12091。最近几天用前景理论解释风险决策盲盒每年都越来越流行,为什么人们更喜欢不确定性,比如你面对的盲盒A有30%的概率拿到100元货物,而盲盒B有80%的概率拿到50元的货物,为什么会有人想要选择第一个选项,即使它的预期收益更低。诺贝尔经济学奖得主卡尼曼和特沃斯基于1979年提出透视理论,通过非线性贴现,解释了为什么人们在面对“损失”时变得冒险,在面对“收益”时变得冒险。表现出风险厌恶。前景理论在经济建模、心理学、神经科学、商业分析等领域有着深远的影响。通过对消费者的选择进行建模,该理论可以帮助政策制定者找到可以改善个人和社会福祉的策略。然而在接下来的几十年里,随着数十种相互竞争的理论的出现,风险决策模型开始相互矛盾:每一种都被证明是不完整的。提出新理论的研究人员通常会对感知、注意力、记忆、情感等问题做出复杂的假设,然后在小数据样本而不是更大的数据集上重现它们。之所以有这么多相互竞争的理论,是因为人类的决策行为是复杂的,每一种理论通常只能从不断增长的假设列表中进行选择,来解释某些场景下的冒险决策现象。由于上述多样性和复杂性,最佳决策理论或模型仍未达成共识,其整体预测能力方面也鲜有收获。但模型好坏,需要根据模型对比数据,对大样本决策数据的预测是否有显着差异,正如机器学习模型必须在训练集和测试集才可以确定什么都没有发生。合身。这样,心理学家提出的假设就可以作为优化问题中的约束,或者归纳偏差,看增加是否有助于模型的预测能力,决定是否增加这个假设。2.MachineLearningHowModelsRiskDecision-Making本研究首先使用Amazon的MechanicalTurk众包平台收集了超过10000个场景,如图1所示,涉及风险决策涉及概率,远超以往的风险决策数据研究。图1.风险决策的特定场景示例。每个风险决策场景都可以用一组风险和收益向量来描述;之后,所有10,000个场景都可以通过t-SNE降维可视化。如图2所示,绿色代表历史上相似场景下的数据,红色代表之前最大的单体数据集,黑点代表本次研究使用的数据集。与红点相比,黑点的数量是红点的30倍,分布更加均匀,更能体现风险决策本身的多样性。图2.10,000个风险决策情景降维后的可视化。人类所有可能的风险感知函数,如图3所示,其中最简单的预期收益(ExpectValue)可以看作是预期收益(ExpectUtility),而前景理论则将预期收益作为非线性函数。这样,所有风险感知的包含关系和普适性就可以如图3所示,其中BEAST代表BestEstimateandSamplingTools,是本研究中找到的最好的预测模型。图3风险认知模型包含关系示意图。认知模型的假设被转化为神经网络中的约束条件。如图4所示,例如,基于预期收益模型,可以将每个收益函数用一个神经网络一个一个表示,然后通过全连接层的组合,通过梯度下降优化最终的预测模型.图4.预期收益假设下的神经网络模型架构3.不同的假设对应神经网络不同的预测性能。如果一个神经网络模型能够预测出特定场景下的选择,那么与人类实际预测有50%以上的概率重合,那么模型就可以预测场景了。对比训练轮数和均方误差,我们可以判断不同心理学理论对应的模型在由1000个未知场景组成的测试集上的准确率。图5.(左图)在预期收益框架下,神经网络(蓝线)模型随着测试数据集上训练时期的数量而下降;(右图)神经网络的学习收益和效用对应函数与期望Prospect理论的对比指出,当人们看待不同的概率时,同样具有非线性认知,所以图最右边的主观概率效应5不像之前那样是一条直线,而且由于引入了这个额外的假设,使得模型的预测更加准确,详见图6。图6.前景理论(左图)与效用与主观概率函数(右图)的预测误差在之前的模型中,假设奖励的多少与主观概率是相互独立的,人们不会仅仅因为奖励是10,000千分之一的概率被主观认为是百分之一,但是基于环境的模型放宽了这个假设。假设V(A)=∑i∈Au(xi,c1)π(pi,c2),其中每个选项的效用取决于当前场景中的其他选项,概率的主观认知取决于相应的概率收入。在进行效用估计时,如果只依赖于当前场景,这样的模型称为单赌博模型(intra-gamble),如果依赖于其他场景,则称为跨赌博模型(inter-gamble),如果不仅效用函数是依赖于场景的,概率的主观估计也是如此,所以它被称为Intergambleprob/outcomemodel。图7不同基于神经网络的模型与传统认知科学模型对风险决策的预测误差比较预测效果优于传统模型,表明神经网络可以复现并超越现有的心理学研究,并且其次,通过指出预测误差最低的模型,即更复杂的博弈概率/结果模型,说明人类对风险的认知本质上是复杂的,不能归因于简单的假设。虽然大多数场景可以看作是主观概率和主观效用的产物,但也应该考虑不同场景下的相对比较以及概率和收益之间的相互依赖关系。4.混合模型具有更好的预测能力当人们面临风险决策时,往往会想象自己大脑中有两个小人在互相争吵。这对应的是一个混合模型,即每个人都有多组一一对应的主观概率和效用函数(策略),然后根据特定的场景,随机选择某组策略进行偏好设置,并且该集合被随机选择用于判断。研究指出,使用混合模型,预测效果与基于场景的模型相似,最终预测误差也相似,说明混合模型可以包含基于场景模型中的信息,并且由于由于模型的简单性,其在训练初期的表现较好。图8混合模型预测效果(左图)效用函数示意图(右图)图8神经网络学习到的混合模型中对应的效用函数和主观概率。值得注意的是,获取的效用函数在一个策略中明显是损失厌恶的,而相应的主观概率正如前景理论所预测的那样,高估小概率的时间,低估大概率的确定性,而另一种策略则基本是理性的。通过找出人们在什么情况下会选择理性策略:什么时候人们会像前景理论预测的那样选择非理性策略,以及什么时候会选择非理性策略,研究者可以更好地理解哪些因素对人类风险决策的影响最大。.什么因素决定了人们的战略选择?研究人员发现,最重要的因素是不同选项的收益之间的差异、最大和最小收益,以及有多少选项是负面收益。也就是说,如果面对1块钱和1万元之间的这种落差,或者说面对大部分损失的选项时,人在这个时候往往会变得不理性。图9显示了在所有场景可视化后,在不同场景下选择非理性主观概率函数和效用函数的可能性。图9-E中的蓝点代表非理性选择占主导地位的情景。图9.风险决策场景二维聚类后,不同选项对应的选择概率的颜色编码热图5.总结通过训练深度学习模型来预测人类在这些问题中的选择,训练后的模型可以是非常准确它比现有模型要好得多。这并不意味着心理学家和行为经济学家的工作将被机器取代。我们仍然需要人的思维来解释深度学习模型所代表的意义。将其转化为描述性理论。传统模型仅在特定数据集下表现优于机器学习模型,而在海量数据集下表现不佳,而大数据集与机器学习算法的结合为揭示新的认知和行为现象提供了前所未有的潜力.在学习模仿人类决策过程中,神经网络再现了许多已知的认知科学理论,例如前景理论。由于深度学习的模型灵活性高,使研究人员能够找到对风险感知的新见解。因此,未来的认知科学需要更多地使用机器学习进行自动化建模,以及更多实验室场景之外的真实数据集。比如盲盒的销售数据等。
