当前位置: 首页 > 科技观察

人工智能能预测未来吗?全球160个研究团队参赛5个月才得到答案

时间:2023-03-12 18:08:14 科技观察

本文转载自雷锋网。如需转载,请在雷锋网官网申请授权。我们的人生轨迹可能会受到家庭、社会、时代的影响,也可能会因大大小小的决定而改变。人工智能能否准确预测我们无法预测的未来?来自普林斯顿大学、加州大学洛杉矶分校、麻省理工学院、弗吉尼亚理工大学等机构的160个研究团队参与了“脆弱家庭挑战赛”(FragileFamiliesChallenge),试图预测、衡量全美儿童、父母和家庭的轨迹,寻求回答这些问题。当地时间2020年3月30日,这项挑战的研究成果在线发表于《美国国家科学院院刊》,论文题目为Measuringthepredictableabilityoflifeoutcomeswithascientificmasscollaboration,共有112位共同作者。4000多个家庭的大样本数据集其实探索人生轨迹更像是一个社会学问题。这不仅仅是预测未来。它对提供家庭援助、理解社会僵化和改进相关政策具有重要意义。该研究基于名为“脆弱家庭和儿童福祉研究”的高质量出生队列数据集——社会科学家在15年多的时间里收集的大样本数据集,包含来自4,000多个家庭的数据。13,000个数据点。研究人员研究了1998年至2000年间在美国大城市出生的儿童,其中未婚父母所生儿童的比例不成比例。不难看出,这个纵向研究的目的也是为了了解未婚家庭所生孩子的生活。具体来说,随着孩子年龄的增长,相关数据共包括6个阶段——孩子出生时、1岁、3岁、5岁、9岁和15岁。值得一提的是,每个年龄段的数据采集范围不同。例如,孩子刚出生时,只收集父母的调查和访谈信息;当孩子9岁时,需要对父母、孩子的主要照顾者(如果不是父母)、老师和孩子本人进行调查访谈,然后收集信息(见下图)。此外,对于不同的年龄段,研究者对数据的关注程度也不同。例如,在出生时,访问母亲的主要问题是孩子的健康和发展、亲子关系、亲子关系、父母对婚姻的态度、与家庭的关系、环境和政策因素、健康状况、人口特征、教育水平、就业和收入;而在孩子9岁时,对孩子的访谈主要涉及父母关系、父母对孩子的要求和监管、与兄弟姐妹的关系、日常生活、学校情况、少年犯罪倾向、任务完成情况和行为习惯等。性能以及健康和安全状况。脆弱家庭挑战其实,这个名为“弱势家庭挑战”的项目可以看作是一个游戏——游戏开发者是项目组织者,玩家是参与的研究团队。游戏设定为项目主办方不公开上述家庭15岁儿童的数据,各研究团队可使用任意AI模型高能玩法准确预测15岁儿童的人生发展。15岁,开发者为玩家提供了6个衡量维度,比如孩子的平均学习成绩、孩子的毅力、家庭经济水平、孩子主要看护人的工作和培训等,玩家需要至少预测其中一个维度。如下图所示,本研究的背景数据包括来自4242个家庭的孩子出生时、1岁、3岁、5岁、9岁共计12942个变量。训练数据是孩子15岁时的6条人生轨迹。事实上,这种游戏设计思想正是计算机科学领域常用的研究设计方法“共同任务法”。雷锋网了解到,项目组织者收到了来自全球68所大学的457份申请,该项目最终由全球160个研究小组开展。挑战赛于2017年3月5日至2017年8月1日发起,参赛者只需将预测结果上传至挑战赛官网即可。【脆弱家庭挑战赛官网】在脆弱家庭挑战赛结束后,主办方对160支队伍的成绩进行了分析比较,发现每支队伍采用了不同的数据处理、统计学习等技术进行预测,虽然每支队伍获得了预测结果相差不大,但预测结果普遍与真实情况相差甚远。即使是最准确的预测结果也与训练数据的实际情况相去甚远。如下图所示,研究团队对家庭经济水平和孩子平均学习成绩的平均预测准确率在0.2左右波动,而其他维度的平均预测准确率在0.05左右(雷锋网(公众号:雷锋.com)注:值越接近1,匹配度越高;越接近0,匹配度越低)。当然,不可否认的是,这些团队在一些预测上也很准确,比如某个孩子的学习成绩。目前看来,我们可以回答文章开头的问题了——AI无法非常准确地预测生命轨迹。这一结论对人工智能模型在刑事司法、儿童保护服务等场景中的应用具有启示意义。同时,未来社会学家和数据科学家应谨慎使用人工智能预测模型。正如普林斯顿大学和哥伦比亚大学脆弱家庭和儿童健康研究的首席研究员萨拉·麦克拉纳汉(SaraMcLanahan)所说:结果令人大开眼界,要么运气在我们的生活中起着重要作用,要么我们作为社会科学家忽略了一些重要变量。