作者|王浩文化研究是一门发展了数百年的人文学科。然而,由于数据规模和地理区域的限制,文化研究一直是一门使用小规模数据的研究学科。随着大数据时代的到来,互联网用户行为数据等公共数据集因其数据量大、信息丰富而成为人文领域最新的金矿。2022年,研究人员在国际学术会议MHEHD2022上发表了介绍计算文化研究的文章,描述了如何通过人工智能算法进行文化研究。本文主要分析了一种名为ZeroMat的零样本机器学习算法的社会学效果。ZeroMat算法是人工智能领域第一个不使用任何数据进行推荐的算法。众所周知,现有的零样本学习算法基本上是迁移学习和元学习的变体。ZeroMat是第一个有区别的算法。ZeroMat算法假设用户的项目评分矩阵服从如下分布:将上式带入概率矩阵分布模型得到如下公式:取对数后,使用随机梯度下降法计算U和V,并设置方差到一个常数1可以得到下面的公式:从公式中我们发现这个算法本质上是一个零样本学习算法。这个算法的社会学效果就是我们的文化被锁定了,因为我们可以非常准确地预测电影等文化消费品的用户评分数据,不需要任何数据,也就是不需要历史数据就可以知道用户个人的文化偏好。而由于用户评分数据的高度不平衡,我们知道人类文化不仅被锁定,而且锁定在一种极度不平等的极端状态,而这一切的发生只需要很短的时间。事实上,这种现象不仅存在于文化领域,也存在于其他社会领域。不过,中国政府采取的多项措施在一定程度上缓解了这一问题。例如,大城市群战略利用马太效应有助于提高效率,促进经济发展的原理。又如政府对互联网大V的监管,有效降低了信息传播的马太效应,防止信息传播陷入锁定状态。人类文化锁定的根本原因是幂律分布在各种社会现象中的作用。幂律分布之所以存在,是因为它最大化效率,与多样性有关。认真研究幂律分布,可以让我们更好地理解各种社会现象,帮助我们更好地研究算法等自然科学。人类文化是否被进化锁住了:https://www.atlantis-press.com/article/125975737.pdf作者简介王浩,互联网资深人士,原趣加游戏AI实验室负责人,曾任职互联网公司如作为豆瓣、新浪、网易拥有超过11年的技术和技术管理经验,成功推出了10余款技术产品。在推荐系统、风控、自然语言处理等领域有着丰富的经验和独到的见解。在国际学术会议和期刊发表论文30篇,3次获得国际学术会议最佳论文奖/最佳论文报告奖。2006ACM/ICPC国际大学生程序设计大赛北美落基山区赛金奖。
