当前位置: 首页 > 科技观察

雅虎面向研究人员发布大规模机器学习数据集

时间:2023-03-19 11:45:32 科技观察

雅虎为研究人员发布大规模机器学习数据集**机器学习数据集。雅虎表示,这组数据集主要面向学术研究社区推出,让他们在研究中再也不用担心无法获得大规模数据集。据悉,公开数据集包括1100亿个事件,未压缩状态下总容量为13.5TB。研究人员可以在数据集中找到匿名用户新闻交互数据等数据,这些数据是去年年初从2000万用户中收集的。在YahooNewsFeed数据集中,有来自用户和YahooMovies、YahooNews、YahooFinance等Yahoo不同版块的交互数据。此外,Yahoo还在这个数据集中加入了一些人口统计分布数据,比如性别、年龄和地理位置。“我们的目标是促进大规模机器学习和推荐系统的独立研究,同时也帮助平衡行业和学术研究之间的竞争环境,”雅虎在一份声明中说。

猜你喜欢