当前位置: 首页 > 科技观察

10个自我充实的机器学习项目

时间:2023-03-13 12:24:17 科技观察

机器学习项目具有巨大的发展潜力。这个词也出现在最近很火的韩剧里,并且用很浪漫的方式来解释。不仅可以通过它学习数据科学,还可以为你的简历加分!毕竟,招聘人员通常会根据您拥有的技能来判断您的潜力。每个程序员都应该学习如何熟练地处理大量数据,包括大型数据集。此外,确保所有数据集都是开放的并且可以自由访问。1.Iris数据集如果你是数据科学的“婴儿”,这是你最好的起点。只有150行和4列的数据应该是模式识别文献中最通用、最简单和最丰富的数据集。想学习分类技术?一定要使用它。2.贷款预测数据集也是一个很简单的数据集,可以帮你预测贷款是否会获批。保险是所有行业中分析和数据科学方法的最大用途之一。这个数据集可以让你从保险公司的数据集中进行操作,你可以知道有什么挑战,使用了什么策略,影响变量是什么等等。3.BigmartSalesDataset使用分析来改进业务流程的广泛行业还包括零售业。这是一个回归问题,这个数据包含销售店铺的交易记录,它可以预测店铺的销售额,产品布局、库存管理、自定义报价等任务可以通过机器学习进行精细管理。4.BlackFridayDataset这是一个经典的数据集,用于探索和扩展您的特殊工程技能以及从多种购物体验中获得的日常理解。此数据集包含在零售店捕获的销售交易,允许预测购买金额。5.HumanActivityRecognitionDataset许多机器学习课程使用这些数据进行教学。它可以预测人类活动类别,这是一个多分类问题。它是从30个人的录音中收集的,通过内置智能惯性传感器的智能手机捕获。6.旅程历史数据集想预测用户类别?该数据集自2010年起按季度提供,来自美国的共享单车服务。这个数据集需要你锻炼专业的数据处理能力。7、电影镜头数据集的很多页面会随着用户的变化而改变内容。你建立了推荐系统吗?它可以向用户推荐新电影。该数据集是数据科学行业中流行的数据集。它拥有来自6,000名用户的4,000部电影的100万次观看次数,并且有各种尺寸。8.识别你的数字数据集它允许你分析和识别图像中的元素。就像相机使用图像识别来检测您的脸一样。您还可以构建和测试识别图像中数字的技术,其中包含7,000张28X28图像。9.城市声音的分类你是一个喜欢声音的人吗?你仔细聆听周围的各种声音吗?本练习主要介绍常规分类情况下的音频处理,帮助您从音频中分类出声音的类型。它包含10个类别的8,732个城市声音的声音摘录。10.ChicagoCrimeDataset它有600万个观察值,可以预测犯罪类型。当企业拥有整个数据集的计算能力时,他们不喜欢重复使用样本。此数据集提供了在本地计算机上处??理大型数据集所需的实践经验。虽然问题很简单,但关键是数据管理。总结上面列出的10个数据集,首先你可以找到一个与你的技能相匹配的数据集。如果您只是初学者,不要大踏步前进,从简单开始,专注于逐步取得进步。