大数据文摘编译:Luna我们都知道,课本上学的和实际操作还是有差距的。那么关于机器学习有哪些好的项目呢?可以练习吗?文摘为您推荐这篇文章。在本教程中,涵盖了面向初学者、中级专家和专家的23个机器学习项目创意,以通过这种增长技术获得真实世界的经验。这些机器学习项目的想法将帮助您了解在您的职业生涯和今天的工作中取得成功所需的所有实践。通过项目学习是您可以进行的最佳短期投资,这些项目想法可以让您快速发展和增强您的机器学习技能。从语言上讲,这些机器学习项目可以用Python、R或任何其他工具开发。初学者机器学习项目在本节中,我们列出了适合初学者/初学者的顶级机器学习项目,如果您已经在从事基础机器学习项目,请跳至下一节:中级机器学习项目1.鸢尾花分类项目项目构想:鸢尾花有不同的种类,您可以通过花瓣和萼片的长度来区分它们。这是机器学习初学者预测新鸢尾花品种的基础项目。数据集:鸢尾花分类数据集https://archive.ics.uci.edu/ml/datasets/Iris2。Emojify–CreateyourownemojiusingPython项目理念:这个机器学习项目的目标是理解人类面部表情,将它们分类并将它们映射到表情符号。我们将构建一个卷积神经网络来识别面部表情。然后,我们会将这些情绪映射到相应的表情符号或头像。源代码:Emojify项目https://data-flair.training/blogs/create-emoji-with-deep-learning/3.使用机器学习进行贷款预测项目理念:这个ML项目背后的理念是建立一个模型,模型将对用户可以借多少钱进行分类。它基于用户的婚姻状况、教育程度、受抚养人人数和就业情况。我们可以为这个项目建立一个线性模型。数据集:贷款预测数据集https://www.kaggle.com/altruistdelhite04/loan-prediction-problem-dataset4。HousingPricePredictionProject项目构想:数据集包含波士顿其余地区的房价。房子的成本根据各种因素而变化,例如犯罪率、房间数量等。对于初学者来说,这是一个很棒的ML项目,可以根据新数据预测价格。数据集:HousePricePredictionDatasethttps://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html5.MNIST数字分类机器学习项目项目构想:MNIST数字分类Python项目让机器识别手写数字.这个项目对计算机视觉非常有用。在这里,我们将使用MNIST数据集使用卷积神经网络训练模型。数据集:MNIST数字识别数据集https://drive.google.com/file/d/1hJiOlxctFH3uL2yTqXU_1f6c0zLr8V_K/view源码:手写数字识别项目https://data-flair.training/blogs/python-deep-learning-project-手写数字识别/6。使用机器学习预测股票价格项目构想:有许多可用于股票市场价格的数据集。这个面向机器学习初学者的项目旨在根据前一年的数据预测股票市场的未来价格。数据集:股票价格预测数据集https://www.kaggle.com/c/two-sigma-financial-news/data源代码:股票价格预测项目https://data-flair.training/blogs/stock-price-预测机器学习项目-in-python/7。TitanicSurvivalProject项目理念:这将是一个有趣的项目,因为我们将预测是否有人会在泰坦尼克号上幸存下来。对于这个初学者项目,我们将使用泰坦尼克号数据集,其中包含有关泰坦尼克号幸存者和遇难者的真实数据。数据集:《泰坦尼克号生存》数据集https://www.kaggle.com/c/titanic8。葡萄酒质量检测项目项目思路:在这个项目中,我们可以建立一个接口来预测红酒的质量。它将使用葡萄酒的化学信息,并基于机器学习模型,为我们提供葡萄酒质量的结果。数据集:葡萄酒质量数据集https://archive.ics.uci.edu/ml/datasets/wine+quality9。FakeNewsDetectionProject项目理念:假新闻不胫而走,是当今时代的一大问题。我们可以学习如何区分假新闻和真新闻。我们可以使用监督学习来实现这样的模型。数据集:假新闻检测数据集https://drive.google.com/file/d/1er9NJTLUA3qnRuyhfzuN0XUsoIC4a-_q/view源代码:假新闻检测项目https://data-flair.training/blogs/advanced-python-project-detecting-fake-news/如果您对DataFlair目前提出的机器学习项目有任何疑问,欢迎留言。中级机器学习项目一、音乐流派分类机器学习项目项目思路:这个python机器学习项目的思路是开发一个机器学习项目,自动对音频中的不同音乐流派进行分类。我们需要使用它们的频域和时域低级特征对这些音频文件进行分类。源代码:MusicGenreClassificationProjecthttps://data-flair.training/blogs/python-project-music-genre-classification/2.BitcoinPricePredictor项目项目理念:BitcoinPricePredictor是一个很有用的项目。区块链技术正在发展,许多数字货币正在兴起。该项目将帮助您使用以前的数据预测比特币的价格。数据集:比特币价格预测数据集https://www.kaggle.com/team-ai/bitcoin-price-prediction/version/13。UberDataAnalysisProject项目思路:本项目可用于对超级数据进行数据可视化。该数据集包含纽约市的450万超级采摘者。为了对行程进行分析,需要将大量的数据进行精美的呈现,才能进一步提升业务。数据集:Uber数据分析数据集https://drive.google.com/file/d/1emopjfEkTt59jJoBH9L9bSdmlDC4AR87/view源代码:Uber数据分析项目https://data-flair.training/blogs/r-data-science-project-超级数据分析/4。性格预测项目项目理念:MyersBriggsTypeIndicator是一个性格类型系统,它根据内向、直觉、思考和感知能力将一个人分为16种不同的性格。我们可以根据他们在社交媒体上发布的帖子类型来识别他们的个性。数据集:性格预测数据集https://www.kaggle.com/datasnaek/mbti-type5。XboxGamePredictionProject项目理念:人们在搜索时产生的数据可以用来预测用户兴趣。BestBuyConsumerElectronics提供了数百万用户搜索的数据,我们将预测用户最有兴趣购买哪些Xbox游戏。这将用于向访问者推荐游戏。数据集:Xbox游戏预测数据集https://www.kaggle.com/c/acm-sf-chapter-hackathon-small/overview6。信用卡欺诈检测项目异常情况。该项目旨在建立信用卡欺诈检测模型。我们将使用交易及其是否为欺诈的标签来检测客户的新交易是否具有欺诈性。数据集:信用卡欺诈检测数据集https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view源代码:信用卡欺诈检测项目https://data-flair.training/blogs/data-science-machine-学习项目信用卡欺诈检测/7。BarbieandtheBrainProject项目理念:芭比娃娃等儿童玩具有一组预定义的单词,可以重复说。我们可以用机器学习的方法给芭比娃娃一些大脑。当玩具能够理解并说出不同的句子时,它会更吸引人。这是一个优秀的项目,将改善孩子们的学习过程。8.UsingMachineLearningforCustomersegmentation项目构想:客户细分是一种根据客户的购买历史、性别、年龄、兴趣等对客户进行细分的技术。拥有这些信息非常有用,可以帮助商店进行个性化营销和为客户提供相关的、信息丰富的交易。在这个项目的帮助下,公司可以运行针对特定用户的活动并提供针对特定用户的优惠,而不是向所有用户广播相同的优惠。数据集:客户细分数据集https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view源代码:客户细分项目https://data-flair.training/blogs/r-data-science-project-customer-segmentation/在我们的机器学习项目创意文章的下一部分中,我们将为那些熟悉的人介绍一些高级项目创意。AdvancedMachineLearningProject1.SentimentAnalysisUsingMachineLearning项目理念:情感分析是分析用户情感的过程。我们可以将他们的情绪分为积极、消极或中性。学习如何进行情绪分析是一个伟大的项目,如今已被广泛使用。这是最受欢迎的机器学习项目之一。这背后的原因是每家公司都试图了解客户的情绪,如果客户满意,他们就会留下来。该项目可能会展示一种减少客户流失的方法。数据集:情感分析数据集http://ai.stanford.edu/~amaas/data/sentiment/源代码:情感分析项目https://data-flair.training/blogs/data-science-r-sentiment-analysis-项目/2。安然调查项目项目构想:安然在2000年倒闭,但提供调查数据。该数据库包含在公司工作的500,000名真实员工的电子邮件,因此该数据对于执行数据分析非常有用,许多数据科学家都使用该数据集。数据集:安然调查数据集https://www.cs.cmu.edu/~enron/3。语音情感识别机器学习项目项目理念:这是最好的机器学习项目之一。语音情感识别系统使用音频数据。它以语音的一部分作为输入,然后确定说话者说话时的情绪。我们可以识别不同的情绪,如快乐、悲伤、惊讶、愤怒等。这个项目可能有助于识别客户在与呼叫中心通话期间的情绪。数据集:语音情感识别数据集https://drive.google.com/file/d/1wWsrN2Ep7x6lWqOXfr4rpKGYrJhWc8z7/view源代码:语音情感识别项目https://data-flair.training/blogs/python-mini-project-speech-情绪识别/4。CatchIllegalFishingProject项目理念:这是一个有趣的机器学习项目。海洋中有很多船,船,不可能手动跟踪每个人的活动。通过卫星和地理定位数据识别非法偷猎动物和捕获捕鱼活动将是一个了不起的项目。GlobalFishingWatch提供可用于构建系统的免费实时数据。Dataset:CaptureIllegalFishingDatasethttps://globalfishingwatch.org/map-and-data/5.Onlinegroceryrecommendationitemideausingcollaborativefiltering:协同过滤是一个很好的反应来过滤掉用户可能喜欢的项目。杂货店推荐系统将是一个让顾客知道他们想要什么的好项目。6.使用机器学习的电影推荐系统项目构想:推荐系统无处不在,无论是在线购物应用程序、电影流媒体应用程序还是音乐流媒体。他们都是根据目标客户推荐产品。电影推荐系统是增强您的投资组合的绝佳项目。数据集:电影推荐系统数据集https://drive.google.com/file/d/1Dn1BZD3YxgBQJSIjbfNnmCFlDW2jdQGD/view源码:电影推荐系统项目https://data-flair.training/blogs/data-science-r-movie-建议/7。车牌自动识别系统项目构想:本机器学习项目的目的是检测并识别车辆的车牌号,并读取车牌上印制的车牌号。这可能是一个很好的安全扫描、流量监控等应用程序。源码:车牌自动识别项目https://techvidvan.com/tutorials/python-project-license-number-plate-recognition/相关报告:https://data-flair.training/blogs/machine-learning-project-ideas/【本文为栏目组织大数据文摘原创翻译,微信公众号“大数据文摘(id:BigDataDigest)”】点此查看作者更多好文
