当前位置: 首页 > 科技观察

选择困难的终结者:不同问题下的机器学习算法

时间:2023-03-21 20:10:44 科技观察

刚开始学习数据科学的时候,经常面临这样一个问题:遇到具体问题时,选择哪种算法合适。也许你和我一样。搜索了很多关于机器学习算法的文章,你会看到很多详细的描述,但是并没有降低选择的难度。言归正传,作者建议大家对几种有监督和无监督机器学习算法的实现方法和数学直觉有很好的了解,例如:线性回归Logistic回归决策树朴素贝叶斯支持向量机随机森林自适应提升(AdaBoost)梯度提升树(GBT)简单神经网络层次聚类高斯混合模型卷积神经网络递归神经网络推荐系统对机器学习任务的类型有一定了解后,可以根据问题探索最流行的现实生活算法及其应用陈述。看完这篇文章,试着解决这些问题吧!我相信你会受益匪浅。问题陈述1:预测房价走势。解决问题的机器学习算法:高级回归算法,例如随机森林和梯度提升。问题陈述2:深入挖掘客户人口统计数据以确定模式。解决这个问题的机器学习算法:聚类算法(elbowrule)。问题陈述3:预测贷款还款。解决问题的机器学习算法:不平衡数据集分类算法。问题陈述4:根据皮损的特征(大小、形状、颜色等)确定皮损是良性还是恶性。解决这个问题的机器学习算法:卷积神经网络(U-Net网络是分割的最佳选择)。问题陈述5:预测客户流失。解决这个问题的机器学习算法:线性判别分析(LDA)或二次判别分析(QDA)。LDA特别受欢迎,因为它既是分类器又是降维技术。问题陈述6:为员工招聘提供决策框架。解决问题的机器学习算法:决策树是这方面的“专家”。问题陈述7:理解和预测产品的销售属性。这个问题的机器学习算法:逻辑回归或决策树。问题陈述8:分析市场情绪并评估市场对产品的看法。解决这个问题的机器学习算法:NaiveBayes-SupportVectorMachine(NBSVM算法)。问题陈述9:创建分类系统来过滤垃圾邮件。解决问题的机器学习算法:分类算法。建议使用朴素贝叶斯、支持向量机、多层感知器神经网络(MLPNN)和径向基函数神经网络(RBFNN)算法。问题陈述10:预测用户点击在线广告的可能性。解决问题的机器学习算法:逻辑回归或支持向量机。问题陈述11:检测信用卡交易中的欺诈行为。针对此问题的机器学习算法:AdaptiveBoosting、IsolationForest或RandomForest。问题陈述12:根据车辆的特性估算车辆的价格。解决问题的机器学习算法:梯度提升是解决这个问题的最佳选择。问题陈述13:预测患者加入医疗保险的可能性。解决问题的机器学习算法:简单的神经网络。问题陈述14:预测注册用户是否愿意为产品支付一定金额。解决这个问题的机器学习算法:神经网络。问题陈述15:根据年龄等不同特征对客户进行分类。解决这个问题的机器学习算法:K-means聚类算法。问题陈述16:为语音识别系统从语音数据中提取特征。解决这个问题的机器学习算法:高斯混合模型。问题陈述17:多目标跟踪,使用混合分量的数量和均值来预测视频序列中每一帧的目标位置。解决这个问题的机器学习算法:高斯混合模型。问题陈述18:对来自一组微阵列实验的基因和样本进行排序,以揭示生物学上有趣的模式。解决这个问题的机器学习算法:HierarchicalClusteringAlgorithm。问题陈述19:根据具有相似特征的其他用户的偏好向用户推荐电影。解决问题的机器学习算法:推荐系统。问题陈述20:根据用户阅读的文章,向用户推荐他们想阅读的新闻文章。解决问题的机器学习算法:推荐系统。问题陈述21:优化自动驾驶汽车的驾驶行为。解决这个问题的机器学习算法:强化学习。问题陈述22:通过医学扫描诊断健康疾病。解决这个问题的机器学习算法:卷积神经网络。问题陈述23:平衡不同需求周期的电网负载。解决这个问题的机器学习算法:强化学习。问题陈述24:处理时间序列数据或序列(例如录音或文本)。针对此问题的机器学习算法:递归神经网络或长短期记忆(LSTM)。问题陈述25:翻译语言。解决这个问题的机器学习算法:递归神经网络。问题陈述26:为图像生成标题。解决这个问题的机器学习算法:递归神经网络。问题陈述27:训练聊天机器人处理更细化的需求和客户查询。解决这个问题的机器学习算法:递归神经网络。希望通过本文的介绍,能够让大家对最常用的机器学习算法有所了解,遇到具体问题时,能够迅速做出反应,选择合适的机器学习算法。本文转载自微信公众号“读芯”,可通过以下二维码关注。转载本文请联系核心阅读公众号。