当前位置: 首页 > 科技观察

数据科学与机器学习:有什么区别?

时间:2023-03-21 20:05:56 科技观察

机器学习是人工智能(AI)的一个分支,而数据科学是数据清理、准备和分析的学科。人们需要了解每种技术的工作原理以及它们如何协同工作。机器学习(ML)和数据科学经常被一起提及,这是有充分理由的。这两种技术相互补充,但重要的是要了解它们的工作原理以及它们如何协同工作。机器学习是人工智能(AI)的一个分支,它使计算机能够从数据中学习并在无需人工干预的情况下应用该学习。业务转型和外包咨询服务提供商PaceHarmon的总监JPBaritugo表示,“本质上,数据科学是一个实践领域,而机器学习是一套工具和方法论。数据科学使用广泛的专业知识,业务知识、工具和方法来处理大数据以生成有意义的见解,从而推动行动并实现有意义的业务成果。”为什么机器学习需要数据科学有效的机器学习需要良好的数据科学。Baritugo说:“企业需要数据科学家的专业知识,以确保正确使用和部署机器学习。使用正确的算法。”IngoMierswa,创始人兼总裁数据科学平台RapidMiner表示,“数据科学可以应用在机器学习领域之外。数据科学是人工智能、机器学习和深度学习以及商业环境中数据准备的实际应用。数据科学的目标是从数据中获得洞察力,预测未来发展,并提出行动建议(有时甚至自动执行),这是通过人工智能和机器学习等工具实现的。”从根本上说,数据科学家从多个角度开展工作。从多个来源收集和准备数据集,然后应用函数从中提取见解。在某些情况下,他们可能会涉足机器学习。在其他情况下,可能需要更基本的分析。ISG自动化和创新总监WayneButterfield说,“数据科学,至少在我看来,只是对数据的操纵。”什么时候使用机器学习的工具。Mierswa说:“机器学习擅长处理这些数据,从中提取模式并获得洞察力,而这些洞察力是人类工作人员所花费时间的一小部分。”“例如,机器学习(由数据科学提供信息)为金融服务、欺诈检测和投资组合管理、基于GPS的旅行预测以及亚马逊和Netflix的产品和内容推荐提供风险分析,”巴特菲尔德说。“机器学习适用于已经有大量标记良好的历史数据或可以非常快速地模拟数据的问题。如果没有足够的数据进行训练,使用机器学习可能会花费很多时间。密歇根理工大学计算学院计算机系统副教授TimothyHavens说:“机器学习模型的好坏取决于它们从中学习的数据的质量,而且有很多数据会导致很多类型的问题。”Butterfield解释说:“某些问题非常适合机器学习。”例如,数据科学(不包括机器学习)已应用于预测和规划多年,但效果有限准确性。因为企业现在可以构建复杂的算法,这些算法可以考虑多种数据源,例如天气、历史疾病模式、外部事件、过去的需求、企业可以获得更准确的预测,而且不仅仅是每天一次,而且可能每小时一次。“在金融服务中,机器学习和数据科学可以为保险和欺诈预防提供强大的解决方案。在IT应用中,可以改进网络管理。医疗机构可??以应用机器学习和数据科学来提高诊断准确性,确定最佳价格和数量组合或预测患者结果。在客户体验管理中,他们共同努力改善客户互动,预测客户生命周期价值,并估计客户流失率。零售商可以使用它们来预测需求。优化定价和细分客户。在制造业,数据科学和机器学习可用于自动化供应链和改进规划。当足够多的数据科学围绕人工智能的技术应用展开时,每个业务问题开始看起来像是向它扔一些机器的问题学习的机会。但在许多情况下,机器学习不一定行得通,也可能造成更大的伤害。everestGroup副总裁AnilVijayan说:“有时数据科学就足够了。由于界限模糊,很难清楚地区分数据科学和机器学习。最终,大多数算法都使用统计技术。并非每个问题都需要AI来解决。在许多情况下,使用传统的数据科学可能不仅足够,而且效率更高。Vijayan说,不涉及机器学习的传统数据科学技术在输出依赖于相对较少且不会随时间发生太大变化的参数时会更加有效。此外,仅当输出和参数之间的关系得到充分理解且不太可能改变时,才采用数据科学就足够了。