当前位置: 首页 > 科技观察

意见不一什么是机器学习?

时间:2023-03-19 16:31:47 科技观察

所谓的数据科学家就是能够使用最合适的工具和方法来完成工作的专业人士。最好的数据科学家将他们的整个知识库和模式发现方案用于统计分析。科技数据的累积量应该如何查阅?通常,这涉及使用所谓的“高级分析”机制。这句话故意表述模糊,其核心是囊括了所有的技术手段——包括统计分析、数据挖掘、预测模型、自然语言处理、支持向量机等。在一般印象中,“数据挖掘”涵盖的范围很广,大多数相关工作似乎都属于它,包括对隐私侵犯和应用程序监控的关注。但在我看来,这相当于把所有能在空中飞翔的鸟类都称为“秃鹰”——显然不准确。原因是数据挖掘的对象是结构化数据。此类解决方案通常涉及特定的技术机制,如回归分析、决策树等,一般不用于非结构化数据的内容分析。.同样,“机器学习”也被越来越多地提及,成为一个包罗万象的概念。或者至少机器学习已经成为当前数据的便捷工具,这是科学家用来从新的(主要是非结构化的)数据中自动获取和发现知识和模式的一类尖端技术。而人们对机器学习定义的追寻似乎延伸到了更广阔和模糊的领域。这是我最近看完文章《了解机器学习:个人探索之路》后建立的印象。在这篇文章中,来自圣地亚哥州立大学和TrueBearingAnalytics的JosephR.Barr从作者的角度和他学习这个主题的个人经历讨论了机器学习的历史。他指出,“将机器学习、数据挖掘、预测分析和高级分析视为或多或少的同义词并没有错。”我不知道将机器学习与前面提到的其他技术进行比较是否实用。如前所述,机器学习主要用于非结构化数据,而数据挖掘专门用于结构化数据集。此外,与数据挖掘一样,机器学习主要关注历史数据中模式的多样性,而预测分析更侧重于在其中找到可预测的模式,这些模式适用于未来新数据收集的测试机制。然而,机器学习、数据挖掘甚至预测分析都是狭义的,而高级分析是一个更广泛的概念,可以容纳前面所有的项目。在我看来,机器学习一只脚在数据科学,另一只脚在计算机科学。基于这种理解,我同意Barr在文章中所说的:“机器学习是由多个不一定相互重叠的数学学科发展而来的,其中最著名的子类别包括数理统计、计算与算法、信息论、和数学优化等……过去,机器学习与人工智能紧密结合……大多数与机器学习相关的主题都集中在凸包、组合、凸性和优化、统计、信息和计算的理论可能性上。对于这个列表,我将向其中添加三个额外的条目:启发式、经验和应用。”这确实是一门比较难的学科,值得深入探讨和理解。通过上面的描述,我们可以看出机器学习有着令人望而生畏的学习曲线,人们需要在大学课堂和实验室里花费数年时间窥探它这其实是巴尔文章的核心:他本人是机器学习老师和数据科学专家,他面临的困难是如何为未来的数据科学家设定机器学习的正确定义。定义范围的变化表明,这些挑战对机器学习本身产生了影响和反思,在机器学习的宏观概念下,不同学科不断以创新的方式相互交叉、相互强化,这将拓展每一位数据科学家的思维方式,决定他们对概念的定义。establishformachinelearningwhenusingthisterm原文链接:http://www.infoworld.com/d/big-data/whats-machine-learning-it-depends-who-you-ask-244787原标题:什么是机器学习?这取决于你问谁