当前位置: 首页 > 科技观察

人工智能会“吃掉”数据

时间:2023-03-15 20:20:43 科技观察

从事过机器学习(ML)项目的都知道,机器学习需要大量的数据来训练算法。有人会说,数据永远不会太多。数据量与生成的机器学习模型的复杂性之间通常存在正相关关系。随着AI进入新领域并使用更复杂的AI功能,这种对数据的渴望只会加剧。除了AI的复杂性之外,其他几个趋势也在加剧这个问题,因此组织面临的问题是:“他们是否拥有成功推动AI项目的正确数据?”如果他们没有足够的资源,他们是否应该做更多的事情来为AI盛宴做准备?图1:AI/DataContinuitypoint”在未来几十年人工智能的发展过程中筛选和收集更多正确的数据。人工智能的发展改变了数据游戏。虽然机器学习需要大量的数据来纠正自身的行为,但随着人工智能功能的复杂性增加,人工智能对数据的需求也会快速增加。这是从机器学习向深度学习(DL)迈出的一大步,深度学习需要比机器学习更多的数据。原因是深度学习通常只识别神经网络层之间的概念差异。当暴露于数百万个数据点时,深度学习可以确定概念的边界。深度学习使机器能够通过像人脑一样的神经网络来表示概念,从而解决更复杂的问题。人工智能还可以解决更多模棱两可的问题,这些问题的答案往往更加不确定或模棱两可。这通常是判断或识别类型的问题,可以扩展到创造性或其他右脑活动。这反过来又会导致对数据的更多需求,在某些情况下,这些数据可能是紧急的或实时的。从数据驱动到结果驱动的转变人工智能在其协助或解决的复杂问题中不断发展,随着它的发展,它将变成数据驱动和目标/结果驱动。这意味着人工智能在解决某些问题或做出某些推论时可能会即时请求数据,从而使数据管理更加复杂。它可能涉及解决方案的归纳数据驱动部分与为实现目标而假设的数据演绎要求的交互。结果导向的问题需要这种类型的动态交互。这与简单地检索数据以查找感兴趣的事件或模式有很大不同。决策驱动的方法恰好介于这两种不同的模型之间。通过匹配数据和结果,可以关注并改进某些决策的健康状况。归纳和演绎都会出现更多战略决策。这只是推动数据使用需求的驱动因素之一。不断变化的问题范围会影响数据需求AI解决方案的范围通常从一个狭窄的领域开始,然后随着时间的推移增长到更大的范围,需要更多的数据。复杂的解决方案通常针对多个答案,需要更多数据来支持分支解决方案集,从而导致复杂/混合的结果。由于决策、行动和结果涉及组织内外的更多场景,因此需要获取更多数据以了解每个场景及其相互作用。这些场景中的每一个都可能以不同的速率变化和变形,因此需要更多的数据。总结显然,更多数据将成为人工智能辅助解决方案的标志。对数据的渴望可能来自更具挑战性的问题、更好地使用高级人工智能/分析或端到端价值链的增长。只有一件事是肯定的。组织更好地为“人工智能/数据交互”的新世界做好准备。它将改变或扩展数据管理策略、方法和技术。