当前位置: 首页 > 科技观察

数据科学的现状与未来

时间:2023-03-16 17:14:47 科技观察

数据科学是近年来技术领域最热门的方向之一。如果你有工作经验和数据科学或相关领域的学位,你可以通过挥笔和简历获得一份有利可图的职位。然而,数据科学家能否成为AI领域的常青树呢?或者,几年后,围绕数据科学的热情最终会消退?在最近的一期AI播客中,邓白氏高级副总裁兼首席数据科学家AnthonyScriffignano分享了他作为数据科学从业者的工作状态,以及他对人工智能如何改变金融行业的前景、经验和见解。数据科学目前定位于Dun&Bradstreet,Scriffgnano主要负责技术创新和开发,同时管理着“全球同类最大的商业数据库”项目。Scriffignano解释说,这个史无前例的数据库不断从世界各国(朝鲜和古巴除外)收集大量数据,每天摄取数百万次。该数据库包含所有语言和文字系统,由七个不同的综合数据库组成。在跟踪企业数据的同时,这个综合数据系统也对整体风险和发展机会进行全局观察和分析。基于此,数据库可以进行大规模数据分析,以检测供应链异常和客户购买行为的变化。毫无疑问,数据科学将成为我们从如此庞大的信息库中提取价值不可或缺的关键武器。像Dun&Bradstreet这样的组织面临的最大挑战之一是寻找具有背景和实践经验的经验丰富的数据科学家来处理如此庞大的研究数据集。不幸的是,当前的就业市场不能满足他们对数据科学技能的需求。Scriffignano表示,他认为AI技术正在快速发展,未来将逐渐取代熟练的数据科学家,从而实现技术本身的通用化和民主化。在Scriffignano看来,成为一名成熟的数据科学家所需的技能在广度和深度上都远远超过机器学习模型开发人员。从本质上讲,真正的数据科学家需要专注于根据更广泛的问题从数据中提取价值;相比之下,现在很多自称数据科学家的从业者其实更像机器学习工程师,更关注机器。学习从事模型开发工作。Scriffignano认为,我们需要更多地关注数据科学家概念中的“科学家”部分。在他看来,数据科学家必须能够从观察到的数据中提出新的问题或理论,对这一理论进行实验设计和具体检验,然后得出结论并分享相关结果。Scriffignano指出,大多数组织只需要数据科学家提出可重用的模型。他强调,只有将数据科学家视为改进和创新的关键,组织才能取得成功。他还指出,不愿将数据科学家分散到纯模型开发以外的新领域,导致许多组织长期未能在数据科学和人工智能技术领域取得真正进展。挑战:治理和伦理除了从大数据中获取价值的问题,Scriffignano认为人工智能和数据科学还面临许多来自治理和伦理层面的挑战。当涉及到个人信息时尤其如此。在构建大型数据库并使用隐私信息构建智能模型时,我们如何确保这些隐私信息被负责任地使用?世界各国开始越来越严格地审查机器学习模型的部分原因是因为此类模型通常涉及大量隐私和安全因素。无论该模型侧重于哪些具体特征,隐私和安全已成为无法回避的现实问题。Scriffignano提出了一个有趣的观点,即AI法规最终将陷入恶性循环或泥潭,即为了满足需求而试图迎合所有人,又为了迎合所有人而创造更多需求。人们希望进一步提升模型的定制空间和开发开放性,但又不愿在隐私上妥协。一些企业和个人将受益于使用大量数据做出更准确预测的模型,但以获取大量私人信息为代价。有些人可能不希望他们的数据包含在这些模型中,这反过来会导致模型的准确性下降。因此,随着机器学习模型的发展和所需数据量的扩大,总会有对现状的不满。Scriffignano坚信,如果政府监管机构想要在维护国家安全的同时回避与隐私相关的担忧,那么最好的方式就是对技术发展持开放态度。在世界不同地区,法律法规的制定和细则总是存在很大差异,不同司法管辖区对伦理道德的理解也可能不一致。这种现象现在很明显:欧洲对道德伦理的约束最严,中国对隐私保护不重视,美国介于两者之间。一些国家更喜欢强调隐私保护,而另一些国家则更强调国家安全或经济发展。正如Scriffignano所提到的,其核心是机器学习本身没有地理界限。在一个地区完全不能接受的做法在另一个地区未必不合适。因此,可以区分模型的构建位置和使用位置。毕竟模型的传播往往是难以控制的,所以这种在隐私要求低的地区生产,在隐私要求高的地区消费的方式很可能成为未来流行的解决方案。在这个播客节目中,Scriffignano还表达了他对拟人化AI的厌恶。他更愿意选择更务实的方式,这让我们想起了当前由算法和流程驱动的人工智能技术变革浪潮。Scriffignano以通用人工智能(AGI)为例提出了自己的具体观点。他认为,如果我们不能根据掌握的大量数据提出正确的问题,人工智能就永远不会取得真正的突破。他还预见到未来专业人士将与AI齐头并进。只要我们保持警惕,就不必担心被机器或机器人完全取代。为了实现如此美好的未来,我们当然需要保持谨慎的态度,高度关注数据伦理和治理问题。只有这样,人工智能才能真正成为通向新时代的桥梁。