当前位置: 首页 > 科技观察

大数据、小模型、深影响

时间:2023-03-19 20:15:26 科技观察

有人可能会问这个问题,我所代表的学院——牛津大学互联网研究院的主要工作职责是什么?我想说,我是牛津大学信息哲学教授,信息伦理学教授,能够在这里和大家一起见证腾讯互联网与社会研究院的成立,是一件非常了不起的事情。因为我觉得人类发展数据技术是一朵灿烂的花朵,在古老的地球上绽放了很多年。事实上,这项技术已经存在很多年了,它已经深深植根于我们的生活中。这是哲学。哲学就是土壤,而这个土壤应该很关心花朵的健康生长,所以我今天要讨论的是,如果你认为你是一朵花,你就必须爱护你的土壤;如果你是土壤,你就必须爱护花朵。这就是哲学与这个新研究所、哲学与我们的信息网络之间的关系。什么是大数据?大数据由三个“V”组成——Velocity、Variety和Volume。事实上,大数据一直在变化——变得更快、更多、更多样化,每天、每周。但是大数据有没有限度?这三个“V”会继续增长吗?数据有其局限性吗?2013年,中国共产生了0.8ZB(约8亿TB)的数据,到2020年将达到35ZB,增长速度很快。我们的内存可以存储多少数据?我们的内存是没有限制的,因为它是动态发展的,跟数据的增长有关。我刚才说的是大数据的一些历史。突然有一天,我们发现大数据将成为一种资产。什么时候能成为大资产?如果要挑一个具体的日子,大概是2012年,世界经济论坛宣布大数据将成为一种新的经济资产,就像货币或黄金一样。毫无疑问,这个经济的增长速度非常快。我也在经济论坛上听到很多知名经济学家对大数据的看法,大家一致认为这是一个全新的情况。现在什么是大数据?不仅仅是速度、多样性和数量,还有价值(Value)——从三个“V”到四个“V”。这四个“V”已经伴随我们很长时间了,这也是我们今天来到这个论坛讨论大数据的原因。但是你要知道,哲学家总是要不停地追问,什么是价值?这个值指的是什么?说到大数据,它体现了什么样的价值?我们首先要问为什么大数据本身有价值?每个人都以这样或那样的方式使用大数据,那么为什么大数据比以前更有价值呢?因为它是网络资源,而且这个资源可以和其他资源结合。它很有价值,因为它是可持续的,可以用于不同的目的。与我们过去接触到的黄金、石油等其他资源相比,它简直就是一望无际的海洋。数据在不断增长,帮助我们改善生活、工作和产品,并预测未来趋势,包括医学和科学领域。我们也可以用数据做一些模拟。比如在生化实验室,可能没有人见过某种动物,但是我们可以在电脑上模拟这种生物。可见,数据越多,决策越容易,最后就可以利用大数据进行创新。这就是为什么我们认为这种新型资源的价值不可低估。《商业周刊》的报道中提到,北京大学光华管理学院教授认为,中国将很快成为最大的数据市场,数据相关的工作将在未来十年成为热门。还有消息称,除日本外,亚太地区的数据产业很快将从2.58亿美元增长到17.6亿美元。到2016年,年复合增长率将达到46.8%。为什么大数据如此重要?对于作为哲学家的我来说,大数据的价值是什么?所谓大数据的价值体现在小格局、小形态上。这是什么意思?我们看到最重要的是一些小的数据是一点一点连接起来的,那么大规模的数据怎么会以一种可辨别的形式出现呢?可以说,除非这些小图案是连在一起的,否则你的眼睛无法分辨出这么小的图案。如果你有足够的能力和足够的数据,你可以发现这些数据可能是一部手机;如果你不太了解技术,你可能看不到这款手机的外形。可见大数据是最敏感的。当这些细小的敏感线连接在一起时,你会立刻发现“小图案”决定了一半数据是垃圾,但你不知道是哪一半,只能不断地收集这些数据。数据可以做出判断。从全球范围来看,这样的大数据有哪些优势?除了优势,大数据还有哪些风险?关于未来,我们应该关注哪些方面?首先,大数据和小模型关系到我们隐私的关系。当然,还会有一个新的问题,那就是预测。我们发现,有了足够的数据,再加上智能小图案的搭配,电脑就知道你会规划什么样的行程,在你买牙膏之前它就已经知道你要买牙膏了。计算机可以告诉我们今天要做什么,但不会告诉我们为什么。当然还有广告的压力,以及越来越有说服力的工具来说服你什么是最好的。这些都影响我们的自由,对个人来说,这些都是风险。但它们不是无法解决的风险,只要我们注意,它们是可以解决的。当然,这里不仅有风险,还有很多好处。当我们谈论大数据时,我们必须记住大数据是有价值的,它具有知识和技术的价值,可以让我们更好地了解这个世界。从健康、技术、教育到医学的研究帮助我们加深了对世界的理解。当然,我们也可以想想大数据给我们带来的经济价值和商业价值。例如,企业和企业家可以利用数据创造经济价值,确保下一代人过上比当代人更好的生活。因此,我们需要思考大数据的经济价值。今天我们聚集在这里,也是关注大数据的社会价值,即如何利用大数据来增加社会价值,如何改善企业运营,如何改善交通,如何预测和改善未来的健康问题。大数据是一个很好的工具,可以帮助我们改善生活,给我们带来希望。我们应该使用什么样的策略来获得大数据的好处并规避风险?对于大数据,我们应该采用什么样的价值策略?我觉得这样的策略制定起来比较容易,但是执行起来比较困难。大数据可以确保我们避免伤害,防止伤害或消除伤害,创造福祉。让我向你解释一下。你可以想想医生对他的病人做了什么。医生应该尽量避免他的病人遭受一些痛苦,并希望他变得更健康、更强壮。大数据可以帮助我们为整个社会做同样的事情——预防和治愈痛苦,最重要的是,改善数百万人的生活。历史的车轮一直在前进,我们无法阻挡。我们确实在发挥作用,无论大小,作为机构还是个人,我们的作用是保证未来社会的顺利发展。同时,数据的价值、体量、速度都会越来越大,可能会出现信息过载、噪音太大的问题。面对这样的情况,我们该怎么办?这个时候,我们必须保证这样的噪音差距尽可能小,这样才能充分发挥大数据的价值,而不会使整个社会系统超载。这是我们研究所的一项非常重要的责任。当然,我也想强调一下我们自己的理念。大家可以想一想,有几万亿的大数据,我们有那么多的信息,我们也知道这些是不是真的问题在不断增加。要想找到答案,从中找到信息,就必须确定正确的问题,即问什么样的问题,才能挤出水分,通过大数据确定小格局。柏拉图就是这样一个聪明人。他知道如何提出问题以及如何回答问题。他看到我们互联网研究院的成果会很开心,因为他看到我们在充分利用大数据帮助我们实现价值。