“硅谷教父”约翰·轩尼诗:“中文自然语言处理有点难” 据2020年5月26日消息,今天,中国国际大数据产业博览会在贵阳正式开幕。
开幕式上,图灵奖获得者、美国国家工程院院士、“硅谷教父”弗拉基米尔·约翰·轩尼诗发表主题为《数字时代的技术创新》的演讲。
约翰·轩尼诗认为,利用大数据改善整个世界的第一个方法是利用大数据进行机器学习,这样我们就可以构建增加和增强人类智能的智能系统。
其中一种方法是使用人工神经网络,即深度学习系统。
它们具有多层复杂的神经网络。
这些人工神经网络可以抽象地描述人脑。
它们并不是人类大脑工作原理的精确复制品。
它们是抽象的、简化的大脑。
大数据是深度学习突然突破的重要原因之一。
为了完成训练,为了做这种监督学习,我们需要大量的数据,大量准确的数据,而在利用大数据创建智能系统的过程中,获得准确的数据是最大的一个。
挑战。
例如,使用 ImageNet 进行图像训练总共涉及 80,000 个不同的对象。
每个对象包含数百张图像。
它们可以用作训练集,因为它们包含大量的对象和图像。
这是一个非常好的图表。
图像识别训练集。
因此,大数据是最重要的组成部分。
另一个重要组成部分是大量的计算资源。
我们需要大量的计算资源来进行训练。
我们无法用传统计算机和个人电脑内的传统微处理器来解决这些问题。
我们需要专门的数据域加速器来很好地实现这些功能。
使用GPU或TPU技术将使计算更容易处理并且更便宜。
低的。
约翰·轩尼诗认为,除了自动驾驶和医疗诊断之外,深度学习应用第三个最有前景的领域是自然语言处理领域,通过分析文本或语言来获取相关信息。
当然,中文翻译有点困难,但未来还有改进的空间。
。