当前位置: 首页 > 科技观察

是什么让深度学习深入世界并改变世界?

时间:2023-03-17 14:44:08 科技观察

还记得小时候,你是怎么学会认识水果、动物、汽车等等的吗?多年来,我们的大脑已经被训练来识别这些图像,然后将它们进一步分类为苹果、橘子、香蕉、猫、狗和马。除了学习识别食物和动物,我们还学习了品牌及其差异:丰田、本田、宝马等。受人脑生物学习过程的启发,科学家开发了人工神经网络(ANN)。“深度学习”是指由许多网络层组成的人工神经网络。它是机器学习中发展最快的领域。它使用由多个网络层组成的深度神经网络(DNN)来学习表示和抽象,以理解图像、声音和文本等数据。那么深度神经网络到底有多深呢?深度学习为什么叫“深度”学习?这是因为这些ANN网络的结构。几十年前,神经网络只有两层深,因为没有足够的计算能力来构建更大的网络。现在,存在超过10层或超过100层的神经网络。在深度学习中使用多个网络层,机器现在具有观察、学习和应对复杂情况的能力,有时甚至比人类更好。通常,数据科学家在数据准备过程、特征提取或变量选择(选择对预测分析有用的变量)上花费大量时间。深度学习使这项工作自动化,让生活更轻松。为了推动深度学习的发展,很多科技公司都开放了自己的深度学习研究资源,比如谷歌的Tensorflow和Facebook的开源模块Torch。亚马逊在GitHub上发布了DSSTNE,而微软也在GitHub上发布了开源深度学习工具包CNTK。所以今天我们看到了很多深度学习的例子,包括:GoogleTranslate使用深度学习和图像识别来翻译语音和书面语言CamFind使用移动视觉搜索技术来告诉你图片中有什么,你只需拍下一个物体的照片图片,无需打字,CamFind可提供快速、准确的结果。目前,Siri、Cortana、Alexa、Google等所有智能语音助手都在使用深度学习进行自然语言处理和语音识别。亚马逊、Netflix和Spotify也在他们的推荐引擎中使用深度学习,机器会在其中为您推荐下一部最佳电影、电影或音乐。GooglePlaNet查看照片并告诉用户照片的拍摄地点。DCGAN用于增强和补充人脸图像。DeepStereo:将街景拍摄的静止图像转换成3D空间,通过计算每个像素的深度和颜色,可以从不同的角度显示不同的视角。DeepMind的WaveNet能够模仿人类的声音来生成比现有的文本到语音系统更自然的语音。Paypal正在使用深度学习来防止支付欺诈。到目前为止,深度学习已经帮助图像分类、语言翻译、语音识别,并可用于解决模式识别问题。毫无疑问,这是一种颠覆性的数字技术,越来越多的公司正在使用它来创建新的商业模式。