当前位置: 首页 > 科技观察

你为什么不揭露深度学习的本质?!

时间:2023-03-13 18:23:14 科技观察

人类正在慢慢接近世界的本质——物质只是信息模式的载体。人脑以外的器官,正是保障这一使命的补给舰队。自从去年AlphaGo虐李世石之后,深度学习开始流行起来。但是好像没人能解释清楚它的原理,就当黑盒子用吧。有人说深度学习是非线性分类器?有人说深度学习是对人脑的模拟……但我不认为他们已经穿透了窗户纸。看完杰夫霍金斯的《论智能》,“就是这样!”。我惊讶地发现原书是在2004年出版的!我怕自己读的是假书,或者美国的一些民间科学著作,于是在豆瓣和知乎上查了一下,发现几乎所有看过这本书的人都对它的理论赞不绝口。但奇怪的是,似乎没有人愿意为其立下汗马功劳,这一说的影响也就到此为止了,仿佛每个人都在刻意隐瞒自己看过这本秘籍一样。把人脑智能的运行机制,清楚完整的解释清楚了!请注意,这是真正的智能,而不仅仅是人工智能!!!三个感悟与大多数脑科学论文相比,作者的感悟要简单而深刻:长期以来,由于我们没有能力从内部观察心灵,人们总是把“智能”等同于“表达智能行为”。但当我们读一本书时,在外人看来似乎一切都没有改变,但我们知道在这期间产生了无数的联想、顿悟和回忆。因此,“理解”不能用外在行为来衡量,它是内在衡量的指标。从草履虫到人类,大自然会为每一种生物设计一套智能机制,或者继续使用一套机制,或者从某一代出现全新的智能机制,并且沿用至今(当时,首先什么样的物种产生了这种智能机制?)?我们所说的智能是人类独有的,还是生物的普遍特征(只是区别)?作者认为,智能不可能是上帝为人类设计的,它一定是来自大自然的某种诡计。大脑皮层无论在结构上还是功能上,都具有相同的结构/机制(严格来说,这不是作者的见解,而是早在1978年就被VernonMountcastle发现了)。从这三个洞见出发,自然会引出以下问题:如果智力不是由行为定义的,那么它是如何定义的?展望未来,智能是如何进化的?向内看,大脑皮层的结构如何捕捉世界的结构?简单地说,作者的结论是:智力并不像人们想象的那么神秘,它只是一种“预知未来的能力”。这些预测的实质不过是“生物稳态机制”和“环境压力”下“生物易怒”的副产品。从本质上讲,智能是“稳定不变的”。这是由于大脑皮层的同质层次结构。接下来,让我们看看作者是如何从这三个简单的洞见中,一步一步推导出智能的本质的。生命的摆动小到人体,大到经济系统。在复杂的系统中也有类似的机制来减少影响并使系统恢复到稳定状态。血糖浓度低时,胰高血糖素分泌增多,血糖升高;当血糖高时,胰岛素的分泌就会增加,从而使血糖降低。通过调节这对激素,系统试图将血糖保持在一定范围内。这种稳态机制出现在生活的各个角落,维持着生命的自我平衡。这就像一只“看不见的手”,时刻想推开挤压,同时抓住“逃兵”。这只“看不见的手”在我们的大脑中编织了无数的“正确位置”(用脑科学家的行话,“恒定的表征”)。一旦出现偏差,我们就开始警惕,调动多个系统共同应对。举个书上的例子,当一个球飞过来的时候,我们不去计算它的轨迹和落点,而是指挥四肢做相应的调整,直到接住球。这套调整算法就是“预测”。从这个例子来看,人接球表现出的聪明与草履虫对食物表现出的暴躁有什么本质区别呢?为什么“预测”是智能的基础?通常,人们理解的“预测”太大了。就像从发球的那一刻起就准确计算出球的落点,而人脑的“预测”更像是“压力”。小调整。现代社会的飞速发展,让我们看不清概念的历史面貌,更容易被表象迷雾所迷惑。当我们回到历史的起点,迷雾自然会散去。智能对我们最大的好处是什么?不是为了创造什么,而是为了生存。人类始终在“生存”与“发展”之间挣扎。但很少有人看到,发展只是为了应对未知的生存挑战。我们应该如何定义智能?也许进化史可以告诉我们更多。智能是一种帮助人类生存的能力:是让我们在溪流中分岔鱼游的能力,是让我们仅凭模糊的形象就可以判断是朋友还是野兽的能力……我们应该研究像“如何保持平衡”这样的问题,而不是弹道式地解决问题。那不是大自然的进化目标,我们自然得不到任何大脑机制。所有的生存问题都可以简化为一个元问题:如何识别这个问题中的那些常量。比如:溪流中的鱼儿,回家的方向……如果智能中还有其他的成分,比如:想象力,创造工具,解决问题,都可以归结为某种抽象的手段。归根结底,人类解决所有问题的方法只有一个——用抽象来调和更高维度的矛盾。一切都绕不开“不变的表示”(invariantrepresentations)。抽象的本质就像是人们在认识了“负数”的概念后,最终可以将“加法”和“减法”这两个在外观上完全不同(一增一减)的运算统一为“整型字段添加“.从更高维度调和矛盾,恰恰是大脑皮层的结构和运作方式。不断寻找现象中的共同点,提炼出来,并给它们起个名字;这些名称成为下一层抽象的基石(或“词汇表”)。依此类推,一层一层地进行,直到你到达智能的圣杯——持续表征。例如,我们如何识别边缘?让我们首先检查一个3×3的小视网膜,标记为#1~#9(如下图所示)。当一条垂直线出现时(#1、#4、#7都被激活),电信号被传递到第二层。第二层中的每个神经元都对视网膜中一组细胞的激活做出反应。例如,第二层最左边的神经元对单个视网膜细胞的激活有反应。另一个例子:第二层的第二个左神经元对任何两个视网膜细胞的激活都有反应。等等……边缘识别:最底层是视网膜细胞;当一组视网膜细胞被激活时,会激活上层相应的神经元;而当上层神经元的组合被激活时,它会激活一条链中的上层神经元。如果我们考虑时间因素,假设信号不是立即消失,而是随时间衰减,那么只要时间足够短,输入(#1,#4,#7),(#2,#5,#8),(#3,#6,#9)这三组刺激会激活第三层的一个神经元,意思是“找一条垂直线”。看,其实每个神经元就是一个“词”(或“概念”/“抽象”/“特征”)。只是低级神经元描述的“词”不那么抽象。例如:第二层的#(1,4,7)神经元表示“一条垂直线出现在视网膜最左边”,而上层没有“在视网膜最左边”的约束”。记忆作用神经元可在5毫秒内完成信息收集-整合-输出,相当于每秒200次的计算速度。人可以识别图像,在半秒内做出选择(100步)......100步,机器不能。在人类已知的算法中,或许只有“打表??”(把答案预先存入内存,所用时间不计算,只提取)可以做到。因此,整个大脑皮层是一个记忆系统,而不是一台电脑。深度学习做对了什么?多层网络为逐层抽象提供了通道。今天,图像识别系统正是这样做的:底层识别边缘,然后识别特定形状,然后高层识别某些特征……卷积提供了获得“常量表示”的手段。还有什么我们不知道的?当我们想要找回某段记忆时,往往只需要寥寥数语。也就是说,记忆似乎以全息形式存储。任何片段都包含所有。此外,我们仍然不知道大脑是如何分100步做出决定的。我们也不知道为什么会有那么多反馈连接?轴突与树突之间的功能区别是什么?......现在让我们回到作者的三个见解,用行话重复一遍:理解是大脑如何形成记忆并使用这些记忆进行预测的内部衡量标准。预测是某种自我调节机制的副产品。大脑皮层在外观和结构上出奇地均匀。也就是说,大脑皮层对其所有功能都使用相同的计算方法。人类显示的所有智能(视觉、听觉、身体运动……)都是基于一套统一的算法