学术研究的专利所有权对于学者来说非常重要,是对自己工作的保护和肯定。但如果他参与研究的专利因为公司变动而被分走,后续的研究会怎样?深度学习三巨头之一、卷积神经网络之父YannLeCun就遇到过这种“烦人的事”。说到美国的贝尔实验室,喜欢研究科技史的同学一定不会陌生。是晶体管、激光器、太阳能电池、发光二极管、数字开关、通信卫星、电子数字计算机、C语言、UNIX操作系统、蜂窝移动通信设备、远距离电视传输、模拟语言、声音的重要组成部分电影、立体声录音和通讯网络等许多重大发明的发源地,拥有数万项专利。但很多人不知道的是,卷积神经网络曾经是万分之一。近日,约克大学EECS副教授KostaDerpanis挖出了这样一个冷知识。他发现,早在1989年和1990年,AT&T贝尔实验室就已经提交了两项关于卷积神经网络的专利申请。专利名称为“HIERARCHICALCONSTRAINEDAUTOMATICLEARNINGNEURALNETWORKFORCHARACTERRECOGNITION”,是一种用于字符识别的层次约束自动学习神经网络。为什么AT&T贝尔实验室这么早就申请了卷积神经网络的专利?这还要从卷积神经网络之父YannLeCun的早期职业生涯说起。80年代后期,LeCun在贝尔实验室工作。1989年发表了《UsingBackpropagationforHandwrittenPostalCodeRecognition》的相关研究,在美国邮政系统得到成功应用。随后,该系统的应用范围扩展到银行支票。到20世纪90年代后期,该系统已经处理了美国10%到20%的支票识别。关于卷积神经网络的专利,LeCun回复如下:卷积神经网络(ConvNet/CNN)有两个专利:一个是stridedconvolution的ConvNet,一个是独立poolinglayer的ConvNet。它们分别于1989年和1990年提交,并分别于1990年和1991年获得批准。官方证明:卷积神经网络的专利确实是贝尔实验室在90年前申请的。不过之前LeCun也提到了一个细节。1996年之后,专利权归NCR所有。这里发生了什么?让我们看看LeCun的回忆:我们首先与一个开发团队合作,他们构建了一个基于ConvNet的OCR系统。此后不久,AT&T收购了NCR,这是一家为银行制造支票成像仪和分拣机的公司,支票图像随后被发送给人工操作员进行转录。显然,NCR希望将这些操作自动化。我们最终构建了一个完整的支票阅读系统,该系统足够可靠,可以部署。自1995年以来,银行一直在对其进行商业部署。该系统可以读取大约一半的支票(机印或手写),并将另一半发送给人工操作员。事实上,第一次部署是在ATM实施货币验证之前一年进行的,这是由法国CMB银行开创的。然后在1996年发生了重大变化:AT&T拆分为AT&T(服务)、Lucent(朗讯,一家电信设备公司)和NCR。我们research(研究)团队留在AT&T(包括AT&TLabs-Research),engineering(工程)团队去了Lucent,product(产品)团队去了NCR。在律师的努力下,ConvNet的专利最终被转让给了NCR,因为他们销售的是基于ConvNet的产品。所以,我停止了ML研究。当时,神经网络越来越不受欢迎,我开始与LéonBottou(法国学者,以其在机器学习和数据压缩方面的工作而闻名)在一个名为DjVu的互联网图像压缩项目上合作。我们在1990年代初期就这项工作撰写了一系列论文。(注:LeCun、LéonBottou和另一位学者PatrickHaffner是DjVu图像压缩技术的主要创造者)我直到2002年离开AT&T后才重新开始ConvNet研究。我希望NCR没有人意识到他们拥有我所做的研究的专利。其实并不是。2007年专利到期时,我开香槟庆祝。所以我们从这个故事中得出的结论是:当专利与最适合建立专利的人分离时,专利制度可能适得其反。对于物理事物,专利是合理的,但对于软件,它几乎从不适用。明明自己参与了发明,却因公司变动被迫与专利分离,甚至还卡在了后续研究中。LeCun的经历或许也不例外。近两年,谷歌为Dropout等算法申请专利的消息也在社区引发热议。尽管杰夫·迪恩后来亲自解释说:“这些与算法相关的专利本质上是防御性的,主要是为了防止谷歌研究人员的成果在申请专利后被其他机构勒索,造成经济损失。”但是很多人对此还是很反感的。这种做法认为,“这是一种野蛮和自私的举动,科学和数学的专利阻碍了人类文明的发展”。从LeCun的遭遇来看,反对者的观点似乎是有根据的。
