当前位置: 首页 > 科技赋能

成立一年后估值突破10亿,这位90后CEO是如何做到的?

时间:2024-05-22 12:50:07 科技赋能

文章| Lina 人工智能热潮的兴起是不争的事实。

在您阅读本文时,为期三天的 ICLR 国际学习表征会议刚刚结束。

这场由全球两大深度学习巨头主办的学术研讨会近年来名声大噪,已成为人工智能领域的重要会议之一。

谷歌、百度、Facebook、英伟达等大公司纷纷加大赞助力度。

(6位专家做了21场演讲,你可以在一篇文章中阅读所有最好的深度学习会议ICLR!)在这份赞助商名单上,一家中国初创公司格外引人注目——深鉴科技。

这是一家非常年轻的公司,但其履历却令人印象深刻。

公司内部聚集了无数清华大学、斯坦福大学的技术专家,并在各类学术研讨会上获奖。

而成立仅仅一年,不仅获得了1万美元的天使轮融资,还在今年年初敲定了数千万美元的A轮融资,估值超过10亿元人民币。

那么它有什么作用呢?既然赞助了ICLR会议,自然就和深度学习有关。

深度学习分为训练和应用两部分。

神剑科技主要解决应用问题。

简单来说,就是企业训练好自己的深度学习算法模型后,深鉴科技会将其压缩20-50倍并进行编译,最终的产品会以板的形式呈现。

神剑科技基于FPGA平台:与擅长训练的GPU相比,FPGA功耗更低,整体性价比更高,更适合应用。

但由于FPGA难度高、开发周期长,很多公司不愿意使用。

神剑科技相当于给用户提供了一个黑匣子。

企业只需提供输入模型和数据,深鉴科技提供应用层FPGA解决方案。

智东西很早就开始关注神剑科技了。

今年2月,深圳科技首席科学家韩松的《深度压缩》论文在FPGA芯片领域顶级会议FPGA上获得最佳论文奖;而更早之前,在去年的 ICLR 国际学习代表大会上,最佳论文奖也被神剑科技夺得。

大家一定非常熟悉同年的另一位最佳论文奖获得者,那就是AlphaGo的开发者谷歌DeepMind。

无独有偶,深鉴科技和智东西都位于人工智能创业热点五道口,两家公司距离也很近,也算是缘分。

今天,志东西来到公司,与创始人兼CEO姚松进行了详细的交谈。

1、“姚老板”和他的兄弟(也是师傅)姚松给人的第一印象就是很年轻,很瘦。

戴着眼镜,穿着蓝白格子长袖衬衫,人很好,很健谈,很容易交谈。

但。

是的。

请不要误以为你只是一个长相帅气的普通理工科男生。

这才是真正的学术大师。

我从小就升职了。

高三时我被直接推荐到清华大学。

进入电子系后,我以大一的身份进入了实验室(理工科的同学大概就能明白这有多厉害了)。

本科期间,我不仅访问斯坦福、在微软亚洲研究院实习、开发项目、发表论文,基本完成了别人的本科、硕士、博士工作……此外,姚松还担任了科学与技术学院的主席。

电子系科技协会,并主办了电气设备等一系列科技竞赛——正是因为董事长的职位与一家公司的CEO非常相似,所以姚松得到了一个绰号:“老大”姚”在他大三的时候。

神剑科技的其他联合创始人和合伙人更是卧虎藏龙。

(从左至右:单毅、王宇、姚松、韩松)王宇——也就是姚松提到的“王老师”,姚松大一时进入的就是王老师的实验室——清华大学电子系毕业1998年任清华大学电子工程系副教授、党委副书记。

自2001年开始研究FPGA,现为ACM FPGA技术委员会亚太区唯一成员。

CTO 单毅 博士清华大学电子系博士,2004年获得学士学位。

曾任地平线机器人FPGA技术总监、百度深度学习研究院高级工程师。

首席科学家韩松2008年毕业于清华大学电子系本科,现为斯坦福大学博士研究生。

韩松就是上述最佳论文奖的获得者。

他开发了“深度压缩”技术,不仅可以将神经网络压缩数十倍而不影响精度,而且可以使用“片上存储”来存储深度学习算法模型,减少内存读取并显着降低功耗消耗。

“我是最小的,11年级。

” “姚老板”说完这句话,低下头笑了。

现在神剑科技整个团队有70人,其中有近一半是清华大学的,而且你看一下……几乎都是男生。

这家于2019年3月3日正式成立的公司,成立仅一个月就获得金沙江创投、高榕资本的1万美元天使轮融资。

今年年初,其完成数千万美元A轮融资。

,投资方包括FPGA鼻祖Xilinx。

2、从GPU到FPGA,深度学习人工智能的风起云涌有目共睹。

从融资如雨后春笋般涌现的各类AI初创企业,到国内外无数巨头高调投资,再到“人工智能”被写入中国政府工作报告等诸多新闻中。

事实上,人工智能的概念由来已久。

为什么近年来它变得如此流行?姚松认为,深度学习不同于以往的人工智能。

不仅在某些领域超越了人类,而且事实证明,人脸识别、微表情、医疗、SLAM等领域都有专家,各个领域的专家都不能重用。

但现在深度学习的AI框架可以涵盖各个领域,对硬件加速非常友好,应用范围也很广泛。

然而,说到深度学习,大多数人想到的就是GPU——五六年前,CPU主要用来运行机器学习算法。

CPU具有良好的通用性,硬件框架非常成熟,非常人性化。

然而,随着机器学习和深度学习的计算量的增加,CPU已经不能满足人们的需求,人们已经将注意力转向了GPU。

GPU不仅具有更强大的并行处理能力,还具有更强大的控制数据流和存储数据的能力。

因此,它可以将神经网络训练的速度提高10-20倍,从而缩短原本需要数周甚至数月的训练时间。

时间缩短为几天。

深度学习分为训练(Training)和应用(Inference)两部分。

尤其是在训练阶段,所需的数据计算量远远超出了CPU时代的人们敢于想象的程度。

这对于专注于GPU生产的英伟达来说确实是个好消息,英伟达去年的股价飙升也证明了这一点。

不过,这个消息对于全球最大的CPU制造商英特尔来说并不是那么友好——不过如果它性能不好,我们也可以购买。

2020年12月29日,英特尔宣布将用1亿元人民币全资收购FPGA/CPLD公司Altera。

至于Altera和前面提到的Xilinx的关系,很可能就像肯德基和麦当劳的关系。

啊?这不是承诺的GPU吗?我们为什么谈论 FPGA? FPGA(Field Programmable Gate Array),全称“可编程门阵列”,是作为专用集成电路领域中的一种半定制电路而出现的。

它不仅解决了完全定制电路的缺点,而且克服了原有的可编程逻辑器件。

缺点是门数有限。

(Xilinx推出的UltraScale架构FPGA)简单来说,FPGA的“可编程性”就是用户可以通过重新配置逻辑资源不断尝试,通过编辑不同的配置文件来设置同一块FPGA的不同属性。

,直到得到最好的解决方案,非常灵活。

深度学习作为一项仍在发展中的技术,由于其灵活、可编程、可试错的特性,对FPGA非常友好。

这是第一点。

除了灵活性之外,第二点就是功耗。

一个GPU的功耗很容易达到W或W,功耗巨大。

虽然NVIDIA也推出了针对嵌入式端的GPU设备(例如Jetson TX2系列,其标准功耗为7.5W/15W),但对于无人机、安防摄像头等功耗敏感的硬件来说,它仍然会存在。

存在功耗过大、发热、过大影响电池寿命等问题。

功耗3W和4W的FPGA在这里具有突出的优势。

第三点是延迟问题。

虽然GPU的运行速度比FPGA快,但GPU的高性能来自于其并行处理能力。

训练时效果很好,但应用时一次只能处理一张输入图像。

优势无法充分发挥,造成延误。

但由于其峰值计算性能高、内存接口带宽高等优势,GPU仍然是当前深度学习训练阶段的最佳选择。

但在应用方面,FPGA灵活、低功耗、价格相对低廉等优势开始凸显。

目前,国内外很多大公司已经逐渐开始关注维护、采购、散热、内部损耗成本等问题,并开始逐步将FPGA引入到自己的系统中。

例如,去年亚马逊与赛灵思合作推出了基于FPGA的亚马逊云服务。

、百度大脑采用基于FPGA版本的AI专有芯片,腾讯云也发布FPGA云服务器等,市场接受度不断提高。

3、产品实现:DPU和深度压缩虽然FPGA有各种好处,但也有一个很大的问题,就是开发难度。

由于传统的FPGA开发需要使用硬件描述语言(Verilog或VHDL)而不是传统的计算机语言(如C语言),程序员需要基于FPGA公司提供的编译器进行二次开发,这使得存在开发难度大、周期时间长(一般为3-6个月)等问题,因此很多企业不愿意使用。

神剑相当于给这些不愿意直接使用FPGA的厂商提供了一个带有接口的黑匣子。

厂商训练好自己的算法模型后,通过接口传输模型和数据,深鉴科技对其进行压缩编译。

生成的指令可以在FPGA上运行,制造商直接获得所需的输出结果。

为此,深鉴科技提出了“DPU”的概念。

DPU(深度学习处理单元)相当于将压缩、编译、执行的整个“黑匣子”过程具体化了,它的最终实现形式是一块板子。

(上:亚里士多德板,用于嵌入式端。

下:笛卡尔版,用于大数据端)压缩方面特别值得一提,因为与GPU相比,FPGA有一定的带宽限制。

缺点。

神剑科技联合创始人兼首席科学家韩松(没错,就是在 FPGA、ICLR 等会议上获奖的韩松)正在研究“深度压缩”技术,他在获奖论文中阐述了如何使用深度压缩将神经网络压缩数十倍而不影响精度,从而降低计算复杂度、存储空间和带宽限制。

姚松还告诉智东智,每套DPU不需要根据不同的公司定制不同的板卡,只要用于类似的应用就可以重复使用。

“比如A公司想做车牌(识别),B公司想做人脸(识别),这些公司只需要改变自己的算法模型就可以接入,DPU可以重复使用。

” (搭载神剑板无人机)目前,神剑科技的合作伙伴主要集中在无人机、安防、数据中心三大领域。

代表企业有无人机厂商零度智控、上市公司东方网络、搜狗等。

例如,将一块板卡装入零度智控无人机中,使其具备人脸识别、跟随、手势拍照等功能。

功耗仅为3W,不会对续航造成太大影响。

其他嵌入式终端如安防摄像头也消耗3W,而数据中心应用的功耗仅为30-40W。

公司下一步的扩张目标包括产品平台化和标准化、推动与其他大型互联网公司的合作等,进一步推动产品成熟。

4、这里聚集的“大神”不配是学术专家——当然,放眼办公室,各种编程代码高手都聚集在这里,学术能力当然就不用提了——“大神”们” 这里值得那些是特别有趣的。

神剑科技整个公司氛围有点像硅谷。

氛围和环境都比较轻松,但工作节奏却比硅谷紧凑很多——毕竟我们地处五道口。

公司拥有多名学术大师,特别是体育大师。

不仅有足球、篮球、羽毛球三支球队,还有一位曾经在国安青年俱乐部效力的足球伟人。

他和其他人根本不是一个档次的……再比如另一位研发总监,开始了研发。

我还是能很好承受的。

之前他在做FPGA项目的时候,恰巧他的孩子刚刚出生。

于是我看到他坐在客厅里,抱着孩子,写着代码。

好吧,这就是努力工作,尽情玩乐。

姚宋本人自然也是“神”之一。

据他的说法,“我相当焦躁,更喜欢新的方法。

”除了学术之外,他还“什么都做一点”,比如社会工作、体育、音乐。

本科毕业后,姚宋收到了美国卡内基梅隆大学(CMU)的博士录取通知书,而且还附带高额的学术奖金,但姚宋拒绝了。

当然,一开始父母是不同意的,但最终还是王宇老师亲自劝说了姚父母和姚妈妈。

不知道是不是一句流行语,姚松在整个采访过程中经常说——“这是一件非常有趣的事情”,这给人一种错觉,深度学习、FPGA、神经网络的知识理论其实并不复杂。

无论如何,经营一家几十上百人、估值超10亿的科技公司似乎是小菜一碟。

结论:科学技术是第一生产力。

当志东问“创业过程中最大的感受是什么?”时,姚松表示最大的感受是“一个理论从技术,到产品,到市场,最后到收入,每一步“在一个商业产品中,纯理论的技术部分可能只占到后续产品开发和商业实现的30%。

因此,对于学术能力较强的团队来说,如何平衡学术与业务,为市场带来有价值的实用产品是一个需要认真思考的问题。

但话说回来,在人工智能领域,今天技术依然是第一生产力。

聚集了众多技术大师的神剑科技,成立短短一年多的时间,就能够推出产品、与厂商达成合作、成功获得融资并获得高估值。

成绩单还是很让人印象深刻的。

随着深度学习的发展,国内外各大公司都逐渐拥抱FPGA。

在这样的浪潮下,深鉴科技专注于深度学习应用的实现,针对FPGA开发难度大的痛点。

前景值得期待。

在此之前,FPGA最大的应用是在通信领域,直到近几年才开始应用于深度学习。

与经过市场多年验证的CPU、GPU等产品不同,FPGA仍然是一个相对小众的市场。

即使巨头赛灵思市值仅1亿美元左右(截至发稿,英伟达市值约10亿美元),提升行业接受度仍需时日;另一方面,FPGA仍然是一项对人力资源要求较高的技术。

在公司未来的扩张过程中,如何更好地招募FPGA人才,人力成本是否会进一步增加?这也是可能面临的挑战之一。