人工智能越来越火,想要在人工智能领域创业的人也纷至沓来。不过,在人工智能领域创业也有很多需要注意的地方人工智能领域。近日,与GeorgeHotz在comma.ai合作开发无人驾驶汽车的EderSantana专门写了一篇文章,对想要培育人工智能的创业者提出了四点有价值的建议。让我们来看看。机器学习如此火爆,以至于被视为AI本身,尤其是更火的深度学习。令人高兴的是,你的创业团队已经获得资金,或者你的团队预算刚刚通过,现在你即将开始深入学习。之前,你已经感受到了来自Keras、Imagenet等人工智能技术带来的快乐,非常激动人心!然而,当你真的想开始在商业中实践人工智能时,有几件事是你必须考虑的。接下来,我会用去年早些时候我在comma.ai与GeorgeHotz一起研究自动驾驶时发生的几个例子来说明我的建议。救命啊艾!我要去哪?1.不要让数据和工程师脱节深度学习是一门数据优先的科学。您的团队或初创公司的重点是理解这些数据。想一想,除非你让文字有意义,否则你无法开发你的AI比特币聊天机器人!在理解图像、视频等之前,你无法构建下一个SnapchatStories风格的自动化多媒体拼贴画。你应该将数据处理视为工作的核心。这方面一定要做好。例如,如果你认为准备和加载数据集“只需要15分钟”,那么每次发现更好的模型架构或发现Tensorflow代码中的错误时,你都必须白等这15分钟。分钟的时间。规则很简单。对您的数据集进行版本控制并对其进行一次预处理,然后一遍又一遍地使用它。Celery、Luigi等工具将是你的好帮手。如果你在一个大团队中工作,团队中的所有任务都需要提交到一个集群,那么你应该考虑一个数据解决方案,将数据批量提供给模型训练员工。当团队成员已经知道模型有缺陷时,不要让他们必须等到整个数据集加载完毕才能修改模型。小故事:comma.ai可能拥有世界第二或第三大驾驶数据集。在comma.ai的早期,为了训练驾驶模型,需要将数小时的视频加载到内存超过700Gb的大型机器上。每当George需要更多数据进行训练时,他都会立即添加100GB的内存。我加入的主要目的是开发这个模型的更好版本,但我不想等待15分钟来加载数据。相反,我从一个简单的ZMQ服务开源项目中得到了一些东西。从此以后,没有更多的数据让我们操心了,我们可以扩大我们的训练规模,使用更便宜的机器。现在对模型训练的限制只有GPU和它的开发者。2.从你能可视化的开始对于深度学习,我们很幸运有Tensorboard,最近推出的Visdom和其他工具来帮助我们可视化结果。我相信数据科学总体上最适合可视化驱动的开发,因为可视化可以让你在开发过程的每一步都能正确解决你遇到的问题。除非您是JavaScript狂热者,否则您无需学习d3.js即可获得有用的可视化效果。小故事:在离职面谈中,我向乔治请教如何提高工程师的效率(相信我,他是我见过的最有效率的人,我会抓住一切机会向他请教学习)。他的建议是构建一些可以可视化我正在做的事情的东西。乔治本人过去常常这样做。此外,George的所有IPython笔记本都有一个幻灯片小部件,可以快速显示参数在原型制作过程中如何影响结果。3.尽早澄清你的验证/疑难案例数据集。我把充满乐趣的可视化放在第二位,这样你就可以在被“准备数据”吓倒后休息一下。然而,如果你想避免成为打字猴,只是随机地向神经网络添加更多层,你必须学习如何衡量进步。问问自己哪些指标与出色的可交付成果相关性更好,哪些数据应该跟踪。这可能不仅仅是简单地“随机验证剩余数据的10%”。经过验证的数据库***具有与产品相同的统计属性。同样的产品也可以用来跟踪困难的、边缘的,甚至是失败的案例,以制作未来的验证集。因此,您的验证集可能会进化,并且应该像训练集一样进行版本化。小故事:我了解到,对于自动驾驶,驾驶时必须由人控制车辆的那些时刻是困难案例和验证集。但唯一的概念验证测试是让经验丰富的控制工程师上路,以准确判断自动驾驶系统的质量。如果你在这个行业,最好去特斯拉找工程师(开玩笑)。4.过早扩张是早期创业失败的主要原因。听到这个建议,你可能会说“别教我这个,我听过的创业故事比你多!”是的,但这里要告诉您的是:您应该将GPU和硬件培训视为与员工相同的因素。一旦你雇佣/购买的资源超过了你的需要,你就会花费大量的精力来安排额外的资源。管理集群可能很困难,而具有深度学习的大规模HPC本身就是一个研究课题。我的建议是:在考虑购买新GPU之前,您应该确保所有GPU都得到充分利用。当然,你可以像谷歌一样花钱,前提是你和谷歌一样有生产力和盈利能力。如果您的团队和公司足够大,请认真考虑雇用从事基础设施工作的人员。如果你雇用的研究人员是你的硬件人员的10倍,而你让他们等待,最好的情况是他们会建立自己的基础设施,最坏的情况是他们会辞职。这当然不是你想看到的。小故事:Niel(comma的移动应用副总裁)在我离开办公室后没有运行所有GPU时给了我如此失望的表情,它甚至让我“空闲GPU恐惧症”。今天,这已成为一个非常普遍的问题。没错!在AI领域工作可能具有挑战性,但也很有趣。确保您对如何处理资源和可视化进行了一些思考,您会没事的。
