本文经人工智能新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。要成为机器学习工程师,您通常必须拥有博士学位。即使没有写成求职的必要条件,也逐渐成为一种自然规律。一个自学成才的人应该写什么样的项目经历才能让面试官相信他有同样的能力?一位名叫AdditionalWay的网友在Reddit上提出了这个问题,直击灵魂,引发了大量讨论,短短两天热度就突破了500。在讨论区,很多人提出了中肯的建议:行业需要的技能。有个网友叫po-handz。他的评论获得80分点赞,占据评论区顶楼:Puttinginputproduction(投入生产),你可以超越99%的应届毕业生和大部分现在的ML工程师。对此,有人(莫拉瓦克)表示同意墙裂:这个“大部分”其实≥99.9%。顶楼补充说,即使很多人博士毕业,也未必有把项目投入生产的经验。那么,怎样才算有这样的经历呢?网友(BernieFeynman)简单解释了一下:建立一些模型,你不必非常非常强大。但是人们可以看到模型在哪里,比如有一个API可以调用。当然,做到这一点不是一句话的事。顶层详细描述了整个过程有多难:比如一般你不是只有一个模型,而是一个组。因此,这些大型模型需要加载到服务器的内存中。也接受新的输入数据。这些数据必须与测试数据采用相同的格式,并且需要进行缩放。它们应该如何缩放?您需要GPU进行推理吗?在这种情况下,在AWS上每月可能需要花费1,000。预算能支持吗?时间序列数据呢?您需要一个持续更新的模型来跟踪调整参数。除此之外,您还需要一个实时的、可维护的数据管道。这样做比处理清晰干净的数据集要困难得多。最后,你还需要一整套的UI、网站和nginxstack,让它变得用户友好。别说应届毕业生了,很多有经验的数据科学家对这些东西都一无所知,因为他们可能只在自己的专业领域工作,别人把干净的数据集交给他们。如果在这一点上打败了他们,对企业的价值就更高了。不要踩到简历的雷区去练实战技能,这只是一方面。不想死在简历筛选的过程中,网友(rudiXOR)总结了“招聘ML工程师的中型公司”的十大雷区,供大家参考:第一,持有大量MOOC证书.没用,我试过了,一路点击quiz谁都能搞定。其次,我对Kaggle的成绩太骄傲了。很多大学生都参加过Kaggle比赛,他们也知道这样的比赛和ML工程师的工作没有什么共同之处。三是去集训3个月。从PCA到LSTM,几乎所有的ML技术都被实践过。没有人真的相信它。第四,GitHub项目是代码只提交过一次的项目。你甚至不知道是不是你自己做的。第五,GitHub主页是新的,不是单个项目。第六,该模型只在玩具数据集上进行了测试,没有更严肃的项目。第七,每种语言都说“精通”。比如C++、Python、Java、C#……第八,仔细匹配简历和职位要求(“HR算法的流行语优化”)。九、没有证明自己的数学/统计知识水平。第十,没有软件开发经验。就算你忘记了前九个,你也可以认真地参考一下第十个。网友清点雷区后强调:如果你是自学成才,不要一上来就投给数据科学家或ML工程师。可以先申请数据分析师或者软件工程师。如果你是自学ML,没有软件开发经验,我不会录用你。参考上一篇文章,如果你没有读过博士,那么拥有更多的行业经验比读博士更有好处。还有一件事然而,自学永远不会太晚。比如谷歌大脑的研究员DavidHa,在投入机器学习的怀抱之前,他已经是高盛的董事总经理(MD)。所以,各位,请尽力而为。Reddit讨论区有更多建议:https://www.reddit.com/r/MachineLearning/comments/c3e9qu/d_those_who_hireinterview_for_machine_learning/
