当前位置: 首页 > 科技观察

不到两个月的时间,如何从小白成为谷歌认证的TensorFlow开发者?

时间:2023-03-14 16:45:37 科技观察

因为新冠疫情在家无事可做,印度尼西亚的应用数学专业学生GradyMatthiasOktavian在从未用Python编程过的情况下,用了不到两个月的时间就获得了谷歌TensorFlow开发者证书。本文将介绍他的经验和学习方法。TensorFlow的起源Oktavian是一个热爱学习的人。在好奇心的驱使下,他在COVID-19大流行期间阅读了大量相关新闻和文章。一天,他偶然看到一篇文章,文章中一组研究人员开发了一种新系统,可以根据X射线区分普通肺炎和新冠肺炎。文章提到研究人员使用“人工智能”和“神经网络”。这让他感兴趣:如何训练一个系统来区分不同的X射线扫描?这个人工智能即使没有医学学位也能达到90%以上的准确率!以此为契机,Oktavian进入了深度学习领域。事实上,他只是在和朋友交流了TensorFlow和Keras之后才觉得大开眼界。然后他花了一天时间浏览相关文章,看到了DanielBourke的一篇文章,描述了他如何获得TensorFlow开发人员认证。所以Oktavian也决定冒险一试,但他担心时间不够,因为他马上就要开始工作,而且差不多同时开始他的硕士课程。另外,他还没有学过Python。他真的能完成这个壮举吗?他之前已经完成了精算学应用数学的本科学位,这意味着他学习了微积分、回归、时间序列和统计学。然而,他的Python技能几乎是零,他唯一学过的编程语言是R。虽然R非常适合处理数据,但不幸的是,TensorFlow开发人员认证考试目前不支持R语言。Oktavian在文章中写道:“获得这个证书对我来说是一个里程碑,因为那时我可以理直气壮地说我是一个数据和AI爱好者。”故事讲完,进入正题。先说说TensorFlow。什么是TensorFlow?为什么要学习它?简而言之:TensorFlow是一个广泛使用的机器学习软件库。具体来说,TensorFlow是一个免费开源的框架,支持用户开发端到端的机器学习和深度学习项目,涵盖从预处理到模型训练和部署的全过程。该框架最初由谷歌大脑团队开发,在谷歌内部使用,现在被广泛使用。那么我们为什么要学习TensorFlow呢?因为它可以做很多事情,它的应用范围比你想象的还要广泛。很多时候,您甚至不知道自己正在使用基于TensorFlow构建的服务。这个GIF展示了Gmail的智能回复是如何工作的你有没有使用过Gmail的智能回复?它由AI驱动,可根据您的电子邮件内容建议3条回复。它是使用TensorFlow构建的。推特时间线排序方法?WPSOffice的光学字符识别(OCR)?来自VSCO的照片预设建议?他们都使用TensorFlow。TensorFlow出现仅四年多一点,就已经广泛应用于我们日常使用的许多服务和产品中。什么是TensorFlow开发者认证考试?参加考试需要多少费用?TensorFlow数字徽章TensorFlow开发人员认证考试是书面的,必须用Python语言完成。对于本次考试,我们使用Python的TensorFlow库和API。每次尝试的费用为100美元。如果第一次挑战失败,您可以在两周后以100美元的价格重新参加考试。有关考试支付和规则的详细信息,请参阅本手册:https://www.tensorflow.org/site-assets/downloads/marketing/cert/TF_Certificate_Candidate_Handbook.pdf。考试大纲涵盖四个主题:使用TensorFlow构建和训练神经网络、图像分类、自然语言处理和时间序列。考试必须在PycharmIDE中完成。看完手册后,Oktavian开始规划自己的学习路径,先学习Python语言,再熟悉TensorFlow。学习之旅:第一个月那么一个没有Python经验的应用数学研究员是如何在两个月内成为TensorFlow开发者的呢?以下是他实现目标的旅程。第一个月,先学Python。如何快速做到这一点?他做的第一件事是访问hackerrank(https://www.hackerrank.com/domains/python),并立即开始练习大量Python问题。当你遇到自己无法解决的问题时,你会立即上网搜索解决方案。如果您还没有找到它,请查看参考答案并尝试理解那里的概念。他这样持续了两个星期。至此,他已经能够在没有任何参考答案的情况下,解答大部分的问题,甚至更难的问题,他也能解答。那么剩下的两周他都做了些什么呢?观看教程。YouTube上有许多免费的Python教程。你没听错。但他也告诫说:如果你能参加正规的Python课程并进行更结构化的学习,那当然更好。Oktavian列出了三个对他的学习之旅有帮助的视频。这些视频是免费的,因此被低估了。而且,即使这些视频完成了,也得不到任何证书。三个视频如下:PythonforBeginners:本教程来自ProgrammingwithMosh。本视频简洁明了地介绍了Python中的基本概念,从字符串、操作、函数、数据类型(列表、字典、元组)和继承入手,然后详细讲解了三个适合初学者的项目。这些项目中的第二个与机器学习有关。(https://www.youtube.com/watch?v=_uQrJ0TkZlc)PythonforDataScienceFullCourse:这个来自edureka的视频涵盖了必要的Python包,为您在数据科学方面打下坚实的基础。视频最后简要介绍了在Python中使用Keras和TensorFlow进行深度学习。(https://www.youtube.com/watch?v=-6RqxhNO2yY)DataAnalysiswithPython:该视频来自freeCodeCamp.org。在开发和训练模型之前,我们经常忽略数据预处理步骤。本视频重点介绍此阶段,重点介绍收集数据、加载数据、清理数据以及通过数据可视化获得洞察力。(https://www.youtube.com/watch?v=r-uOLxNrNk8)Python的深度学习虽然要上正规课,但这三个YouTube视频就够了。一句警告:你必须自己编写代码,并在观看视频时不断自己尝试。学习之旅:第二个月Oktavian在第二个月参加了Coursera上的DeepLearning.AITensorFlow开发人员专业认证课程:https://www.coursera.org/professional-certificates/tensorflow-in-practice。该课程的讲师是来自GoogleBrain的LaurenceMoroney和deeplearning.ai的创始人AndrewNg。本次专业培训共有四门课程,涵盖了考试大纲的四个要点。每门课程为期四个星期,但Oktavian每天要上一周的课,这是他当月的首要任务。每门课程结束后,他都会休息一天来测试他所学的内容。白天,他会尝试代码,或者以随意的方式探索与课程相关的想法。总的来说,他有5天的时间来完成每门课程。4天看课程资料,第5天休息和复习。就这样,他在20天内完成了4门课程。每门课程都有编程项目,Oktavian实际上探索了课程中提供的代码。他经常花费数小时来调整神经网络的超参数,以获得尽可能好的验证精度。通过这种方式,可以在创建深度神经网络模型的试错过程中获得某种“直觉”。有时课程索引外部资源,例如数据集、文章和未分级的材料。学习这些外部材料并不是完成和通过课程所必需的,但Oktavian仍然探索了大量内容。这些课程大多以实践为导向,Ng也有一些视频解释直观和理论方法。您不必遵循与其他材料相同的路径来通过此考试。如果您不想花49美元来学习这门课程,Coursera上还有其他值得学习的课程:Hands-OnMachineLearningwithScikit-Learn、Keras和TensorFlow:Concepts,Tools,andTechniquestoBuildIntelligentSystems(第2版),AurélienGéron着。Oktavian计划在未来几个月通读这本书。他认为这本书非常全面,有助于理解机器学习和深度学习的一些关键概念。与考试大纲类似的材料出现在本书的第10-16章中。CodingTensorflowVideoSeries:这个免费的YouTube播放列表包含本次考试的材料,主要由LaurenceMoroney教授教授。Oktavian选择Coursera课程是因为它提供了额外的分级测试问题和项目,但如果您自己探索这个YouTube播放列表中的材料,您也可以做得很好。也不要忘记查看Keras和TensorFlow官方网站上的文档。(https://www.youtube.com/playlist?list=PLQY2H8rRoyvwLbzbnKJ59NkZvQAW9wLbx)在参加考试并完成所有课程后,Oktavian花了四天时间复习课程并重读手册。二月二十五日,开始考试。显然,这里不会讨论考试内容的细节,但他给出了一些关于准备和参加考试的注意事项:首先,安装所需的PythonIDE。目前TensorFlow认证考试所需的IDE是PyCharm。为确保安装了正确的版本(请参阅手册),请禁用并卸载其他第三方插件。提示:在参加考试之前,运行一些TensorFlow模型测试,看看是否有任何需要解决的错误。考试报名:https://www.tensorflow.org/certificate。完成付款并上传身份证明(国家身份证/护照)。此时您将收到另一本小册子,该小册子仅供注册和付费用户使用。阅读本手册以确保您在考试开始前做好准备。考试持续五个小时。你需要明智地计划你的时间:当你为一个问题开发的模型正在训练时,你可以开始下一个问题。训练并保存模型后,不要忘记提交和测试模型(安装考试插件后,您的IDE将有一个“测试和提交模型”按钮)。第一个目标是先完成所有的问题,然后如果你还有时间,你可以回去优化你的模型。记住:时间有限。只要你的模型拿到了满分,就可以放手了。您可以在GoogleColab、AWS等外部平台上训练模型。在开始考试之前,您应该学习如何从这些外部平台保存模型,然后将它们加载到PyCharm中。您必须以“.h5”格式保存模型。如果你学得很好并且掌握了教学大纲中列出的要点,你应该可以通过考试。小册子中概述的教学大纲非常有指导意义,您可以将其用作准备考试的学习指南。至于硬件要求,Oktavian考试是在没有专用GPU的AMD笔记本电脑上运行的,GoogleColab只用了一次来解决一个大数据集的问题。您可以通过在自己的设备上训练几个模型来测试它,看看您的设备是否足以完成考试。更让人担心的是网速和网络稳定性,因为需要上传模型才能完成考试。考试成绩考试结束后,基本上可以立即收到是否通过考试的邮件。两周内,Oktavian收到了一份官方数字证书和一个指向他的LinkedIn页面的链接。证书有效期为三年,所以他已经打算在2023年再考一次。他想,到那时TensorFlow和深度学习领域一定有了巨大的发展和进步,考试内容也可能会发生一些变化。变化。总结对于Oktavian来说,认证不是结束,而是开始。Oktavian说:“通过这次考试是我真正意义上超越自我的第一个里程碑,也让我跨入了数据科学的大门。”在当下火热的AI和数据科学领域,不乏“三天学”、“七日精通”、“一个月精通”的故事,但Oktavian从零开始的经历Python因为疫情的闷闷不乐,在不到两个月的时间就成为了TensorFlow认证的开发者,依然令人钦佩和羡慕。