机器学习入门平台的天花板,还有免费的实用经典教程,真的没有别人了。论AI围观菩萨,非李牧先生莫属。之前写过《深度学习实战》,成为圈内的入门经典。后来在B站做了一个斯坦福AI的免费讲座,一个有难度的硬核讲座视频播放了36万次。许多研究小组的范围从导师到实习本科生。人生在追逐。这么精彩的分享,难怪很多人都自豪地称自己“拜师门下”——而最近,我发现还有一个平台做了更精彩的事情。本平台不仅免费提供算力,还将入门经典《深度学习手把手》免费放到平台上,供大家学习实践。名称是:AmazonSageMakerStudio实验室。据介绍,该平台基于JupyterLab,提供免费GPU和CPU算力+15G永久存储功能,同时还链接GitHub,支持使用主流机器学习工具组件和开源资源包。开发者可以结合《动手深度学习》教材自己训练模型并查看结果。而且,他们声称他们只需要一个电子邮件地址就可以申请,不需要公众号,更不用说信用卡了。真的有这么好的东西吗?今天就带大家去测试一下。“动手深度学习”的案例,你真的能练出来吗?通过链接studiolab.sagemaker.aws,我们可以登录网页平台探索现实。在哪里可以找到“动手深度学习”?从界面可以看出,平台提供了GPU/CPU算力选项,无需付费即可直接使用。在右下角,我们可以看到DiveintoDeepLearning(简称D2L)。直接点击OpenD2Lnotebooks打开:打开项目后,系统会自动加载D2L资源,存放在我们的云文件夹中。README文件也被打开。其中,系统环境配置、图书概要、面向读者、目录框架等一应俱全。文末还有各章节的链接,可以直接进入。至此,你可以通过平台将课程内容与实操相结合来学习深度学习——那么实操效果如何呢?代码可以运行的地方,我会告诉你。以经典的AlexNet部分为例来感受一下。平台上展示了??AlexNet的开发和基本原理的讲解,可以运行模型的定义和构建代码。为了保证初学者更好的理解,我们也可以搭建一个单通道的数据例子,观察AlexNet内部8层的输出。目的是帮助我们直观的了解不同层的功能:最重要的是训练模型环节也开放练习操作,选择代码部分运行即可。但是,这个过程允许很长时间。我们在GPU选项下用7分钟左右的时间进行训练,慢慢等吧!△看到曲线画的很慢,值得一提的是,由于整个界面都可以作为Notebook来添加代码,记录学习和思考-so,即使我们的课程学完了,也可以在下面添加一个代码栏文末,对照章末习题,编程实现作业。从数学基础到实际环境的配置,都安排得清清楚楚。以上展示只是一部分。其实从全连接层、卷积、池化等概念的介绍,到ResNet和DenseNet的讲解……都是在AmazonSageMakerStudioLab的免费环境中呈现和实践的,而且都安排的一清二楚。该平台还深思熟虑地认为我们的高级线性代数基础不同。不是每个人都超过了90分。还给出了单变量微积分、极大似然等数学基础的介绍和代码实现,还附上了环境配置方法,很靠谱。经过以上验证,这个AmazonSageMakerStudioLab确实可以免费完整的练习大神的“深度学习动手”——对于想要入门甚至深入掌握AI/ML技术的人来说,这那种理论+实践的学习方式自然效率更高,以后向实际工作或者科研甚至创业的过渡会更加无缝。事实上,它的能力不仅限于这个层面。面向开发者的免费平台,顾名思义,AmazonSageMakerStudioLab的推出背后的公司是亚马逊云科技。这家尖端科技公司这次推出了一个免费平台。它不仅将“动手深度学习”打造成一个理论+实践的实践领域,还想为数据科学家、企业开发者、高校师生提供一个免费的低门槛入门。机器学习的包容性机会。事实上,在AmazonCloudTechnology之前,业界已经有多个开放的机器学习平台——那么,这次AmazonSageMakerStudioLab有哪些值得关注的新亮点呢?让我们从配置开始。平台提供15G以上永久存储,16G内存,4个CPU,GPU为NvidiaTeslaT4,略高于目前其他主流平台。由于采用了更新的架构NVIDIATeslaT4,其混合精度运算速度指标也相应更高。另外,免费版采用了与SageMakerStudio相同的架构,相当于叠加了一层企业级Buff,稳定性更有保障。值得注意的是,平台宣传的是4小时GPU+12小时CPU,但实际上时间到了之后我们仍然可以再次打开Runtime,原来的文件依然存在。但是你要挖币算了……平台明令禁止使用SageMakerStudioLab进行生产活动,挖加密货币直接封号。说完配置,我们来看实际操作。在可操作性方面,AmazonSageMakerStudioLab比其他平台更加简洁直观。该接口不仅可以创建JupyterNotebook文件,还支持我们直接创建新的Terminaltabs和Markdown格式文件。另外本平台配备了Conda和Pip资源包管理器,让我们不用重复安装开源软件包,省事省心。无需使用命令行即??可拉取GitHub项目,只需单击左侧的按钮即可。如果克隆出来的项目中有yml环境配置文件,则在项目建立时也会同步建立Conda环境。该平台还与Github相关联。在我们自己的Github项目README中添加以下内容:[](https://studiolab.sagemaker.aws/import/github/org/repo/blob/master/path/to/notebook.ipynb)添加“在StudioLab中打开”按钮——其他人只需单击一下即可访问AmazonSageMakerStudioLab平台。当然我们也可以通过手动上传或者复制的方式新建一个ipynb。以经典的图像分类算法为例。从其他平台拷贝一个ipynb文件后,不加修改就可以使用,顶多就是手动安装依赖。实测训练模型的速度与其他平台基本一致,有时甚至略快。最后,我们还要看看很多人关心的数据安全问题。我们在做机器学习的时候,往往会有很多隐私的人脸信息,甚至是还没有脱敏的医院患者信息。为了保护他人的隐私和数据安全,我们不得不从这方面来看。AmazonSageMakerStudioLab脱胎于企业级应用,承诺每个人的数据都经过加密保护,如果账号被删除,所有相关数据也会随之删除,平台承诺不会保留。目前,已有多家知名学校和企业使用AmazonSageMakerStudioLab并为其平台背书。其中,有ENIAC诞生地宾夕法尼亚大学工程学院、加州圣克拉拉大学金融系、HuggingFace。国内也有不少追随者。南方某985理工学院机器学习领域的博士生表示,虽然他们的课题组专注于传统的机器学习,但仍然需要深度学习的方法来辅助验证。由于实验室的计算设备是几年前购买的,随着人员和研究方向的增加,尤其是投稿前夕,竞争计算资源的情况屡见不鲜。AmazonSageMakerStudioLab确实对他们有吸引力。说完这个免费平台的各种优势,接下来的问题就是:如何申请?让我们在这里谈谈它。无需亚马逊云技术账号,登录官方链接studiolab.sagemaker.aws/requestAccount填写邮箱地址及相关信息即可。不过为了保证大家尽快通过申请使用,希望大家注意一些提示:推荐语言为英文,填写清楚相关机构的名称,以及机构的后缀电子邮件地址与机构的英文名称相匹配。这样的应用程序更可信和可靠。满足以上条件,亲测24小时内即可获得邀请,注意查收邮箱。高级版本的无缝迁移上面已经讲过了。AmazonSageMakerStudioLab和AmazonSageMakerStudio专业版的架构相同,所以如果你想从初学者免费版迁移到专业版,那绝对不是什么大不了的事情。对于专业的开发者来说,这无疑为进阶科研和创业提供了更多可能。更具体地说,AmazonSageMakerStudio专业版自始至终为开发者提供了一套相当全面的功能:比如为我们高效的大型模型训练需求提供大规模分布式训练。使用分区算法在GPU实例中自动拆分大型模型和数据集,以提高并行度并加快训练速度。例如,数据标注功能GroundTruthPlus吸引了人类专家,结合机器学习辅助预标注,大大减少标注错误,提高标注速度。再比如AmazonSageMakerDataWrangler,它面向机器学习中的数据准备阶段,可以通过可视化界面进行数据选择、清洗和探索。只需一键导入,无需编码即可快速标准化转换各种结构的海量数据。“四大”之一的德勤就采用了这一功能。原本几个月就能完成的数据准备,现在被压缩到几天。此外,AmazonSageMakerStudio还包括访问控制管理、模型监控、Serverless推理功能、推理配置建议……直至工业化AI/ML服务的全周期都涵盖在内。以上很多是亚马逊云科技re:Invent2021今年推出的新功能,很大程度上体现了该公司对需求的理解和对技术的前瞻性——对于专业开发人员和数据科学家,无论是研究,还是创业,这些功能提供了更多的可能性。更有趣的是,亚马逊的云技术似乎并不局限于商业运营,还有很多对我们来说“不赚钱”的普惠活动。机器学习马拉松项目就是一个例子。赛事每年举办数次,平台将在AI相关领域的应用中拿出试题,涵盖AI自动编程、防灾或损失评估等。赛事将考验挑战者在CV、NLP等方面的能力等,在此期间,相关平台和资源也将由平台提供。获胜者将获得高达50,000美元的奖金。像这样面向实际需求,以技术造福开发者的活动还有很多,各有各的乐趣或社会价值。零门槛上手机器学习的自动驾驶竞赛AmazonDeepRacer,拥有数百万粉丝和14万开发者参与;也有与非营利组织GirlsinTech合作的活动,帮助更多女性了解和上手机器学习,消除科技圈的性别差距;还有最新的AmazonSageMakerCanvans,在圈内备受关注,面向零代码经验的内部分析师和运维人员,帮助他们将机器学习应用到实际业务门技术中。您如何评价亚马逊云科技的SageMakerStudioLab?从商业角度来看,这些做法当然有利于未来自身生态的建设,是龙头企业保持地位的必要举措。此外,大量公司往往以50万年薪招收相关从业人员,这对很多开发者来说也是一件好事。毕竟,人工智能的不足是肉眼可见的。大多数开发人员具有丰富的编程经验和数学基础。唯一的障碍是他们不熟悉机器学习。灌完这块为什么不喝汤呢?不过,从行业的角度来看,上述动作确实是在推动前沿技术的落地——只不过这里的推动不是更快,而是更广。要知道,汽车是一百多年前才发明出来的,只有机械专家才能成为车主,所以在当时的社会,司机是一个技术尖端的职业。要知道,三十年前,PC和互联网还只是一小部分开发者的玩具,开发网站可以让人快速致富,资产积累如高楼大厦。所以一百年前的人无法理解一个人人都能开车的社会,所以30年前的人很难想象动动手指就能拥有自己的互联网平台。今天的机器学习也是如此。即使是最前沿的技术大师,也只能看到一小部分AI落地图。只有反复降维,这项技术才能走进千行百业的场景,在不同背景、经历的人手中产生不同频率的回响。达娜的公众心在撒谎。那么,未来AI技术能释放出多少能量呢?答案还得从每个开发者个体和每个场景缝隙中寻找。
