高达86%,这是目前“定制化AI模型开发”的市场需求占比。然而,在这个过程中,企业用户和开发者往往存在以下问题:缺乏模型训练经验数据收集和标注成本高模型适配和部署过程非常繁琐模型优化迭代周期长那么,有没有一种工具可以能否“一站式解决”以上问题?了解有关百度EasyDL的信息。简单来说,EasyDL大大降低了深度学习的应用门槛:让AI开发像使用“家电”一样简单。而且,训练出来的AI模型的质量和高级工程师制作出来的一样专业。但实际上,百度早在2017年底就推出了EasyDL,2018年初正式开放,同时提出了一个愿景——人人都能AI。那么在将近三年之后,这个愿景是从哪里来的呢?像家电一样的人工智能到底有多可靠?来看看EasyDL的三大特点:极简交互和使用流程,模型训练最快15分钟即可完成;高精度训练结果,如图像分类模型在线平均准确率在99%以上;丰富的部署方式,全面支持云、端、边部署。首先是EasyDL的易用性和低门槛。使用过程只有四个简单的步骤,分别是“创建模型”、“准备数据”、“训练模型”和“部署应用”。而且整个过程都是可视化的图形化操作,大大降低了企业和开发者的使用门槛。用百度AI平台研发部技术总监周鑫的话来说:你可以根据需求和数据定制自己的AI解决方案,不需要一行代码。在工业制造生产质量检测领域,以“爱宝花饰”为例。在监测残留异物(针头、金属件等)算法细节的前提下,还训练了一个准确率达到90%的模型。以“汉才猎头”为例,几位人力资源专家在不懂AI算法的情况下,利用EasyDL完成了简历数据的结构化处理和自动分类模型,大大提高了员工的简历检索能力。效率。但简单并不意味着会忽略专业性。相反,两者是“兼容和并行”的。依旧是“寒菜猎头”的案例。作为高管招聘机构,它储备了200万条不同行业的公司和人才信息。但一个很“致命”的问题是:200万条数据的简历检索率低,导致人才库利用率不足10%。但在使用EasyDL训练多个模型促进简历数据的结构化处理后,“候选函数”和“候选排名”两个模型的识别率都达到了95%以上。在关键词搜索任务中,汉才猎头过去每天只能找到60-70份合适的简历。但是今天可能20分钟就可以达到600-1000份,而且准确率已经达到了95%。总之,百度EasyDL不仅可以让企业使用“定制AI模型”像家电一样简单,也可以像高级AI工程师一样专业。此外,EasyDL还支持公有云API、私有服务器部署、设备端SDK、软硬件一体化解决方案等丰富的模型部署方式。例如,在软硬件一体化方案的部署上,EasyDL提供了6款软硬件一体化方案,支持专项适配加速,覆盖高、中、低全矩阵,模型识别速度可提升10倍。不仅丰富,而且速度非常快——最快5分钟即可集成。而EasyDL的这些优秀特性,都离不开其背后的技术硬实力。EasyDL的能力是如何实现的?从表面上看,工具或平台看起来和使用起来越简单,其背后的设计可能就越复杂。百度EasyDL也是如此。平台内部使??用了很多复杂的深度学习算法和工程技术,都是为了保证其简单易用、低门槛的使用效果。EasyDL之所以能够在模型方面做到高精度,一个重要原因是它基于百度自主研发的深度学习平台飞桨。一站式的模型培训和服务体验,融入了更多百度长期积累的独特技术和工程能力。首先,EasyDL预设了百度超大规模数据训练的预训练模型。视觉任务中,图像分类训练任务内置百度超大规模视觉预训练模型,基于海量互联网数据,包含100,000+分类,6500万张图片,平均准确率可提升3.24%-7.73%。物体检测训练任务方面,内置基于800+标签、170万张图片、1000万+检测框的百度超大规模物体检测预训练模型,平均准确率提升1.78%-4.53%.在自然语言处理方面,EasyDL预置了百度自研、业界最优的预训练模型文心(ERNIE),将机器语义理解水平提升到一个新的高度。EasyDL还提供自动数据增强、自动超参数搜索等AutoML/DL自动建模机制,降低零算法基础用户使用AI的门槛。而且,基于飞桨DGC加速机制,通过只传输重要的梯度(稀疏更新)减少了通信带宽的使用,使得EasyDL提高了分布式训练的效率。与传统分布式训练方式相比,训练速度提升70%以上。获得。其次,在数据处理方面,EasyDL构建了EasyData智能数据服务平台。在数据标注和数据清洗方面,EasyData提供了11种数据标注模板和5种标准和高级清洗方案。EasyData还提供了软硬件一体化、端云协同的自动化数据采集解决方案,可以省去数据采集过程中繁琐耗时的设备选型、调试和集成开发工作。最后,在部署方面,EasyDL提供了四种解决方案:公有云API、设备端SDK、本地服务器部署、软硬件一体化部署。其中,公有云API可以支持弹性伸缩;设备端SDK目前EasyDL提供端模适配服务,支持15+芯片类型,4种常用操作系统。而这些,正是EasyDL强大能力背后的硬实力。为什么选择EasyDL?因为有需求,所以这就是问题的答案。以人工智能为主导的第四次工业革命正在不断渗透到各行各业,大公司往往具备一定的人才储备和技术积累。但相比之下,中小企业在智能化转型过程中往往处于碰壁状态,智能化的门槛过高,包括高级开发人员成本、技术能力等。但是,中小企业在整个国民经济的发展中起着举足轻重的作用。因此,解决这样的问题就成了“刚需”。也正是因为如此,EasyDL一经开通,就得到了中小企业的广泛认可和支持。在两年多的时间里,EasyDL也不断升级打磨,让整体的产品体验和功能更加完善。这也使得EasyDL与其他AutoDL平台相比具有更加突出的优势,能够取得更好的效果。不仅如此,EasyDL的更新迭代还在继续。比如,今年升级的最大亮点就是5月份新发布的EasyData智能数据服务平台。专注于AI开发场景,在业界打通了完整的解决方案,提供一站式的数据采集、数据清洗、数据标注、数据归还。内置的超大规模预训练模型也是今年的核心技术升级之一,提供更高精度的训练结果。就在刚刚过去的9月,我们看到了EasyDL的另一轮重大升级。在EasyDL经典版的NLP方向,新增自定义情感分析、多标签文本分类、文本实体抽取;新增表格数据预测分析ML方向,进一步丰富了模型类型。数据服务在现有智能标注的基础上,推出多人标注,大大提高了数据标注的效率。新增上线模型市场,支持个人或企业将EasyDL经典版训练的模型发布到市场销售,业内率先支持对从市场购买的模型结合数据进行再训练,以达到更好的模型效果。未来,EasyDL将继续发力:除了扩展现有的CV、NLP、ML、语音识别算法类型外,还将引入OCR、视频追踪等定制化能力。不断提升模型效果,提高训练速度,加速模型推理。在数据、模型、服务等方面,不断降低使用门槛。至此,可以说百度EasyDL距离“人人能AI”的初衷又近了一步。
