【.com原稿】图像学习是一个精妙的算法,其对图像的高度适应性给很多产业变革带来了质的变化。然而,对于企业来说,很难找到精通深度学习的人才来调整图像学习参数。再加上数据科学家团队昂贵的人力资源成本,让很多中小企业望而却步。然而,企业不断需要通过图像识别适配行业来解决一些痛点。BaiduEasyDL是百度为没有算法基础的开发者和企业提供的AI图像识别解决方案。具有数据量小、操作简单、图像识别AI模型训练速度快等优点。EasyDL让中小企业和个人在短时间内获得AI能力,将图像识别投入生产或爱好生产。它可以作为优秀技术方案的基石。图像特征学习算法是从传统的图像模式识别算法中衍生出来的一种新算法。其算法原型借鉴了LeicaBiosystems旗下品牌Aperio系列软件ImageAnalysis。它是非常成熟的图像分析模式识别算法的迭代进化算法。目前,特征学习算法越来越多地应用于临床无染色尿沉渣检查医疗器械产品中。在使用传统或AI单一算法的过程中,无论哪种算法我们都不能让系统自己证明结果的正确性,但是当引入竞争算法时,两种AI算法可以相互证明结果的正确性.传统单一的AI算法无法指出自身的识别错误,往往需要人工审核每一个结果;而对抗算法可以有效解决这个问题,人工在应用过程中只需要对两个AI的差异结果进行仲裁即可完成正确推理。在全自主对抗系统中,仲裁结果将重新加入训练集,以进化两个AI的准确率。这避免了对单一AI算法的过度学习,提高了AI的准确性。因此,我试图在EasyDL和特征学习之间进行对抗。它们都具有良好的可操作性和小样本量;EasyDL和图像特征学习算法可以利用学习样本、样本采集和标注工具,形成对抗。相互学习,形成更高形式的AI学习,在相互竞争中形成更准确的识别模型,不仅可以满足企业通过图像学习解决实际问题的需求,还可以获得更高的识别结果。下面详细介绍基于临床测试数据的对抗和图像模型制作的8个步骤:特征学习从原始图像制作出可用于训练的图像模型需要以下八个步骤:图像增强,图像裁剪、图像标注、图像清洗、训练可用性审查(imagereview)、单类特征模型学习、多类特定特征学习、训练模型注入运行程序。EasyDL和特征学习的训练方式基本互通,但在单类特征模型学习和多类特征学习过程中,EasyDL将深度学习作为其多个逻辑层之一独立完成计算。将训练模型注入到运行程序中,利用本地内网系统优势自动完成特征学习,EasyDL提供API接口和本地化识别SDK完成部署。EasyDL与特征学习的比较1)图像增强特征学习提供了更适合临床显微镜下图像检查的“L30图像增强”,用于调整图像增强参数以获得更好的图像特征。增强后的图像比增强前的图像更清晰,细胞内线条更鲜明,背景更纯净,但有时会增强,因此需要调整显微镜和相机的参数。2)图像切割、图像分类、图像标注。图像切割也可以使用“L31图像标签”系统完成,这是一种用于特征学习的快速切割、分类和标签软件。L31的使用非常方便。只需圈出单个细胞,然后点击细胞分类,L31会自动完成图像切割,并自动命名为标签名称,上传至内网图像数据服务器“HomeShip\FH\细胞名称\“之中。EasyDL的训练图片需要上传到百度平台,所以图片清洗操作完成后,可以分别上传细胞、晶体、管型、菌类各类型,直接在EasyDL中标注,也可以通过上传标注API训练数据。百度EasyDL的数据操作界面,特征学习自带的图像切割、分类、标注系统3)图像清洗:图像清洗的目的是去除与目标物体无关的图像信息,从而使训练模型可以减少干扰训练的因素。《L33特征学习系统》自带图像校正工具,可以轻松高效地处理训练图像,去除无效信息。修图过程只需要几个步骤:1.点击“Broadside”两次扩大边界范围2.点击“MarkBa??ckground”让AI知道背景颜色(小红框)3.点击“Smear”擦除无效的Noise和杂质4.点击“Collat??eral”,尽可能将细胞主体置于图像中央。5.单击“保存图像”以保存此内置图像校正工具。通常,校正一幅图像只需要10秒。4)图像训练、EasyDL图像上传及审核:首先在http://ai.baidu.com/easydl/注册或登录,点击开始训练,具体见百度官方说明,然后创建模型,填写型号名称等相关信息信息。点击“开始训练模型”,选择“图像分类”或“目标检测”模型进行训练。下面以物体检测模型为例,详细介绍使用步骤:第一步:创建模型。自定义模型名称将生成刚刚创建的模型并显示模型ID。第2步:创建数据集。我们可以独立命名一个刚刚经过特征学习处理的子类名称,命名数据集名称。这里创建了两个数据集,正常红细胞和正常白细胞。创建完成后,点击右侧“标记/上传”导入数据图片。需要注意的是一次只能上传20张图片。因为上传的图集是经过特征学习和分割后的图像,所以不会受到EasyDL图像大小的限制。上传数据后,进行数据标注,点击添加标签,选择特征图片,设置标签名称并保存,“BLC”为白细胞(主要是中性粒细胞)。红细胞和晶体的标记方法与白细胞相同,这里不再赘述。值得一提的是,针对数据量较大的模型,EasyDL近期推出了“智能标注”功能,点击“数据集标注/上传”步骤中的“智能标注”按钮即可激活。.该功能会自动筛选出对提高模型效果比较重要的图片先标注,其余图片预标注,可以大大提高整个数据标注过程的效率,非常方便.第三步:训练模型。数据集上传完成后,点击左侧导航栏中的“训练模型”选项。以红细胞为例,选取训练红细胞数据集。“离线识别SDK”选项不需要勾选,因为对抗训练是基于端和云端的双平台系统对抗。如果是在无网络环境下使用,可以查看trainingofflineSDK。之后还需要等待一定的时间让百度强大的云平台自己训练。本次培训约1.5小时。第四步:模型验证。训练完成后,点击左侧导航栏验证模型。第五步:模型发布。验证模型效果满意后,点击提交模型在线申请,1个工作日左右即可完成模型审核,通过后??即可部署上线。特征学习图像回顾:特征学习图像训练需要使用“L33图像学习系统”,它由五个部分组成:特征提取方法编辑器、图像目录、可训练图像列表、特征索引列表、单索引打分和学习状态。特征基础元素由特征方法编辑器控制,一般不建议修改。单图训练:1.首先通过图片目录确认训练图集的路径;2.第一次训练点击“否”,然后点击红色按钮“开始训练”;3.每次自动识别训练图片对于细胞的边缘,医生需要确认轮廓是否覆盖了整个细胞,如果覆盖,则点击“是”进行下一次图像训练。4、训练完成后,会提示完成,“L33图像学习系统”会自动计算出“特征指标列表”中的学习结果,您可以点击查看;5、对于不可用的图片,可以点击“否”暂停修改作业,或删除,或继续修改;6、“L33图像学习系统”会自动默认勾选的图像为可用图像,所以不会弹出该选项。特异性训练:调整权重:在特征指标列表中,可以根据待识别类型的特征选择特征指标;未选中的指标不参与计算。例如,红细胞的体积和周长在一定范围内,就可以使用,而晶体没有大小限制,但在形状和颜色上各有差异,所以可以使用特殊的颜色指示剂。每个指标都有自己的权重。点击指标后,可以选择体重状态。系统会根据权重选项自动计算指标权重等级,并在下次计算时规划评分标准。重量不同,计分棒的粗细也会不同,但计分只会在下一次训练时更新。调整权重后,再次点击红色按钮“StartTraining”,程序会在3~5个点内快速完成对新指标的识别模型。测试识别:测试识别依赖于“L35图像识别系统”。L35是root主系统的后台系统,所以没有操作界面,需要通过指令打开;但是我们提供了L35的测试说明文件。在测试模式下,L35不会判断细胞类型,但会显示每种细胞类型的识别分数。一般识别模型(编号02为白细胞)为正数,不符合和图像质量差的为负数,图片中的白细胞基本为正数,不匹配的为负数是负数。有时,您的凝聚力形象会是一个正数。这种情况下,只需要修改尿沉渣主系统中的识别评分范围,或者参考提取方法中的图像分割功能即可。如果识别状态还是不理想,可以调整权重,实现对识别的精准控制,可以多试几次成功。正式识别程序由尿沉渣主系统控制调用,识别结果显示在尿沉渣主系统中。在主系统正式的识别操作中,如果修改了错误的标签,系统会自动将修改后的细胞图谱总结为新的学习样本,在接下来的系统学习中,可以实现自我升级迭代。EasyDL模型部署:EasyDL模型通过审核后,我们有两种方式使用EasyDL进行识别。一种是使用“体验H5”制作H5二维码,上传图片进行识别。另外,大家可以直接调用模型的API接口实际测试一下效果。对抗算法实现:EasyDL支持在iOS、Android、Windows、Linux系统终端设备部署,可实现双前端AI对抗验证。目前EasyDL与特征学习的对抗主要体现在错误识别的相互修正,然后通过对结果的人工分析,将错误的图像重新添加到训练模型的数据集中,从而使模型能够迭代。目前,对抗训练仍然需要人工完成。各种AI算法/产品在临床尿沉渣检测中的优缺点对比:EasyDL和特征学习目前的优缺点:EasyDL是百度出品的高级AI算法,其定位是easy-to-traindeeplearning图像识别模型训练平台。具有极强的广义识别能力,更容易部署图像计数和物体识别方案,依托百度强大的云平台培训,节省企业培训服务器和深度学习人才的投资。企业更注重业务产品化。由于EasyDL对训练图片大小尺寸的限制,在某些特定场景使用时,如工业和临床显微镜,需要对存储容量大于GB的图片进行分割,以实现大图片的训练和识别.对于医学显微镜和工业扫描操作,可以通过上下游图像处理系统进行适配操作。EasyDL增加了iOS、Android、Windows、Linux等主流平台的兼容性,在WIN平台上,还可以通过winAPI对第三方软件进行智能二次开发,降低企业开发难度.EasyDL现在完全有能力转化生产力,也是工业和医疗领域需要的强大的图像识别核心系统。特征学习的缺点是需要过多依赖图像切割算法。面对比较复杂的图片,无法裁剪单个图片,无法识别;因此,特征学习只能局限于特定的离散类型图像:临床细胞学、组织学、工业颗粒检测、流水线质量检测等。从模型泛化的角度来看,特征学习完全是针对某种应用的定制模型,并且不能具有泛化能力。任何AI技术都是人工智能的视角,无法独立解决行业应用的复杂问题。所以,需要互相弥补自己的不足,才能走得更远。【原创稿件,合作网站转载请注明原作者和出处为.com】
