【原创.com】乳腺癌是女性最常见的浸润性癌症,是仅次于肺癌的女性第二大死因。在本文中,我将构建一个基于WideResNet的神经网络,并将幻灯片图像分为两类,一类用于使用深度学习检测乳腺癌,另一类不使用深度学习。浸润性导管癌(IDC)是最常见的乳腺癌类型。美国癌症协会估计,美国每年有超过180,000名女性被诊断出患有浸润性乳腺癌,其中大多数患有IDC。准确识别和分类乳腺癌类型是一项重要任务,基于人工智能的自动化方法可以大大节省时间并减少误诊。关于数据集位于俄亥俄州克利夫兰的凯斯西储大学的研究人员为此问题收集了一个数据集。Kaggle工作人员对原始数据集进行了预处理,作为我们工作的起点。有关详细信息,请参见:http://gleason.case.edu/webdata/jpi-dl-tutorial/IDC_regular_ps50_idx5.zip图1:每张幻灯片包含大约1700个50x50像素的小片段。该数据集有162个大切片(wholemount)幻灯片。幻灯片以40倍分辨率扫描。最后,它们被分成275215个50x50像素的图块。然后为每个补丁分配一个标签0或1,标签1表示包含IDC的补丁,标签0表示不包含IDC的补丁。图2:3个正面和负面IDC组织示例使用WideResNet对幻灯片进行分类使用残差连接的ResNet架构非常擅长图像分类任务。ResNet的核心思想是引入所谓的跳过一层或多层的“恒等式快捷连接”。WideResNet架构表明,仅16层深即可实现类似的性能。这有助于解决与非常深的ResNet相关的各种问题,例如梯度爆炸/消失和退化。使用VincentFung(https://medium.com/@vincent.fung13)和ApilTamang(https://medium.com/@apiltamang)撰写的博客文章中的详细信息,我们可以看看实际使用ResNet的学习。图3:残差块假设将叠加层拟合到残差图比将它们直接拟合到所需的底层图更容易。这表明较深的模型不应比较浅的模型产生更高的训练错误。由于出色的实际效果,ResNet迅速成为各种计算机视觉任务最流行的架构之一。另外,WideResNet的存在也有它的原因:精度每提升一次,层数几乎翻倍,所以深度残差网络存在特征复用逐渐降低的问题,导致网络训练非常缓慢。图4:WideResNet训练为了解决这些问题,Zagoruyko和Komodakis对ResNet块的架构进行了详细的实验研究,在此基础上他们提出了一种新的架构:我们可以减少残差网络的深度并增加宽度。他们称之为宽残差网络。我们现在介绍使用WideResNet架构解决此问题的分步过程。我们使用DeepLearningStudio快速构建神经网络,无需担心编程、语法和数据集摄取。项目创建登录本地或云端运行的深度学习工作室后,点击+按钮创建一个新项目。数据集摄取然后我们在“数据”选项卡中为此项目创建一个数据集。通常训练和验证之间的80%和20%是一个很好的比例,但您可以根据需要使用其他设置。如果你的机器有足够的内存,你可以将整个数据集加载到内存中,不要忘记将“Loaddatasetintomemory”设置为“Entiredataset”。创建神经网络您可以通过拖放层来创建神经网络,如下图所示:确保使用右侧的属性将WideResNet设置为完全可训练。此外,第一个密集层(Dense_3)应该有大约20个以ReLU作为激活函数的神经元。最后的密集层(Dense_1)应将输出维度设置为1,并将激活设置为sigmoid。这样做的原因是我们将这个问题设置为回归而不是分类。如果回归输出低于0.5,那么我们可以说输入属于0类(即没有IDC癌症),否则它有IDC癌症。超参数和训练我们使用的超参数如下图所示,你可以随意更改和尝试这些超参数。最后,您可以从训练选项卡开始训练,并在训练仪表板的帮助下跟踪您的进度。训练完成后,您可以在“结果”选项卡中查看结果。在每小时0.90美元的K80GPU上,我们在几个小时内实现了超过85%的准确率。使用DeepLearningStudio,部署为Web应用程序或RESTAPI变得轻而易举,这可以使用“部署”选项卡完成,如下所示:部署模型部署的模型可以作为Web应用程序或RESTAPI进行访问,如下所示注意:结论使用DeepLearningStudio,您可以在几分钟内构建深度学习模型,并在几秒钟内部署它。这种便利将使开发人员能够解决复杂的问题,而不必担心编程和API等其他方面。【原创稿件,合作网站转载请注明原作者和出处为.com】
