当前位置: 首页 > Web前端 > HTML5

[PaperBrief]Deepwebdataextractionbasedonvisual

时间:2023-04-05 14:34:12 HTML5

《Deep web data extraction based on visual information processing》作者JLiu上海海事大学2017AIHC会议发表并引用LiuJ,LinL,CaiZ,etal.基于视觉信息处理的深网数据抽取[J].环境智能与人性化计算杂志,2017(1):1-11。介绍一种基于卷积神经网络(CNN)的数据区域定位方法结合视觉信息进行网页分割(作者将其命名为VIBS)1.CNN基于卷积神经网络的区域定位CNN网络结构由三个阶段组成,如如图所示。第一阶段设置卷积层和池化层来学习图像的特征。第二阶段需要设置扁平化层,它将卷积层和池化层产生的特征图转换为一维向量以计算全连接层。除了为输出设置最后一个全连接外,第三阶段还设置了多个连接层来过滤前面层学习到的特征。网络架构设计采用13层CNN,包括5个采样层(S)、6个卷积层(C)和2个全连接层。根据区域检测的标准IOU,如果IOU>>50%,则认为该数据区域为正样本。区域定位主要步骤流程图如下2.基于视觉信息的网页分割方法VIBS3、实验结果及分析数据集(链家、Complanet、方家)58500个样本数据集,包括195个不同大小的图像样本以及不同的位置,包含数据区,共300组。实验结果总结总体而言,文章的创新意义大于实际意义。这么高的准确率感觉有点过拟合,速度不可能这么快。它应该先保存为图片。文章写的很好,比较系统也比较完整,但是有些地方没说清楚,比如是否划分的判断等。