Page 50 - 理化检验-物理分册2024年第七期
P. 50
云 晗,等:基于卷积神经网络焊管缺陷分类识别
图 4 二维时频图
缺陷。通过二维时频图可以对焊管缺陷的类型进行 4.1 学习率的优化
区分。 学习率是深度学习优化算法中的一个重要参
4 分类识别结果 数,其控制了模型权重在每次迭代中更新的幅度,学
习率过高会引起参数的频繁更新,使模型在训练时
在处理图像等二维数据时,其输入数据通常都
出现剧烈的波动,直至不收敛;学习率过低会使算法
是高维的。当采用传统神经网络训练时,因模型的
收敛得很慢。通过调节学习率,使算法达到较快的
训练参数过多,通常需要耗费更多的计算资源和更
收敛速率与较高的稳定性。选择学习率分别为0.01,
长的时间,特别是对于大规模数据集,模型对训练
0.001和0.000 1,其他参数保持不变,不同学习率下
数据过于敏感,从而影响其在新数据上的泛化性能。
的准确度如表4所示。由表4可知:VGG-16模型和
CNN是一种经典的深度学习模型,其由一个或多个
GoogLeNet模型均在学习率为0.01时的准确度最高,
卷积层和其他分类神经网络组成。CNN作为一种
分别达到了79.1%和68.3%。
图像识别工具,可以利用卷积层来捕捉输入数据的
表4 不同学习率下的准确度 %
局部特征,通过权值共享,相同的权重被用于处理输
入的不同部分,从而减少参数的数量,提高模型的效 学习率
神经网络模型
率。在采用卷积神经网络作为分类器对工业不锈钢 0.01 0.001 0.000 1
焊管缺陷进行分类和识别时,选择合适的神经网络 VGG-16 79.1 75.2 76.9
结构至关重要,笔者对VGG-16 和GoogLeNet两种 GoogLeNet 68.3 62.3 64.1
训练模型进行了对比研究。
4.2 VGG-16和GoogLeNet两种模型对比
将图4的二维时频图作为训练特征输入CNN输
为了对 VGG-16 模型和 GoogLeNet 模型的准
入层中,制作特征样本集,如表3所示,并将各种缺
确性进行评估,对测试集中的 40 张含有各类缺陷
陷的时频图按3∶1∶1的比例随机分为训练集、验证
的图像进行了试验。这些图像涵盖了多种缺陷类
集和测试集。
型,旨在全面检验模型的识别能力。试验结果显示,
表3 特征样本集
在面对特定缺陷时,VGG-16 模型的准确性较高,
项目 训练集 验证集 测试集 总体
因为其深层架构能够捕捉并提取特定缺陷的复杂
缺陷1 120 40 40 200
特征。GoogLeNet 模型在处理其他类型的缺陷时
缺陷2 120 40 40 200
显示出更好的性能,能够有效地捕捉和识别多样化
缺陷3 120 40 40 200 的缺陷。
缺陷4 120 40 40 200 不同模型对缺陷的识别精度和整体分类精度如
缺陷5 120 40 40 200 表5所示。由表5可知:VGG-16模型对5种不同类
38