摘要:针对复杂工况下高速动车组轴箱轴承故障难以准确诊断的问题,本文提出了一种Shuffle-SE单元设计方法,并基于模块化思想建立了一种新的轻量化网络Shuffle-SENet用于高速列车轴箱轴承故障诊断。所提Shuffle-SE单元以ShuffleNetV2单元为基础,在保留网络轻量化的同时,对网络结构进行了局部优化,并进一步嵌入了Squeeze-and-Excitation(SE)结构。所构建的轻量化网络模型在保证运算高效的同时,故障诊断精度明显提升。此外,本文还对Shuffle-SE单元的数量及SE结构中降维系数对网络模型性能的影响做了深入分析。实验分析结果表明,所提网络模型可有效用于多种复杂工况下高铁轴箱轴承故障诊断,相比MobileNetV2、ShuffleNetV1/V2、ResNets等目前较为流行的神经网络模型,所提模型在运行效率和故障诊断精度两方面均有较好表现。本文所做的研究为深度学习技术走向工程实际应用,克服对计算机硬件配置较高的限制提供了一种新的解决方法。
关键词:故障诊断;轴箱轴承;高速动车组;轻量化网络;ShuffleNet单元
0引言
根据《中国国家铁路集团有限公司2020年统计公报》,我国高速铁路营业里程已达3.8万公里。随着高速铁路的飞速发展,高速列车行车安全日益成为人们关注的焦点。轴箱轴承作为高铁走行部的核心部件之一,工作环境非常恶劣,极易发生各类故障。但由于受到变载荷、多激励、强噪声等多种复杂因素的影响,准确诊断与检测轴箱轴承故障是一个亟待解决的难点问题,具有重要的工程应用价值[1]。传统的“特征提取+机器学习”方法往往先采用信号处理技术提取特征信息,后建立浅层机器学习模型对故障进行识别,虽然能取得较高的诊断精度,但依赖大量的信号处理技术,并且不适用于海量监测数据的分析[2]。人工智能技术的飞速发展,使得基于深度学习技术的轴承故障诊断研究成为当前的发展方向。此类方法基于数据驱动模型,通过构建深度神经网络(Deepneuralnetwork,DNN)将特征信息挖掘与智能识别融合在一起,能够实现大数据环境下特征信息的自适应提取与设备服役状态智能诊断,摆脱了对复杂信号处理方法及大量诊断经验的依赖[3]。DNN模型主要有深度置信网络(Deepbeliefnetwork,DBN)、堆叠自编码网络(Stackedauto-encoderSAE)和卷积神经网络(ConvolutionneuralnetworkCNN)等[4]。Zou等[5]采用离散小波变换处理信号后,输入已建立的改进DBN模型对高速列车牵引电机轴承故障进行了诊断和识别。Wang等[6]构建了SAE模型,采用了一种新的激活函数ReLTanh提高了齿轮箱故障诊断的准确性。CNN模型采用了局部感受野和权值共享策略,是目前应用最为广泛的深度学习模型框架之一。Wang等[7]建立了一维CNN模型来诊断轴承故障,并利用(Particleswarmoptimization,PSO)算法对网络参数进行优化;Jing等[8]构建了二维CNN模型实现了对旋转机械复杂故障模式识别;Peng等[9]建立了深度残差神经网络对列车轮对轴承故障进行诊断,具有很高的诊断精度。虽然DNN在故障诊断应用中具有巨大潜力,但传统网络模型层数较多,参数量较大,运行计算非常耗时,因此要求较高的计算机配置,这极大限制了其在实际工程中的应用。近年来,为了简化网络模型结构,轻量化神经网络受到了人们广泛关注。MobileNetV1[10]采用深度可分离卷积(Depthwiseseparableconvolution,DSC)代替了传统的标准卷积,减少了网络模型的参数量与计算量;MobileNetV2[11]在V1基础上引入了残差结构,并通过对特征信息先升维再降维的方式增强了网络的表达能力;ShuffleNetV1[12]引入了分组卷积(Groupconvolution,GC)与通道混洗(Channelshuffle,CS)操作来进一步降低网络运算中的计算量,使其可以在移动设备中使用;ShuffleNetV2是Ma等[13]在EuropeanConferenceonComputerVision2018(ECCV2018)最新提出的轻量化网络模型。他总结了影响网络模型运行效率的四条准则,并基于这些准则设计了ShuffleNetV2基本单元,通过大规模图像分类任务证实了该网络的优势。相比传统DNN,上述轻量化网络运行更加高效,模型参数量较少。但轻量化的结构设计会牺牲网络模型部分复杂特征提取能力,因此在分析成分复杂,噪声干扰严重的旋转机械信号时,模型性能会受到很大影响,诊断精度偏低,导致其在机械设备故障应用中受到很大限制。因此,网络模型需要同时兼顾结构轻量化设计及模型诊断性能提高两方面,而目前文献中此类研究还较为缺少。为解决该问题,本文提出一种新的轻量化Shuffle-SENet模型用于高速动车组轴箱轴承故障诊断研究。该方法在对ShuffleV2单元结构进行改进的基础上,融合Squeeze-and-Excitation(SE)网络结构,提出了Shuffle-SE单元设计方法,然后基于模块化思想构建了Shuffle-SENet网络模型。实验结果表明,该模型运行快速高效,可有效用于高铁轴箱轴承故障诊断,具有较好的工程应用价值。
1背景理论
1.1分组卷积与通道混洗标准卷积操作中,上一层特征图中每个通道的特征信息都会通过卷积操作输出到下一层特征图每个通道中,过程如图1所示。
GC中由于每组卷积核只与同组输入特征进行卷积操作,导致各组卷积操作是相对孤立的,彼此没有信息的交互流通,如图2(a)所示,这无疑减弱了卷积操作中特征信息的学习能力。CS技术通过对输出层各分组特征信息进行混洗操作,将不同组特征信息重新分组,克服了各组之间的约束,在不增加计算量的前提下,使得各组之间充分融合,如图2(b)所示。CS详细过程如图3所示。假设输出层特征图分为G组,每组包含w个通道输入特征,CS具体实现步骤如下:步骤一:将具有G´w通道的输出特征reshape为(G,w)格式;步骤二:将(G,w)格式的输出特征转置为(w,G)格式;步骤三:对(w,G)格式的输出特征进行平坦化处理,再次分为G组,作为下一层输入特征。
1.2ShuffleNetV2单元
ShuffleNetV2网络主要由两个基本单元模块组成,它们如图4中所示。ShuffleNetV2单元1中,输入特征首先按照通道数一分二,相当于对输入通道进行了二分组,每一组对应有各自的分支结构,左侧分支不采取任何操作做同等映射,右侧分支进行了2次1´1单位卷积操作和1次3´3深度卷积操作(Depthwiseconvolution,DWConv),输入与输出通道数相同。两分支输出后级联在一起,然后进行CS操作,保证两分支信息充分融合。ShuffleNetV2单元2是一个下采样模块,每个分支均有步长为2的卷积操作,特征图维度大小减半,最终输出通道数加倍。相比ShuffleNetV2单元1,单元2主要起减小特征图维度的作用,从而进一步减少了网络模型的计算量。
1.3SENetSENet由Hu等[15]在ComputerVisionandPatternRecognition2017(CVPR2017)上首次提出,它主要由SE单元组成,该单元包含三个基本操作,操作过程如图5所示。首先是挤压操作,按照输入特征空间维度对每个通道的输入特征进行全局平均池化(Globalaveragepooling,GAP),从而将每个通道的特征信息压缩为一个权重因子,该权重因子表征了对应特征通道上的全局信息响应,具有全局的感受野。其次是激励操作,它通过连接两个全连接(Fullyconnected,FC)层获取了归一化后(0~1)之间的权重因子。
2Shuffle-SENet网络模型2.1Shuffle-SE单元本文针对ShuffleNetV2两个单元的结构特点,以结构更为简单、计算效率更高的单元1为基础,在其末端添加了一个尺寸为2´2的平均池化层,从而进一步降低输出特征图的维度,提高网络运算效率。然后,我们将SE单元嵌入其中,提出了Shuffle-SE单元设计方法,结构如图6所示。SE单元通过评估ShuffleNetV2单元处理后每个通道的特征层信息,自适应地获取相应的权重参数,从而利用该参数提升有用通道的特征信息,抑制对当前任务用处不大的特征通道信息,从而强化了重要特征层信息,有效提升了网络模型的抗噪性能。相比ShuffleNetV2两个基本单元,所设计的单元结构并未添加复杂的卷积操作,最大程度保留了原ShuffleNetV2网络轻量化的结构,并通过嵌入SE单元,进一步增强了网络模型的性能。需要指出的是,所提方法中,我们可根据输入特征图的维度大小,灵活使用2´2的平均池化层。当特征图维度较大,添加池化操作来降低计算量;当维度较小,去除该操作,最大程度保留特征信息。
2.2Shuffle-SENet网络模型基于模块化设计思想,本文以所提的Shuffle-SE单元为基本模块,构建Shuffle-SENet轻量级网络模型如图7所示。由于所分析数据格式是一维的,无法与所提二维网络模型兼容,本文参考文献[16]方法,将一维数据转化为二维图像格式后再输入网络,输入特征图大小为32×32。为了进一步提高网络模型的运算效率,输入特征图为3通道。首先网络首层采用了一个通道为64、卷积核大小为3×3的深度可分离卷积层,相比标准卷积,深度可分离卷积操作所需参数量更少,计算更快[17]。接着首尾连接3个Shuffle-SE单元块,单元块数量过少会无法充分提取数据特征信息,而数量过多又会导致网络结构复杂,运行效率下降,本文针对不同数量单元块的影响在实验部分做了进一步的分析讨论,从而确定其最优的数值。然后对每个通道的输出特征进行全局平均池化(Globalaveragepooling,GAP),添加Dropout层减小过拟合的影响。最后,使用全连接层并进行Softmax分类输出,对高铁轴箱轴承不同健康状态进行智能识别。
3实验分析与讨论
3.1实验介绍
实验是在交通工程结构力学行为与系统安全国家重点实验室高速列车单轮对滚振实验台上完成的,实验台结构如图8所示。该实验台下方放置有两个直径1.8m轨道轮,每个轨道轮分别由25T和50T液压激振器提供横向和垂向激振。实验台同时具备滚动和振动加载功能,通过施加实测的轨道谱激励可以较为真实地模拟高速列车走行部各种复杂的运行工况,能够开展500km/h以内不同速度等级、不同激扰条件下高铁轴箱轴承跑合振动测试试验。实验台上为和谐号CRH380B动车组转向架,测试轮对和轴箱轴承如图9所示,通过对轨道轮对进行多边形镟轮,可以模拟轨道损伤故障。
相关期刊推荐:《轴承》(月刊)创刊于1958年,由洛阳轴承研究所主管、主办,是中国轴承行业唯一国内外公开发行的轴承科技及其应用期刊。全面介绍轴承制造技术与装备、仪器、检测等方面的科技发展和研究成果,报道国内外轴承发展动态和最新信息,同时也介绍设备故障诊断、技术改造等方面的经验。设有:产品设计与应用、工艺与装备、试验与分析、试验分析、专题综述、中国轴承论坛、国外轴承科技等栏目。
实验过程中,加速度传感器安装在轴箱上方,采样频率为25600Hz。在施加轨道谱激励和无轨道谱激励两种工况下,分别进行了轴箱轴承内圈故障、外圈故障、轨道轮损伤+内圈故障、轨道轮损伤+外圈故障、正常等5类不同健康状态的轴箱轴承跑合测试,具体实验数据如表1所示。图10显示了时速50km/h时5种不同工况下轴箱轴承的振动信号时域波形图,从图中可以看到每种工况下的信号波形均较为复杂。其中,当模拟滚道轮损伤时,波形振动幅值明显增大,没有损伤时,轴承正常、外圈、内圈故障时的振动波形幅值偏小,且轴承正常时振动幅值最小。相对轴承内圈故障信号,外圈故障信号中振动冲击成分更为明显。针对每一种工况,我们分别采集了3600组信号样本,每组样本包含3072个数据点,共计3600´5=18000组信号样本。每类健康状态中,我们随机选取720组样本作为测试样本,其余作为训练样本。我们采用五折交叉验证方法对网络进行训练,确定最优网络模型后,输入测试集进行测试分析,测试过程重复5次,最终结果取均值。实验分析时,我们使用PyCharm开发环境,深度学习框架为TensorFlow2.1。计算机配置为:英特尔酷睿i7-9700KCPU,32G内存。
转载请注明来自:http://www.lunwencheng.com/lunwen/lig/21212.html