摘要:面对复杂的海洋环境, 利用舰船辐射噪声进行水声目标特征提取与识别具有极大的挑战性. 本文首先将船舶音频信号的三维梅尔频率倒谱系数(3D dynamic Mel-frequency cepstrum coefficient, 3D-MFCC)特征与三维梅尔谱(3D dynamic Mel-spectrogram, 3D-Mel)特征进行融合作为模型输入, 并基于此提出了一种新的水下目标识别深度神经网络模型, 该模型在卷积神经网络(convolutional neural network, CNN)和长短期记忆网络(long short-term memory, LSTM)的串行架构基础上, 用多尺度深度可分离卷积网络(multi-scale depthwise convolutional network, MSDC), 替代了传统的CNN, 并增加了多尺度通道注意力机制(multi-scale channel attention, MSCA). 实验结果表明, 该方法在DeepShip数据集和ShipsEar数据集上的平均识别率分别达到了85.92%和97.32%, 展现了良好的分类效果.