基于频谱增强和卷积宽度学习的音乐流派分类
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金面上项目(42271409); 辽宁省高等学校基本科研项目(LIKMZ20220699)


Music Genre Classification Based on Spectrogram Enhancement and CNNBLS
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对频谱图对于音乐特征挖掘较弱、深度学习分类模型复杂且训练时间长的问题, 设计了一种基于频谱增强和卷积宽度学习(CNNBLS)的音乐流派分类模型. 该模型首先通过SpecAugment中随机屏蔽部分频率信道的方法增强梅尔频谱图, 再将切割后的梅尔频谱图作为CNNBLS的输入, 同时将指数线性单元函数(ELU)融合进CNNBLS的卷积层, 以增强其分类精度. 相较于其他机器学习网络框架, CNNBLS能用少量的训练时间获得较高的分类精度. 此外, CNNBLS可以对增量数据进行快速学习. 实验结果表明: 无增量模型CNNBLS在训练400首音乐数据可获得90.06%的分类准确率, 增量模型Incremental-CNNBLS在增加400首训练数据后可达91.53%的分类准确率.

    Abstract:

    For the problems of weak music feature mining, complex deep learning classification models, and long training time, a music genre classification model based on spectrogram enhancement and convolutional neural network-based broad learning system (CNNBLS) is designed. This model first enhances the Mel spectrogram by randomly masking part of frequency channels in SpecAugment and then uses the cut Mel spectrogram as the input of CNNBLS. At the same time, exponential linear unit functions (ELUs) are fused into the convolutional layer of CNNBLS to enhance its classification accuracy. Compared to other machine learning network frameworks, CNNBLS can achieve higher classification accuracy with less training time. In addition, CNNBLS can quickly learn incremental data. The experimental results show that the non-incremental model of CNNBLS can achieve a classification accuracy of 90.06% after training 400 pieces of music data, while the incremental model of Incremental-CNNBLS can achieve a classification accuracy of 91.53% after adding 400 pieces of training data.

    参考文献
    相似文献
    引证文献
引用本文

刘万军,李雨萌,曲海成.基于频谱增强和卷积宽度学习的音乐流派分类.计算机系统应用,2023,32(10):85-95

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-03-30
  • 最后修改日期:2023-05-11
  • 录用日期:
  • 在线发布日期: 2023-08-09
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号