基于频谱增强和卷积宽度学习的音乐流派分类

doi:10.15888/j.cnki.csa.009272

AIPUB归智期刊联盟

微信公众号

网站二维码

2025年4月7日 20:51 星期一

首页 > 过刊浏览>2023年第32卷第10期 >85-95. DOI:10.15888/j.cnki.csa.009272

PDF HTML阅读 XML下载导出引用引用提醒

基于频谱增强和卷积宽度学习的音乐流派分类
DOI:
                        10.15888/j.cnki.csa.009272
                    
CSTR:
                        
                    
作者:
                        刘万军刘万军
辽宁工程技术大学 软件学院, 葫芦岛 125105
在期刊界中查找
在百度中查找
在本站中查找
李雨萌李雨萌
辽宁工程技术大学 软件学院, 葫芦岛 125105
在期刊界中查找
在百度中查找
在本站中查找
曲海成曲海成
辽宁工程技术大学 软件学院, 葫芦岛 125105
在期刊界中查找
在百度中查找
在本站中查找

                    
作者单位:
作者简介:
通讯作者:
中图分类号:
基金项目:国家自然科学基金面上项目(42271409); 辽宁省高等学校基本科研项目(LIKMZ20220699)

Music Genre Classification Based on Spectrogram Enhancement and CNNBLS

Author:

LIU Wan-Jun
LIU Wan-Jun
School of Software, Liaoning Technical University, Huludao 125105, China
在期刊界中查找
在百度中查找
在本站中查找
LI Yu-Meng
LI Yu-Meng
School of Software, Liaoning Technical University, Huludao 125105, China
在期刊界中查找
在百度中查找
在本站中查找
QU Hai-Cheng
QU Hai-Cheng
School of Software, Liaoning Technical University, Huludao 125105, China
在期刊界中查找
在百度中查找
在本站中查找

Affiliation:

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

针对频谱图对于音乐特征挖掘较弱、深度学习分类模型复杂且训练时间长的问题, 设计了一种基于频谱增强和卷积宽度学习(CNNBLS)的音乐流派分类模型. 该模型首先通过SpecAugment中随机屏蔽部分频率信道的方法增强梅尔频谱图, 再将切割后的梅尔频谱图作为CNNBLS的输入, 同时将指数线性单元函数(ELU)融合进CNNBLS的卷积层, 以增强其分类精度. 相较于其他机器学习网络框架, CNNBLS能用少量的训练时间获得较高的分类精度. 此外, CNNBLS可以对增量数据进行快速学习. 实验结果表明: 无增量模型CNNBLS在训练400首音乐数据可获得90.06%的分类准确率, 增量模型Incremental-CNNBLS在增加400首训练数据后可达91.53%的分类准确率.

关键词:梅尔频谱|宽度学习|语音增强|音乐流派分类|指数线性单元函数 (ELU)

Abstract:

For the problems of weak music feature mining, complex deep learning classification models, and long training time, a music genre classification model based on spectrogram enhancement and convolutional neural network-based broad learning system (CNNBLS) is designed. This model first enhances the Mel spectrogram by randomly masking part of frequency channels in SpecAugment and then uses the cut Mel spectrogram as the input of CNNBLS. At the same time, exponential linear unit functions (ELUs) are fused into the convolutional layer of CNNBLS to enhance its classification accuracy. Compared to other machine learning network frameworks, CNNBLS can achieve higher classification accuracy with less training time. In addition, CNNBLS can quickly learn incremental data. The experimental results show that the non-incremental model of CNNBLS can achieve a classification accuracy of 90.06% after training 400 pieces of music data, while the incremental model of Incremental-CNNBLS can achieve a classification accuracy of 91.53% after adding 400 pieces of training data.

Key words:Mel spectrogram|broad learning system (BLS)|speech enhancement|music genre classification (MGC)|exponential linear unit function (ELU)

引用本文

刘万军,李雨萌,曲海成.基于频谱增强和卷积宽度学习的音乐流派分类.计算机系统应用,2023,32(10):85-95

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2023-03-30
最后修改日期:2023-05-11
录用日期:
在线发布日期: 2023-08-09
出版日期:

微信公众号

网站二维码

引用本文

分享

文章指标

历史

文章二维码

微信公众号

网站二维码

引用本文

分享

微信扫一扫：分享

文章指标

历史

文章二维码