基于时频分布与MFCC的说话人识别

AIPUB归智期刊联盟

微信公众号

网站二维码

2025年4月26日 5:59 星期六

首页 > 过刊浏览>2012年第21卷第4期 >189-192,178

PDF HTML阅读 XML下载导出引用引用提醒

基于时频分布与MFCC的说话人识别
DOI:
                        
                    
CSTR:
                        
                    
作者:
                        金银燕金银燕
江南大学 物联网工程学院, 无锡 214122
在期刊界中查找
在百度中查找
在本站中查找
于凤芹于凤芹
江南大学 物联网工程学院, 无锡 214122
在期刊界中查找
在百度中查找
在本站中查找
何艳何艳
江南大学 物联网工程学院, 无锡 214122
在期刊界中查找
在百度中查找
在本站中查找

                    
作者单位:
作者简介:
通讯作者:
中图分类号:
基金项目:国家自然科学基金(61075008)

Speaker Recognition Based on Time-Frequency Distribution and MFCC

Author:

JIN Yin-Yan
JIN Yin-Yan
School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China
在期刊界中查找
在百度中查找
在本站中查找
YU Feng-Qin
YU Feng-Qin
School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China
在期刊界中查找
在百度中查找
在本站中查找
HE Yan
HE Yan
School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China
在期刊界中查找
在百度中查找
在本站中查找

Affiliation:

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

针对MFCC不能得到高效的说话人识别性能的问题，提出了将时频特征与MFCC相结合的说话人特征提取方法。首先得到语音信号的时频分布，然后将时频域转换到频域再提取MFCC+MFCC作为特征参数，最后通过支持向量机来进行说话人识别研究。仿真实验比较了MFCC、MFCC+MFCC分别作为特征参数时语音信号与各种时频分布的识别性能，结果表明基于CWD分布的MFCC和MFCC的识别率可提高到95.7%。

关键词:短时傅里叶变换;Wigner-Ville分布;Choi-Williams分布;Mel频率倒谱系数;说话人识别

Abstract:

Because MFCC can't reflect the dynamic characteristics of speech signal and their own non-stationary, a feature extraction method by combining time-frequency distribution with MFCC is proposed. First get time-frequency distribution of speech signal, and convert time-frequency domain into frequency domain, then extract MFCC+MFCC as characteristic parameters. Finally speaker recognition uses the support vector machine. The simulation experiment compares recognition performance when MFCC and MFCC+MFCC are respectively as characteristic parameters by speech signal and all kinds of time-frequency distribution. Results show that the speaker recognition performance using MFCC+MFCC based on the CWD time-frequency distribution can be improved to 95.7%.

Key words:STFT; WVD; CWD; MFCC; speaker recognition

引用本文

金银燕,于凤芹,何艳.基于时频分布与MFCC的说话人识别.计算机系统应用,2012,21(4):189-192,178

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2011-07-14
最后修改日期:2011-09-07
录用日期:
在线发布日期:
出版日期:

微信公众号

网站二维码

引用本文

分享

文章指标

历史

文章二维码

微信公众号

网站二维码

引用本文

分享

微信扫一扫：分享

文章指标

历史

文章二维码