本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients,MFCC)作为特征参数。试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率。
基于10个网页-相关网页
The Mel-frequency ceptral coefficients(MFCC) are adopted as the speech feature parameters and a voice activity detection(VAD) algorithm based on energy and zero crossing rate is introduced in this system. Then we build a Gaussian mixture model for each speaker.
该系统采用语音信号的梅尔倒谱系数(MFCC)作为说话人的语音特征,使用短时能量和过零率进行语音的话音激活检测(VAD),并采用高斯混合模型(GMM)为每一个说话人建立特征库模型。
参考来源 - 基于高斯混合模型的说话人识别技术·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐