【语音识别】 MFCC+VQ说话人识别系统【含GUI Matlab源码 1153期】
MFCC+VQ说话人识别系统完整的代码,方可运行;可提供运行操作视频!适合小白!
💥💥💞💞欢迎来到Matlab仿真科研站博客之家💞💞💥💥
✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,Matlab项目合作可私信。
🍎个人主页:Matlab仿真科研站博客之家
🏆代码获取方式:
💥扫描文章底部QQ二维码💥
⛳️座右铭:行百里者,半于九十;路漫漫其修远兮,吾将上下而求索。
⛄更多Matlab语音处理(仿真科研站版)仿真内容点击👇
Matlab语音处理(仿真科研站版)
⛄一、MFCC+VQ简介
1 引言
在人类生活的这样一个信息高度交互的社会里, 判定人的身份是一个十分重要的问题。传统的身份鉴别方法 (如钥匙、证件、口令等等) 已经不能满足社会的需要, 基于生物特征的身份鉴别技术为我们提供了一种更加方便和可靠的方法, 已经引起了国内外学术界和企业界的极大关注。说话人识别技术是一项根据语音波形中反映说话人生理和行为特征的语音参数, 自动识别说话人身份的技术。
属于生物识别技术的一种。从说话人识别系统的职能上看, 可以分为说话人辨认系统和说话人确认系统。从识别基于的对象来看, 又可以分为基于文本的说话人识别系统和文本无关的说话人识别系统两大类。根据待识别的说话人是否在注册的说话人集合内, 说话人识别可以分为开集 (Open-set) 识别和闭集 (Close-set) 识别。说话人识别的关键问题在于特征参数的选择与识别模型的建立, 目前常用的特征参数有LPC、LPCC以及MFCC等, 常用的识别模型有DTW、VQ、HMM等。
2 说话人识别的过程及系统框架
图1中, 建立和应用说话人识别系统分为两个部分:训练 (或注册) 部分和识别部分。
图1 说话人识别系统框图
3 说话人识别中的特征提取
3.1 Mel倒谱参数 (MFCC)
倒谱特征是用于说话人个性特征和说话人识别的最有效的特征之一[4]。实验表明, 大部分情况下, MFCC优于其他倒谱系数。其提取及计算过程如下:
(1) 原始语音信号S (n) 经过预加重、分帧、加窗等处理, 得到每个语音帧的时域信号X (n) 。然后经过离散傅里叶变换 (DFT) 后得到离散频谱X (k) 。设语音信号的DFT为:
式中x (n) 为输入的语音信号, N表示傅里叶变换的点数。
(2) 将上述离散频谱X (k) 通过Mel频率滤波器组得到Mel频谱并通过对数能量的处理, 得到对数频谱S (m) 。
(3) 计算每个滤波器组输出的对数能量为:
(4) 经离散余弦变换 (DCT) 得到MFCC系数:
例如, 语音样本为“说话人识别”, 采样率8000kHz, 精度为8bit, 滤波器组数为24, 系数选取了前面的16个 (C0~C15) 提取的MFCC参数如图2, 图中x轴表示语音分析的帧数, y轴表示倒谱系数的维数, z轴表示对应的倒谱值。图2 (a) 带有倒谱C0项, 图2 (b) 不带有倒谱C0项。
图2 MFCC参数
从图中可以看出, 对于MFCC系数, 它的第一维的值C0的能量很大, 故在一般的识别系统中, 将其称为能量系数, 不作为倒谱系数中的一员。
3.2 不同参数结合特征
表征说话人特征的参数主要有:基音周期、倒谱系数、共振峰频率与带宽、音调轮廓特征等。以上所有的特征参数中, 我们并不能说单独使用哪个参数就能有效可靠地表征说话人特征。一般情况下, 为了更有效地表征说话人特征, 更多地采用几个特征参数的组合使用。当各组合参数间相关性不大时, 会有较好的效果, 因为它们分别反映了语音信号的不同特征。
(1) 基音特征参数与倒谱特征结合, 它们分别描述了说话人声道、声带特征, 可以充分反映说话人特征。
(2) 利用倒谱系数和差值倒谱系数作为描述声道的信息, 利用基音和差值基音来描述激励派。
(3) 采用倒谱系数和相应的差分倒谱参数相结合等。
4 识别模型VQ
对于N个说话人集合的系统, 需要为每个人建立一个码本。训练的时候, 用LBG算法, 由说话人语音的训练样本序列聚类生成码本。识别的时候, 用同样的方法从待识别语音中提取特征序列X1…XN, 然后用系统中建立的N个码本对其进行矢量量化, 用式
定义的平均量化畸变程度判断该矢量序列与哪一个码本的分布最为接近。其中Yji表示第i个说话人码本的第j个码字, T是特征矢量序列的长度, 也就是待识别语音所包含帧的总数, 式中, d (Xi, Yji) 采用欧式距离测度。最终的识别结果就是Di最小所对应的第i个说话人。
利用矢量量化技术时, 主要有两个问题要解决:
(1) 设计一个好的码本;
(2) 未知矢量的量化。
⛄二、部分源代码
function varargout = untitled(varargin)
% UNTITLED M-file for untitled.fig
% UNTITLED, by itself, creates a new UNTITLED or raises the existing
% singleton*.
%
% H = UNTITLED returns the handle to a new UNTITLED or the handle to
% the existing singleton*.
%
% UNTITLED(‘CALLBACK’,hObject,eventData,handles,…) calls the local
% function named CALLBACK in UNTITLED.M with the given input arguments.
%
% UNTITLED(‘Property’,‘Value’,…) creates a new UNTITLED or raises the
% existing singleton*. Starting from the left, property value pairs are
% applied to the GUI before untitled_OpeningFunction gets called. An
% unrecognized property name or invalid value makes property application
% stop. All inputs are passed to untitled_OpeningFcn via varargin.
%
% *See GUI Options on GUIDE’s Tools menu. Choose “GUI allows only one
% instance to run (singleton)”.
%
% See also: GUIDE, GUIDATA, GUIHANDLES
% Edit the above text to modify the response to help untitled
% Last Modified by GUIDE v2.5 21-May-2021 13:54:38
% Begin initialization code - DO NOT EDIT
gui_Singleton = 1;
gui_State = struct(‘gui_Name’, mfilename, …
‘gui_Singleton’, gui_Singleton, …
‘gui_OpeningFcn’, @untitled_OpeningFcn, …
‘gui_OutputFcn’, @untitled_OutputFcn, …
‘gui_LayoutFcn’, [] , …
‘gui_Callback’, []);
if nargin & isstr(varargin{1})
gui_State.gui_Callback = str2func(varargin{1});
end
if nargout
[varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:});
else
gui_mainfcn(gui_State, varargin{:});
end
% End initialization code - DO NOT EDIT
% — Executes just before untitled is made visible.
function untitled_OpeningFcn(hObject, eventdata, handles, varargin)
% This function has no output args, see OutputFcn.
% hObject handle to figure
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
% varargin command line arguments to untitled (see VARARGIN)
% Choose default command line output for untitled
handles.output = hObject;
% Update handles structure
guidata(hObject, handles);
% This sets up the initial plot - only do when we are invisible
% so window can get raised using untitled.
if strcmp(get(hObject,‘Visible’),‘off’)
plot(sin(1:0.01:25));
end
axes(handles.axes1);cla;plot(rand(5));
axes(handles.axes3);cla;plot(rand(5));
% UIWAIT makes untitled wait for user response (see UIRESUME)
% uiwait(handles.figure1);
% — Outputs from this function are returned to the command line.
function varargout = untitled_OutputFcn(hObject, eventdata, handles)
% varargout cell array for returning output args (see VARARGOUT);
% hObject handle to figure
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
% Get default command line output from handles structure
varargout{1} = handles.output;
% — Executes on button press in pushbutton1.
function pushbutton1_Callback(hObject, eventdata, handles)
% hObject handle to pushbutton1 (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
axes(handles.axes1);
cla;
%plot(rand(5));
% --------------------------------------------------------------------
function FileMenu_Callback(hObject, eventdata, handles)
% hObject handle to FileMenu (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
% --------------------------------------------------------------------
function OpenMenuItem_Callback(hObject, eventdata, handles)
% hObject handle to OpenMenuItem (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
file = uigetfile(‘*.fig’);
if ~isequal(file, 0)
open(file);
end
% --------------------------------------------------------------------
function PrintMenuItem_Callback(hObject, eventdata, handles)
% hObject handle to PrintMenuItem (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
printdlg(handles.figure1)
% --------------------------------------------------------------------
function CloseMenuItem_Callback(hObject, eventdata, handles)
% hObject handle to CloseMenuItem (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
selection = questdlg(['Close ’ get(handles.figure1,‘Name’) ‘?’],…
['Close ’ get(handles.figure1,‘Name’) ‘…’],…
‘Yes’,‘No’,‘Yes’);
if strcmp(selection,‘No’)
return;
end
delete(handles.figure1)
% — Executes during object creation, after setting all properties.
function popupmenu1_CreateFcn(hObject, eventdata, handles)
% hObject handle to popupmenu3 (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles empty - handles not created until after all CreateFcns called
% Hint: popupmenu controls usually have a white background on Windows.
% See ISPC and COMPUTER.
if ispc
set(hObject,‘BackgroundColor’,‘white’);
else
set(hObject,‘BackgroundColor’,get(0,‘defaultUicontrolBackgroundColor’));
end
set(hObject, ‘String’, {‘plot(rand(5))’, ‘plot(sin(1:0.01:25))’, ‘comet(cos(1:.01:10))’, ‘bar(1:10)’, ‘plot(membrane)’, ‘surf(peaks)’});
% — Executes on selection change in popupmenu3.
function popupmenu1_Callback(hObject, eventdata, handles)
% hObject handle to popupmenu3 (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
% Hints: contents = get(hObject,‘String’) returns popupmenu3 contents as cell array
% contents{get(hObject,‘Value’)} returns selected item from popupmenu3
% — Executes on button press in pushbutton4.
function pushbutton4_Callback(hObject, eventdata, handles)
% hObject handle to pushbutton4 (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
n=get(handles.popupmenu2, ‘Value’);
second=1;%录音时长(秒)
framelnc = 100;%length of Frames excursion
framelen = 256;%length of Frames 采样频率12.500kHz ,桢长为020.5ms
Fs =8000;
pause(2);
message={‘录音开始!’};
msgbox(message);
x= audiorecord(second*Fs, Fs, ‘double’);
message={‘录音结束!’};
msgbox(message);
pause(1);
audioplay(x, Fs);
[x1,x2,amp,zcr]=vad2(x,framelen,framelnc);
axes(handles.axes1);
cla;
%subplot(3,1,1)
plot(x)
axis([1 length(x) -1 1])
line([x1framelnc x1framelnc],[-1 1],‘color’,‘red’);
line([x2framelnc x2framelnc],[-1 1],‘color’,‘red’);
ylabel(‘归一化的原始信号’)
text(x1framelnc,0.5,‘起始端点 \rightarrow’,…
‘HorizontalAlignment’,‘right’)
text(x2framelnc,0.5,'\leftarrow 结束端点 ',…
‘HorizontalAlignment’,‘left’)
axes(handles.axes3);
cla;
plot(amp,‘b’);
hold on;
plot(zcr,‘y’);
length(amp)
length(zcr)
pmax=max(max(amp),max(zcr));
pmin=min(min(amp),min(zcr));
axis([1 length(amp) 0 pmax])
line([x1 x1],[pmin,pmax],‘color’,‘red’);
line([x2 x2],[pmin,pmax],‘color’,‘red’);
ylabel(‘短时能量(蓝色),过零率(黄色)’)
text(x1,pmax/2,‘起始端点 \rightarrow’,…
‘HorizontalAlignment’,‘right’)
text(x2,pmax/2,'\leftarrow 结束端点 ',…
‘HorizontalAlignment’,‘left’)
file = sprintf(‘mytrain\s%d.wav’,n);
WAVWRITE(x,Fs,file);
% — Executes on button press in pushbutton5.
function pushbutton5_Callback(hObject, eventdata, handles)
% hObject handle to pushbutton5 (see GCBO)
% eventdata reserved - to be defined in a future version of MATLAB
% handles structure with handles and user data (see GUIDATA)
%code=train1(‘mytrain’,4);
Fm = 100;%length of Frames excursion
Fn = 256;%length of Frames 采样频率12.500kHz ,桢长为020.5ms
k = 16; % number of centroids required
n=8;
traindir=‘mytrain’;
⛄三、运行结果


⛄四、matlab版本及参考文献
1 matlab版本
2014a
2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.
3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除
🍅 仿真咨询
1 各类智能优化算法改进及应用
1.1 PID优化
1.2 VMD优化
1.3 配电网重构
1.4 三维装箱
1.5 微电网优化
1.6 优化布局
1.7 优化参数
1.8 优化成本
1.9 优化充电
1.10 优化调度
1.11 优化电价
1.12 优化发车
1.13 优化分配
1.14 优化覆盖
1.15 优化控制
1.16 优化库存
1.17 优化路由
1.18 优化设计
1.19 优化位置
1.20 优化吸波
1.21 优化选址
1.22 优化运行
1.23 优化指派
1.24 优化组合
1.25 车间调度
1.26 生产调度
1.27 经济调度
1.28 装配线调度
1.29 水库调度
1.30 货位优化
1.31 公交排班优化
1.32 集装箱船配载优化
1.33 水泵组合优化
1.34 医疗资源分配优化
1.35 可视域基站和无人机选址优化
2 机器学习和深度学习分类与预测
2.1 机器学习和深度学习分类
2.1.1 BiLSTM双向长短时记忆神经网络分类
2.1.2 BP神经网络分类
2.1.3 CNN卷积神经网络分类
2.1.4 DBN深度置信网络分类
2.1.5 DELM深度学习极限学习机分类
2.1.6 ELMAN递归神经网络分类
2.1.7 ELM极限学习机分类
2.1.8 GRNN广义回归神经网络分类
2.1.9 GRU门控循环单元分类
2.1.10 KELM混合核极限学习机分类
2.1.11 KNN分类
2.1.12 LSSVM最小二乘法支持向量机分类
2.1.13 LSTM长短时记忆网络分类
2.1.14 MLP全连接神经网络分类
2.1.15 PNN概率神经网络分类
2.1.16 RELM鲁棒极限学习机分类
2.1.17 RF随机森林分类
2.1.18 SCN随机配置网络模型分类
2.1.19 SVM支持向量机分类
2.1.20 XGBOOST分类
2.2 机器学习和深度学习预测
2.2.1 ANFIS自适应模糊神经网络预测
2.2.2 ANN人工神经网络预测
2.2.3 ARMA自回归滑动平均模型预测
2.2.4 BF粒子滤波预测
2.2.5 BiLSTM双向长短时记忆神经网络预测
2.2.6 BLS宽度学习神经网络预测
2.2.7 BP神经网络预测
2.2.8 CNN卷积神经网络预测
2.2.9 DBN深度置信网络预测
2.2.10 DELM深度学习极限学习机预测
2.2.11 DKELM回归预测
2.2.12 ELMAN递归神经网络预测
2.2.13 ELM极限学习机预测
2.2.14 ESN回声状态网络预测
2.2.15 FNN前馈神经网络预测
2.2.16 GMDN预测
2.2.17 GMM高斯混合模型预测
2.2.18 GRNN广义回归神经网络预测
2.2.19 GRU门控循环单元预测
2.2.20 KELM混合核极限学习机预测
2.2.21 LMS最小均方算法预测
2.2.22 LSSVM最小二乘法支持向量机预测
2.2.23 LSTM长短时记忆网络预测
2.2.24 RBF径向基函数神经网络预测
2.2.25 RELM鲁棒极限学习机预测
2.2.26 RF随机森林预测
2.2.27 RNN循环神经网络预测
2.2.28 RVM相关向量机预测
2.2.29 SVM支持向量机预测
2.2.30 TCN时间卷积神经网络预测
2.2.31 XGBoost回归预测
2.2.32 模糊预测
2.2.33 奇异谱分析方法SSA时间序列预测
2.3 机器学习和深度学习实际应用预测
CPI指数预测、PM2.5浓度预测、SOC预测、财务预警预测、产量预测、车位预测、虫情预测、带钢厚度预测、电池健康状态预测、电力负荷预测、房价预测、腐蚀率预测、故障诊断预测、光伏功率预测、轨迹预测、航空发动机寿命预测、汇率预测、混凝土强度预测、加热炉炉温预测、价格预测、交通流预测、居民消费指数预测、空气质量预测、粮食温度预测、气温预测、清水值预测、失业率预测、用电量预测、运输量预测、制造业采购经理指数预测
3 图像处理方面
3.1 图像边缘检测
3.2 图像处理
3.3 图像分割
3.4 图像分类
3.5 图像跟踪
3.6 图像加密解密
3.7 图像检索
3.8 图像配准
3.9 图像拼接
3.10 图像评价
3.11 图像去噪
3.12 图像融合
3.13 图像识别
3.13.1 表盘识别
3.13.2 车道线识别
3.13.3 车辆计数
3.13.4 车辆识别
3.13.5 车牌识别
3.13.6 车位识别
3.13.7 尺寸检测
3.13.8 答题卡识别
3.13.9 电器识别
3.13.10 跌倒检测
3.13.11 动物识别
3.13.12 二维码识别
3.13.13 发票识别
3.13.14 服装识别
3.13.15 汉字识别
3.13.16 红绿灯识别
3.13.17 虹膜识别
3.13.18 火灾检测
3.13.19 疾病分类
3.13.20 交通标志识别
3.13.21 卡号识别
3.13.22 口罩识别
3.13.23 裂缝识别
3.13.24 目标跟踪
3.13.25 疲劳检测
3.13.26 旗帜识别
3.13.27 青草识别
3.13.28 人脸识别
3.13.29 人民币识别
3.13.30 身份证识别
3.13.31 手势识别
3.13.32 数字字母识别
3.13.33 手掌识别
3.13.34 树叶识别
3.13.35 水果识别
3.13.36 条形码识别
3.13.37 温度检测
3.13.38 瑕疵检测
3.13.39 芯片检测
3.13.40 行为识别
3.13.41 验证码识别
3.13.42 药材识别
3.13.43 硬币识别
3.13.44 邮政编码识别
3.13.45 纸牌识别
3.13.46 指纹识别
3.14 图像修复
3.15 图像压缩
3.16 图像隐写
3.17 图像增强
3.18 图像重建
4 路径规划方面
4.1 旅行商问题(TSP)
4.1.1 单旅行商问题(TSP)
4.1.2 多旅行商问题(MTSP)
4.2 车辆路径问题(VRP)
4.2.1 车辆路径问题(VRP)
4.2.2 带容量的车辆路径问题(CVRP)
4.2.3 带容量+时间窗+距离车辆路径问题(DCTWVRP)
4.2.4 带容量+距离车辆路径问题(DCVRP)
4.2.5 带距离的车辆路径问题(DVRP)
4.2.6 带充电站+时间窗车辆路径问题(ETWVRP)
4.2.3 带多种容量的车辆路径问题(MCVRP)
4.2.4 带距离的多车辆路径问题(MDVRP)
4.2.5 同时取送货的车辆路径问题(SDVRP)
4.2.6 带时间窗+容量的车辆路径问题(TWCVRP)
4.2.6 带时间窗的车辆路径问题(TWVRP)
4.3 多式联运运输问题
4.4 机器人路径规划
4.4.1 避障路径规划
4.4.2 迷宫路径规划
4.4.3 栅格地图路径规划
4.5 配送路径规划
4.5.1 冷链配送路径规划
4.5.2 外卖配送路径规划
4.5.3 口罩配送路径规划
4.5.4 药品配送路径规划
4.5.5 含充电站配送路径规划
4.5.6 连锁超市配送路径规划
4.5.7 车辆协同无人机配送路径规划
4.6 无人机路径规划
4.6.1 飞行器仿真
4.6.2 无人机飞行作业
4.6.3 无人机轨迹跟踪
4.6.4 无人机集群仿真
4.6.5 无人机三维路径规划
4.6.6 无人机编队
4.6.7 无人机协同任务
4.6.8 无人机任务分配
5 语音处理
5.1 语音情感识别
5.2 声源定位
5.3 特征提取
5.4 语音编码
5.5 语音处理
5.6 语音分离
5.7 语音分析
5.8 语音合成
5.9 语音加密
5.10 语音去噪
5.11 语音识别
5.12 语音压缩
5.13 语音隐藏
6 元胞自动机方面
6.1 元胞自动机病毒仿真
6.2 元胞自动机城市规划
6.3 元胞自动机交通流
6.4 元胞自动机气体
6.5 元胞自动机人员疏散
6.6 元胞自动机森林火灾
6.7 元胞自动机生命游戏
7 信号处理方面
7.1 故障信号诊断分析
7.1.1 齿轮损伤识别
7.1.2 异步电机转子断条故障诊断
7.1.3 滚动体内外圈故障诊断分析
7.1.4 电机故障诊断分析
7.1.5 轴承故障诊断分析
7.1.6 齿轮箱故障诊断分析
7.1.7 三相逆变器故障诊断分析
7.1.8 柴油机故障诊断
7.2 雷达通信
7.2.1 FMCW仿真
7.2.2 GPS抗干扰
7.2.3 雷达LFM
7.2.4 雷达MIMO
7.2.5 雷达测角
7.2.6 雷达成像
7.2.7 雷达定位
7.2.8 雷达回波
7.2.9 雷达检测
7.2.10 雷达数字信号处理
7.2.11 雷达通信
7.2.12 雷达相控阵
7.2.13 雷达信号分析
7.2.14 雷达预警
7.2.15 雷达脉冲压缩
7.2.16 天线方向图
7.2.17 雷达杂波仿真
7.3 生物电信号
7.3.1 肌电信号EMG
7.3.2 脑电信号EEG
7.3.3 心电信号ECG
7.3.4 心脏仿真
7.4 通信系统
7.4.1 DOA估计
7.4.2 LEACH协议
7.4.3 编码译码
7.4.4 变分模态分解
7.4.5 超宽带仿真
7.4.6 多径衰落仿真
7.4.7 蜂窝网络
7.4.8 管道泄漏
7.4.9 经验模态分解
7.4.10 滤波器设计
7.4.11 模拟信号传输
7.4.12 模拟信号调制
7.4.13 数字基带信号
7.4.14 数字信道
7.4.15 数字信号处理
7.4.16 数字信号传输
7.4.17 数字信号去噪
7.4.18 水声通信
7.4.19 通信仿真
7.4.20 无线传输
7.4.21 误码率仿真
7.4.22 现代通信
7.4.23 信道估计
7.4.24 信号检测
7.4.25 信号融合
7.4.26 信号识别
7.4.27 压缩感知
7.4.28 噪声仿真
7.4.29 噪声干扰
7.5 无人机通信
7.6 无线传感器定位及布局方面
7.6.1 WSN定位
7.6.2 高度预估
7.6.3 滤波跟踪
7.6.4 目标定位
7.6.4.1 Dv-Hop定位
7.6.4.2 RSSI定位
7.6.4.3 智能算法优化定位
7.6.5 组合导航
8 电力系统方面
微电网优化、无功优化、配电网重构、储能配置
更多推荐


所有评论(0)