查看: 422|回复: 0|关注: 0

[未答复] bp神经网络对单通道语音去噪过程中遇到的问题,请大神指点一下

[复制链接]

新手

10 麦片

财富积分


050


1

主题

1

帖子

0

最佳答案
发表于 2020-11-11 20:13:41 | 显示全部楼层 |阅读模式
最近在做单通道语音去噪增强,用神经网络进行训练,先用了基础的bp,但是效果很差。
自己写的程序大概流程如下:
从网上找了一个开源语音集,在里面取了 300个语音对其加洗衣机噪声 作为训练集输入,对应的纯净语音作为输出,进行训练。
随机取了 一些其余的语音再加洗衣机噪声 测试,网络输出效果很差,但不知道问题出在哪边,请大神指点一下。

对取得300个语音先进行src(把48khz转换成8khz),加上洗衣机噪声,信噪比设置为0。
特征提取:对每个含噪语音信号stft , 把得到的每一个s矩阵的幅值转换成一个N维1列的矩阵,再将这300个构成一个Nx300的矩阵,作为网络的输入,其中 300个样本,1个样本N个特征。网络的output也是这样,是Nx300的一个矩阵。并且保存stft后的相位角。
             数据对齐 :取语音信号长度最短的语音,在其他语音上截取与他相同的长度,构成样本矩阵。
再把需要测试的语音输入到训练好的网络,得到一个N维1列的矩阵,reshape回到之前stft后的s矩阵的size,在根据之前的相位角,重构之前的复数阵,然后的在经过stft的逆变换,得到预测的语音。 但是效果很差。。。
     stft时候 加窗长度512,重叠256,单个语音矩阵长度100848,降频后16808   stft后是一个512x64的矩阵 ,reshape成一列就是32768x1,然后300个语音就是32768x300,bp网络隐含层1层,9个神经元,
大概过程就是这么个过程,有没有大神指点一下,哪里出问题了,另外,附上程序,语音集太大就不发了,求大神指点,感谢!

dsp0.m

2.12 KB, 下载次数: 0

回复主题 已获打赏: 0 积分

举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /5 下一条

快速回复 返回顶部 返回列表