树莓派基于语音活性检测VAD的应用
如果你想尝试用树莓派打造一款语音对话机器人,那么你肯定避免不了一点,录音!
前言:
我之前的中提到过alsa的arecord录制,录音时间固定,当程序运行一次后就会出现arecord资源被占用的情况,除非你把这个进程kill掉。然后事实上,你不可能每次运行完就手动kill一次,那样太麻烦了。 后来我用pyaudio,完美解决了上述的问题。直到今天,我遇到了语音活性检测VAD···
科普来了~ 语音活性检测 (Voice activity detection,VAD), 也称为 speech activity detection or speech detection, 是一项用于语音处理的技术,目的是检测语音信号是否存在。VAD技术主要用于语音编码和语音识别。 在本篇文章中用到的是WebRTC之VAD算法。 其主要功能:
- 自动打断
- 去掉语音中的静音成分
- 获取输入语音中有效语音
- 去除噪声,对语音进行增强
参考:gdjzkj.com/?m=home&c=View&a=index&aid=118