树莓派基于语音活性检测VAD的应用

如果你想尝试用树莓派打造一款语音对话机器人,那么你肯定避免不了一点,录音!

前言:
我之前的中提到过alsa的arecord录制,录音时间固定,当程序运行一次后就会出现arecord资源被占用的情况,除非你把这个进程kill掉。然后事实上,你不可能每次运行完就手动kill一次,那样太麻烦了。 后来我用pyaudio,完美解决了上述的问题。直到今天,我遇到了语音活性检测VAD···

科普来了~ 语音活性检测 (Voice activity detection,VAD), 也称为 speech activity detection or speech detection, 是一项用于语音处理的技术,目的是检测语音信号是否存在。VAD技术主要用于语音编码和语音识别。 在本篇文章中用到的是WebRTC之VAD算法。 其主要功能:

  1. 自动打断
  2. 去掉语音中的静音成分
  3. 获取输入语音中有效语音
  4. 去除噪声,对语音进行增强

参考:gdjzkj.com/?m=home&c=View&a=index&aid=118

经验分享 程序员 微信小程序 职场和发展