针对语音服务提供厂商的记录(2022-08-16)
1、前言
最近结合项目概要,需要用到录音文件解析服务,所以需要根据现行主流仓上的语音服务进行排比,主要调研的厂商为:①科大讯飞 ②阿里巴巴 ③腾讯 ④微软
2、容量试用方面
分析到底,还是需要一个试用才能知真解,这里提及的试用主要针对为API调用方式。 ①科大讯飞: https://www.xfyun.cn/services/lfasr ②微软: https://azure.microsoft.com/zh-cn/services/cognitive-services/speech-to-text/#features ③腾讯: https://cloud.tencent.com/product/asr ④阿里: https://ai.aliyun.com/nls/trans
2.1、参考返回时间
2.1.1、科大讯飞:
基于官网的数据讯息,
2.1.2、微软:
基于参考文档, 并没有给出一个细节内的数据示例,故对应时间为自行测试的大概时间,测试次数大概为40个轮回数据。
2.1.3、阿里巴巴
普通版:
免费用户的识别任务在24小时内完成并返回识别文本; 付费用户的识别任务在3小时内完成并返回识别文本
极速版本:
支持100 MB以内且时长不超过2小时的音频文件,通常10秒内执行完毕。
2.1.4、腾讯
普通版:
3小时内完成识别(大多数情况下1小时音频约3分钟以内完成识别)
极速版本:
支持100 MB以内且时长不超过2小时的音频文件,通常10秒内执行完毕。
3、本地化部署支持
上一篇:
通过多线程提高代码的执行效率例子
下一篇:
如何批量消费队列中数据