在现实生活中,无论是个人手机智能助理、聊天语音转文字;还是企业智能呼叫中心、语音质检等场景下,都会广泛用到语音识别技术。
实时率(FTR)
实时率,就是一段声音的时间和处理它所需要的时间的比值。显然,这个指标越小,对应的耗时性能越好。
32核CPU服务器环境下,用52秒音频文件进行32并发测试,深思维语音识别(ASR)平均耗时只用到了18371毫秒;实时率在0.009 – 0.011 之间,真正实现了毫秒级识别响应。
字错率(WER)
字错率的定义比较专业,我们可以笼统的理解为语音识别的错误率,这个值当然是越低越好。
全新版本的深思维语音识别(ASR)技术能力,将字错率控制在了6.01%以内,在识别精度上也交出了令人满意的答卷。
- 一句话识别
- 实时语音识别
- 录音文件识别
- 离线语音识别
目前,语音识别能力核心技术掌握在各大云厂商的手中,使用成本较高已成为普遍事实,尤其是对于如运营商等拥有着超大量的语音识别需求的企业来说,更是难以承受。深思维语音识别能力,在指标完全胜任商业化要求的同时,也提供了及其有竞争力的价格,能够最大限度地降低客户成本,欢迎垂询。