产品简介
提供高精度语音识别服务,支持多场景智能语音交互,针对实效性高的业务,提供在线音频转文字的服务,针对实效性要求低的业务,提供低成本离线音频转文字服务。产品功能
短语音识别
将30秒以内的语音精准识别为文字。
实时语音识别
将音频流实时识别为文字,并返回每句话的开始和结束时间。
音频文件转写
将上传的长音频文件转写为文字,返回给上传者。
准确率
多场景下的字准确率达95%,已支持全国30个不同省份带口音普通话识别
识别速度
虚拟机部署识别服务实时率达0.125,即1秒可识别8秒的语音
并发能力
虚拟机部署识别服务支持1核1路并发。
应用场景
客服质检
通过快速转写客服语音服务记录,进行客服质量检查和考核,保证服务质量。
实时会议字幕
能快速实时识别会议或演讲语音,同步给出会议或演讲字幕,提高参会者用户体验。
语音搜索
替代传统的线性交互产品,用户通过语音可一句话直达,缩减繁琐的页面跳转等操作