语音识别是将语音转化成文字的产品,为企业提供精准而极具性价比的识别服务。适用于录音质检、会议实时转写、语音输入法等多个场景。
应用场景
1.客服质检 2.会议实时转写 3.实时字幕 4.法庭转写 5.面对面销售 6.语音输入法 7.外呼虚拟号 8.身份认证
功能特色
1.录音文件识别
对用户上传的5小时内的录音文件进行识别。可应用于呼叫中心音频转写与质检、视频字幕转写、会议语音资料转写等场景。
2.实时语音识别
对不限时长的实时音频流进行识别,识别结果自动断句,标记每句话的开始和结束时间。可应用于智能语音助手、语音输入法等实时音频流场景。
3.录音文件识别极速版
对用户上传的录音文件进行极速识别,准实时返回识别结果。返回速度快于录音文件识别。可应用于短视频配音转写、字幕转写等时效要求高的场景。
4.一句话识别
对60秒内的短音频文件进行识别。可应用于即时通信应用(IM)、语音消息转文字、语音搜索等短文件识别场景。
5.语音异步识别
对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型。可应用于直播流质检等场景。
6.说话人识别
基于语音识别与声纹识别能力,将说话人的音频与语音库中该说话人预存的音频进行1:1比对验证,具备一定的抗攻击能力,可用于身份验证场景。
7.虚拟号真人判定
基于语音识别和声学算法能力,在智能外呼场景下,能够在毫秒级准确判断真人用户何时接起电话,帮助客户判断对话机器人的启动时机。