语音识别如何接入?
语音识别怎么进行功能体验?
语音识别控制台功能体验怎样上传大于 5M 的文件?
不同使用场景对应的是语音识别哪种服务?
实时语音识别适用于有实时性要求的场景,例如语音输入、语音机器人、会议现场记录等场景。
一句话识别适用于对60秒之内的短音频文件进行识别的场景,例如语音短信、语音搜索等场景。
录音文件识别适用于语音时间较长、实时性要求低的场景,例如客服质检、视频字幕生成等场景。
支持远场和离线的语音识别吗?
语音识别支持中英文混合场景和地方方言吗?
?实时语音识别、一句话识别、录音文件识别、录音文件识别极速版和语音流异步识别支持中英文混合识别(使用中文引擎的时候,在少量英文的情况下可以支持中英文混合识别,大量英文可能出现识别率降低的情况),且支持带口音的中文普通话语音识别。
语音识别支持的输入音频时长是多少?
一句话识别每次调用支持60秒之内的音频。
录音文件识别每次调用支持五小时之内的音频。
实时语音音频流中每个数据包的音频分片为200ms。
语音识别接口的 HTTP 请求返回鉴权失败?
请用户对照参数表检查自己的参数是否正确上传。如果想快速接入,推荐使用官网提供的 SDK。
语音识别接口会限制音频文件的采样率吗?
接口不会限制,但是采样率不符合标准,会影响到识别效果。