便宜云服务器租用语音识别服务对于常用词汇的识别效果极佳,但对一些特有的人名、产品名、公司名或者某个领域的专有词汇,例如:品牌名智聆、建筑名滨海大厦、保险领域专业词汇核保、云存储专业词汇存储桶、原创食品名金尊披萨等,可能存在识别准确率降低的情况。对于这些专有词汇,便宜云服务器租用语音识别提供了热词功能供用户使用,添加热词可以显著提升通用引擎在这类专有词汇上的识别准确率。
功能介绍:热词
在热词功能中,我们开放了通用热词、超级热词、热词增强版三个维度的热词能力供客户使用,热词生效强度依次增加。其中“热词增强版”是我们首创的热词支持形式之一,开启“热词增强版”以后可以极大提升语言模型的识别准确率。这三个功能介绍如下:
热词功能 | 热词生效等级 | 说明 |
通用热词 | 一般 | “通用热词”强度最低,但对整体数据集的 WER(Wer Error Rate,字错率)影响最小。因此,通用热词级别的热词根据上下文语义不同,有一定概率不生效。通用热词的权重范围为[1,10],数值越大生效概率越大。 |
超级热词 | 中等 | “超级热词”对词表相关内容识别准确率相比通用热词有极大提升。创建热词表或每次请求直接传入临时热词表时,若热词权重设置为11,当前热词将升级为超级热词。 不过,超级热词的生效将在一定程度上影响整体识别的 WER,因此建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体数据集的字准率。 |
热词增强版 | 必现 (发音相同时) | 在使用“通用热词”、“超级热词”功能效果不显著的情况下(如:部分热词因为同音词过多,即使进行了配置,模型输出的概率变化也不大),使用“热词增强版”可开启同音同调替换的能力,可以极大提升相关热词的输出概率。若热词权重设置为100,当前热词将升级为热词增强版。 举例:在热词表中配置热词“蜜制”后,选择开启热词增强版,则与“蜜制”同音同调的“秘制”(mìzhì)的识别结果会被替换成“蜜制”。因此建议客户根据自己的实际情况谨慎开启此功能。 |
功能介绍:临时热词表
临时热词表:临时热词表是一种在请求中带入热词组的调用方式,不受热词表创建数量、热词创建数量限制。适用于单次请求中有大量热词需求、且需要频繁切换热词的用户(如:开放热词功能给到C端用户进行配置的情况)。临时热词表无需事先创建热词表,在每次请求时直接传入临时热词表即可使用热词功能,云端不会保留每次传入的临时热词表。
注意:
?临时热词表 仅适用于通过接口调用语音识别服务的客户。临时热词表 与 热词 在功能层面互相独立,如客户在调用接口时同时传入两者,将只会生效临时热词表中的热词。具体调用方法请见 支持范围 中的语音识别基础产品各接口文档和参数说明。
临时热词表功能暂不支持 MRCP 协议。
支持范围
语音识别基础产品 | 通用热词参数 | 超级热词 | 热词增强版 | 临时热词表 | 支持语种 | 使用方式 |
HotwordId | 将通用热词参数中的热词权重调整至11 | 将通用热词参数中的热词权重调整至100 | hotword_list | 所有中文普通话模型 所有英文模型 所有粤语模型 (包括含中文普通话、英文、粤语的混合模型) 请注意:热词增强版仅支持各子产品中的中文普通话模型 | 请注意:临时热词表在每次请求时直接传入即可使用 | |
hotword_id | ? | ? | hotword_list | ? | ? | |
hotword_id | ? | ? | hotword_list | ? | ? | |
HotwordId | ? | ? | hotword_list | ? | ? | |
HotwordId | ? | 暂不支持 | 暂不支持 | ? | ? |
使用建议
常见的通用词汇不建议加入热词,例如“客户”、“朋友”等词汇,加入过多的通用词汇会降低专有词汇的识别率。
热词权重越大,被识别出来的概率越大,热词权重的范围为[1,11]之间的整数,以及数值100,具体对应关系如下:
当热词权重设置为1-10之间,热词为通用热词,生效强度随数值变大而增大;
当热词权重设置为11时,热词将升级为超级热词。建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率;
当热词权重设置为100时,热词将升级为热词增强版。热词增强版为同音替换功能,请谨慎开启。
热词的添加可以极大提升识别准确率,是快速提升专有领域词汇的重要途径之一,但是仍可能存在无法正确识别的概率。请首先确认音频的清晰度和质量是否达标,达标的标准是普通人听一遍录音就能正确识别出文字。
使用时无需区分热词词性或所属实体类型。
热词表在创建时无需关联引擎。
临时热词表与热词参数在功能层面互相独立,如客户同时传入两者参数,将只会生效临时热词表中的热词。具体调用方法请见 支持范围 中的语音识别基础产品各接口文档和参数说明。
使用限制
默认每个账号最多可创建30个热词表,每个热词表最多可添加1000个热词,每个热词最长10个字,不能超出限制(如有超过限制的需求,请使用 自学习模型)。
热词表文件必须为 UTF-8 或 GBK 编码格式,每行仅添加一个热词和对应权重(热词和权重间用英文符号|隔开),不能包含标点和特殊字符。详见 热词示例。
同一个账号最多可以设置1个默认热词表(但最多可以创建30个)。如果在调用语音识别服务时,不进行单独的热词表 ID 设置,则自动生效默认热词表;如果进行单独的热词表 ID 设置,那么将生效单独设置的热词表 ID。
临时热词表最多可添加128个热词,多个热词用英文逗号分割,如:“便宜云服务器租用|10,语音识别|5,ASR|11”。
热词生效流程
产品后端服务将热词表配送至识别层(由后端服务完成,客户无感知)
客户发起语音识别请求,并传入热词表 ID(如不传入热词表 ID,则生效默认热词表)
识别层根据请求传入的热词表 ID 生效对应的热词表(由后端服务完成,客户无感知)
热词使用方法一:通过API创建并使用
您可以通过调用下述接口,自行对热词进行创建、删除、更新、设置等操作,无需依赖控制台的操作:
?创建热词表:用户通过本接口添加热词,添加成功后会返回给用户热词表 ID,然后用户可以通过在请求语音识别服务时,对热词参数设置对应的热词表 ID 的方式使用。
?删除热词表:用户通过本接口进行热词表的删除。
?下载热词表:用户通过本接口进行热词表的下载,获得词表权重文件形式的 base64 值,文件形式为通过 “|” 分割的词和权重,即 word|weight 的形式。
?获取热词表:用户根据词表的ID可以获取对应的热词表信息。
?列举热词表:用户通过该接口,可获得所有的热词表及其信息。
?设置热词表状态:用户通过该接口可以设置热词表的默认状态。初始状态为0,用户可设置状态为1,即为默认状态。默认状态表示用户在请求识别时,如不设置热词表 ID,则默认使用状态为1的热词表。
?更新热词表:用户通过本接口进行对应的词表信息更新。
对于每个语音识别请求,同时只能有一个热词表起作用,但不同的请求可以使不同的热词表生效。针对不同语音识别子产品的请求说明如下:
语音识别子产品 | 接口文档连接 | 接口对应热词参数名 | 如何定义请求 |
录音文件识别 | HotwordId | 每个 HTTP请求 | |
实时语音识别 | hotword_id | 每个音频流 | |
录音文件识别极速版 | hotword_id | 每个 HTTP 请求 | |
一句话识别 | HotwordId | 每个 HTTP 请求 | |
语音流异步识别 | HotwordId | 每个音频流 |
热词使用方法二:通过控制台配置
1. 新建热词表和热词
说明
?
?2. 查看列表
3. 更新热词
在热词列表中,选择操作 > 更新编辑热词,在弹出页面单击更换文件,文件更换完成后,单击确定即可。
?
?4. 设置默认热词
在热词列表中,选择操作 > 设置默认,在弹出页面中将该热词设置为默认热词。热词设为默认后,调用服务时默认生效,无需进行参数设置。
?
?
?5. 下载热词
在热词列表中,选择操作 > 下载,可直接下载热词。
6. 删除热词
在热词列表中,选择操作 > 删除,在弹出页面中单击确定,即可删除热词。删除后,热词数据和效果均无法恢复。
?
?
?7. 编辑标签
在热词列表中,选择操作 > 编辑标签,在弹出页面中设置标签键和标签值,也可同时设置多个标签键和标签值,设置完成后,单击确定即可。
?
?8. 热词示例
?
?
?例如:“孔银”、“聊币玄”、“李朝辉”、“罗倾听”这样的专业词汇,可以参照上述示例添加热词,热词权重越大,识别的效果越好。
注意:其中的数字推荐按照发音替换为对应汉字,例如“689元”替换为“六百八十九元”。
?