一种提高语音识别率的方法与流程-ag尊龙凯时

文档序号：29948493发布日期：2022-05-07 17:09来源：国知局

导航：ag尊龙凯时-人生就是博尊龙ag旗舰厅> 最新专利>乐器;声学设备的制造及制作,分析技术

1.本发明涉及一种提高语音识别率的方法，属于语音识别技术领域。

背景技术：

2.离线语音识别为能有效识别用户语音中的命令词，需要根据命令词的标准发音来设置语音阈值，在对用户语音信息进行识别时，若满足阈值条件，则认定语音识别成功，若不满足阈值条件，则认定语音识别失败。因此该识别方式的识别率与语音阈值相关。若语音阈值较高(对用户命令词发音的标准程度要求高)，则识别率降低，对于方言用户会产生很大的识别困难。若语音阈值较低(对用户命令词发音的标准程度要求低)，则识别率提高，但同时会导致误识别的概率提高。

技术实现要素：

3.本发明提供了一种提高语音识别率的方法，在提高语音识别有效率的同时，降低误识别的概率。
4.本发明提供了一种提高语音识别率的方法，包括：
5.在单位时间内，n次采集到的命令词发音低于发音预设阈值，且各次采集到的命令词均在于可信区间内，则认定该命令词识别成功，n为大于1的整数。
6.进一步地，所述提高语音识别率的方法具体包括：
7.s101.设定发音预设阈值；
8.s102.采集用户命令词发音，并与预设阈值进行比较；
9.s103.若低于预设阈值，且该用户命令词发音在单位时间内重复n次，且各次采集到的命令词均在于可信区间内，则认定命令词识别成功。
10.更进一步地，所述s101设定发音预设阈值包括：
11.s1011.确定命令词，提取命令词标准发音；
12.s1012.以该命令词标准发音的正常值作为预设阈值，并根据该命令词标准发音设定可信区间，预设阈值为可信区间上限。
13.更进一步地，所述s102采集用户命令词发音，并与预设阈值进行比较包括
14.s1021.采集用户语音；
15.s1022.对用户语音进行解析，提取命令词，获取命令词分值。
16.更进一步地，所述s103若低于预设阈值，且该用户命令词发音在单位时间内重复n次，各次采集到的命令词均在可信区间内，则认定命令词识别成功包括：
17.s1031.将命令词分值与预设阈值进行比较；
18.s1032.若命令词分值不小于预设阈值，则认定语音识别成功；
19.s1033.若命令词分值小于预设阈值，且在单位时间内n次采集到该命令词分值均在可信区间内，则认定命令词识别成功。
20.更进一步地，所述s1033若命令词分值小于预设阈值，且在单位时间内n次采集到
该命令词分值均在可信区间内，则认定命令词识别成功包括：
21.s201.若命令词分值小于预设阈值，则重复采集用户语音；
22.s202.从用户语音中再次获取命令词分值，并与预设阈值进行比较；
23.s203.若s202所得的命令词分值不小于预设阈值，则认定语音识别成功；
24.s204.若s202所得的命令词分值小于预设阈值，且此时仍处于单位时间内，用户语音采集总次数少于n，则重复s201-s204，至命令词的总获取次数达到n次；若n次采集的命令词分值均在可信区间内，则认定命令词识别成功；若n次采集的命令词分值不全在可信区间内，则认定命令词识别失败。
25.更进一步地，所述s1033若命令词分值小于预设阈值，且在单位时间内n次采集到该命令词分值均在可信区间内，则认定命令词识别成功还包括：；
26.s205.若s202所得的命令词分值小于预设阈值，且用户语音采集总次数不大于n，并处于单位时间外，则将最后一次获得的命令词分值重新设定为第一次获取的命令词分值，并重新计算单位时间，再次重复步骤s102、s103。
27.进一步地，所述单位时间为10-30秒。
28.进一步地，所述n为2。
29.本发明相对于现有技术，在设定较高语音阈值的基础上，利用提高语音识别率的方法可提高语音识别系统对不满足语音阈值的命令词进行有效识别，进而提高语音识别率。
附图说明
30.图1为本发明实施例命令词识别部分流程图；
31.图2为本发明实施例流程示意图。
具体实施方式
32.为了使本技术领域的人员更好地理解本发明方案，下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。
33.本发明实施例公开了一种提高语音识别率的方法，包括：
34.在单位时间内，n次采集到的命令词发音低于发音预设阈值，且各次采集到的命令词均在于可信区间内，则认定该命令词识别成功，n为大于1的整数。
35.传统语音识别系统若命令词发音低于发音预设阈值，则认为命令词识别失败，但本发明实施例提高语音识别率的方法，对n次采集到的命令词发音与发音预设阈值进行比较，若低于发音预设阈值，且各次采集到的命令词均在于可信区间内，则认为此时n次发生的命令词发音并非偶然，应当是由于使用者发音不标准导致，则可认定该不满足发音预设阈值但满足可信区间的命令词符合识别要求。
36.本发明实施例在设定较高语音阈值的基础上，利用提高语音识别率的方法可提高语音识别系统对不满足语音阈值的命令词进行有效识别，进而提高语音识别率。
37.可选的，所述提高语音识别率的方法具体包括：
38.s101.设定发音预设阈值；
39.其中，此时设定发音预设阈值为高阈值；
40.s102.采集用户命令词发音，并与预设阈值进行比较；
41.其中，提取用户命令词发音的分值，并与发音预设阈值进行比较；
42.s103.若低于预设阈值，且该用户命令词发音在单位时间内重复n次，且各次采集到的命令词均在于可信区间内，则认定命令词识别成功。
43.其中，如图1所示，若低于预设阈值，则记录命令词的序号及分值，并设定此时为t1，在一个时间(t1，t2)区间内连续多次检测，获取用户命令词发音，至用户命令词的采集次数达到n次，若n次用户命令词的识别结果均在可信区间(a，b)内，则判定识别成功。语音识别可信度设为b(识别结果大于等于b时认为识别成功)，设置可信区间为(a，b)，用户语音命令词分值为si，识别结果分值a《si《b时，记录语音识别id号ni和分值si；若在设定的时间(t1，t2)内识别到多次结果在可信区间(a，b)内，则对结果进行统计分析。
44.特别的，所述s101设定发音预设阈值包括：
45.s1011.确定命令词，提取命令词标准发音；
46.s1012.以该命令词标准发音的正常值作为预设阈值，并根据该命令词标准发音设定可信区间，预设阈值为可信区间上限。
47.特别的，所述s102采集用户命令词发音，并与预设阈值进行比较包括
48.s1021.采集用户语音；
49.s1022.对用户语音进行解析，提取命令词，获取命令词分值。
50.特别的，所述s103若低于预设阈值，且该用户命令词发音在单位时间内重复n次，各次采集到的命令词均在可信区间内，则认定命令词识别成功包括：
51.s1031.将命令词分值与预设阈值进行比较；
52.s1032.若命令词分值不小于预设阈值，则认定语音识别成功；
53.其中，若命令词分值符合预设阈值，则可认为语音中的命令词属于标准命令词，可认为语音识别成功，此时识别效率高，准确率高；
54.s1033.若命令词分值小于预设阈值，且在单位时间内n次采集到该命令词分值均在可信区间内，则认定命令词识别成功。
55.其中，若命令词分值小于预设阈值，则说明此时用户语音的命令词不符合认定标准，但通过对单位时间内的n次采集及统计，若n次命令词分值均在可信区间内，则认定命令词的出现并不是偶然，而是由于用户方言或周围环境导致命令词分值不满足预设阈值的识别要求，并仍认定符合识别要求，判定命令词识别成功。
56.特别的，所述s1033若命令词分值小于预设阈值，且在单位时间内n次采集到该命令词分值均在可信区间内，则认定命令词识别成功包括：
57.s201.若命令词分值小于预设阈值，则重复采集用户语音；
58.s202.从用户语音中再次获取命令词分值，并与预设阈值进行比较；
59.s203.若s202所得的命令词分值不小于预设阈值，则认定语音识别成功；
60.s204.若s202所得的命令词分值小于预设阈值，且此时仍处于单位时间内，用户语音采集总次数少于n，则重复s201-s204，至命令词的总获取次数达到n次；若n次采集的命令词分值均在可信区间内，则认定命令词识别成功；若n次采集的命令词分值不全在可信区间内，则认定命令词识别失败。
61.其中，在单位时间内若n次对用户语音的采集仍不符合预设阈值的要求，此时通过对n次用户语音的分析统计，若n次命令词分值均在可信区间内，则认定命令词的出现并不是偶然，并认定符合识别要求，判定命令词识别成功
62.特别的，所述s1033若命令词分值小于预设阈值，且在单位时间内n次采集到该命令词分值均在可信区间内，则认定命令词识别成功还包括：；
63.s205.若s202所得的命令词分值小于预设阈值，且用户语音采集总次数不大于n，并处于单位时间外，则将最后一次获得的命令词分值重新设定为第一次获取的命令词分值，并重新计算单位时间，再次重复步骤s102、s103。
64.其中，若s202所得的命令词分值小于预设阈值，且用户语音采集总次数不大于n，并处于单位时间外，此时由于用户语音采集总次数不大于n，说明单位时间内的用户语音采集次数不符合要求，则需要重新进行统计，若再次无法获得命令词识别成功的结构，则停止本发明实施例的识别过程。
65.可选的，所述单位时间与n比值的绝对值范围为4-10。
66.可选的，所述单位时间为10-30秒。
67.可选的，所述n为2。
68.其中，本发明实施例单位时间为10秒，n为2。
69.下面以单位时间为10秒，n为2为例，如图1-2所示，详细描述具体的识别方法：
70.s301.对用户的语音进行识别，并获取到语音中包含的命令词，作为识别结果；
71.s302.判断识别结果中语音识别分值是否小于预设阈值；
72.s303.若不小于预设阈值，则判定为识别成功；若小于预设阈值，则记录该次命令词序号为id_num1和分值为id_score1；
73.s304.计时10秒；
74.s305.对后续语音进行识别，获取到命令词识别结果；
75.s306.判断该次语音识别分值是否小于预设阈值；
76.s307.若不小于预设阈值，则判定为识别成功；若小于预设阈值，则记录该次命令词序号id_num2和分值id_score2；
77.s308.此时判断计时的时间是否超过10秒；
78.s309.若超过10秒，则命令词序号id_num2的值替换掉id_num1，分值id_score2替换掉id_score 2；并重新计时10秒，并再次重复s305-s308；
79.若未超过10秒，则判断连续2次记录命令词分值id_score是否都在可信区间；
80.s310若均在可信区间，则判定为识别成功，并清除记录的命令词序号id_num的值和分值id_score；若不全在可信区间，则判定为识别失败。
81.在语音识别环境复杂时，没有人发出语音控制指令，却偶尔出现一次识别结果分值大于可信度阈值的情况，此时虽被判断为识别成功，但是这种情况不会在很短时间(如10秒)内重复出现，因此本发明实施例通过在一个时间区域内进行多次检测，有效解决发音不标准情况下的识别率低的问题，同时降低误识率，达到提高语音识别率的效果。
82.本发明实施例还涉及到一种语音识别设备，所述语音识别设备采用本发明实施例的提高语音识别率的方法。
83.其中，语音识别设备可选为应用于灯光、音响等设备的语音识别及控制模块，也可
为集成有语音识别及控制模块的具体家电设施。
84.最后应当说明的是，以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解，技术人员阅读本技术说明书后依然可以对本发明的具体实施方式进行修改或者等同替换，但这些修改或变更均未脱离本发明申请待批权利要求保护范围之内。

当前第1页1