基于语音识别的信息推送方法、装置、设备和介质与流程

文档序号:33560093发布日期:2023-03-22 13:54阅读:50来源:国知局
基于语音识别的信息推送方法、装置、设备和介质与流程

1.本技术涉及金融科技技术领域,尤其涉及一种基于语音识别的信息推送方法、装置、设备和介质。


背景技术:

2.在金融科技技术领域中,为了方便与用户交互,通常会开发出各式各样的应用软件,用户通过应用软件就可以办理相关的金融业务。但是用户在使用这些应用软件时,由于涉及到各种复杂的金融信息,例如时间日期、卡号等,往往很难快速的从中查找到其所需的信息。
3.现有技术中,为了能够方便用户快速的查找信息,通常在应用软件中设置有搜索栏,用户手动在搜索栏中输入待查询的目标词汇,然后应用软件基于目标词汇,查询得到相关联的信息并展示在页面上。
4.但是,这种方式在操作过程中由于用户需要手动输入目标词汇,在实际操作过程中并不能够快速的完成信息的查询,效率较低。


技术实现要素:

5.本技术提供一种基于语音识别的信息推送方法、装置、设备和介质,用于解决现有手工输入文本进行信息搜索效率的问题。
6.第一方面,本技术实施例提供一种基于语音识别的信息推送方法,包括:
7.获取输入至终端设备的语音和所述终端设备中目标应用所包含的至少一个页面;
8.根据所述语音,获取关键指示信息;
9.提取所述至少一个页面中的至少一个关键词信息,组合得到语义集合;
10.根据所述关键指示信息和语义集合,确定出目标信息,所述目标信息用于展示在所述终端设备的显示界面上。
11.在第一方面的一种可能设计中,所述根据所述关键指示信息和语义集合,确定出目标信息,包括:
12.确定所述语义集合中是否存在与关键指示信息匹配的目标关键词;
13.若存在所述目标关键词,则在所述至少一个页面中确定出所述目标关键词所处的页面;
14.将所述目标关键词所处的页面作为所述目标信息。
15.在第一方面的另一种可能设计中,所述方法还包括:
16.在所述语义集中不存在所述目标关键词时,获取所述目标应用中存储的用户信息;
17.确定是否存在与所述用户信息相关联的匹配信息;
18.若存在所述匹配信息,则将所述匹配信息作为所述目标信息。
19.在第一方面的再一种可能设计中,所述确定所述语义集合中是否存在与所述关键
指示信息匹配的目标关键词,包括:
20.获取所述语义集合中每个关键词信息与所述关键指示信息的关联度,所述关联度用于表征所述关键词信息与所述关键指示信息之间的向量距离;
21.若存在所述关联度大于预设阈值的关键词信息,则将所述关键词信息作为目标关键词。
22.在第一方面的又一种可能设计中,所述确定所述语义集合中是否存在与关键指示信息匹配的目标关键词之前,还包括:
23.获取所述终端设备当前所展示的页面中的样本关键词、与所述样本关键词存在关联的样本指示信息,所述样本关键词包括日期关键词、所述目标应用的应用操作关键词中的至少一种;
24.获取所述样本关键词和样本指示信息的相似度,并根据所述相似度对预设模型进行训练更新,得到预测模型,所述预测模型用于预测所述关键指示信息与所述语义集合中的关键词信息是否匹配。
25.在第一方面的又一种可能设计中,所述根据所述关键指示信息和语义集合,确定出目标信息,包括:
26.确定语义集合中是否存在与关键指示信息匹配的目标关键词;
27.若存在所述目标关键词,则获取与所述目标关键词关联的展示信息;
28.将所述展示信息作为所述目标信息。
29.在第一方面的又一种可能设计中,所述根据所述语音,获取关键指示信息,包括:
30.对所述语音进行预处理,所述预处理包括语音滤波、语音采样和语音量化中的至少一种;
31.将预处理之后的语音转换为文字信息,并对所述文字信息进行语义分析,提取得到所述关键指示信息。
32.在第一方面的又一种可能设计中,所述方法还包括:
33.若不存在所述匹配信息,则获取预设的匹配失败信息作为所述目标信息。
34.第二方面,本技术实施例提供一种基于语音识别的信息推送装置,包括:
35.语音获取模块,用于获取输入至终端设备的语音和所述终端设备中目标应用所包含的至少一个页面;
36.信息获取模块,用于根据所述语音,获取关键指示信息;
37.信息提取模块,用于提取所述至少一个页面中的至少一个关键词信息,组合得到语义集合;
38.信息确定模块,用于根据所述关键指示信息和语义集合,确定出目标信息,所述目标信息用于展示在所述终端设备的显示界面上。
39.第三方面,本技术实施例提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
40.所述存储器存储计算机执行指令;
41.所述处理器执行所述存储器存储的计算机执行指令,以实现上述的方法。
42.第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现上述的方法。
43.第五方面,本技术实施例提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述的方法。
44.本技术实施例提供的基于语音识别的信息推送方法、装置、设备和介质,通过为应用软件新增语音处理功能,获取用户输入至终端设备的语音并提取语音中的关键指示信息,然后可以自动搜索到与关键指示信息匹配的目标信息,并显示在终端设备的显示界面上,如此避免了用户手动输入的过程,提高了信息查询和业务办理的效率。
附图说明
45.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理;
46.图1为本技术实施例提供的应用软件的页面示意图;
47.图2为本技术实施例提供的基于语音识别的信息推送方法的流程示意图;
48.图3为另一本技术实施例提供的应用软件的页面示意图;
49.图4为本技术实施例提供的语音处理流程的示意图;
50.图5为本技术实施例提供的基于语音识别的信息查询系统的结构示意图;
51.图6为本技术又一实施例提供的应用软件的页面示意图;
52.图7为又一本技术实施例提供的应用软件的页面示意图;
53.图8为本技术实施例提供的基于语音识别的信息推送装置的结构示意图;
54.图9为本技术实施例提供的电子设备的结构示意图。
55.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
56.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
57.需要说明的是,本公开基于语音识别的信息推送方法、装置、设备和介质可用于金融领域。也可用于除金融领域以外的任意领域。本公开基于语音识别的信息推送方法、装置、设备和介质应用领域不作限定。
58.在日常生活中,很多的用户都会借助终端设备(例如手机、平板电脑和计算机设备)上安装的应用软件来办理相关的个人业务,例如用户可以在应用软件中输入“查询个人历史业务”,并点击查询,由此应用软件将基于用户的查询需求,将用户在某一段历史时期办理过的业务展示在当前页面上。由此可见,在业务办理过程中,应用软件需要用户手动输入查询条件,才能输出对应的查询结果。但是在实际应用中,用户可能由于个人因素无法手动输入查询条件,例如在开车驾驶时双手需要操作方向盘,又例如双手受伤或残疾导致操作不便等,此时业务办理就会遇到很大的阻力,业务办理效率就会大大降低,其可能还不如人工窗口办理的效率。
59.针对上述问题,本技术提供了一种基于基于语音识别的信息推送方法、装置、设备和介质,为了能够提高用户使用应用软件办理业务的效率,需要优化应用软件的输入功能。具体的,为应用软件新增语音处理功能,获取用户输入至终端设备的语音并提取语音中的关键指示信息,然后可以自动搜索到与关键指示信息匹配的目标信息,并显示在终端设备的显示界面上,如此避免了用户手动输入的过程,提高了信息查询和业务办理的效率。
60.下面,通过具体实施例对本技术的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
61.图1为本技术实施例提供的应用软件的界面示意图,如图1所示,以手机作为终端设备为例,在手机的显示界面上显示的当前页面中包括有语音按键(用户长按该按键可以触发手机进行语音采集)、推荐语录(例如查历史记录、查热门活动、办理个人业务、办理其它业务)。用户可以长按语音按键之后开始说话,例如用户可以说“查询历史记录”,此时终端设备在采集到用户说出的语音之后,进行语音识别,并查找出该用户的历史记录,展示在当前页面上。如此整个历史记录的查询过程就不需要用户再做手工的文字输入,极大的提高了效率。
62.实施例一
63.图2为本技术实施例提供的基于语音识别的信息推送方法的流程示意图,该方法可以应用于终端设备,也可以应用于与终端设备通信连接的云端服务器,即上述方法可以在终端设备中执行,也可以在云端服务器上执行。以云端服务器作为执行主体为例,该方法具体可以通过如下步骤实现:步骤s201,获取输入至终端设备的语音和终端设备中目标应用所包含的至少一个页面。
64.在本实施例中,终端设备携带有拾音器,用户的相关操作可以触发拾音器的启动并采集终端设备周围的声音。其中,用户在触发拾音器启动之后,可以通过语音的方式来表达出自己的需求,以替换传统的手工输入文字信息的方式。示例性的,目标应用可以是金融应用软件,不同的应用软件,涉及到的业务功能可能不相同,用户可能需要基于不同的应用软件对应的调整输入的语音的内容。
65.示例性的,以目标应用为金融应用软件为例,用户输入的语音可以是“查历史记录”,而以目标应用为导航应用软件为例时,用户输入的语音可能是“导航回家”。
66.在本实施例中,目标应用可以包括有一个或多个页面,每一个页面中涉及到的信息可能会不同,例如目标应用可以有一个主页面,该主页面中包括有多个不同的导航标签,用户通过点击这些导航标签,可以进入到相应的子页面中,子页面中则包括有详细的标签信息。示例性的,图3为本技术另一实施例提供的应用软件的页面示意图,依然以终端设备为手机为例,在手机中打开应用软件进入到其主页面之后,如图3所示,其主页面包括有多个导航标签,例如“生活缴费”、“任务中心”、“活动大厅”、“本地服务”、“管家服务”、“密码管理”、“黄金”、“其它”。用户可以手动点击这些导航标签,将会跳转到对应的子页面。例如当用户点击“生活缴费”时,进入到“生活缴费”的子页面,其包括有“水费缴纳”、“电费缴纳”、“燃气费缴纳”等子导航标签。进一步的,如果用户点击“水费缴纳”,则进入水费缴纳页面以进行水费缴纳。
67.其中,用户也可以通过语音的方式来替换手动点击的方式,例如用户说“水费缴
纳”,则页面会直接跳转到水费缴纳页面。
68.步骤s202,根据语音,获取关键指示信息。
69.在本实施例中,语音中可能会包含有一些与应用软件相关的重要信息,例如用户说的语音为“我要查询2022年10月的明细记录”,基于应用软件的每个页面所包含的信息,可以确定出关键指示信息为“2022年10月”、“明细记录”。其中,关键指示信息是文字形式的,而语音则是音频形式的,故而在获取关键指示信息时,需要先识别语音,转化得到文字,然后再从转化后的文字中抽取出关键指示信息。
70.另外,在本实施例中,由于是以云端服务器作为执行主体为例,故而终端设备需要将语音上传到云端服务器,由云端服务器来实现语音识别以及关键指示信息的提取,如此可以不占用终端设备的性能资源,保证终端设备的其它功能不受影响。
71.步骤s203,提取至少一个页面中的至少一个关键词信息,组合得到语义集合。
72.在本实施例中,应用软件可以包括有上述的主页面,同时还可以包括有子页面,主页面与子页面存在有关联关系(即通过主页面可以跳转到任意一个子页面)。不论是主页面或者子页面,其中都包含有相应的关键词信息。其中,关键词信息可以是指主页面或者子页面中存在的功能标签(例如上述的导航标签),通过这些功能标签可以实现对应的功能,例如上述的“生活缴费”可以实现费用缴纳。
73.其中,语义集合中可以包括有多个关键词信息,每个关键词信息可以来源于不同的页面,可以预先存储每个关键词信息与其来源的页面之间的关联关系。示例性的,以“生活缴费”为关键词信息为例,其来源于主页面,此时可以预先构建关键词信息-页面之间的关联关系,以标记“生活缴费”来源于主页面。
74.步骤s204,根据关键指示信息和语义集合,确定出目标信息,目标信息用于展示在终端设备的显示界面上。
75.在本技术实施例中,可以将关键指示信息与语义集合中的关键词信息进行逐一对比,如果语义集合中包含有与关键指示信息相同的目标关键词,则可以基于目标关键词确定出目标信息,然后展示在终端设备的显示界面上。
76.另外,在其他实施方式中,也可以计算关键指示信息的特征向量,和关键词信息的特征向量,基于关键指示信息的特征向量与每个关键词信息的特征向量之间的向量距离,找出向量距离最小的关键词信息作为目标关键词、
77.在本实施例中,在确定了目标关键词之后,如果目标关键词关联有子页面,则可以将子页面作为目标信息,显示在终端设备的显示界面上。进一步的,在其他实施方式中,还可以预先设置与目标关键词关联的信息,将其作为目标信息。
78.本技术实施例通过获取用户的语音并提取语音中的关键指示信息,然后可以自动搜索到与关键指示信息匹配的目标页面,并显示在终端设备的显示界面上,如此避免了用户手动输入的过程,提高了效率。
79.实施例二
80.在本实施例中,上述步骤s203具体可以通过如下步骤实现:确定语义集合中是否存在与关键指示信息匹配的目标关键词;若存在目标关键词,则在至少一个页面中确定出目标关键词所处的页面;将目标关键词所处的页面作为目标信息。
81.示例性的,以用户说出的语音为“我要进行生活缴费”为例,通过语音识别以及特
征提取得到的关键指示信息为“生活缴费”,此时语义集合中与之匹配的目标关键词为“生活缴费”,参考图3,目标关键词所处的页面为主页面,此时可以将主页面作为目标信息,展示在终端设备的显示界面上。
82.其中,示例性的,语义集合中的关键词可以按照一定的类别进行分类,例如涉及到费用变更的,例如生活缴费、电费缴纳、水费加纳等关键词可以分为一类,涉及到活动的,例如任务中心、活动大厅可以分为一类。如此可以根据类别,针对性的进行匹配查找,更快的找到目标关键词。
83.本技术实施例通过直接将目标关键词所处的页面展示在终端设备的显示界面上,不需要用户手动操作,提高了用户与应用软件之间的交互效率。
84.实施例三
85.在本实施例中,当语义集合中不存在目标关键词时,云端服务器可以获取目标应用中存储的用户信息,然后查找是否存在有与用户信息关联的匹配信息,如果存在匹配信息,则将该匹配信息作为目标信息。
86.其中,可以在云端服务器的数据库中预先存储用户信息相关联的匹配信息。示例性的,匹配信息可以是用户在之前的操作记录,例如用户在此之前进行过生活缴费,则匹配信息对应为生活缴费。
87.在其他实施方式中,与用户信息关联的匹配信息也可以是账号、卡号等,对于不同的目标应用,用户信息可能不同,与用户信息关联的匹配信息也可能不同,其具体可以根据实际情况预先设置。
88.另外,在另一些实施例中,如果不存在与用户信息关联的匹配信息,则云端服务器直接返回预先设置的匹配失败信息,作为目标信息并展示在终端设备的显示界面上,提示用户再次输入其它语音。
89.本技术实施例通过设置匹配信息,当语义集合中查找不到目标关键词时,可以将匹配信息显示给用户,提高用户与应用软件之间的交互效果。
90.实施例四
91.在上述实施例二的基础上,在本实施例中,在确定语义集合中是否存在与关键指示信息匹配的目标关键词时,具体可以通过如下步骤实现:获取语义集合中每个关键词信息与关键指示信息的关联度,关联度用于表征关键词信息与关键指示信息之间的向量距离;若存在关联度大于预设阈值的关键词信息,则将关键词信息作为目标关键词。
92.在本实施例中,基于语义集合对所待确定的关键指示信息生成预确定关联关系,根据预确定关联关系的相似度向量作为更新样本集,得到关联度预测模型。云端服务器可以调用关联度预测模型判断在语义集合中是否存在与关键指示信息相匹配的关键词信息,并且关键词信息与关键指示信息的关联度需要大于预设阈值。其中,向量距离是指关键词信息的特征向量与关键指示信息的特征向量之间的向量距离。
93.其中,当在语义集合中存在关键词信息时,服务器可以发送展现信息标识,例如“匹配信息成功”,以此来将相对应的信息内容展示在终端设备的显示界面上,方便用户查阅。
94.在其它实施方式中,还可以获取语义集合中每个关键词信息与关键指示信息之间的关联度,并根据关联度大小依次进行排序,从中选择出排序最靠前(即关联度最大)的关
键词信息,作为目标关键词。
95.本技术实施例通过计算关键词信息与关键指示信息之间的关联度,选择出关联度大于预设阈值的关键词信息作为目标关键词,能够提高信息推送的准确性,避免在终端设备的显示界面上展示不准确的信息给用户。
96.实施例五
97.在上述实施例二和实施例四的基础上,在另一些实施例中,上述方法还可以包括如下步骤:获取终端设备当前所展示的页面中的样本关键词、与样本关键词存在关联的样本指示信息,样本关键词包括日期关键词、目标应用的应用操作关键词中的至少一种;获取样本关键词和样本指示信息的相似度,并根据相似度对预设模型进行训练更新,得到预测模型,预测模型用于预测关键指示信息与语义集合中的关键词信息是否匹配。
98.在本实施例中,预测模型可以上述实施例四中的关联度预测模型,其中,关联度预测模型可以预先存储在模型库中,当云端服务器需要确定关键指示信息与语义集合中的关键词信息是否匹配时,可以直接从模型库中调用关联度预测模型并进行测度估计。
99.示例性的,以终端设备的应用软件为金融应用软件为例,在当前所展示的页面中可能包括有用户进行的转账操作(即应用操作关键词)、交易金额、交易日期(即日期关键词)等样本关键词。样本指示信息是由用户的语音确定的,例如用户的语音为“我要查询2022年1月转账明细”,则对应的样本指示信息为“2022年1月”、“转账明细”。其中,“转账明细”与样本关键词“转账操作”关联,“2022年1月”与样本关键词“转账日期”关联。其中,可以计算样本关键词的特征向量和样本指示信息的特征向量,并基于两特征向量之间的向量距离,确定出相似度,以此作为训练样本来训练预测模型,使训练后的预测模型能够预测关键指示信息与关键词信息的匹配程度。
100.本技术实施例通过对预设模型进行训练得到预测模型来预测关键指示信息与语义集合中的关键词信息是否匹配,能够准确的找到对应的信息展示到终端设备的显示界面上,提高信息展示的准确性。
101.实施例六
102.在本实施例中,在确定目标信息时,具体可以通过如下步骤实现:确定语义集合中是否存在与关键指示信息匹配的目标关键词;若存在目标关键词,则获取与目标关键词关联的展示信息;将展示信息作为目标信息。
103.在本实施例中,可以为每个关键词信息设置关联的展示信息并预先存储在数据库中,当找到与关键指示信息匹配的目标关键词之后,可以从数据库中获取该目标关键词关联的展示信息来作为目标信息。
104.示例性的,以卡号“6225001234567890”作为目标关键词为例,可以设置与卡号关联的展示信息包括历史支出金额、历史支出金额日期、历史转入金额、历史转入金额日期等。
105.本技术实施例通过预先配置与每个关键词信息关联的展示信息,当语义集合中存在有与关键指示信息匹配的目标关键词时,可以直接将该目标关键词关联的展示信息展示到终端设备的显示界面上,提高信息展示的灵活性。
106.实施例七
107.在本实施例中,在获取关键指示信息时,具体可以通过如下步骤实现:对语音进行
预处理,预处理包括语音滤波、语音采样和语音量化中的至少一种;将预处理之后的语音转换为文字信息,并对文字信息进行语义分析,提取得到关键指示信息。
108.在本实施例中,需要使用到语音识别技术。其中,语音识别技术,也被称为自动语音识别(automatic speech recognition,asr),是将人类语言中的语句词汇内容转换成计算机可读的输入。语音识别技术主要包括特征提取技术、模式匹配规则和模型训练技术三个方面。首先通过特征提取技术,模式匹配技术识别出相关的语音声学模型;然后通过模型训练形成一定的语言模型,在实现过程中,进行语音的快速寻优,实现对语音信号的文字转变。
109.语音识别系统可以根据对输入语音的限制进行分类:
110.①
从行为人的说话方式考虑,分成三类:(1)连接词语音识别系统:要求对每个词都清楚发音,会出现一些连音现象;(2)孤立词语音识别系统:要求输入每个词后要停顿;(3)连续语音识别系统:要求输入的是自然流利的连续语音,会出现大量的连音和变音。
111.②
从识别系统的词汇量大小考虑,分成三类:(1)小词汇量语音识别系统:包括几十个词的语音识别系统;(2)中等词汇量语音识别系统:包括几百个词到上千个词的识别系统;(3)大词汇量语音识别系统:包括几千个到几万个词的语音识别系统。随着计算机运行算力以及识别系统精度的提高,词汇量语音识别系统的分类也不断进行变化。
112.③
从行为人与识别系统的相关性考虑,分成三类:(1)非特定人语音识别系统:识别的语音与人无关;(2)特定人语音识别系统:考虑对于专人的语音进行识别;(3)多人的语音识别系统:能识别一组人的语音。
113.在本实施例中,可以根据用户输入的语音选择不同的语音识别系统。同时,在语音识别过程中,输入的模拟语音信号首先要进行预处理,具体包括语音滤波、语音采样和语音量化。模拟语音信号在预处理完成之后通过模数转换形成数字信号,从中获取语音的本质特征。具体的,在提取语音的本质特征之前,可以采用共同的短时分析技术,比如语音信号的数字化、端点检测、预加重、分帧等,起到数据压缩的作用。
114.在提取到语音的本质特征并进行文字转化时,涉及到音频特征提取技术,基于该技术对音频特征相似度检索,提取音频特征的常用方法是使用隐马尔可夫模型(hidden markov model,hmm)。该模型是一种结构最简单的动态贝叶斯网的生成模型,有效的解决了语音信号短时稳定、长时时变的特性,并且能够根据一些基本建模单元构造成连续语音的句子模型,拥有比较高的建模精度和灵活度。根据采集到的语音单位的大小,hmm可以分为整词模型的hmm,优点在于可以很好的描述词内音素协同发音的特点,因此很多小词汇量语音识别采用整词模型hmm。例如,用户说的语音为“我要查询银行卡6225001234567890从2021年1月1日到2021年12月31日的交易明细”,则对应的会该语音转换为文字信息。
115.在本实施例中,在得到文字信息之后,将通过语义分析提取出关键指示信息,具体的,可以利用知识图谱或知识库(knowledge graph),通过自然语言分析(natural language processing,nlp)分析得到关键指示信息。例如上述文字“我要查询银行卡6225001234567890从2021年1月1日到2021年12月31日的交易明细”中,将提取出“6225001234567890”、“2021-01-01”、“2021-12-31”这三个关键指示信息。
116.其中,在得到关键指示信息之后,由于云端服务器使用的是机器语言,而关键指示信息是汉字形式,为此还需要将汉字形式的关键指示信息转化为机器语言,云端服务器基
于机器语言,从语义集合中寻找与之匹配的关键词信息。示例性,语义集合中的关键词可以按照一定的索引形式存放以方便查找,例如以卡号+日期的形式存放。
117.本技术实施例通过对语音进行处理,能够从中获取到准确的关键指示信息,提高与用户进行语音交互的效果,避免出现语音误识别的情况。
118.实施例八
119.示例性的,图4为本技术实施例提供的语音处理流程的示意图,如图4所示,其包括如下步骤:步骤s401,前端感知设备获取输入的语音。步骤s402,前端服务器对语音进行预处理。步骤s403,前端服务器对预处理之后的语音进行特征提取。步骤s404,测度估计。步骤s405,后处理。步骤s406,语音处理服务器得到识别结果。
120.在本实施例中,前端感知设备可以是终端设备,前端感知设备在获得用户语音信息后,将用户语音信息发送给前端服务器;前端服务器在接收到用户语音信息后对用户语音进行识别并提取出关键指示性信息,如用户说出“我要查询2022年1月转账明细”。获取当前设备呈现给用户的页面信息,并提取出关键词组,如“2022年1月”,“转账”以生成语义集合。服务器根据预测模型进行测度估计,判断在语义集合中是否存在与用户的关键指示信息相匹配的信息,并且匹配信息与用户指示性信息关联度大于设定的阈值。
121.其中,如果在语义集合中存在相匹配的信息,则前端服务器将会向语音处理服务器发送展现信息标识,如“匹配信息成功”,语音处理服务器在接收到信息标识后将相对应信息内容提供给前端感知设备,方便前端设备将语音识别的信息内容呈现给用户。如果在语义集合中不存在匹配信息,则前端服务器将会判断在数据库中查询到与用户信息相关联的匹配信息,若能查询到则重复上面步骤,若查询不到,则将特定的提示信息标识,如“匹配信息失败”,发送给语音处理服务器。
122.实施例九
123.进一步的,图5为本技术实施例提供的基于语音识别的信息查询系统的结构示意图,该信息查询系统可以应用于上述的信息推送方法中,即通过信息查询系统查询得到对应的信息之后,将推送至终端设备的显示界面进行显示。如图5所示,该信息查询系统包括有语音采集模块510、语音识别模块520、语义分析模块530、信息查询处理模块540和数据库模块550。其中,语音采集模块用于采集语音信息,对采集到的语音信息暂存,并将存储后的语音信息发送到语音识别模块。语音识别模块用于完成语音转文字的处理,将接收到的语音信息,通过对接收的语音信息进行语音检测,将转化后的文字信息发送至语义分析模块。语义分析模块将提取文字信息中的关键信息,一般利用知识图谱或知识库,通过自然语言分析,并分析结果发送至历史数据查询处理模块。历史数据查询处理模块将接收到的关键信息,转化为数据库可识别的查询机器语句,发送至数据库模块,进行数据的抽取,并范围查询结果。数据库模块用于存储数据信息,按照一定的索引存放,以便于查询。
124.示例性的,图6为本技术又一实施例提供的应用软件的页面示意图,如图6所示,用户可以通过长按麦克风虚拟按键来输入语音,在云端服务器对语音进行识别分析之后,将得到的结果展示到终端设备的显示界面上以供用户确认,例如识别分析后的结果为“帮我查询2022年07月的明细”。当用户确定无问题之后,云端服务器再基于识别分析后的结果,进行目标信息的查找。
125.示例性的,图7为又一本技术实施例提供的应用软件的页面示意图,如图7所示,根
据关键指示信息“2022年07月”、“明细”查询得到用户在2022年07月的历史交易明细。
126.下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
127.图8为本技术实施例提供的基于语音识别的信息推送装置的结构示意图,该信息推送装置800包括有语音获取模块810、信息获取模块820、信息提取模块830和信息确定模块840。其中,语音获取模块810用于获取输入至终端设备的语音和终端设备中目标应用所包含的至少一个页面。信息获取模块820用于根据语音,获取关键指示信息。信息提取模块830用于提取至少一个页面中的至少一个关键词信息,组合得到语义集合。信息确定模块840用于根据关键指示信息和语义集合,确定出目标信息,目标信息用于展示在终端设备的显示界面上。
128.可选的,信息确定模块具体可以用于:确定语义集合中是否存在与关键指示信息匹配的目标关键词;若存在目标关键词,则在至少一个页面中确定出目标关键词所处的页面;将目标关键词所处的页面作为目标信息。
129.可选的,还包括匹配信息关联模块,用于在语义集中不存在目标关键词时,获取目标应用中存储的用户信息;确定是否存在与用户信息相关联的匹配信息;若存在匹配信息,则将匹配信息作为目标信息。
130.可选的,信息确定模块具体可以用于:获取语义集合中每个关键词信息与关键指示信息的关联度,关联度用于表征关键词信息与关键指示信息之间的向量距离;若存在关联度大于预设阈值的关键词信息,则将关键词信息作为目标关键词。
131.可选的,还包括模型训练模块,用于获取终端设备当前所展示的页面中的样本关键词、与样本关键词存在关联的样本指示信息,样本关键词包括日期关键词、目标应用的应用操作关键词中的至少一种;获取样本关键词和样本指示信息的相似度,并根据相似度对预设模型进行训练更新,得到预测模型,预测模型用于预测关键指示信息与语义集合中的关键词信息是否匹配。
132.可选的,信息确定模块还可以用于确定语义集合中是否存在与关键指示信息匹配的目标关键词;若存在目标关键词,则获取与目标关键词关联的展示信息;将展示信息作为目标信息。
133.可选地,信息获取模块可以用于:对语音进行预处理,预处理包括语音滤波、语音采样和语音量化中的至少一种;将预处理之后的语音转换为文字信息,并对文字信息进行语义分析,提取得到关键指示信息。
134.可选的,还包括匹配失败模块,用于若不存在匹配信息,则获取预设的匹配失败信息作为目标信息。
135.本技术实施例提供的装置,可用于执行上述实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
136.需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,信息确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以
程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上信息确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
137.图9为本技术实施例提供的电子设备的结构示意图。如图9所示,该电子设备900包括:至少一个处理器910、存储器920、总线930及通信接口940。其中:处理器910、通信接口940以及存储器920通过总线930完成相互间的通信。通信接口,用于与其它设备进行通信。该通信接口包括用于进行数据传输的通信接口以及用于进行人机交互的显示界面或者操作界面等。处理器,用于执行存储器存储的计算机执行指令,具体可以执行上述实施例中所描述的方法中的相关步骤。处理器可能是中央处理器,或者是特定集成电路(application specific integrated circuit,asic),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
138.存储器,用于存放计算机执行指令。存储器可能包含高速ram存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。
139.本实施例还提供一种可读存储介质,可读存储介质中存储有计算机指令,当电子设备的至少一个处理器执行该计算机指令时,电子设备执行上述的各种实施方式提供的基于语音识别的信息推送方法。
140.本实施例还提供一种程序产品,该程序产品包括计算机指令,该计算机指令存储在可读存储介质中。电子设备的至少一个处理器可以从可读存储介质读取该计算机指令,至少一个处理器执行该计算机指令使得电子设备实施上述的各种实施方式提供的基于语音识别的信息推送方法。
141.本技术中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b的情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
142.可以理解的是,在本技术实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本技术的实施例的范围。在本技术的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术的实施例的实施过程构成任何限定。
143.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1