同音词的语音搜索处理方法及装置的制造方法

文档序号：9524262阅读：490来源：国知局

同音词的语音搜索处理方法及装置的制造方法
【技术领域】
[0001]本申请涉及搜索信息处理技术领域，尤其涉及一种同音词的语音搜索处理方法及
目.ο
【背景技术】
[0002]随着语音识别技术的发展，语音识别技术的应用领域越来越广，使用语音进行搜索的用户也越来越多。然而，在语音搜索的场景下，经常会出现多个同音词。对于不同用户在不同的搜索场景下，同一个发音对应的搜索词可能是不同的。
[0003]现有的语音搜索应用中，若根据用户输入的语音信息，获知对应多个同音词，则根据当前的搜索热度列表，从多个同音词中识别出最热门的同音词作为用户的搜索词，并直接对该搜索词进行检索。
[0004]由此可见，针对同音词的语音搜索，现有技术只是根据其他用户搜索记录从多个同音词中识别最热门的词进行检索，并不能根据用户自身的搜索需求进行智能识别，不能满足用户的个性化需求，造成大量的无效搜索，浪费了处理资源，降低了处理效率。

【发明内容】

[0005]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此，本申请的第一个目的在于提出一种同音词的语音搜索处理方法，该方法实现了根据用户自身的搜索需求进行智能识别，满足用户的个性化需求节约了处理资源，减少了用户的搜索时间，提高了处理效率和用户体验度。
[0007]本申请的第二个目的在于提出一种同音词的语音搜索处理装置。
[0008]为达上述目的，本申请第一方面实施例提出了一种同音词的语音搜索处理方法，包括:接收用户输入的语音信息，检索与所述语音信息对应的多个同音词；根据预设的搜索特征信息库，获取每个同音词与用户搜索需求的相似度，其中，所述搜索特征信息库包括:至少一个搜索特征，以及对应的数学模型；根据所述相似度和预设的相似度计算策略，确定与所述用户搜索需求对应的搜索词，以便根据所述搜索词进行信息检索。
[0009]本申请实施例的同音词的语音搜索处理方法，首先接收用户输入的语音信息，检索与所述语音信息对应的多个同音词，然后根据预设的搜索特征信息库，获取每个同音词与用户搜索需求的相似度，其中，所述搜索特征信息库包括:至少一个搜索特征，以及对应的数学模型；最后根据所述相似度和预设的相似度计算策略，确定与所述用户搜索需求对应的搜索词，以便根据所述搜索词进行信息检索。由此，实现了根据用户自身的搜索需求进行智能识别，满足用户的个性化需求节约了处理资源，减少了用户的搜索时间，提高了处理效率和用户体验度。
[0010]为达上述目的，本申请第二方面实施例提出了一种同音词的语音搜索处理装置，包括:检索模块，用于接收用户输入的语音信息，检索与所述语音信息对应的多个同音词；获取模块，用于根据预设的搜索特征信息库，获取每个同音词与用户搜索需求的相似度，其中，所述搜索特征信息库包括:至少一个搜索特征，以及对应的数学模型；确定模块，用于根据所述相似度和预设的相似度计算策略，确定与所述用户搜索需求对应的搜索词，以便根据所述搜索词进行信息检索。
[0011]本申请实施例的同音词的语音搜索处理装置，通过检索模块接收用户输入的语音信息，检索与所述语音信息对应的多个同音词；通过获取模块根据预设的搜索特征信息库，获取每个同音词与用户搜索需求的相似度，其中，所述搜索特征信息库包括:至少一个搜索特征，以及对应的数学模型；通过确定模块根据所述相似度和预设的相似度计算策略，确定与所述用户搜索需求对应的搜索词，以便根据所述搜索词进行信息检索。由此，实现了根据用户自身的搜索需求进行智能识别，满足用户的个性化需求节约了处理资源，减少了用户的搜索时间，提高了处理效率和用户体验度。
【附图说明】
[0012]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中:
[0013]图1是本申请一个实施例的同音词的语音搜索处理方法的流程图；
[0014]图2是本申请另一个实施例的同音词的语音搜索处理方法的流程图；
[0015]图3是本申请一个实施例的同音词的语音搜索处理装置的结构示意图；
[0016]图4是本申请另一个实施例的同音词的语音搜索处理装置的结构示意图。
【具体实施方式】
[0017]下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。
[0018]下面参考附图描述本申请实施例的同音词的语音搜索处理方法及装置。
[0019]图1是本申请一个实施例的同音词的语音搜索处理方法的流程图。
[0020]如图1所示，该同音词的语音搜索处理方法包括:
[0021]步骤101，接收用户输入的语音信息，检索与所述语音信息对应的多个同音词。
[0022]本发明实施例提供的同音词的语音搜索处理方法应用于具有人机语音交互接口的终端设备中，终端设备上安装有能够访问人机语音交互接口的应用来为用户提供语音搜索服务，该应用可以根据实际需要进行选择，本实施例对此不作限制。
[0023]用户需要进行语音搜索服务时，向人机语音交互接口输入语音信息，当接收到用户输入的语音信息时，检索与该语音信息对应的多个同音词，具体的检索方式有很多，可以根据实际应用需要进行选择，举例说明如下:
[0024]方式一，采用倒排索引方式检索同音词，包括:
[0025]识别所述语音信息的音节，所述音节包括:发音音节和/或模糊音节；
[0026]查询预设的倒排索引获取与所述音节对应的多个同音词。
[0027]具体地，识别用户输入的语音信息的音节，其中，本实施例中涉及的音节包括:发音音节和/或模糊音节，音节是用听觉可以区分清楚的语音基本单位，音节之间具有明显可感知的界限。在汉语中一般一个汉字的读音即为一个音节，音节包括声母、韵母和音调。需要注意的是，在某些方言中，有很多音节与普通话不同，专门为对某些音节容易混淆的用户设计模糊音节。例如:声母模糊音zh和z，ch和c，sh和s ;以及韵母模糊音ang和an，eng 和 en，iang 和 ian 等。
[0028]识别出用户输入的语音信息的音节之后，查询预设的倒排索引获取与音节对应的多个同音词。其中，预设的倒排索引是基于语音音节建立的，倒排索引指的是用“单词-文档矩阵”表示的一种具体存储形式，通过倒排索引可以根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成:“单词词典”和“倒排文件”，由于搜索引擎的通常索引单位是单词，因此，通过查询倒排索引的单词词典，可以获取与音节对应的多个同音
Τ.κ| ο
[0029]方式二，采用预设的语音模型检索同音词，具体包括:
[0030]预先存储有语音数据库，语音数据库中包括大量的词组语音模型，每个词组语音模型对应了所有发该语音的词汇列表。
[0031]将用户输入的语音信息进行词组划分，将各个词组的语音信息与预先存储的词组语音模型进行匹配，若匹配结果一致，则将与所述词组语音模型对应的词汇列表中的所有词作为与

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李裕东;颜振祥;赵程亮;郎文静;陈凯;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：基于可扩展标记语言的报表处理方法及装置的制造方法
上一篇：一种基于大数据的数据监控方法和设备的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。