同音词的语音搜索处理方法及装置的制造方法_4

文档序号:9524262阅读:来源:国知局
传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(R0M),可擦除可编辑只读存储器(EPR0M或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDR0M)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0092]应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0093]本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0094]此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0095]上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
【主权项】
1.一种同音词的语音搜索处理方法,其特征在于,包括以下步骤: 接收用户输入的语音信息,检索与所述语音信息对应的多个同音词; 根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型; 根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。2.如权利要求1所述的同音词的语音搜索处理方法,其特征在于,所述检索与所述语音信息对应的多个同音词,包括: 识别所述语音信息的音节,所述音节包括:发音音节和/或模糊音节; 查询预设的倒排索引获取与所述音节对应的多个同音词。3.如权利要求1所述的同音词的语音搜索处理方法,其特征在于,所述根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,包括: 采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值; 根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度。4.如权利要求3所述的同音词的语音搜索处理方法,其特征在于,所述搜索特征的类型包括: 搜索频次、搜索结果、搜索词发音、搜索上文,以及搜索偏好。5.如权利要求1-4任一所述的同音词的语音搜索处理方法,其特征在于,所述根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,包括: 根据所述相似度筛选满足预设阈值信息的备选同音词; 根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词; 根据所述推荐同音词确定与所述用户搜索需求对应的搜索词。6.如权利要求5所述的同音词的语音搜索处理方法,其特征在于,所述根据所述推荐同音词确定与所述用户搜索需求对应的搜索词,包括: 判断所述推荐同音词的数量是否唯一; 若判断获知所述推荐同音词唯一,则确定所述搜索词为所述推荐同音词; 若判断获知所述推荐同音词不唯一,则根据知识图谱生成与所述推荐同音词对应的推荐列表发送给所述用户,并根据所述用户的反馈信息确定所述搜索词。7.一种同音词的语音搜索处理装置,其特征在于,包括: 检索模块,用于接收用户输入的语音信息,检索与所述语音信息对应的多个同音词; 获取模块,用于根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型; 确定模块,用于根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。8.如权利要求7所述的同音词的语音搜索处理装置,其特征在于,所述检索模块包括: 识别单元,用于识别所述语音信息的音节,所述音节包括:发音音节和/或模糊音节; 查询单元,用于查询预设的倒排索引获取与所述音节对应的多个同音词。9.如权利要求7所述的同音词的语音搜索处理装置,其特征在于,所述获取模块,包括: 处理单元,用于采用与每个搜索特征对应的数学模型,处理与所述搜索特征相关的输入信息,获取与所述搜索特征对应的特征值; 生成单元,用于根据获取的所有特征值,生成每个同音词与用户搜索需求的相似度。10.如权利要求9所述的同音词的语音搜索处理装置,其特征在于,所述搜索特征包括: 搜索频次、搜索结果、搜索词发音、搜索上文,以及搜索偏好。11.如权利要求7-10任一所述的同音词的语音搜索处理装置,其特征在于,所述确定丰吴块,包括: 第一选取单元,用于根据所述相似度筛选满足预设阈值信息的备选同音词; 第二选取单元,用于根据与所述备选同音词对应的相似度,筛选满足预设方差信息的推荐同音词; 获取单元,用于根据所述推荐同音词确定与所述用户搜索需求对应的搜索词。12.如权利要求11所述的同音词的语音搜索处理装置,其特征在于,所述获取单元,具体用于: 判断所述推荐同音词的数量是否唯一; 若判断获知所述推荐同音词唯一,则确定所述搜索词为所述推荐同音词; 若判断获知所述推荐同音词不唯一,则根据知识图谱生成与所述推荐同音词对应的推荐列表发送给所述用户,并根据所述用户的反馈信息确定所述搜索词。
【专利摘要】本申请提出一种同音词的语音搜索处理方法和装置,其中,该方法包括:接收用户输入的语音信息,检索与所述语音信息对应的多个同音词;根据预设的搜索特征信息库,获取每个同音词与用户搜索需求的相似度,其中,所述搜索特征信息库包括:至少一个搜索特征,以及对应的数学模型;根据所述相似度和预设的相似度计算策略,确定与所述用户搜索需求对应的搜索词,以便根据所述搜索词进行信息检索。实现了根据用户自身的搜索需求进行智能识别,满足用户的个性化需求节约了处理资源,减少了用户的搜索时间,提高了处理效率和用户体验度。
【IPC分类】G06F17/30
【公开号】CN105279227
【申请号】CN201510580634
【发明人】李裕东, 颜振祥, 赵程亮, 郎文静, 陈凯
【申请人】百度在线网络技术(北京)有限公司
【公开日】2016年1月27日
【申请日】2015年9月11日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1