基于即时语音内容检测的推荐方法及系统的制作方法_2

文档序号：9489505阅读：来源：国知局

列表推送给目标用户。
[0048] 优选地，所述语音内容分析模块包括：
[0049] 语音关键词转录子模块，用于将语音信息转换成文本内容并生成词图；
[0050] 词图优化子模块，用于将词图中的词串进行全局对齐，全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集，通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率，根据每条候选链接弧的后验概率得分进行剪枝，保留后验概率超过预设阈值的候选链接弧，得到采用混淆网络方法优化后的词图；
[0051] 词图索引子模块，用于对采用混淆网络方法优化后的词图进行索引标注得到索引库，所述索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。
[0052] 优选地，所述语音关键词检索模块包括：
[0053]词项搜索子模块，用于采用预设的词项搜索算法，根据所述索引库从预设的推荐物品词典中进行词项搜索，得到搜索结果列表；
[0054] 搜索结果重排序子模块，用于针对搜索结果列表进行重排序，得到推荐物品词典中的即时语音关键词。
[0055] 本发明基于即时语音内容检测的推荐方法具有下述优点：本发明提供采集用户的语音信息，将语音信息转换成文本内容进行索引得到索引库，根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词，根据即时语音关键词及用户历史行为数据计算用户兴趣模型，计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度，根据相似度进行排序生成推荐物品信息库中的候选物品集，从候选物品集中选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户，能够充分挖掘用户在语音聊天通讯软件、观看在线流媒体影视剧等场景下的语音信息，捕获用户在听说渠道下反应出的兴趣关注点，并结合用户的历史兴趣模型，进而推荐满足用户兴趣的商品及其他信息，能够充分利用用户日常语音通讯聊天、观看的影视剧台词等语音信息与用户当前兴趣的紧密关联性，具有推荐物品的针对性强且准确性高、用户的使用体验好的优点。
[0056] 本发明基于即时语音内容检测的推荐系统具有下述优点：本发明基于即时语音内容检测的推荐系统为本发明基于即时语音内容检测的推荐方法完全对应的系统，因此同样也具有本发明基于即时语音内容检测的推荐方法的前述优点，在此不再赘述。
【附图说明】
[0057] 图1为本发明实施例方法的基本流程示意图。
[0058] 图2为本发明实施例方法步骤2)的基本原理示意图。
[0059] 图3为本发明实施例方法步骤3)的基本原理示意图。
[0060] 图4为本发明实施例方法步骤4)的基本原理示意图。
【具体实施方式】
[0061] 如图1所示，本实施例基于即时语音内容检测的推荐方法的详细步骤包括：
[0062] 1)采集用户的语音信息；
[0063] 2)将语音信息转换成文本内容进行索引得到索引库；
[0064] 3)根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词；
[0065] 4)根据即时语音关键词及用户历史行为数据计算用户兴趣模型；
[0066] 5)计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度；
[0067] 6)根据相似度进行排序生成推荐物品信息库中的候选物品集，从候选物品集中选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户。
[0068] 本实施例中，步骤1)采集用户的语音信息时，具体是指监听检测目标用户当前在影音播放器、在线流媒体播放平台或即时语音通讯软件等应用下的实时语音信息，将捕获到音频卡的数据流导入系统进行处理。
[0069] 如图2所示，步骤2)的详细步骤包括：
[0070] 2. 1)将语音信息转换成文本内容并生成词图（Lattice);词图结构是一种有向无环图，节点代表时间，每条弧代表一个时间片内一个语音识别的候选结果，并伴随这个将语音信息转换成文本得到的STT候选结果的声学模型、语言学模型评分；在词图结构中，每个链接弧表示了一个词（也可使用音节、音素），该词在词名、起始时间、结束时间或是前置词三个方面至少有一个方面与其它链接弧不同；
[0071] 2.2)将词图中的词串进行全局对齐，全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集，通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率，根据每条候选链接弧的后验概率得分进行剪枝，保留后验概率超过预设阈值的候选链接弧，得到采用混淆网络方法优化后的词图；上述优化只保留评判分较高的大多数弧，节点数和路径数大幅减少，减少了存储空间；正确的候选词可能不在一条路径中，而转换成混淆网络之后，原来不在一条路径上的候选也可以有偏序关系，从而提高了搜索效率；
[0072] 2. 3)对采用混淆网络方法优化后的词图进行索引标注得到索引库，索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。语音关键词检测就是要在有词图索引结构中找到匹配特定内容的局部路径并对该局部路径进行置信测度，每一个匹配的局部路径都是一个潜在的可能结果，利用后验概率值作为置信测度可以对这种可能性的大小进行度量。
[0073] 如图3所示，步骤3)的详细步骤包括：
[0074] 3. 1)采用预设的词项搜索算法，根据索引库从预设的推荐物品词典中进行词项搜索，得到搜索结果列表；语音关键词检测系统的搜索词项可以分为三种：（1)由推荐物品词典中的单个词构成的词项。（2)由推荐物品词典中的多个词构成的词项。（3)至少包含一个推荐物品词典以外的词的词项。前两种词项为词表内（InVocabulary，IV)词，第三种词项为词表外（〇ut-〇fVocabulary，00V)词。基于词图创建索引，对于第一种词项，只需检索词项的每个节点。对于第二种词项，则需要在词图中寻找一条能与查询词项相匹配的局部路径。对于第三种词项，需要采用不同的检测逻辑，例如可以构建音素索引库，将查询词项表示成音素序列，在音素中查找匹配表示查询词项音素序列的局部路径。语音关键词检测的候选决策阶段是对检测到的关键词的正确与否做出判断的阶段，它舍弃可能性较小的检测结果，保留可能性较大的检测结果；
[0075] 3. 2)针对搜索结果列表进行重排序，得到推荐物品词典中的即时语音关键词。
[0076] 本实施例中，步骤3. 2)的详细步骤包括：
[0077] 3. 2. 1)预先获取多组步骤3. 1)得到的搜索结果列表样本，将搜索结果列表样本中得分排在前面的N个搜索结果视为相关的、得分排在倒数的最后N个搜索结果视为不相关的，把相关的N个搜索结果作为正面样本数据、把不相关的N个搜索结果作为负面样本数据来训练机器学习分类模型，完成机器学习分类模型的训练；
[0078] 3. 2. 2)将词项的搜索结果列表输入机器学习分类模型，通过机器学习分类模型对搜索结果列表进行重排序，得到重排序后的推荐物品词典中的即时语音关键词。
[0079] 本实施例步骤3. 2. 1)、3. 2. 2)是利用伪相关反馈的二次检索进行结果重排序，能够提高返回推荐词项列表的准确性。伪相关反馈的二次检索基本思路是得到词图的第一次检索结果后，假设得分排在前面的N个结果是相关的，而得分排在倒数的最后N个结果是不相关的。把这些分别作为正面和负面的例子用来训练具体查询的机器学习分类方法，并将训练后的机器学习分类方法用于初步检索的重排序。机器学习分类模型可根据需要采用支持向量机、多层感知等机器学习方法等模型，支持向量机、多层感知等机器学习方法的高区分能力优势可在二次检索中有效提升语音关键词检测性能。
[0080] 如图4所示，步骤4)的详细步骤包括：
[0081] 4. 1)根据计算预设的语音检测窗W内的用户即时兴趣模型如式（1)所示；本实施例中，语音检测窗W设置为300s;
[0082] 叫={wH，w2i，…，wni}，wkie[0, 1] (1)
[0083] 式⑴中，1^为用户即时兴趣模型，wkl是语音检测窗W内语音关键词中第k个词典主题词4的即时兴趣权重，且即时兴趣权重wkl设置为归一化的词频-逆文档频率 TF-IDF;用户即时兴趣模型urf{ww2i,…，wni}，wkie[0, 1]，检测窗时间内的语音内容即是目

完整全部详细技术资料下载

当前第2页1 2 3 4