商品推荐方法及系统的制作方法

文档序号:6635099阅读:217来源:国知局
商品推荐方法及系统的制作方法
【专利摘要】本发明公开了一种商品推荐方法及系统。该商品推荐方法包括以下步骤:接收目标用户输入的语音信息;将语音信息识别转换为文本信息;处理文本信息生成结构化文本;查询获取语音查询结果;将结构化文本记录至目标用户的日志中;聚类分析并确定目标用户所属的用户聚类;搜索目标用户的最近邻用户;根据最近邻用户对商品的评分及目标用户的平均评分计算目标用户对商品的潜在评分,根据潜在评分筛选商品以生成候选商品集;根据结构化文本从候选商品集中选取出若干商品并推荐给目标用户。本发明的商品推荐方法及系统避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验。
【专利说明】商品推荐方法及系统

【技术领域】
[0001]本发明涉及一种商品推荐方法及系统。

【背景技术】
[0002]随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。
[0003]另一方面,语音查询功能在各行业中都有非常实际的应用。随着移动终端的普及,越来越多的语音识别应用被开发。利用语音识别技术能够在一定程度上便于用户的搜索或操作,若能够将语音识别技术辅以主动根据用户需求对商品进行筛选推荐的系统,则有望更快、更便利地推荐最适合用户的产品,以达到使得用户能够更便捷地找寻所需商品的目的,从而大大改善用户的使用体验。


【发明内容】

[0004]本发明要解决的技术问题是为了现有电子商务中用户需要花费大量的时间才能找到自己想买的商品,而在这种浏览中必然产生大量无关的信息,因而会大大降低电子商务的效率,同时严重影响用户的使用体验的缺陷,提出一种商品推荐方法及系统。
[0005]本发明是通过下述技术方案来解决上述技术问题的:
[0006]本发明提供了一种商品推荐方法,其特点在于,在一数据库中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录,该商品推荐方法包括以下步骤:
[0007]S1、接收一用户输入的语音信息,并将这一用户作为目标用户;
[0008]S2、对语音信息进行语音识别转换为一文本信息;
[0009]S3、对该文本信息进行结构化处理,以生成一结构化文本;
[0010]S4、根据结构化文本在数据库中进行查询,以获取一语音查询结果;
[0011]S5、若在该数据库中记录有该目标用户的用户日志,则将该结构化文本记录至该目标用户的用户日志中,若在该数据库中未记录有该目标用户的用户日志,则在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中;
[0012]S6、根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征;
[0013]S7、确定该目标用户所属的用户聚类;
[0014]S8、根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户;
[0015]S9、根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集;
[0016]Sltl、根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。
[0017]其中用户日志可以是用户的历史语音查询日志,用户日志中收集了用户的历史行为等内容,用于作为聚类分析、近邻用户确定等后续分析处理的基础。
[0018]上述步骤S9可以为根据用户日志建立用于分析用户喜好的模型,根据收集的用户信息的行为记录,按照多种维度抽取出用户的信息,建立用户喜好或偏好的模型。在用户喜好或偏好的基础上,利用用户的历史信息较为准确地预测目标用户对特定商品的喜欢程度,并根据这一喜好程度对目标用户进行推荐商品。
[0019]较佳地,该步骤S2包括以下步骤:
[0020]S21、对语音信息进行音频特征的提取;
[0021]S22、获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的首频特征匹配度最闻的词序列;
[0022]S23、将该词序列生成为该文本信息。
[0023]上述步骤中,以马尔科夫模型为基础建立声学模型,并建立包含系统所能处理的词汇集和其发音的发音模型(可包含于声学模型中),在发音模型中,包含了声学模型建模单元与语言模型建模单元之间的映射。根据声学模型打分,寻找一个词模型序列以描述输入语音信号,从而得到对应的词解码序列。上述过程也可理解为,对输入的信号,根据声学模型及词典,找寻最大概率输出的词串或词序列。
[0024]较佳地,该步骤S3包括以下步骤:
[0025]S31、利用预设的分词和词性标注算法对该文本信息进行分词和词性标注;
[0026]S32、对分词后的该文本信息进行同义词替换,以进行归一化处理;
[0027]S33、找出该文本信息所包含的第一类词,并以预设的通配符代替该文本信息中的第一类词,以形成该结构化文本。
[0028]较佳地,该步骤S21为:对语音信息进行模数转换、端点检测、预加重、加窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。其中的LPC为LinearPredictive Coding,译为线性预测编码,也称为声源编码。
[0029]较佳地,该步骤S7为:计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。
[0030]经过上述步骤S7的处理所形成的聚类结果,实质上是大体将对商品具有相近似的兴趣点的用户放入同一聚类中。
[0031]本发明还提供了一种商品推荐系统,其包括:
[0032]数据库,其中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录;
[0033]输入模块,用于接收一用户输入的语音信息,并将这一用户作为目标用户;
[0034]语音识别模块,用于对语音信息进行语音识别转换为一文本信息;
[0035]结构化模块,用于对该文本信息进行结构化处理,以生成一结构化文本;
[0036]查询模块,用于根据结构化文本在数据库中进行查询,以获取一语音查询结果;
[0037]日志记录模块,用于在该数据库中记录有该目标用户的用户日志的情况下将该结构化文本记录至该目标用户的用户日志中,在该数据库中未记录有该目标用户的用户日志的情况下在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中;
[0038]聚类分析模块,用于根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征;
[0039]属类确定模块,用于确定该目标用户所属的用户聚类;
[0040]近邻搜索模块,用于根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户;
[0041]筛选模块,用于根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集;
[0042]推荐模块,用于根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。
[0043]较佳地,语音识别模块包括音频特征提取单元、词序列匹配单元和文本生成单元。
[0044]音频特征提取单元用于对语音信息进行音频特征的提取。词序列匹配单元用于获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的音频特征匹配度最高的词序列。文本生成单元用于将该词序列生成为该文本信息。
[0045]较佳地,结构化模块包括词性标注单元、同义词替换单元、通配符单元。
[0046]词性标注单元用于利用预设的分词和词性标注算法对该文本信息进行分词和词性标注。同义词替换单元用于对分词后的该文本信息进行同义词替换,以进行归一化处理。通配符单元用于找出该文本信息所包含的第一类词,并采用预设的通配符代替该文本信息中的第一类词以形成该结构化文本。其中涉及的用于替换的同义词、通配符以及其替换规则应当理解为预存在系统中。
[0047]较佳地,音频特征提取单元用于对语音信息进行模数转换、端点检测、预加重、力口窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。
[0048]较佳地,属类确定模块用于计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。
[0049]在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
[0050]本发明的积极进步效果在于:
[0051]本发明的商品推荐方法及系统避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验。

【专利附图】

【附图说明】
[0052]图1为本发明实施例1的商品推荐方法的流程图。
[0053]图2为本发明实施例2的商品推荐系统的示意图。

【具体实施方式】
[0054]下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案,但并不因此将本发明限制在所述的实施例范围之中。
[0055]实施例1
[0056]本实施例的商品推荐方法,在一数据库中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录。参考图1所示,本实施例的商品推荐方法包括以下步骤:
[0057]S1、接收一用户输入的语音信息,并将这一用户作为目标用户;
[0058]S2、对语音信息进行语音识别转换为一文本信息;
[0059]S3、对该文本信息进行结构化处理,以生成一结构化文本;
[0060]S4、根据结构化文本在数据库中进行查询,以获取一语音查询结果;
[0061]S5、若在该数据库中记录有该目标用户的用户日志,则将该结构化文本记录至该目标用户的用户日志中,若在该数据库中未记录有该目标用户的用户日志,则在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中;
[0062]S6、根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征;
[0063]S7、计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类;
[0064]S8、根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户;
[0065]S9、根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集;
[0066]Sltl、根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。
[0067]其中,该步骤S9为根据用户日志建立用于分析用户喜好的模型,根据收集的用户信息的行为记录,按照多种维度抽取出用户的信息,建立用户喜好或偏好的模型。在用户喜好或偏好的基础上,利用用户的历史信息较为准确地预测目标用户对特定商品的喜欢程度,并根据这一喜好程度对目标用户进行推荐商品。
[0068]具体来说步骤S2和步骤S3包括如下所述的具体步骤。
[0069]步骤S2包括以下步骤:
[0070]S21、对语音信息进行模数转换、端点检测、预加重、加窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征;
[0071]S22、获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的首频特征匹配度最闻的词序列;
[0072]S23、将该词序列生成为该文本信息。
[0073]步骤S3包括以下步骤:
[0074]S31、利用预设的分词和词性标注算法对该文本信息进行分词和词性标注;
[0075]S32、对分词后的该文本信息进行同义词替换,以进行归一化处理;
[0076]S33、找出该文本信息所包含的第一类词,并以预设的通配符代替该文本信息中的第一类词,以形成该结构化文本。
[0077]实施例2
[0078]如图2所示,本实施例的商品推荐系统包括:数据库1、输入模块2、语音识别模块3、结构化模块4、查询模块5、日志记录模块6、聚类分析模块7、属类确定模块8、近邻搜索模块9、筛选模块10和推荐模块11。
[0079]数据库I中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录。输入模块2用于接收一用户输入的语音信息,并将这一用户作为目标用户。语音识别模块3用于对语音信息进行语音识别转换为一文本信息。
[0080]结构化模块4用于对该文本信息进行结构化处理,以生成一结构化文本。查询模块5用于根据结构化文本在数据库中进行查询,以获取一语音查询结果。
[0081]日志记录模块6用于在该数据库中记录有该目标用户的用户日志的情况下将该结构化文本记录至该目标用户的用户日志中,在该数据库中未记录有该目标用户的用户日志的情况下在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中。
[0082]聚类分析模块7用于根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征。属类确定模块8用于确定该目标用户所属的用户聚类。近邻搜索模块9用于根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户;
[0083]筛选模块10用于根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集。推荐模块11用于根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。
[0084]其中,语音识别模块包括音频特征提取单元、词序列匹配单元和文本生成单元。而结构化模块包括词性标注单元、同义词替换单元、通配符单元。
[0085]具体来说,音频特征提取单元用于对语音信息进行模数转换、端点检测、预加重、加窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。
[0086]词序列匹配单元用于获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的音频特征匹配度最高的词序列。文本生成单元用于将该词序列生成为该文本信息。
[0087]词性标注单元用于利用预设的分词和词性标注算法对该文本信息进行分词和词性标注。同义词替换单元用于对分词后的该文本信息进行同义词替换,以进行归一化处理。通配符单元用于找出该文本信息所包含的第一类词,并采用预设的通配符代替该文本信息中的第一类词以形成该结构化文本。其中涉及的用于替换的同义词、通配符以及其替换规则应当理解为预存在系统中。
[0088]属类确定模块用于计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。
[0089]虽然以上描述了本发明的【具体实施方式】,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
【权利要求】
1.一种商品推荐方法,其特征在于,在一数据库中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录,该商品推荐方法包括以下步骤: 51、接收一用户输入的语音信息,并将这一用户作为目标用户; 52、对语音信息进行语音识别转换为一文本信息; 53、对该文本信息进行结构化处理,以生成一结构化文本; 54、根据结构化文本在数据库中进行查询,以获取一语音查询结果; 55、若在该数据库中记录有该目标用户的用户日志,则将该结构化文本记录至该目标用户的用户日志中,若在该数据库中未记录有该目标用户的用户日志,则在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中; 56、根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征; 57、确定该目标用户所属的用户聚类; 58、根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户; 59、根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集; Sltl、根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。
2.如权利要求1所述的商品推荐方法,其特征在于,该步骤S2包括以下步骤: 521、对语音信息进行音频特征的提取; 522、获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的首频特征匹配度最闻的词序列; 523、将该词序列生成为该文本信息。
3.如权利要求1所述的商品推荐方法,其特征在于,该步骤S3包括以下步骤: 531、利用预设的分词和词性标注算法对该文本信息进行分词和词性标注; 532、对分词后的该文本信息进行同义词替换,以进行归一化处理; 533、找出该文本信息所包含的第一类词,并以预设的通配符代替该文本信息中的第一类词,以形成该结构化文本。
4.如权利要求2所述的商品推荐方法,其特征在于,该步骤S21为:对语音信息进行模数转换、端点检测、预加重、加窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。
5.如权利要求1-4中任意一项所述的商品推荐方法,其特征在于,该步骤S7为:计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。
6.—种商品推荐系统,其特征在于,包括: 数据库,其中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录; 输入模块,用于接收一用户输入的语音信息,并将这一用户作为目标用户; 语音识别模块,用于对语音信息进行语音识别转换为一文本信息; 结构化模块,用于对该文本信息进行结构化处理,以生成一结构化文本; 查询模块,用于根据结构化文本在数据库中进行查询,以获取一语音查询结果; 日志记录模块,用于在该数据库中记录有该目标用户的用户日志的情况下将该结构化文本记录至该目标用户的用户日志中,在该数据库中未记录有该目标用户的用户日志的情况下在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户曰志中; 聚类分析模块,用于根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征; 属类确定模块,用于确定该目标用户所属的用户聚类; 近邻搜索模块,用于根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户; 筛选模块,用于根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集; 推荐模块,用于根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。
7.如权利要求6所述的商品推荐系统,其特征在于,语音识别模块包括音频特征提取单元、词序列匹配单元和文本生成单元,音频特征提取单元用于对语音信息进行音频特征的提取,词序列匹配单元用于获取以马尔科夫模型为基础建立的声学模型、然后根据该声学模型解析得到和提取的音频特征匹配度最高的词序列,文本生成单元用于将该词序列生成为该文本信息。
8.如权利要求6所述的商品推荐系统,其特征在于,结构化模块包括词性标注单元、同义词替换单元、通配符单元,词性标注单元用于利用预设的分词和词性标注算法对该文本信息进行分词和词性标注,同义词替换单元用于对分词后的该文本信息进行同义词替换、以进行归一化处理,通配符单元用于找出该文本信息所包含的第一类词、并以预设的通配符代替该文本信息中的第一类词以形成该结构化文本。
9.如权利要求7所述的商品推荐系统,其特征在于,音频特征提取单元用于对语音信息进行模数转换、端点检测、预加重、加窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。
10.如权利要求6-9中任意一项所述的商品推荐系统,其特征在于,属类确定模块用于计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。
【文档编号】G06Q30/02GK104361507SQ201410668170
【公开日】2015年2月18日 申请日期:2014年11月20日 优先权日:2014年11月20日
【发明者】何玉 申请人:携程计算机技术(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1