一种信息发送方法及系统的制作方法

文档序号:6541913阅读:149来源:国知局
一种信息发送方法及系统的制作方法
【专利摘要】本发明公开了一种信息发送方法及系统,用以实现向用户设备发送更加准确的搜索对象。本发明提供的一种信息发送方法,包括:获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
【专利说明】一种信息发送方法及系统
【技术领域】
[0001]本发明涉及智能推荐【技术领域】,尤其涉及一种信息发送方法及系统。
【背景技术】
[0002]随着互联网技术的快速发展,智能推荐技术在各个领域逐渐兴起。大型的电子商务系统,都不同程度使用了各种形式的推荐。智能推荐在商品交易领域应用广泛,各大商业网站几乎都涵盖了商品推荐的功能。
[0003]例如有的电子商务系统提供了“其他用户现在正在看的商品”、“购买了此商品的人还购买了”,都是依据用户的相似性实现推荐;
[0004]有的电子商务系统提出了 “购买了此商品的人还购买了如下商品”,“看了又看”,也是把相同类型的商品推荐给用户;
[0005]有的电子商务系统提供了“最佳拍档”把同一主题的书目组合推荐给用户、也提供了“买过本商品的还买了”,根据用户可能具有的相同购买取向实现推荐的。
[0006]以上电子商务智能推荐领域,主流推荐算法是基于内容的推荐算法、协同过滤推荐算法、混合推荐算法。其中,基于内容的推荐算法的思想:记录用户过去的浏览喜好,建立用户的个性化档案,进而向用户推荐相似产品。协同过滤推荐算法的思想:分析大量用户的兴趣,在用户群中找出具有相同兴趣的相似用户,根据其他用户的行为历史进行推荐,综合相似用户对某一信息的评价,预测用户喜好。混合推荐算法,则是结合两者的优势。
[0007]在影视推荐领域,由于影视具有主观性,及时性,情感体验强烈、实时评论等特点;电商领域的推荐算法并不适合影视推荐。目前,所用较多的方法是基于提前分好的类别,添加分类筛选条件。如把影视按照类型、国家/地区、艺术家、年代等维度分类,供用户选择。目前一些主流的视频网站均是基于这种分类方法管理影视的。但这种方法存在以下方面的不足:
[0008]缺乏用户之间的交互:用户选择的过程是用户和制定分类规则人员之间的交互,而缺少用户与用户之间的交互。虽然有的视频网站提供了贴标签功能,已观看的用户用一个词概括该影视,多个用户评论后生成标签组,把这一组标签显示给其他待观看的用户,实现用户与用户之间的交流。但这种标签为用户找到电影后提供参考,并不能满足用户在检索前的需要;
[0009]影视智能推荐技术要求能够准确定位用户搜索意图,对用户的需求做出有效的预测。需要考虑已观者对影视的情感体验,而往往影评是用户充分发挥观后感的平台,通过对评论的分析可以了解观看者对影视的真实感受。但是,目前的智能推荐系统均没有基于情感体验信息的推荐;
[0010]另外,如果用户想要搜索“最新的节奏紧张的影视”,在现有技术的影视搜索系统中,并不存在这样的模糊查找,而是需要用户预测出这种影视对应的类别,再去一一查找,或者只有在用户了解到“最新的节奏紧张的影视”的具体影视名称后,再通过名称查找才能找到相应的影视,因此现有技术并不能根据用户的搜索信息做出准确的推荐;[0011]综上,在现有技术的影视搜索系统中,根据用户输入的具体的检索要求,并不能向用户设备发送的准确的满足检索要求的搜索对象。

【发明内容】

[0012]本发明实施例提供了一种信息发送方法及系统,用以实现向用户设备发送更加准确的搜索对象。
[0013]本发明实施例提供了一种信息发送方法,该方法包括:
[0014]获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
[0015]将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
[0016]本发明实施例提供的上述信息发送方法,在用户对搜索对象进行检索时,能够实现用户与用户之间的交互,并且把检索句中包含的信息进行分类,当检索信息中包括属性项信息类别和/或情感评价信息类别的检索关键词时,能够在预设的动态标签集合中对属性项信息类别和/或情感评价信息类别的检索关键词进行匹配,因此,能够实现向用户设备发送更加准确的搜索对象。
[0017]较佳的,预先建立搜索对象的动态标签集合,包括:
[0018]获取搜索对象的评论信息,并提取所述评论信息的有效词表;
[0019]根据所述有效词表,更新预先建立的搜索对象的特征词库;
[0020]根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
[0021]通过不断更新预先建立的搜索对象的特征词库,根据当前搜索特征词库生成搜索对象的动态标签集合,能够不断的更新搜索对象的动态标签集合,从而在用户检索时能够更准确的进行信息的匹配。
[0022]较佳的,预先建立搜索对象的特征词库,包括:
[0023]获取搜索对象的元信息;
[0024]建立搜索对象的属性项信息的向量空间模型;
[0025]建立搜索对象的情感评价信息的向量空间模型;
[0026]建立搜索对象的关联对象信息集合;
[0027]将所述搜索对象的元信息、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
[0028]通过预先建立包括搜索对象的元信息、属性项信息、情感评价信息以及关联对象信息的特征词库,保证搜索对象的信息的完整性,从而保证用户搜索时信息匹配的准确性。
[0029]较佳的,所述建立搜索对象的属性项信息的向量空间模型,包括:
[0030]获取搜索对象的属性项词集合;
[0031]确定每一所述属性项词对应的评论词;
[0032]根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
[0033]根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
[0034]根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
[0035]对于每一搜索对象,均存在其对应的属性项信息,对于每一属性项词语均存在一定的评论词,每一评论词均代表了用户的情感体验,因此根据所述属性项词、所述属性项词对应的评论词以及所述属性项词对应的评论词的情感极值,建立属性项信息的向量空间模型,能够更加准备的定位搜索对象的属性项信息。
[0036]较佳的,所述获取搜索对象的属性项词,包括:
[0037]从所述有效词表中提取属性项词表;
[0038]将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
[0039]对于一定类型的搜索对象,均存在相应的表征该搜索对象的属性项信息,因此,预先形成一属性项标注词表,再通过从有效词表中提取属性项词表,将两者进行拟合,能够保证那些能够表征该搜索对象的特征的属性项信息生成到特征词库中,从而保证搜索对象的特征词库的信息完整性。
[0040]较佳的,所述建立搜索对象的情感评价信息的向量空间模型,包括:
[0041]从所述有效词表中提取情感评价词集合;
[0042]根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
[0043]根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
[0044]根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
[0045]在搜索对象的评论信息中,总存在用户对于该对象的主观情感评价信息,以此来表达用户对该对象的情感态度,因此,通过建立搜索对象的情感评价信息的向量空间模型,能够更加准确的获得搜索对象的信息,从而在用户进行检索时,能够更加准确的进行信息的匹配,实现更加准确的推荐。
[0046]较佳的,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,包括:
[0047]将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
[0048]将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
[0049]将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;[0050]将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
[0051]通过上述的分级匹配顺序,能够保证匹配更加准确。
[0052]较佳的,所述将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,包括:
[0053]确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
[0054]根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
[0055]根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
[0056]若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
[0057]根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
[0058]通过确定所述检索关键词中属性项词对应的评论词的情感色彩类别,当在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配时,若匹配不成功,可以将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签,从而对用户的检索做出推荐。
[0059]较佳的,将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,包括:
[0060]根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
[0061]根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
[0062]若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
[0063]根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
[0064]本发明还提供了一种信息发送系统,包括:
[0065]检索信息获取单元,用于获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
[0066]匹配单元,用于将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
[0067]较佳的,所述匹配单元在预先建立搜索对象的动态标签集合时,具体用于:
[0068]获取搜索对象的评论信息,并提取所述评论信息的有效词表;[0069]根据所述有效词表,更新预先建立的搜索对象的特征词库;
[0070]根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
[0071]较佳的,所述匹配单元在预先建立搜索对象的特征词库时,具体用于:
[0072]获取搜索对象的元信息集合;
[0073]建立搜索对象的属性项信息的向量空间模型;
[0074]建立搜索对象的情感评价信息的向量空间模型;
[0075]建立搜索对象的关联对象信息集合;
[0076]将所述搜索对象的元信息集合、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
[0077]较佳的,所述匹配单元在建立搜索对象的属性项信息的向量空间模型时,具体用于:
[0078]获取搜索对象的属性项词集合;
[0079]确定每一所述属性项词对应的评论词;
[0080]根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
[0081]根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
[0082]根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
[0083]较佳的,所述匹配单元在获取搜索对象的属性项词时,具体用于:
[0084]从所述有效词表中提取属性项词表;
[0085]将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
[0086]较佳的,所述匹配单元在建立搜索对象的情感评价信息的向量空间模型时,具体用于:
[0087]从所述有效词表中提取情感评价词集合;
[0088]根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
[0089]根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
[0090]根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
[0091]较佳的,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,所述匹配单元将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息时,具体用于:
[0092]将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
[0093]将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
[0094]将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
[0095]将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
[0096]较佳的,所述匹配单元将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配时,具体用于:
[0097]确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
[0098]根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
[0099]根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
[0100]若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
[0101]根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
[0102]较佳的,所述匹配单元将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配时,具体用于:
[0103]根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
[0104]根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
[0105]若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
[0106]根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
【专利附图】

【附图说明】
[0107]图1为本发明实施例提供的一种信息发送方法的流程示意图;
[0108]图2为本发明实施例提供的另一种信息发送方法的流程示意图;
[0109]图3为本发明实施例提供的一种信息发送系统的结构示意图。
【具体实施方式】
[0110]本发明实施例提供了一种信息发送方法及系统,用以实现向用户设备发送更加准确的搜索对象。
[0111]首先对本发明中涉及的技术用语进行介绍。[0112]搜索对象的元信息:用于表征搜索对象的基本信息,是固定不变的。例如,若搜索对象为影视,则元信息即可包括影视名、演员、导演、上映时间等;若搜索对象为音乐,则元信息即可包括音乐名、演奏者、发行时间等。
[0113]搜索对象的属性项信息:用于表征评论该搜索对象的维度以及其特点。例如,若搜索对象为影视,则属性项信息即可包括场景很宏大、情节好感人、化妆很假等,其中“场景、情节和化妆”为属性项词,“很宏大、好感人、很假”是属性项词对应的评论词,“很、好”为评论词中的程度词;若搜索对象为音乐,则属性项信息即可包括旋律是否动听、歌词是不是经典等。
[0114]搜索对象的情感评价信息:用于表征用户对搜索对象的情感体验。例如,开心、喜欢、恶心、恐惧、念念不忘、不能漏掉等。
[0115]搜索对象的关联对象信息:用于表征与搜索对象相关联的对象信息。例如,若搜索对象为影视,则关联对象信息即可包括同一导演的影视、同一上映档期的影视等;若搜索对象为音乐,则关联对象信息即可包括同一演奏者的音乐、同一专辑的音乐等。
[0116]情感极性:对于给定的一段带有观点的评论性文本,标记出该文本整体上是正面评价或者负面评价,也就是标记某一段评论性文本所代表的倾向性情感是正面还是负面,对所表达的主题是喜爱还是讨厌,是赞同还是反对。例如,若搜索对象为影视,对某一影视的评论中提及很喜欢这部电影,那么很喜欢就是正面评价,很不喜欢就是负面评价。
[0117]向量空间模型:把对文本内容的处理简化为向量空间中的向量运算,并且以空间上的相似度表达语义的相似度。当文档被表示为文档空间的向量,就可以通过计算向量之间的相似性来度量文档间的相似性。
[0118]文档词频-反向文档频率(TF-1DF,Term Frequency-1nverse DocumentFrequency):是一种统计方法,用以评估某一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
[0119]下面对本发明实施例进行说明。
[0120]如图1所示,本发明实施例提供的一种信息发送方法,包括:
[0121]步骤SlOl:获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
[0122]步骤S102:将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
[0123]本发明实施例提供的上述信息发送方法,在用户对搜索对象进行检索时,能够实现用户与用户之间的交互,并且把检索句中包含的信息进行分类,当检索信息中包括属性项信息类别和/或情感评价信息类别的检索关键词时,能够在预设的动态标签集合中对属性项信息类别和/或情感评价信息类别的检索关键词进行匹配,因此,能够实现向用户设备发送更加准确的搜索对象。
[0124]较佳的,所述检索信息包括文本信息或语音信息,系统通过分词和语音处理,提取所述检索信息的检索关键词。以对文本信息的分词为例,例如可以通过句法分析进行句式的识别,以及语法分析器识别语法结构来进行分词处理,以获取检索关键词并提取。在提取所述检索信息的检索关键词的过程中,若搜索对象为影视,在进行分词时,还可以引入预设的用户词典,该用户词典包括了影视名称、演员名字、导演名字、影视歌曲名称、上映时间、类型、地区等,在对检索信息进行分词时将该词典导入,能够更加快速的识别检索关键词中的元信息,并将其提取。
[0125]较佳的,预先建立搜索对象的动态标签集合,包括:
[0126]获取搜索对象的评论信息,并提取所述评论信息的有效词表;
[0127]根据所述有效词表,更新预先建立的搜索对象的特征词库;
[0128]根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
[0129]其中,所述有效词表中包括元信息类别、属性项信息、情感评价信息和/或关联对象信息类别中的至少一类有效词。
[0130]在具体实施过程中,获取搜索对象的评论信息包括:
[0131]定期检测评论信息的更新情况,从而获取评论信息,以及评论之间的关联信息,此处,评论之间的关联信息包括针对同一搜索对象的评论信息、针对之前评论追加的评论信息等,从而动态的更新用户对该搜索对象的评价;
[0132]进一步,获取搜索对象的评论信息还包括:
[0133]按照评论的热度,其中热度参数包括评论的回复数、点击率、被引率的数量等,去掉热度较低的评论,若热度相同,按照评论时间的先后,去掉时间靠前的评论,从而获取搜索对象的评论信息。
[0134]提取所述评论信息的有效词表,包括:
[0135]将获取的搜索对象的评论信息存储在云端服务器;在获取了搜索对象的评论信息后,对评论信息进行解析,通过过滤无意义词,提取出有效词,并生成有效词表。例如,对于评论信息“电影A的特技很炫”,其中“的”为无意义词,“电影A”、“特技”、“很炫”均为有效
ο
[0136]进一步,搜索对象的特征词库建立之后,根据所述有效词表,更新预先建立的搜索对象的特征词库;根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
[0137]具体实施过程中,可以根据影视的特征词的权重大小的不同,将特征词按照其权重由大到小的顺序排列,取权重较大的一部分特征词作为影视的动态标签集合;具体的,针对每一类动态标签,将每一类特征词按照其权重由大到小的顺序排列,取权重较大的一部分特征词生成到影视的动态标签集合中。
[0138]较佳的,预先建立搜索对象的特征词库,包括:
[0139]获取搜索对象的元信息;
[0140]建立搜索对象的属性项信息的向量空间模型;
[0141]建立搜索对象的情感评价信息的向量空间模型;
[0142]建立搜索对象的关联对象信息集合;
[0143]将所述搜索对象的元信息、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
[0144]在具体实施过程中,以搜索对象为影视为例,元信息包括时间信息、导演信息、演员信息等,属性项信息包括场景信息、配乐信息等,情感评价信息包括“喜欢”、“经典”、“飙泪”等,关联对象信息包括关联的影视,比如导演相同的影视、类型相同的影视或者影评中提到的对比影视等,其中,元信息一般是相对固定的,而属性项信息、情感评价信息和关联对象信息是根据评论信息的更新不断的变化的。通过预先建立包括搜索对象的元信息类另IJ、属性项信息类别、情感评价信息类别以及关联对象信息类别的特征词库,保证搜索对象的信息的完整性,从而保证用户搜索时信息匹配的准确性。
[0145]较佳的,所述建立搜索对象的属性项信息的向量空间模型,包括:
[0146]获取搜索对象的属性项词集合;
[0147]确定每一所述属性项词对应的评论词;
[0148]根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
[0149]根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
[0150]根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
[0151]在具体实施过程中,根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立属性项信息的向量空间模型,能够更加准确的定位搜索对象的属性项信息,同时简化计算,缩短搜索时间。
[0152]其中,确定所述属性项词对应的评论词的情感色彩类别,包括:
[0153]确定所述属性项词对应的评论词,例如,系统根据前述的属性词集合,定义一定大小的文本窗口,利用词共现的方法,确定属性项词对应的评论词;
[0154]进一步,根据预设的情感色彩分类规则,确定所述属性项词对应的评论词的情感色彩类别。例如,将情感色彩类别分为褒义、中性和贬义三种情感色彩类别,对于某一搜索对象A的属性项词“场景”对应的评论词包括2个“非常宏大”、I个“较宏大”、I个“很差”,“宏大”一词的情感色彩类别为褒义,“差”对应的情感色彩类别为贬义;
[0155]再进一步,根据预设的关于情感色彩类别的情感极性权重表,计算所述属性项词对应的评论词的情感色彩类别的情感极性值。例如,对于褒义这一情感色彩类别,其对应的程度词有“很、非常”、“比较”、“一般”、“较不”、“很不”等五类,对于贬义这一情感色彩类别,其对应的程度词有“很、非常”、“比较”、“一般”、“较不”、“很不”等五类,依次对应的情感极性权重分别为-10、-5、0、5、10 ;那么通过计算得出情感极性值10X2+5X1+ (-10) X 1=15,数值为正,则说明场景一词的情感极性值为15,整体评价为褒义;因此对于属性项信息“场景非常宏大”,在属性项信息的向量空间模型中将表达为“A、场景、褒义、宏大、15”。
[0156]较佳的,所述获取搜索对象的属性项词,包括:
[0157]从所述有效词表中提取属性项词表;
[0158]将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
[0159]在具体实施过程中,对于一定类型的搜索对象,均存在相应的表征该搜索对象的属性项信息,因此,预先设置一属性项标注词表,再通过从有效词表中提取属性项词表,将两者进行拟合,能够保证那些能够表征该搜索对象的特征的属性项信息生成到特征词库中,从而保证搜索对象的特征词库的信息完整性。例如,以影视为搜索对象为例,预设的属性项标注词表包括了表征影视的一些属性项词,比如“场景、特效、氛围、音效、配乐、配音、画面、魔幻、故事、编剧、情节、场面、制作、化妆、原著、剧情”等,同时从评论信息中获取的有效词表中,通过特征提取算法,提取属性项词表,将两者进行拟合,生成的属性项词集合能够保证那些出现次数少但能表征该搜索对象的特征的属性项信息生成到特征词库中。
[0160]较佳的,所述建立搜索对象的情感评价信息的向量空间模型,包括:
[0161]从所述有效词表中提取情感评价词集合;
[0162]根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
[0163]根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
[0164]根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
[0165]通过建立搜索对象的情感评价信息的向量空间模型,能够更加准确的获得搜索对象的信息,从而在用户进行检索时,能够更加准确的进行信息的匹配,实现更加准确的推荐。在搜索对象的评论信息中,存在用户对于该对象的主观情感评价信息,以此来表达用户对该对象的情感态度,例如,根据心理学对情感类别的分类方法可以将情感类别分为“喜、怒、哀、惧”四种,每一情感类别对应一定的情感词库,例如“喜”类别中包括开心、高兴等。
[0166]在此,以影视为搜索对象为例,建立搜索对象的情感评价信息的向量空间模型,包括:
[0167]从有效词表中通过特征提取算法提取出情感评价词集合,例如,对于影视B,情感评价词为“非常垃圾”,根据前述的预设的情感分类规则,通过查找情感类别对应的情感词库,确定“垃圾”一词的情感类别为“怒”;
[0168]进一步,根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值,例如,“非常”对应的情感极性权重值为10,则确定“垃圾”的情感极性值为10 ;
[0169]再一步,根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立情感评价信息的向量空间模型。那么,对于情感评价词“非常垃圾”,在情感评价信息的向量空间模型中表达为“B、怒、垃圾、10”。
[0170]较佳的,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,包括:
[0171]将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
[0172]将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
[0173]将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
[0174]将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
[0175]在具体实施过程中,以影视为搜索对象为例,其中搜索对象与该动态标签的对应关系,可以通过建立搜索对象与特征词的倒排索引,进而在生成动态标签集合时搜索对象与动态标签之间也存在同样的倒排索引;例如,电影A的特征词包括“小清新”、“80后”、“爱情”等,将这些特征词与电影A建立倒排索引,若“80后”出现在动态标签集合中,则通过匹配到“80后”,能够迅速的映射到电影A。
[0176]又如,如果检索信息为“2014年播出的场景好,以爱情为主题轻松愉快的喜剧”,其中检索信息中,元信息为“时间(2014)、类型(喜剧)、种类(爱情)”;属性项信息为“场景(好)”、情感评价信息为“轻松愉快”,那么首先根据元信息内容检索到2014年播出的爱情喜剧,再根据属性项信息在已搜索到的2014年播出的爱情喜剧中检索到配乐好的影视,进一步根据情感评价信息在配乐好的2014年播出的爱情喜剧中检索到轻松愉快的影视,最后根据匹配度由高到低的顺序将搜索到的影视以列表信息发送给用户设备。通过上述的信息发送过程,当检索信息中包括多个类别的检索关键词时,能够向用户设备发送更加准确的搜索对象。
[0177]较佳的,所述将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,包括:
[0178]确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
[0179]根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
[0180]根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
[0181]若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
[0182]根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
[0183]此处,依然以检索信息为“2014年播出的场景好,以爱情为主题轻松愉快的喜剧”为例,其中检索信息中属性项信息为“场景(好)”,“好”对应的情感色彩类别为褒义,在属于场景的褒义的动态标签中对场景的检索关键词进行匹配时,若匹配到“场景(好)”,则确定“场景(好)”为匹配成功的动态标签;若没有匹配到“场景(好)”,但在属于场景的褒义的动态标签中存在“场景宏大”的标签,则将“场景宏大”作为匹配成功的动态标签;进一步,根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
[0184]通过确定所述检索关键词中属性项词对应的评论词的情感色彩类别,当在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配时,若匹配不成功,可以将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签,从而对用户的检索做出推荐。[0185]较佳的,将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,包括:
[0186]根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
[0187]根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
[0188]若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
[0189]根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
[0190]此处,依然以检索信息为“2014年播出的配乐好,以爱情为主题轻松愉快的喜剧”为例,其中情感评价信息为“轻松愉快”,“轻松愉快”对应的情感类别为喜,在属于喜类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配,若匹配到“轻松愉快”,则将“轻松愉快”作为匹配成功的动态标签;若没有匹配到“轻松愉快”,但在喜的类别的动态标签中存在“特别乐呵”的动态标签,则将“特别乐呵”作为匹配成功的动态标签;进一步,根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
[0191]另外,如果检索信息仅为“节奏紧张的影视”或者“恐惧的影视”,在现有技术的影视搜索系统中,并不存在这样的模糊查找,用户需要预测出这种影视对应的类别,再去一一查找。而本发明提供的方案中,“节奏紧张”为属性项信息,“恐惧”为情感评价信息,因此通过针对属性项信息类别的检索关键词-动态标签之间的匹配,即可检索到动态标签中包括该“节奏紧张”的影视;通过针对情感评价信息类别的检索关键词-动态标签之间的匹配,即可检索到动态标签中包括“恐惧”的影视。
[0192]下面将结合附图和具体实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0193]下面以影视作为搜索对象为例,对本发明实施例提供的技术方案进行说明。
[0194]参见图2,本发明实施例提供的另一种信息发送方法,包括:
[0195]步骤S201:获取用户设备发送的影视的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
[0196]步骤S202:将所述检索关键词与预先建立的用于表征影视的特征的动态标签集合匹配,并利用预设的影视与动态标签的对应关系,生成影视的列表信息,并发送给所述用户设备。
[0197]其中,动态标签集合包括影视的元信息类别、属性项信息类别、情感评价信息类别和关联影视信息类别的动态标签。
[0198]在步骤S201中,所述检索信息包括文本信息或语音信息,系统通过分词和语音处理,提取所述检索信息的检索关键词。以对文本信息的分词为例,通过句法分析进行句式的识别以及语法分析器识别语法结构进行分词处理,以获取检索关键词并提取。在进行分词时,引入预设的用户词典,该用户词典包括了影视名称、演员名字、导演名字、影视歌曲名称、上映时间、类型、地区等,在对检索信息进行分词时将该词典导入,能够更加快速的识别检索关键词中的兀彳目息,并将其提取。
[0199]在步骤S202中,预先建立影视的动态标签集合,包括:
[0200]获取影视的评论信息,并提取所述评论信息的有效词表;
[0201]根据所述有效词表,更新预先建立的影视的特征词库;
[0202]根据当前所述特征词库,生成影视的动态标签集合。
[0203]其中,所述有效词表中包括影视的元信息类别、属性项信息、情感评价信息和/或关联对象信息类别中的至少一类有效词。
[0204]下面对获取影视的评论信息进行说明。
[0205]在具体实施过程中,获取影视的评论信息包括:
[0206]定期检测影视评论信息的更新情况,从而获取评论信息以及评论之间的关联信息,此处,评论之间的关联信息包括针对同一影视的评论信息、针对之前评论追加的评论信息等,从而动态的更新用户对该搜索对象的评价;
[0207]进一步,获取影视的评论信息还包括:
[0208]按照评论的热度,其中热度参数包括评论的回复数、点击率、被引率的数量等,去掉热度较低的评论,若热度相同,按照评论时间的先后,去掉时间靠前的评论,从而获取搜索对象的评论信息。
[0209]提取所述评论信息的有效词表,包括:
[0210]将获取的影视的评论信息存储在云端服务器;在获取了影视的评论信息后,对评论信息进行解析,通过过滤无意义词,提取出有效词,并生成有效词表。例如,对于评论信息“电影A的特技很炫”,其中“的”为无意义词,“电影A”、“特技”、“很炫”均为有效词,生成的有效词表如下面的表一所不:
[0211]
评论分类举例
属性项词场景、特效、电脑特效、恐怖片、氛围、情节、音效、配 乐、配音、画面、魔幻、3D、故事、情节、剧情、场面、
制作、化妆、来源
情感评价念念不忘、难忘、好看、最好、诱惑、吸引、不能漏掉、精 词辟、到位、经典、牛逼、惊艳、美、垃圾、废物、伤心、感
人、落泪、魅力、心灵鸡汤、惊吓、痛苦 关联影视西游记、红楼梦等
[0212]表一
[0213]下面对生成动态标签集合的过程进行说明。
[0214]在此,首先对对预先建立影视的特征词库进行说明。
[0215]预先建立影视的特征词库,包括:
[0216]获取影视的元信息;
[0217]建立影视的属性项信息的向量空间模型;[0218]建立影视的情感评价信息的向量空间模型;
[0219]建立影视的关联对象信息集合;
[0220]将所述影视的元信息、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成影视的特征词库。
[0221]在具体实施过程中,元信息包括时间信息、导演信息、演员信息等,属性项信息包括场景信息、配乐信息等,情感评价信息包括“喜欢”、“经典”、“飙泪”等,关联对象信息包括关联的影视,比如导演相同的影视、类型相同的影视或者影评中提到的对比影视等,其中,元信息一般是相对固定的,而属性项信息、情感评价信息和关联对象信息是根据评论信息的更新不断的变化的。通过预先建立包括影视的元信息、属性项信息、情感评价信息以及关联对象信息的特征词库,保证影视的信息的完整性,从而保证用户搜索时信息匹配的准确性。
[0222]在建立影视特征词库的过程中,其中建立影视的属性项信息的向量空间模型,包括:
[0223]从所述有效词表中提取属性项词表;
[0224]将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合;
[0225]确定每一所述属性项词对应的评论词;
[0226]根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
[0227]根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
[0228]根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
[0229]其中,在具体实施过程中,生成属性项词集合的包括:
[0230]预设属性项标注词表,包括表征影视的一些属性项词,比如“场景、特效、氛围、音效、配乐、配音、画面、魔幻、故事、编剧、情节、场面、制作、化妆、原著、剧情”等;
[0231]从评论信息中获取的有效词表中,通过特征提取算法(例如TF-1DF)提取属性项词表;
[0232]进一步,将预设的属性项标注词表和提取的属性项词表进行拟合,生成属性项词集合,能够保证那些出现次数少但能表征该影视的特征的属性项信息生成到特征词库中。需要说明的是,该属性项词集合是一个有限集合,因为随着评论信息的不断更新,属性项词的更新将达到饱和,当自动发现的属性词达到一定数量停止增加,就可以把这些词作为整个属性项词集合,如此,方便处理,简化过程。
[0233]确定所述属性项词对应的评论词的情感色彩类别,包括:
[0234]确定所述属性项词对应的评论词,例如,系统根据前述的属性词集合,定义一定大小的文本窗口,利用词共现的方法,确定属性项词对应的评论词;
[0235]进一步,根据预设的情感色彩分类规则,确定所述属性项词对应的评论词的情感色彩类别。例如,将情感色彩类别分为褒义、中性和贬义三种情感色彩类别,确定属性项词对应的评论词的情感色彩类别,如下面表二所示:
[0236]
【权利要求】
1.一种信息发送方法,其特征在于,该方法包括: 获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词; 将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
2.根据权利要求1所述的方法,其特征在于,预先建立搜索对象的动态标签集合,包括: 获取搜索对象的评论信息,并提取所述评论信息的有效词表; 根据所述有效词表,更新预先建立的搜索对象的特征词库; 根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
3.根据权利要求2所述的方法,其特征在于,预先建立搜索对象的特征词库,包括: 获取搜索对象的元信息集合; 建立搜索对象的属性项信息的向量空间模型; 建立搜索对象的情感评价信息的向量空间模型; 建立搜索对象的关联对象信息集合; 将所述搜索对象的元信息集合、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
4.根据权利要求3所述的方法,其特征在于,所述建立搜索对象的属性项信息的向量空间模型,包括: 获取搜索对象的属性项词集合; 确定每一所述属性项词对应的评论词; 根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别; 根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值; 根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
5.根据权利要求4所述的方法,其特征在于,所述获取搜索对象的属性项词,包括: 从所述有效词表中提取属性项词表; 将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
6.根据权利要求4所述的方法,其特征在于,所述建立搜索对象的情感评价信息的向量空间模型,包括: 从所述有效词表中提取情感评价词集合; 根据预设的情感分类规则,确定每一所述情感评价词的情感类别; 根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值; 根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
7.根据权利要求6所述的方法,其特征在于,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,包括: 将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象; 将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象; 将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象; 将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹 配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
8.根据权利要求7所述的方法,其特征在于,所述将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,包括: 确定所述属性项信息类别的检索关键词中的属性项词对应的评论词; 根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别; 根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配; 若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签; 根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
9.根据权利要求7所述的方法,其特征在于,将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,包括: 根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别; 根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配; 若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签; 根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
10.一种信息发送系统,其特征在于,该系统包括: 检索信息获取单元,用于获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词; 匹配单元,用于将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
11.根据权利要求10所述的系统,其特征在于,所述匹配单元在预先建立搜索对象的动态标签集合时,具体用于: 获取搜索对象的评论信息,并提取所述评论信息的有效词表; 根据所述有效词表,更新预先建立的搜索对象的特征词库; 根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
12.根据权利要求11所述的系统,其特征在于,所述匹配单元在预先建立搜索对象的特征词库时,具体用于: 获取搜索对象的元信息集合; 建立搜索对象的属性项信息的向量空间模型; 建立搜索对象的情感评价信息的向量空间模型; 建立搜索对象的关联对象信息集合; 将所述搜索对象的元信息集合、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
13.根据权利要求12所述的系统,其特征在于,所述匹配单元在建立搜索对象的属性项信息的向量空间模型时,具体用于: 获取搜索对象的属性项词集合; 确定每一所述属性项词对应的评论词; 根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别; 根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值; 根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
14.根据权利要求13所述的系统,其特征在于,所述匹配单元在获取搜索对象的属性项词时,具体用于: 从所述有效词表中提取属性项词表; 将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
15.根据权利要求13所述的系统,其特征在于,所述匹配单元在建立搜索对象的情感评价信息的向量空间模型时,具体用于: 从所述有效词表中提取情感评价词集合; 根据预设的情感分类规则,确定每一所述情感评价词的情感类别; 根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值; 根据所述情感评价词 、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
16.根据权利要求15所述的系统,其特征在于,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,所述匹配单元将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息时,具体用于: 将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象; 将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象; 将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象; 将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
17.根据权利要求16所述的系统,其特征在于,所述匹配单元将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配时,具体用于: 确定所述属性项信息类别的检索关键词中的属性项词对应的评论词; 根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别; 根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配; 若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签; 根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
18.根据权利要求16所述的系统,其特征在于,所述匹配单元将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配时,具体用于: 根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别; 根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配; 若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标 签作为匹配成功的动态标签; 根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
【文档编号】G06F17/30GK103886081SQ201410116639
【公开日】2014年6月25日 申请日期:2014年3月26日 优先权日:2014年3月26日
【发明者】高桂平, 王勇进, 王峰 申请人:海信集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1