1.一种信息处理方法,包括:
从数据源获取指定领域的对象数据;
从所述对象数据中提取多个对象;以及
基于所述对象数据,确定所述多个对象之间是否具有竞争关系。
2.如权利要求1所述的信息处理方法,其中,确定所述多个对象之间是否具有竞争关系的步骤包括:
对于所述多个对象中的每个对象,识别所述对象数据中是否存在与所述对象在预定距离内共现的共现对象、以及所述对象数据中是否存在与所述对象和所述共现对象对应的第一指示词,所述第一指示词表示所述对象与所述共现对象之间可能存在竞争关系;
当识别出所述对象数据中存在所述共现对象与所述第一指示词时,将所述共现对象确定为候选对象;
识别所述对象数据中是否存在与所述对象和所述候选对象对应的第二指示词和与所述对象和所述候选对象对应的第三指示词中的至少一个,所述第二指示词表示所述对象与所述候选对象之间存在互补关系,所述第三指示词表示所述对象与所述候选对象之间存在替换关系;以及
当识别出所述对象数据中存在所述第二指示词和所述第三指示词中的至少一个时,基于所述第二指示词和所述第三指示词中的所述至少一个,过滤所述候选对象,以得到与所述对象之间存在竞争关系的对象。
3.如权利要求2所述的信息处理方法,其中,过滤所述候选对象的步骤包括以下中的至少一个:
当识别出所述对象数据中存在所述第二指示词时,删除与所述第二指示词对应的候选对象;
当识别出所述对象数据中存在所述第三指示词时,删除与所述第三指示词对应的候选对象,并基于所述对象数据的生成时间确定与所述对象之间存在竞争关系的对象。
4.如权利要求1所述的信息处理方法,其中,确定所述多个对象之间是否具有竞争关系的步骤包括:
计算所述多个对象的特征之间的特征相似度,所述特征表示对象的规格 说明中提供的关于所述对象的物理特征和功能特征;
计算所述多个对象的评价方面之间的评价方面相似度,所述评价方面表示用户评论中出现的关于对象的可评价的产品特性;以及
基于所述特征相似度和所述评价方面相似度,确定所述多个对象之间是否具有竞争关系。
5.如权利要求4所述的信息处理方法,其中,
计算所述多个对象的特征之间的特征相似度的步骤包括:
从所述对象数据中提取每个对象的每个特征的特征值;以及
基于特征与特征值对的文本相似度、语义相似度和值相似度中的至少一个,计算所述多个对象的特征之间的特征相似度;
计算所述多个对象的评价方面之间的评价方面相似度的步骤包括:
从所述对象数据中提取每个对象的每个评价方面的观点,所述观点表示用户对对象的评价方面而表达的主观判断;以及
基于评价方面与观点对的文本相似度和语义相似度中的至少一个,计算所述多个对象的评价方面之间的评价方面相似度。
6.一种信息处理装置,包括:
获取模块,从数据源获取指定领域的对象数据;
提取模块,从所述对象数据中提取多个对象;以及
确定模块,基于所述对象数据,确定所述多个对象之间是否具有竞争关系。
7.如权利要求6所述的信息处理装置,其中,所述确定模块包括:
第一识别模块,对于所述多个对象中的每个对象,识别所述对象数据中是否存在与所述对象在预定距离内共现的共现对象、以及所述对象数据中是否存在与所述对象和所述共现对象对应的第一指示词,所述第一指示词表示所述对象与所述共现对象之间可能存在竞争关系;
候选确定模块,当识别出所述对象数据中存在所述共现对象与所述第一指示词时,将所述共现对象确定为候选对象;
第二识别模块,识别所述对象数据中是否存在与所述对象和所述候选对象对应的第二指示词和与所述对象和所述候选对象对应的第三指示词中的至少一个,所述第二指示词表示所述对象与所述候选对象之间存在互补关系,所述第三指示词表示所述对象与所述候选对象之间存在替换关系;以及
过滤模块,当识别出所述对象数据中存在所述第二指示词和所述第三指示词中的至少一个时,基于所述第二指示词和所述第三指示词中的所述至少一个,过滤所述候选对象,以得到与所述对象之间存在竞争关系的对象。
8.如权利要求7所述的信息处理装置,其中,所述过滤模块被配置为执行以下中的至少一个:
当识别出所述对象数据中存在所述第二指示词时,删除与所述第二指示词对应的候选对象;
当识别出所述对象数据中存在所述第三指示词时,删除与所述第三指示词对应的候选对象,并基于所述对象数据的生成时间确定与所述对象之间存在竞争关系的对象。
9.如权利要求6所述的信息处理装置,其中,所述确定模块包括:
第一计算模块,计算所述多个对象的特征之间的特征相似度,所述特征表示对象的规格说明中提供的关于所述对象的物理特征和功能特征;
第二计算模块,计算所述多个对象的评价方面之间的评价方面相似度,所述评价方面表示用户评论中出现的关于对象的可评价的产品特性;以及
竞争关系确定模块,基于所述特征相似度和所述评价方面相似度,确定所述多个对象之间是否具有竞争关系。
10.如权利要求9所述的信息处理装置,其中,
所述第一计算模块包括:
特征值提取模块,从所述对象数据中提取每个对象的每个特征的特征值;以及
特征相似度计算模块,基于特征与特征值对的文本相似度、语义相似度和值相似度中的至少一个,计算所述多个对象的特征之间的特征相似度;
所述第二计算模块包括:
观点提取模块,从所述对象数据中提取每个对象的每个评价方面的观点,所述观点表示用户对对象的评价方面而表达的主观判断;以及
评价方面相似度计算模块,基于评价方面与观点对的文本相似度和语义相似度中的至少一个,计算所述多个对象的评价方面之间的评价方面相似度。