一种数据处理方法、装置和用于数据处理的装置与流程

文档序号:17321924发布日期:2019-04-05 21:35阅读:180来源:国知局
一种数据处理方法、装置和用于数据处理的装置与流程

本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置和用于数据处理的装置。



背景技术:

随着互联网的普及和计算机技术的发展,人机交互技术逐渐兴起。其中,智能对话系统得到了广泛的关注,人与计算机之间的智能对话,极大地方便了用户的工作、生活及学习。借助于智能对话系统,用户可以和计算机聊天,或者要求计算机提供某些帮助等。具体地,智能对话系统可以接收用户输入的查询请求,对该查询请求进行解析,并依据对应的解析结果,确定该查询请求对应的回复。

现有的智能对话系统,针对查询请求中的某个语言单元,通常给出固定的解析结果。例如,查询请求a为“你知道卡路里吗”、查询请求b为“我在研究卡路里”、查询请求c为“跑步能消耗多少卡路里”,则现有的智能对话系统针对查询请求a、查询请求b、或者查询请求c等任意包含“卡路里”的查询请求,均给出“热量单位卡路里”的解析结果,进而依据该解析结果提供查询请求对应的回复,例如,该回复可以包括:“热量单位卡路里”的介绍信息等。

然而,在实际应用中,一个语言单元可能具有多种含义表达。例如,“卡路里”对应的含义表达除了包括:“热量单位卡路里”之外,还可以包括:“歌曲卡路里”等。因此,固定地向用户提供“热量单位卡路里”的介绍信息,可能并不符合用户需求。



技术实现要素:

本发明实施例提供一种数据处理方法、装置和用于数据处理的装置,可以得到与当前环境最匹配的反馈结果,因此可以提高反馈结果与用户需求之间的匹配度。

为了解决上述问题,本发明实施例公开了一种数据处理方法,包括:

接收请求,获取所述请求包括的实体;

判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;

在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;

输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

另一方面,本发明实施例公开了一种数据处理装置,包括:

请求处理模块,用于接收请求,获取所述请求包括的实体;

实体属性判断模块,用于判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;

目标实体属性确定模块,用于在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;以及

目标实体属性输出模块,用于输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

再一方面,本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

接收请求,获取所述请求包括的实体;

判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;

在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;

输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的数据处理方法。

本发明实施例包括以下优点:

本发明实施例针对请求中包括的实体,判断该实体在第一时间段内的实体属性与该实体在第二时间段内的实体属性是否相同,在判断结果为否的情况下,可以说明该实体的实体属性随着时间段的变化发生了变化,故依据该实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;其中,目标实体属性可以表征与当前环境最匹配的实体属性,本发明实施例确定并输出的目标实体属性,可以得到与当前环境最匹配的反馈结果,因此可以提高反馈结果与用户需求之间的匹配度。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种数据处理方法的应用环境的结构示意图;

图2是本发明的一种数据处理方法实施例的步骤流程图;

图3是本发明的一种数据处理装置实施例的结构框图;

图4是本发明的一种用于数据处理的装置800的框图;及

图5是本发明的一些实施例中服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种数据处理方法,该方法可以包括:接收请求,获取所述请求包括的实体;判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;以及输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

本发明实施例中,实体是一个具体事物或概念。实体一般会划分类型,例如人物类实体、电影类实体等。同一个实体可以对应多个实体实例,实体实例可以是在网络(或其它媒介)中对一个实体的描述性页面(内容),例如百科的页面中即包含实体对应的实体实例。

可选地,实体可以包括:命名实体(namedentity),命名实体可以指人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的命名实体还可以包括:书名、歌曲名、影视剧名、产品名、品牌名、数字、日期、货币、地址等等。

实体属性可以指实体的属性,也即实体所表征的意义。本发明实施例经研究发现,某些实体的实体属性并不是一成不变的,随着时间的推移,有些实体的实体属性可能会发生变化,例如产生新的实体属性。而目前的智能对话系统针对查询请求中的某个语言单元,一般会给出固定的解析结果,由于固定的解析结果无法反映实体属性随时间发生变化的规律,因此可能无法满足用户需求。

而本发明实施例中,针对请求中包括的实体,判断该实体在第一时间段内的实体属性与该实体在第二时间段内的实体属性是否相同,在判断结果为否的情况下,可以说明该实体的实体属性随着时间发生了变化,故依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;其中,目标实体属性可以表征该实体与当前环境最匹配的实体属性。本发明实施例确定并输出的目标实体属性,可以得到与当前环境最匹配的反馈结果,因此可以提高反馈结果与用户需求之间的匹配度。上述当前环境可以包括:当前时间。

可选地,上述搜索结果数据可以获取时效性较强的信息,作为搜索结果项,和/或,上述搜索结果数据中多个搜索结果项的排序因子可以包括:时效性,使得上述搜索结果数据可以反映不同的搜索结果项在时效性方面的差异,而搜索结果项涉及的实体可以与实体属性相应。故本发明实施例依据上述搜索结果数据得到的目标实体属性,可以具有较强的时效性,因此可以与当前环境相匹配。而大多数用户关注的是时效性较强的信息,因此,本发明实施例可以提高目标实体属性与用户意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户需求。

可选地,所述搜索结果数据可以包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。多个搜索结果项可以对应实体对应的搜索结果项的全部或者部分。

可选地,多个搜索结果项可以对应实体对应的搜索结果项的部分,例如,多个搜索结果项可以为前n个搜索结果项。n可以为自然数,例如,n可以为10、20等数值。上述排序位置可以为绝对位置,也可以为相对位置。例如,n个搜索结果项中的每一个分别排在n个搜索结果项中的第i位。i为自然数,1≤i≤n。

前n个搜索结果项中每个搜索结果项可以对应有实体属性,而每个搜索结果项的排序位置可以反映其所对应实体属性的时效性,例如排序位置靠前的搜索结果项对应的实体属性的时效性可以强于排序位置靠后的搜索结果项对应的实体属性的时效性等等,因此,本发明实施例可以依据实体在预设时间段内的搜索结果数据,确定出与当前环境最匹配的目标实体属性。

对于上述预设时间段、或者第一时间段、或者第二时间段等时间段而言,其起始时间、终止时间和时间段长度,可由本领域技术人员根据实际应用需求确定。时间段长度的单位可以为:月、天、时间、分钟、或者秒等。

上述预设时间段可以包括:第一时间段、或者第一时间段和第二时间段。

第一时间段可以指当前时间对应的时间段。当前时间可以指用于执行本发明实施例的数据处理方法的机器对应的当前时间。例如,第一时间段可以指当月、当天、当天的某个小时等。实体在第一时间段内对应的搜索结果数据可以反映该实体在第一时间段内对应的实体属性对应的时效性,因此可以作为目标实体属性的确定依据。

第二时间段可以指历史时间对应的时间段。第二时间段的终止时间可以早于第一时间段的起始时间。例如,第二时间段可以指过去的月、天、或者小时等。可以理解,第一时间段的时间段长度与第二时间段的时间段长度可以相同或者不同。另外,第二时间段可以为一个或者多个。

本发明实施例可以综合利用实体在第一时间段和第二时间段内分别对应的搜索结果数据,挖掘该实体的实体属性随时间发生变化的规律,进而可以确定该实体包括的与当前环境最匹配的目标实体属性。

在本发明的一种应用示例1中,例如请求中包括实体“卡路里”,按照常识,实体“卡路里”对应的实体属性为“热量单位卡路里”。

假设第一时间段为最近半年,第二时间段为半年前的一定时间段。分别获取实体“卡路里”最近半年的搜索结果数据和半年前的一定时间段内的搜索结果数据,假设实体“卡路里”在最近半年对应的搜索结果数据中体现的实体属性包括:“热量单位卡路里”和“歌曲卡路里”,实体“卡路里”在半年前的一定时间段内对应搜索结果数据中体现的实体属性包括:“热量单位卡路里”。而且实体“卡路里”在第一时间段内即最近半年的搜索结果数据表明,最近半年内“歌曲卡路里”的时效性强于“热量单位卡路里”的时效性,则可以确定实体“卡路里”的实体属性随着时间发生了变化,出现了新的实体属性“歌曲卡路里”,且新的实体属性“歌曲卡路里”的时效性强于常规实体属性“热量单位卡路里”的时效性;因此可以确定实体“卡路里”与当前环境最匹配的目标实体属性为:“歌曲卡路里”。

可以理解,本发明实施例的当前环境还可以包括:当前语境,此种情况下,可以依据所述实体在预设时间段内的搜索结果数据、以及所述实体在请求中对应的上下文,确定所述实体对应的目标实体属性。

根据一种实施例,上下文可以指请求中与实体相邻的文本,如位于实体之前的上文、或者位于实体之后的下文等。根据另一种实施例,上下文可以指对话中与请求相邻的内容,如位于请求之前的上文、或者位于请求之后的下文等。上下文可以反映实体对应的语境,因此将上下文作为目标实体属性的确定依据,可以提高目标实体属性与用户需求之间的匹配度。

例如,在应用示例1中,假设用户a的请求a为“你知道卡路里吗”、用户b的请求b为“我在研究卡路里”、以及用户c的请求c为“跑步能消耗多少卡路里”,则综合利用实体“卡路里”在预设时间段内的搜索结果数据、以及实体“卡路里”在请求中的上下文,可以确定请求a对应的目标实体属性为“歌曲卡路里”,确定请求b对应的目标实体属性为“歌曲卡路里”,以及确定请求c对应的目标实体属性为“热量单位卡路里”。可见,本发明实施例可以针对不同的上下文得到相同或者不同的目标实体属性。

可以理解,本发明实施例的当前环境还可以包括:用户属性,此种情况下,可以依据所述实体在预设时间段内的搜索结果数据、以及所述用户属性,确定所述实体对应的目标实体属性。

用户属性可以指用户具有的属性。将用户属性作为目标实体属性的确定依据,可以使得目标实体属性满足用户的个性化需求。

可选地,用户属性可以包括如下属性中的至少一种:场景属性、偏好属性和静态属性。

其中,场景属性可以包括用户所在的实时场景,如用户正在跑步、用户刚起床、用户在家、用户在单位等。或者,场景属性可以包括用户偏好的场景,如用户喜欢跑步等。

静态属性为相对稳定的属性,如用户的年龄、性别、地域、学历、商圈、职业、婚姻、消费等级、用户身份等。其中,用户身份可以指用户在社会行业中的身份,如医生、教师等用户职业。用户身份还可以指用户在家庭中的角色,如爸爸、妈妈、孩子等。

相对于上述静态属性的相对稳定性,场景属性和偏好属性通常具有动态性,其可以随着不断变化的用户行为而变化。

在本申请的一种可选实施例中,偏好属性可以指用户对内容的偏好属性。其中,该属性可以随着用户对于内容的行为(浏览行为、搜索行为、收藏行为、保存行为、关注行为、选择行为和评价行为中的至少一种)而变化。偏好属性的例子可以包括:喜欢游戏、喜欢音乐等。

例如,在应用示例1中,假设用户a和用户b的请求中均包括“卡路里”,但用户a经常听音乐,因此可以确定用户a的用户属性包括“音乐”,因此可以确定用户a对应的目标实体属性包括“歌曲卡路里”。假设用户b最近在减肥,因此,可以确定用户b对应的目标实体属性包括“热量单位卡路里”。

可以理解,本发明实施例可以依据所述实体在预设时间段内的搜索结果数据、所述实体在请求中对应的上下文、以及用户属性,确定所述实体对应的目标实体属性。

本发明实施例适用的场景可以包括:对话场景、问答场景等。其中,对话场景可以为智能对话场景、或者普通对话场景。其中,智能对话场景可用于在人与计算机之间生成自然无缝对接的对话,智能对话场景下的请求可以为用户发送的请求,普通对话场景下的请求可以为通信对端发送的请求。问答场景下的请求可以为用户发布的问题,例如,用户在问答网站发布的问题等。可以理解,本发明实施例的请求可以为任意场景下的请求,本发明实施例对于具体的场景和请求不加以限制。

本申请实施例提供的数据处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务器200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务器200进行数据交互。

可选地,客户端100可以运行在设备上,例如,客户端100可以为设备上运行的app,如短信息app、电子商务app、即时通讯app、输入法app、或者操作系统自带的app等,本申请实施例对于客户端所对应的具体app不加以限制。可选地,上述客户端100可以基于人工智能技术实现控制功能。

可选地,上述设备具体可以包括但不限于:智能手机、平板电脑、电子书阅读器、mp3(动态影像专家压缩标准音频层面3,movingpictureexpertsgroupaudiolayeriii)播放器、mp4(动态影像专家压缩标准音频层面4,movingpictureexpertsgroupaudiolayeriv)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备、智能音响等等。可以理解,本申请实施例对于具体的设备不加以限制。

方法实施例

参照图2,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括如下步骤:

步骤201、接收请求,获取所述请求包括的实体;

步骤202、判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段可以为当前时间对应的时间段,所述第二时间段可以早于所述第一时间段;

步骤203、在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;

步骤204、输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

图2所示实施例的至少一个步骤可由服务器和/或客户端执行,当然本发明实施例对于各个步骤的具体执行主体不加以限制。

在步骤201中,客户端可以通过语音输入方式、键盘输入方式等输入方式,接收用户输入的请求。或者,客户端可以接收通信对端发送的信息,并依据该信息得到请求。可以理解,本发明实施例对于具体的请求不加以限制。

本发明实施例可以假定请求呈现为文本形式。对于呈现为非文本形式的请求,可以将非文本形式的请求转换为文本形式的请求。例如,可以通过语音识别技术,将语音形式的请求转换为文本形式的请求。又如,可以对图片形式的请求进行ocr(光学字符识别,opticalcharacterrecognition),以得到文本形式的请求。

步骤202中,可以采用ner(命名实体识别,namedentityrecognition)方法,确定所述请求中的实体。

根据一种实施例,ner方法可以包括:基于词库的方法。基于词库的方法可以根据词组出现的频率对高频词构建实体库,对于可以在实体库中检索到的词直接将其识别为实体。其中,词组可以指两个或更多词的组合。在实际应用中,可以从互联网抓取实体相关数据,并对实体相关数据进行分析,以得到对应的实体词,并将该实体词存储至实体库,本发明实施例对于具体的实体词及其获取方式不加以限制。

根据另一种实施例,ner方法可以包括:基于规则的方法。基于规则的方法可以根据词组的组成规则,将请求中满足相应规则的词组标注为实体。

根据再一种实施例,ner方法可以包括:基于统计学习的方法。基于统计学习的方法将命名实体识别看作一个分类问题,采用类似svm(支持向量机,supportvectormachine)、贝叶斯等分类方法;或者,将命名实体识别看作一个序列标注问题,采用hmm(隐马尔科夫模型,hiddenmarkovmodel)、最大熵模型(maximumentropymodel)、crf(条件随机场,conditionalrandomfieldalgorithm)、lstm(长短期记忆网络,longshort-termmemory)模型等序列标注模型。

在本申请的一种实施例中,确定所述请求中的实体的过程可以包括:确定请求的文本特征,然后利用ner方法确定该文本特征对应的实体。其中,该文本特征可以是请求对应的词特征、上下文特征、词与词之间的关系特征等,其中,可以对请求进行分词后得到词,如对请求“你知道卡路里吗”进行分词得“我”、“最近”、“对”、“卡路里”和“感兴趣”,分别对各个词进行命名实体识别,可以得到实体“卡路里”。

可以理解,前述的ner方法和确定所述请求中的实体的过程只是作为可选实施例,实际上,本领域技术人员可以根据实际应用需求,采用所需的ner方法、以及确定所述请求中的实体的过程,本申请实施例对于具体的ner方法和确定所述请求中的实体的具体过程不加以限制。

根据一种实施例,步骤202可以爬取与实体相关的网页,依据网页的内容,确定该实体在第一时间段内的实体属性、以及该实体在第二时间段内的实体属性。例如,可以周期性爬取与实体相关的网页,依据爬取网页的内容,确定当前周期内该实体的实体属性,并保存周期及其实体与实体属性的对应关系。由此,可以根据当前周期与第一时间段或者第二时间段与周期之间的关系,分别确定第一时间段内实体对应的实体属性、以及第二时间段内实体对应的实体属性。

在实际应用中,网页的爬取难度高、运算量大,这导致第一时间段内实体的实体属性、以及第二时间段内实体的实体属性对应的确定效率较低。

根据另一种实施例,步骤202可以依据所述请求中的实体在预设时间段内对应的搜索结果数据,确定第一时间段内该实体的实体属性、以及第二时间段内该实体的实体属性。

本发明实施例中,服务器日志(serverlog)为服务器的日常功能。服务器日志是一个或多个由服务器自动创建和维护的日志文件,其中包含其所执行活动的列表。搜索日志可以为服务器日志的一种,也即,服务器可以通过搜索日志记录搜索请求对应的搜索结果数据。可选地,搜索日志可以记录全网用户的搜索请求、搜索请求对应的多个搜索结果项、以及多个搜索结果项的位置。

相对于爬取与实体相关的网页,本发明实施例可以直接利用搜索日志中记录的搜索结果数据,确定第一时间段内实体的实体属性、以及第二时间段内实体的实体属性,可以降低各时间段内实体对应的实体属性的确定难度,且可以提高实体对应的实体属性的确定效率。

在本发明的一种可选实施例中,可以将请求中的实体与搜索日志中的搜索请求进行匹配,以得到请求中的实体对应的搜索结果数据;也可以直接将请求中包括的实体输入搜索引擎,搜索得到该实体对应的搜索结果数据。搜索结果数据中的每一个搜索结果项可以对应有标题、摘要、页面等特征,本发明实施例对于搜索结果项对应的特征进行分析,以得到与实体相关的实体属性。

在本发明的一种可选实施例中,上述方法还可以包括:分别获取所述实体在第一时间段内的搜索结果数据中包括的多个搜索结果项、以及在第二时间段内的搜索结果数据中包括的多个搜索结果项;依据所述第一时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第一时间段内的实体属性;依据所述第二时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第二时间段内的实体属性。

本发明实施例可以依据所述实体在第一时间段内的搜索结果数据,确定所述实体在第一时间段内的实体属性。具体地,可以对实体在第一时间段内的搜索结果数据进行分析,确定该实体的实体属性a。

本发明实施例可以依据所述实体在第二时间段内的搜索结果数据,确定所述实体在第二时间段内的实体属性。具体地,对该实体在第二时间段内的搜索结果数据进行分析,确定该实体的实体属性b。

根据一种实施例,可以通过第一实体属性集合记录实体属性a。可以将实体在第一时间段内的搜索结果数据涉及的一个或者多个实体属性a,保存在第一实体属性集合中。同理,可以通过第二实体属性集合记录实体属性b。可以将实体在第二时间段内的搜索结果数据涉及的一个或者多个实体属性b,保存在第二实体属性集合中。也即,只要搜索结果数据涉及实体属性,则可以将涉及的实体属性保存在对应的实体属性集合。

根据另一种实施例,可以对搜索结果数据涉及的实体属性进行筛选,以得到重要性较高的实体属性。也即,本发明实施例的实体属性集合可以记录:相应时间段内n个搜索结果数据涉及的所有实体属性、或者部分实体属性,其中,部分实体属性的重要性较高,重要性的确定依据可以包括:排序位置和/或占比。

搜索结果数据中每个搜索结果项可以对应有实体属性,而每个搜索结果项的排序位置可以反映其所对应实体属性的时效性,例如排序位置靠前的搜索结果项对应的实体属性的时效性可以强于排序位置靠后的搜索结果项对应的实体属性的时效性等等。因此,可选地,可以依据排序靠前的搜索结果项对应的实体属性、和/或、占比较大的搜索结果项对应的实体属性,确定实体属性。占比可以指实体属性对应的搜索结果项数量相对于n个搜索结果项的比例。

具体地,可以依据第一时间段内的、排序靠前的搜索结果项对应的实体属性、和/或、占比较大的搜索结果项对应的实体属性,确定该实体在第一时间段的实体属性a。同理,可以依据第二时间段内的、排序靠前的搜索结果项对应的实体属性、和/或、占比较大的搜索结果项对应的实体属性,确定该实体在第二时间段的实体属性b。

可选地,实体属性a和实体属性b可以不同。例如,实体“卡路里”对应的实体属性a为“歌曲卡路里”、对应的实体属性b为“热量单位卡路里”。

当然,实体属性a和实体属性b可以相同。本发明实施例的一个目的在于:确定实体属性随着时间发生变化的实体。故在实体属性a和实体属性b不同的情况下,可以认为实体属性随着时间发生了变化,故可以提供时效性更强的反馈结果,可以执行后续的步骤203和步骤204。而在实体属性a和实体属性b相同的情况下,可以认为实体属性未随着时间发生变化,可以不执行后续的步骤203和步骤204。

在本发明的一种可选实施例中,可以对第一实体属性集合与第二实体属性集合进行比较,若两个集合不同,则可以认为实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性不同。

例如,第二实体属性集合为{实体属性1},而第一实体属性集合为{实体属性1,实体属性2},由于第一实体属性集合相对于第二实体属性集合多了实体属性2,故可以认为实体属性2为实体的新的实体属性。

步骤203中,实体在预设时间段内的搜索结果数据可以反映实体属性与时效性或者热度之间的关系,尤其地,可以反映不同的实体属性在时效性方面的差异;因此,实体在预设时间段内的搜索结果数据可以作为目标实体属性的确定依据。

本发明实施例可以提供确定所述实体对应的目标实体属性的如下技术方案:

技术方案1

技术方案1中,步骤203确定所述实体对应的目标实体属性,具体可以包括:依据实体在第一时间段内的搜索结果数据中排在首位的搜索结果项对应的实体属性,确定所述实体对应的目标实体属性。

由于排在首位的搜索结果项通常具有最强的时效性,故可以将排在首位的搜索结果项对应的实体属性,作为目标实体属性的确定依据。例如,可以直接将排在首位的搜索结果项对应的实体属性,作为目标实体属性。

技术方案2

技术方案2中,步骤203确定所述实体对应的目标实体属性,具体可以包括:获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述多个搜索结果项分别对应的排序位置,从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性。

上述搜索结果数据可以获取时效性较强的信息,作为搜索结果项,和/或,上述搜索结果数据中多个搜索结果项的排序因子可以包括:时效性,使得上述搜索结果数据可以反映不同的搜索结果项在时效性方面的差异,而搜索结果项可以与实体属性相应。因此,本发明实施例可以利用不同的搜索结果项在时效性方面的差异,从所述实体对应的至少两种实体属性中确定出、所述实体对应的目标实体属性。

根据一种实施例,上述从所述实体对应的至少两种实体属性中确定出、所述实体对应的目标实体属性,具体可以包括:针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;依据所述结果特征,确定每个搜索结果项中所述实体对应的匹配度最高的第一实体属性;依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项中所述实体对应的第一实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

本发明实施例的搜索结果项的类型可以包括:网页、文档、应用程序、音乐、或者电视节目等。结果特征可用于表征搜索结果项的特性;不同类型的搜索结果项对应的结果特征可以相同,也可以不相同。例如,网页或者文档的结果特征可以表征网页或者文档的主题等;应用程序的结果特征可以表征应用程序的功能等;音乐的结果特征可以包括:作词人、歌手、以及表达的情感等特征。电视节目的结果特征可以包括:主持人、或者嘉宾、或者节目的主题等,其中主题可以指一个对象所要表现的中心思想,泛指主要内容。

可选地,上述针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征,具体可以包括:从一个搜索结果项对应的信息中,提取所述搜索结果项对应的结果特征;所述信息可以包括如下信息中的至少一种:标题、摘要和页面内容。

其中,标题和摘要可以为搜索结果页中针对搜索结果项展示的内容。

通常的搜索结果项可以对应有页面,页面可以指用户触发搜索结果项后进入的页面,本发明实施例可以对搜索结果项对应的页面内容进行分析,以得到结果特征。

本发明实施例的结果特征可以作为搜索结果项中实体与实体属性之间的匹配度的确定依据。可选地,可以将结果特征与实体属性的关键词进行匹配。

本发明实施例中,将结果特征与实体属性的关键词进行匹配的确定方式可以包括:字符串比较方式、或者词向量之间的相似度确定方式。

其中,字符串比较方式可以包括:对结果特征进行分词处理后,对结果特征包括的分词与实体属性的关键词进行字符串比较。

其中,词向量之间的相似度确定方式可以包括:对结果特征进行分词处理后,确定结果特征包括的各分词对应的词向量、以及实体属性的关键词对应的词向量,并利用相似度度量方法,确定结果特征包括的各分词对应的词向量与实体属性的关键词对应的词向量之间的相似度。

结果特征与实体属性的关键词之间的匹配度可以表征搜索结果项中实体与实体属性之间的匹配度。而所述多个搜索结果项对应的排序位置可以在一定程度上反映搜索结果项对应的时效性,因此,本发明实施例可以依据多个搜索结果项对应的排序位置和每个搜索结果项对应的匹配度最高的第一实体属性,对至少两种实体属性进行排序,以从所述至少两种实体属性中确定出目标实体属性。

在本发明的一种实施例中,可以针对每个实体属性,确定其与排在前n位的n个搜索结果项中实体之间的匹配次数,并依据该匹配次数,确定目标实体属性。例如,每个实体属性对应的匹配次数的初始值为0,若实体属性i与搜索结果项j中实体匹配(也即两者的匹配度最高),则实体属性i对应的匹配次数加1。可选地,可以选取匹配次数最多的实体属性,作为目标实体属性。或者,可以选取匹配次数最多、且相匹配的任一搜索结果项排在前p位的实体属性,作为目标实体属性;其中,p为小于n的自然数,n通常为1、2、3等数值,本发明实施例还可以要求目标实体属性对应的任一搜索结果项排在前p位,以提高目标实体属性的时效性和用户关注度。

根据另一种实施例,上述从所述实体对应的至少两种实体属性中确定出、所述实体对应的目标实体属性,具体可以包括:针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别中所述实体对应的匹配度最高的第二实体属性;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;依据每个结果项类别对应的排序位置、结果项数量、以及第二实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

本发明实施例可以对多个搜索结果项进行聚类,得到的结果项类别中的多个搜索结果项可以具有共性。例如,最近新出了一部作品,该作品可以为电影、歌曲、电视剧等,该作品的标识与实体的标识相同,则该实体可以被赋予新的实体属性。

假设实体的标识为“为你写诗”,半年前“为你写诗”的实体属性可以为歌曲a,但是最近新出了名称为“为你写诗”的电影,且“为你写诗”的电影的热度较高,因此可以为“为你写诗”赋予了“电影”属性。

在最近新出了一部作品a的情况下,多个网站可能均会报道作品a对应的新闻,本发明实施例可以通过聚类,将与作品a相关的多个新闻进行聚集。

本发明实施例可以依据具有共性的结果项类别对应的排序位置和结果项数量、以及每种结果项类别对应的第二实体属性,确定目标实体属性,以使目标实体属性对应的排序位置最优、且数量最多。其中,结果项类别对应的排序位置可以是:结果项类别所包括的搜索结果项的位置中、最靠前的位置,或者,排序位置可以是:结果项类别所包括的搜索结果项的平均位置。

例如,前p位搜索结果项均为:与作品a相关的新闻,则目标实体属性可以为作品a的属性。第二实体属性的确定过程可以参照第一实体属性的确定过程,在此不作赘述。

技术方案3

技术方案3中,步骤203确定所述实体对应的目标实体属性,具体可以包括:将所述实体在预设时间段内的搜索结果数据输入模型,并依据所述模型输出的结果,确定所述实体对应的目标实体属性;其中所述搜索结果数据可以包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。

上述模型可以为机器学习模型。从广义上讲,机器学习是一种能够赋予机器学习的能力,让它以此完成直接编程无法完成的功能的方法。但从实践的意义上讲,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。机器学习方法可以包括:决策树方法、线性回归方法、逻辑回归方法、神经网络方法、k近邻方法等,可以理解,本发明实施例对于具体的机器学习方法不加以限制。

本发明实施例的模型可以对实体样本数据进行学习,实体样本数据可以包括:符合实体属性变化条件的实体样本、以及实体样本在预设时间段内的搜索结果数据,通过对实体样本数据的学习,可以使得上述模型学习实体样本的实体属性随着时间变化的规律,进而可以使得上述模型具备目标实体属性的确定能力。

根据一种实施例,上述模型可以为分类模型,该分类模型对实体进行分类,具体地,可以将实体划分到至少两种实体属性中的一种,作为目标实体属性。根据另一种实施例,上述模型可以为排序模型。此种情况下,上述模型可以利用排序学习(learningtorank)方法,依据输入的搜索结果数据学习排序特征,并依据学习得到的排序特征、对至少两种实体属性进行排序。

在实际应用中,上述模型可以直接输出目标实体属性,或者,上述分类模型可以输出实体属于每种实体属性的概率,则可以依据该概率确定目标实体属性。

技术方案4

技术方案4中,步骤203确定所述实体对应的目标实体属性,具体可以包括:获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述实体在请求中对应的上下文和/或用户属性,确定所述实体对应的目标实体属性。

用户属性可以指用户具有的属性。将用户属性作为目标实体属性的确定依据,可以使得目标实体属性满足用户的个性化需求。

例如,假设用户a和用户b的请求中均包括“卡路里”,但用户a经常听音乐,因此可以确定用户a的用户属性包括“音乐”,因此可以确定用户a对应的目标实体属性包括“歌曲卡路里”。假设用户b最近在减肥,因此,可以确定用户b对应的目标实体属性包括“热量单位卡路里”。

上下文可以反映实体对应的语境,因此将上下文作为目标实体属性的确定依据,可以提高目标实体属性与用户需求之间的匹配度。

例如,假设用户a的请求a为“你知道卡路里吗”、用户b的请求b为“我在研究卡路里”、以及用户c的请求c为“跑步能消耗多少卡路里”,则综合利用实体“卡路里”在预设时间段内的搜索结果数据、以及实体“卡路里”在请求中的上下文,可以确定请求a对应的目标实体属性为“歌曲卡路里”,确定请求b对应的目标实体属性为“歌曲卡路里”,以及确定请求c对应的目标实体属性为“热量单位卡路里”。可见,本发明实施例可以针对不同的上下文得到相同或者不同的目标实体属性。

可选地,可以将实体在预设时间段内的搜索结果数据、所述实体在请求中对应的上下文、以及用户属性分别作为模型的输入,输入模型,并接收上述模型输出的结果。

在本发明的一种可选实施例中,还可以将用户情绪作为目标实体属性的确定依据。

本发明实施例中,情绪是指人有喜、怒、哀、乐、惧等心理体验,这种体验是人对客观事物的态度的一种反映。情绪具有肯定和否定的性质。能满足人的需要的事物会引起人的肯定性质的体验,如快乐、满意等;不能满足人需要的事物会引起人的否定性质的体验,如愤怒、憎恨、哀怨等;与需要无关的事物,会使人产生无所谓的情绪和情感。积极的情绪可以提高人的活动能力,而消极的情绪则会降低人的活动能力。部分老年人出现不良情绪的状况较多,长期情绪不好对身体健康不利,因此需要及时调节。

在本发明的一种可选实施例中,用户情绪可以包括:正面情绪、或者负面情绪,其中,正面情绪具有建设性和积极性,负面情绪具有破坏性和消极性。其中,负面情绪可以包括但不限于:焦虑、紧张、愤怒、沮丧、悲伤、痛苦等。正面情绪可以包括但不限于:开心、乐观、自信、欣赏、放松等。可选地,用户情绪还可以包括:中性情绪,中性情绪可以包括但不限于:平静、无所谓、冷淡、惊奇等。

本发明实施例依据用户的语音数据、和/或、图像数据,确定用户情绪。可选地,情绪检测方法可以包括:模式分类方法,该模式分类方法通过特征提取、模型训练和模型检测等环节,实现对于语音数据、和/或、图像数据的情绪检测。

通常用户对于内容的需求在不同的情绪下是有区别的,例如,用户在兴奋时喜欢快节奏的音乐,在失落时需要平淡的音乐。本发明实施例将用户情绪作为目标实体属性的确定依据,可以提升用户体验。

在本发明的一种可选实施例中,可以保存用户情绪与实体属性之间的映射关系,这样可以依据用户情绪,在该映射关系中进行查找,以实现依据用户情绪对实体属性进行筛选的作用。

可选地,可以对用户的历史内容进行分析,以得到用户情绪与实体属性之间的映射关系,这样可以使得用户情绪对应的实体属性符合用户的个性化习惯。例如,负面情绪对应的实体属性可以包括:电商领域,以使用户通过购物释放情绪;而正面情绪对应的实体属性可以包括:教育学习领域等,以使用户在心情舒畅的情况下学习、进而可以提高学习效率。

步骤204中,假设本发明实施例应用于智能对话系统,则可以向智能对话系统的下游设备输出所述目标实体属性,以使该下游设备根据所述目标实体属性确定所述请求对应的反馈结果,由于该目标实体属性与当前环境相匹配,故可以提高反馈结果的准确度。

在智能对话场景中,可以向用户提供语音类型的反馈结果,以提升用户体验。当然,本发明实施例对于反馈结果的具体类型不加以限制,例如,反馈结果的类型还可以包括:文本、图片、音乐、或者视频等。

例如,在目标实体属性为“歌曲卡路里”的情况下,反馈结果可以包括:“歌曲卡路里”的播放链接、或者介绍信息(如演唱者等)。

又如,请求为“我听说无双不错”,则本发明实施例在实体“无双”对应的实体属性发生变化的情况下,可以确定实体“无双”对应的至少两种实体属性:“主持人无双”、“动漫角色无双”、“主题曲无双”和“电影无双”等,并从至少两种实体属性中确定出目标实体属性“电影无双”,并确定反馈结果:“电影无双”的播放链接、或者介绍信息(如演员、影评等)。

综上,本发明实施例的数据处理方法,判断第一时间段内的实体属性与第二时间段内的实体属性是否相同,在判断结果为否的情况下,可以说明在实体属性随着时间段的变化发生了变化,故依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;其中,目标实体属性可以表征与当前环境最匹配的实体属性,本发明实施例确定并输出的目标实体属性,可以得到与当前环境最匹配的反馈结果,因此可以提高反馈结果与用户需求之间的匹配度。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

装置实施例

参照图3,示出了本发明的一种数据处理装置实施例的结构框图,具体可以包括:请求处理模块301、实体属性判断模块302、目标实体属性确定模块303和目标实体属性输出模块304;

其中,请求处理模块301,用于接收请求,获取所述请求可以包括的实体;

实体属性判断模块302,用于判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;

目标实体属性确定模块303,用于在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;以及

目标实体属性输出模块304,用于输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

可选地,所述目标实体属性确定模块303可以包括:

第一搜索结果项获取模块,用于获取所述实体在预设时间段内的搜索结果数据中可以包括的多个搜索结果项;

属性确定模块,用于依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述多个搜索结果项分别对应的排序位置,从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性。

可选地,所述属性确定模块可以包括:

第一提取模块,用于针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

第一实体属性确定模块,用于依据所述结果特征,确定每个搜索结果项中所述实体对应的匹配度最高的第一实体属性;

第一确定模块,用于依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项中所述实体对应的第一实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

可选地,所述属性确定模块可以包括:

第二提取模块,用于针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

聚类模块,用于依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;

第二实体属性确定模块,用于依据每个结果项类别可以包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别中所述实体对应的匹配度最高的第二实体属性;其中,所述结果项类别对应的排序位置由所述结果项类别可以包括的搜索结果项的排序位置确定;

第二确定模块,用于依据每个结果项类别对应的排序位置、结果项数量、以及第二实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

可选地,所述目标实体属性确定模块303可以包括:

模型处理模块,用于将所述实体在预设时间段内的搜索结果数据输入模型,并依据所述模型输出的结果,确定所述实体对应的目标实体属性;其中所述搜索结果数据可以包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。

可选地,所述目标实体属性确定模块303可以包括:

第二搜索结果项获取模块,用于获取所述实体在预设时间段内的搜索结果数据中可以包括的多个搜索结果项;

多维确定模块,用于依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述实体在所述请求中对应的上下文和/或用户属性,确定所述实体对应的目标实体属性。

可选地,所述装置还可以包括:

第三搜索结果项获取模块,用于分别获取所述实体在第一时间段内的搜索结果数据中可以包括的多个搜索结果项、以及在第二时间段内的搜索结果数据中可以包括的多个搜索结果项;

第一时间段实体属性确定模块,用于依据所述第一时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第一时间段内的实体属性;

第二时间段实体属性确定模块,用于依据所述第二时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第二时间段内的实体属性。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本发明实施例提供了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收请求,获取所述请求包括的实体;判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

图4是根据一示例性实施例示出的一种用于数据处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(i/o)的接口812,传感器组件814,以及通信组件816。

处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当装置800处于操作模式,如呼叫模式、记录模式和语音数据处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。

i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频数据处理(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

图5是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图2所示的数据处理方法。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:接收请求,获取所述请求包括的实体;判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

本发明实施例公开了a1、一种数据处理方法,所述方法包括:

接收请求,获取所述请求包括的实体;

判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;

在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;

输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

a2、根据a1所述的方法,所述确定所述实体对应的目标实体属性,包括:

获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;

依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述多个搜索结果项分别对应的排序位置,从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性。

a3、根据a2所述的方法,所述从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性,包括:

针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

依据所述结果特征,确定每个搜索结果项中所述实体对应的匹配度最高的第一实体属性;

依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项中所述实体对应的第一实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

a4、根据a2所述的方法,所述从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性,包括:

针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;

依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别中所述实体对应的匹配度最高的第二实体属性;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;

依据每个结果项类别对应的排序位置、结果项数量、以及第二实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

a5、根据a1所述的方法,所述确定所述实体对应的目标实体属性,包括:

将所述实体在预设时间段内的搜索结果数据输入模型,并依据所述模型输出的结果,确定所述实体对应的目标实体属性;其中所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。

a6、根据a1所述的方法,所述确定所述实体对应的目标实体属性,包括:

获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;

依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述实体在所述请求中对应的上下文和/或用户属性,确定所述实体对应的目标实体属性。

a7、根据a1所述的方法,所述方法还包括:

分别获取所述实体在第一时间段内的搜索结果数据中包括的多个搜索结果项、以及在第二时间段内的搜索结果数据中包括的多个搜索结果项;

依据所述第一时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第一时间段内的实体属性;

依据所述第二时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第二时间段内的实体属性。

本发明实施例公开了b8、一种数据处理装置,包括:

请求处理模块,用于接收请求,获取所述请求包括的实体;

实体属性判断模块,用于判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;

目标实体属性确定模块,用于在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;以及

目标实体属性输出模块,用于输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

b9、根据b8所述的装置,所述目标实体属性确定模块包括:

第一搜索结果项获取模块,用于获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;

属性确定模块,用于依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述多个搜索结果项分别对应的排序位置,从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性。

b10、根据b9所述的装置,所述属性确定模块包括:

第一提取模块,用于针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

第一实体属性确定模块,用于依据所述结果特征,确定每个搜索结果项中所述实体对应的匹配度最高的第一实体属性;

第一确定模块,用于依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项中所述实体对应的第一实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

b11、根据b9所述的装置,所述属性确定模块包括:

第二提取模块,用于针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

聚类模块,用于依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;

第二实体属性确定模块,用于依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别中所述实体对应的匹配度最高的第二实体属性;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;

第二确定模块,用于依据每个结果项类别对应的排序位置、结果项数量、以及第二实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

b12、根据b8所述的装置,所述目标实体属性确定模块包括:

模型处理模块,用于将所述实体在预设时间段内的搜索结果数据输入模型,并依据所述模型输出的结果,确定所述实体对应的目标实体属性;其中所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。

b13、根据b8所述的装置,所述目标实体属性确定模块包括:

第二搜索结果项获取模块,用于获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;

多维确定模块,用于依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述实体在所述请求中对应的上下文和/或用户属性,确定所述实体对应的目标实体属性。

b14、根据b8所述的装置,所述装置还包括:

第三搜索结果项获取模块,用于分别获取所述实体在第一时间段内的搜索结果数据中包括的多个搜索结果项、以及在第二时间段内的搜索结果数据中包括的多个搜索结果项;

第一时间段实体属性确定模块,用于依据所述第一时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第一时间段内的实体属性;

第二时间段实体属性确定模块,用于依据所述第二时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第二时间段内的实体属性。

本发明实施例公开了c15、一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

接收请求,获取所述请求包括的实体;

判断所述实体在第一时间段内的实体属性与所述实体在第二时间段内的实体属性是否相同;所述第一时间段为当前时间对应的时间段,所述第二时间段早于所述第一时间段;

在判断结果为否的情况下,依据所述实体在预设时间段内的搜索结果数据,确定所述实体对应的目标实体属性;

输出所述目标实体属性,以根据所述目标实体属性确定所述请求对应的反馈结果。

c16、根据c15所述的装置,所述确定所述实体对应的目标实体属性,包括:

获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;

依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述多个搜索结果项分别对应的排序位置,从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性。

c17、根据c16所述的装置,所述从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性,包括:

针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

依据所述结果特征,确定每个搜索结果项中所述实体对应的匹配度最高的第一实体属性;

依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项中所述实体对应的第一实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

c18、根据c16所述的装置,所述从所述实体对应的至少两种实体属性中确定出所述实体对应的目标实体属性,包括:

针对所述多个搜索结果项,分别提取每个搜索结果项对应的结果特征;

依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;

依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别中所述实体对应的匹配度最高的第二实体属性;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;

依据每个结果项类别对应的排序位置、结果项数量、以及第二实体属性,从所述实体对应的至少两种实体属性中确定出目标实体属性。

c19、根据c15所述的装置,所述确定所述实体对应的目标实体属性,包括:

将所述实体在预设时间段内的搜索结果数据输入模型,并依据所述模型输出的结果,确定所述实体对应的目标实体属性;其中所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。

c20、根据c15所述的装置,所述确定所述实体对应的目标实体属性,包括:

获取所述实体在预设时间段内的搜索结果数据中包括的多个搜索结果项;

依据所述多个搜索结果项中所述实体分别对应的实体属性、以及所述实体在所述请求中对应的上下文和/或用户属性,确定所述实体对应的目标实体属性。

c21、根据c15所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

分别获取所述实体在第一时间段内的搜索结果数据中包括的多个搜索结果项、以及在第二时间段内的搜索结果数据中包括的多个搜索结果项;

依据所述第一时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第一时间段内的实体属性;

依据所述第二时间段内的多个搜索结果项中所述实体分别对应的实体属性,确定所述实体在第二时间段内的实体属性。

本发明实施例公开了d22、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如a1至a7中一个或多个所述的数据处理方法

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

以上对本发明所提供的一种数据处理方法、一种数据处理装置和一种用于数据处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1