一种数据处理方法、服务器及计算机可读介质与流程

文档序号:16329487发布日期:2018-12-19 06:06阅读:152来源:国知局
一种数据处理方法、服务器及计算机可读介质与流程

本申请涉及计算机技术领域,尤其涉及一种数据处理方法、服务器及计算机可读介质。

背景技术

在传统的信息查询和检索系统中,系统需要获取用户输入的指定关键词,才可以为用户定位出目标信息以推送给用户进行查阅。并且,在用户需要针对特定领域或者行业查询信息时,用户输入的关键词的准确性会直接影响系统输出的查询结果。然而,在用户对特定领域或者行业不了解时,用户输入准确的信息会较为困难,这就导致系统根据用户输入的关键词所推送的信息也会出现偏差。



技术实现要素:

本申请实施例提供了一种数据处理方法、服务器及计算机可读介质,可以使得为用户推送的消息更为精确。

第一方面,本申请实施例提供了一种数据处理方法,包括:

接收终端发送的原始数据,并对所述原始数据进行处理得到目标数据;从所述目标数据中确定出至少一个关键词,并统计所述至少一个关键词中各个关键词的词频;根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合;发送所述推荐信息集合至所述终端。

可选地,所述对所述原始数据进行处理得到目标数据,包括:对所述原始数据进行同义词标准化处理,得到目标数据;和/或对所述原始数据进行错误修复处理,得到目标数据。

可选地,所述从所述目标数据中确定出至少一个关键词,包括:对所述目标数据进行命名实体识别处理,得到至少一个命名实体;对所述至少一个命名实体进行分词,得到至少一个关键词。

可选地,所述根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息模型以构成推荐信息集合,包括:根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度;根据计算得到的相似度,从所述各个待推荐信息中确定出目标待推荐信息;所述目标待推荐信息与所述各个关键词的相似度大于或等于预设相似度;利用所述目标待推荐信息构成推荐信息集合。

可选地,所述根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度,包括:根据所述各个关键词的词频计算出各个关键词的权重,并利用所述各个关键词的权重构成目标向量;根据所述目标向量与数据库中每一个待推荐信息模型,计算出所述各个关键词与数据库中各个待推荐信息的相似度;其中,所述每一个待推荐信息模型对应一组向量,每一组向量对应至少一个待推荐信息。

可选地,所述发送所述推荐信息集合至所述终端之后,所述方法还包括:接收终端反馈的由用户从所述推荐信息集合选取的目标推荐信息;根据所述目标推荐消息更新所述数据库中所述待推荐信息模型和/或所述目标向量;所述待推荐信息模型至少包括所述目标推荐消息对应的向量。

可选地,所述利用所述目标待推荐信息模型构成推荐信息集合,包括:根据计算得到的相似度对所述目标待推荐信息中各个待推荐信息进行排序;利用排序好的所述目标待推荐信息构成推荐信息集合。

第二方面,本申请实施例提供了一种服务器,包括:

接收单元,用于接收终端发送的原始数据,并对所述原始数据进行处理得到目标数据;处理单元,用于从所述目标数据中确定出至少一个关键词,并统计所述至少一个关键词中各个关键词的词频;所述处理单元,还用于根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合;发送单元,用于发送所述推荐信息集合至所述终端。

可选地,所述处理单元对所述原始数据进行处理得到目标数据,具体为对所述原始数据进行同义词标准化处理,得到目标数据;和/或对所述原始数据进行错误修复处理,得到目标数据。

可选地,所述处理单元从所述目标数据中确定出至少一个关键词,具体为对所述目标数据进行命名实体识别处理,得到至少一个命名实体;对所述至少一个命名实体进行分词,得到至少一个关键词。

可选地,所述处理单元根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息模型以构成推荐信息集合,具体为根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度;根据计算得到的相似度,从所述各个待推荐信息中确定出目标待推荐信息;所述目标待推荐信息与所述各个关键词的相似度大于或等于预设相似度;利用所述目标待推荐信息构成推荐信息集合。

可选地,所述处理单元根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度,具体为根据所述各个关键词的词频计算出各个关键词的权重,并利用所述各个关键词的权重构成目标向量;根据所述目标向量与数据库中每一个待推荐信息模型,计算出所述各个关键词与数据库中各个待推荐信息的相似度;其中,所述每一个待推荐信息模型对应一组向量,每一组向量对应至少一个待推荐信息。

可选地,所述接收单元,还用于在所述发送单元发送所述推荐信息集合至所述终端之后,接收终端反馈的由用户从所述推荐信息集合选取的目标推荐信息;所述处理单元,还用于根据所述目标推荐消息更新所述数据库中所述待推荐信息模型和/或所述目标向量;所述待推荐信息模型至少包括所述目标推荐消息对应的向量。

可选地,所述处理单元利用所述目标待推荐信息模型构成推荐信息集合,具体为根据计算得到的相似度对所述目标待推荐信息中各个待推荐信息进行排序;利用排序好的所述目标待推荐信息构成推荐信息集合

第三方面,本申请实施例提供了一种服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面及其任一种可选方式所述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面及其任一种可选方式所述的方法。

综上所述,服务器可以接收终端发送的原始数据,并对该原始数据进行处理得到目标数据;从该目标数据中确定出至少一个关键词,并统计该至少一个关键词中各个关键词的词频,以根据该各个关键词的词频,从数据库中为该各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合,并发送该推荐信息集合至该终端,从而使得为用户推送的消息更为精确。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种数据处理系统的架构示意图;

图2是本申请实施例提供的一种数据处理方法的流程示意图;

图3是本申请实施例提供的另一种数据处理方法的流程示意图;

图4是本申请实施例提供的另一种服务器的结构示意图;

图5是本申请实施例提供的另一种服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图描述本申请实施例中的技术方案。

请参阅图1,为本申请实施例提供的一种数据处理系统的架构示意图。其中,该数据处理系统包括终端10、服务器20。终端10与服务器20之间可以进行通信。其中,该终端10包括但不限于智能手机、平板电脑、智能机器人等具有图像处理功能、语音识别功能或文字处理功能等功能的设备。该服务器20可以为互联网中一个单独的服务器或服务器集群。

用户可以在终端10上输入原始数据。该原始数据可以包括但不限于为语音、文字等数据。终端10可以获取该原始数据,并将该原始数据上传至服务器20进行分析,以为用户进行信息推送。

为了实现在用户输入的原始数据(如语句)不标准的情况下,服务器20能够根据原始数据进行精确化地推送信息,服务器20可以在接收到该原始数据后对该原始数据进行处理以提取至少一个关键词,并从数据库中为该至少一个关键词中各个关键词匹配出满足预设条件的目标待推送信息以构成推送信息集合后发送至终端10,从而实现根据原始数据快速定位出用户期望得到的信息的目的。其中,该目标待推荐信息可以为命名实体、关键词、语句等信息,如解决方案或链接等信息。

在一个实施例中,服务器20可以在接收到该原始数据后对该原始数据进行处理以提取至少一个关键词,从数据库中为该至少一个关键词中各个关键词匹配出与该各个关键词相似度大于或等于预设相似度(如0.8)的目标待推荐信息,以构成推送信息集合后发送至终端10,从而实现根据原始数据快速定位出用户期望得到的信息的目的。

在一个应用场景中,若该数据处理系统为汽车资讯系统,终端10为咨询专家机器人。用户a可以与咨询专家机器人通过语音或文字进行互动,如向该咨询专家机器人咨询关于汽车购买或汽车维修方面的问题。若用户a向该咨询专家机器人发送的语音包括查询零排放汽车。该咨询专家机器人将该输入的语音发送至服务器20,服务器20可以对输入的语音进行处理以提取至少一个关键词:零排放和汽车等词语,然后在数据库中查找与“零排放”“汽车”匹配的目标推荐信息。若查询出的目标推荐信息构成的推荐信息集合为太阳能汽车、氢气汽车、混合动力汽车,则服务器20可以将该推荐信息集合发送至咨询专家机器人。该咨询专家机器人可以通过语音输出该推荐信息集合,或者可以通过显示屏输出该推荐信息集合。其中,太阳能汽车、氢气汽车、混合动力汽车与“零排放”“汽车”的相似度均大于预设相似度0.8。

请参阅图2,为本申请实施例提供的一种数据处理方法的流程示意图。该方法可以应用于图1所示的系统中。具体地,该方法可以包括以下步骤:

s101、服务器接收终端发送的原始数据,并对所述原始数据进行处理得到目标数据。

在一个实施例中,该服务器对原始数据进行处理得到目标数据可以包括:该服务器对该原始数据进行初始化处理。该初始化处理至少可以包括同义词标准化处理和/或错误修复处理。其中,该同义词标准化处理是指识别出原始数据中的目标关键词对应的同义词,并利用该同义词替换该目标关键词的过程。该错误修复处理是指将所述原始数据中缺少的语句或字词补齐的过程,和/或将错误的语句或字词进行修改或替换的处理过程。

在一个实施例中,服务器对原始数据进行处理得到目标数据,可以包括:对所述原始数据进行同义词标准化处理,得到目标数据;和/或对所述原始数据进行错误修复处理,得到目标数据。本申请实施例中,通过同义词标准化处理和错误修复处理,可以使得语句识别更加标准化和规范化,有利于语句识别的精确度,提高语句识别速度。

以汽车行业为应用场景举例来说,若原始数据中包括目标关键词:半轴,则服务器在对原始数据进行同义词标准化处理后,服务器可以得到“驱动轴”。或者,若原始语句中包括目标关键词:发迹,则服务器在对原始语句进行错误修复处理后,就可以得到“发动机”。

s102、服务器从所述目标数据中确定出至少一个关键词,并统计所述至少一个关键词中各个关键词的词频。

本申请实施例中,服务器可以从目标数据中确定出至少一个关键词,该至少一个关键词可以为一个或多个。

在一个实施例中,服务器从该目标数据中确定出至少一个关键词,可以包括:服务器对该目标数据进行分词处理以得到至少一个关键词。

在一个实施例中,服务器从该目标数据中确定出至少一个关键词,还可以包括:服务器对该目标数据进行命名实体识别处理,得到至少一个命名实体;对该至少一个命名实体进行分词,得到至少一个关键词。其中,该至少一个命名实体包括一个或多个命名实体。

例如,该目标数据包括命名实体:零排放汽车,则服务器可以对该目标数据进行命名实体识别处理得到命名实体“零排放汽车”。服务器在对“零排放汽车”进行分词处理后,可以得到两个关键词“零排放”和“汽车”。

s103、服务器根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合。

本申请实施例中,数据库可以包括一个或多个待推荐信息。服务器可以根据该各个关键词的词频,从数据库中为该各个关键词匹配出至少一个待推荐信息。

具体地,为了更加精确地进行信息推送,服务器可以对该至少一个待推荐信息进行筛选,具体地,服务器可以根据该各个关键词的词频,从数据库中为该各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合。其中,该满足预设条件包括但不限于满足预设相似度条件和/或预设关联度条件等。

在一个实施例中,服务器根据该各个关键词的词频,从数据库中为该各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合,可以包括:服务器根据该各个关键词的词频,计算该各个关键词与数据库中各个待推荐信息的相似度;根据计算得到的相似度,从该各个待推荐信息中确定出目标待推荐信息;利用该目标待推荐信息构成推荐信息集合。其中,该目标待推荐信息与该各个关键词的相似度大于或等于预设相似度。

举例来说,假设至少一个关键词包括零排放和汽车,该至少一个关键词中各个关键词的词频为零排放词频5次,汽车词频5次,则服务器可以根据各个关键词的词频,从数据库中匹配出满足条件的目标待推荐信息:太阳能汽车、氢气汽车、混合动力电动汽车。其中,太阳能汽车与至少一个关键词的相似度为0.9、氢气汽车与至少一个关键词的相似度为0.85,混合动力汽车与该至少一个关键词的相似度为0.8。太阳能汽车、氢气汽车、混合动力电动汽车与该至少一个关键词的相似度均大于或等于预设相似度0.8。

在一个实施例中,该目标待推荐信息与该各个关键词的相似度还可以是该至少一个待推荐信息与该各个关键词的相似度中最大的。例如,若至少一个待推荐信息包括阳能汽车、氢气汽车、混合动力电动汽车。其中,太阳能汽车与至少一个关键词的相似度为0.9、氢气汽车与至少一个关键词的相似度为0.85,混合动力汽车与该至少一个关键词的相似度为0.8。服务器可以选取太阳能汽车作为目标待推送消息。

在一个实施例中,服务器可以采用常规统计方法、条件统计方法、分布拟合方法等方法对该各个关键词的词频进行处理后得到该至少一个关键词的向量,从而可以根据该至少一个关键词的向量计算该各个关键词与数据库中各个待推荐信息的相似度。相应地,该至少一个关键词的向量包括但不限于权重向量或词频向量等向量。

s104、服务器发送所述推荐信息集合至所述终端。

本申请实施例中,服务器在利用目标待推荐信息构成推荐信息集合后,可以将该待推荐信息集合发送至终端。

在一个实施例中,服务器可以接收终端反馈的由用户从所述推荐信息集合中选取的目标推荐信息,并可以根据该目标推荐信息执行更新操作,从而使得后续的消息推送工作更加精确化。

可见,图2所示的实施例中,服务器可以接收终端发送的原始数据,并对该原始数据进行处理得到目标数据,并可以统计出从该目标数据中确定出的至少一个关键词中各个关键词的词频,从而根据该各个关键词的词频,从数据库中为该各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合以发送该推荐信息集合至该终端,使得为用户推送的消息更为精确。

请参阅图3,为本申请实施例提供的另一种数据处理方法的流程示意图。具体地,该数据处理方法可以包括:

s201、服务器接收终端发送的原始数据,并对所述原始数据进行处理得到目标数据。

s202、服务器从所述目标数据中确定出至少一个关键词,并统计所述至少一个关键词中各个关键词的词频。

步骤s201-s202可以参见图2实施例中的步骤s101-s102,本申请实施例在此不做赘述。

s203、服务器根据所述各个关键词的词频计算出各个关键词的权重,并利用所述各个关键词的权重构成目标向量。

本申请实施例中,服务器根据所述各个关键词的词频计算出各个关键词的权重,并利用所述各个关键词的权重构成目标向量,可以包括:服务器对该各个关键词的词频进行处理得到该各个关键词的权重,并利用该各个关键词的权重构成目标向量。

在一个实施例中,服务器对该各个关键词的词频进行处理得到该各个关键词的权重,并利用该各个关键词的权重构成目标向量,可以包括:服务器采用常规统计方法对该各个关键词的词频进行归一化处理得到该各个关键词的权重,并利用该各个关键词的权重构成目标向量。

举例来说,若该各个关键词的词频为零排放词频5次、汽车5次,则对各个关键词的词频进行归一化处理后,零排放的权重为0.5、汽车的权重为0.5,该目标向量可以为s(0.5,0.5)。

在一个实施例中,该目标向量可以是一个n维向量,该n为数据库中待推送信息模型的数量。或者,该n为数据库中待推送信息的数量。

s204、服务器根据所述目标向量与数据库中每一个待推荐信息模型,计算出所述各个关键词与数据库中各个待推荐信息的相似度。

本申请实施例中,数据库还可以包括多个待推荐信息模型。其中,每一个待推荐信息模型对应一组向量,每一组向量对应至少一个待推荐信息。

若将目标向量表示为s,数据库中的待推荐信息模型表示为x,则可以利用距离测量公式来计算s与每一个信息模型(如x1,x2...xn)的值。其中,n为大于或等于1的正整数。在一个实施例中,该距离测量公式可以为:

表示点乘。d可以表征为相似度。由于目标向量与至少一个关键词中各个关键词之间的对应关系,每一个待推荐信息模型与至少一个待推荐信息的对应关系,因此,各个关键词与数据库中各个待推荐信息的相似度是可以通过s与每一个信息模型(如x1,x2...xn)的值来表征的。

s205、服务器根据计算得到的相似度,从所述各个待推荐信息中确定出目标待推荐信息。

通过步骤s204,服务器可以计算得到各个关键词与各个待推荐信息之间的相似度。在步骤s205中,服务器可以根据计算得到的相似度,从该各个待推荐信息中确定出目标待推荐信息。

若该各个待推荐信息所对应的待推荐信息模型为x1,x2...xn,则服务器可以从该x1,x2...xn中提取出满足预设条件的目标待推荐信息模型x1,x2...xm构成推荐信息模型集合{x1,x2,…,xm}。其中,m∈[1,n]。具体地,该满足预设条件可以为:

其中,k为正整数,d∈(0,1)。通过该公式确定出的目标待推荐信息与该各个关键词的相似度大于或等于预设相似度。

或者,该满足预设条件还可以为:

其中,maxs为s统计的上界。通过该公式确定出的目标待推荐信息与所述至少一个关键词的相似度,为至少一个待推荐信息中与该各个关键词相似度最大的。

s206、服务器利用所述目标待推荐信息构成推荐信息集合。

s207、服务器发送所述推荐信息集合至所述终端。

本申请实施例中,服务器可以利用目标待推荐信息构成推荐信息集合,如可以利用推荐信息模型集合{x1,x2,…,xm}中各个待推荐信息模型所对应的待推荐信息构成推荐信息集合。

在一个实施例中,服务器利用该目标待推荐信息构成推荐信息集合,可以包括:根据计算得到的相似度对该目标待推荐信息中各个待推荐信息进行排序;利用排序好的该目标待推荐信息构成推荐信息集合。该排序好的该目标待推荐信息中各个待推荐信息包括但不限于按照相似度高低由前到后排列。

举例来说,假设至少一个关键词中各个关键词为零排放汽车,推荐信息集合为氢气汽车、混合动力汽车、太阳能汽车。若太阳能汽车与至少一个关键词的相似度为0.92、氢气汽车与至少一个关键词的相似度为0.85,混合动力汽车与该至少一个关键词的相似度为0.8,则按照相似度对该推荐信息集合进行排序后,该排序好的推荐信息集合由前到后分别为太阳能汽车、氢气汽车、混合动力汽车。

s208、服务器接收终端反馈的由用户从所述推荐信息集合选取的目标推荐信息。

终端在接收到该推荐消息集合后,可以对该推荐消息执行处理、存储、输出等操作,本申请实施例对终端执行的操作不做限制。

在一个实施例中,终端可以输出该推荐信息集合,或者终端可以对该目标信息进行处理后输出,以便用户可以根据该推荐信息集合选取目标信息。

终端在检测到用户针对该推荐信息集合中的目标推荐信息的选取操作时,可以向服务器返回该用户从该推荐信息集合中选取的目标推荐信息,服务器可以接收终端反馈的由用户从该推荐信息集合选取的目标推荐信息。

s209、服务器根据所述目标推荐消息更新所述数据库中所述待推荐信息模型和/或所述目标向量。

服务器在接收到该目标推荐消息后,可以根据该目标推荐消息执行更新操作。该更新的对象至少可以包括数据库中该待推荐信息模型和/或该目标向量。其中,该待推荐信息模型至少包括该目标推荐消息对应的向量。

具体地,服务器可以根据该目标推荐消息执行更新操作,可以包括:服务器根据该目标推荐消息更新该数据库中该待推荐信息模型和/或该目标向量。

例如,若目标推荐信息为太阳能汽车,至少一个关键词中各个关键词对应的目标向量为(0.5,0.5),则服务器可以将太阳能汽车对应的待推荐信息模型从(0.2、0.3)调整为(0.4、0.5),还可以将目标向量为(0.5,0.5)调整为(0.6,0.6)。

在一个实施例中,步骤s208-s209为可选的步骤。

可见,图3所示的实施例中,服务器可以接收终端发送的原始数据,并对该原始数据进行处理得到目标数据。服务器可以统计出通过该目标数据中确定出至少一个关键词中各个关键词的词频,从而根据该各个关键词的词频得到目标向量。服务器可以根据该目标向量和数据库中每一个待推荐模型计算出该各个关键词与数据库中各个待推荐信息的相似度,以便筛选出满足预设条件的目标待推荐信息以构成推荐信息集合发送至终端,并可以接收终端反馈的由用户从该待推荐信息集合中选取的目标推荐消息以进行更新,从而便于后续更精确化地为用户推送消息。

请参阅图4,为本申请实施例提供的一种服务器的结构示意图。具体地,该服务器可以包括以下步骤:

接收单元10,用于接收终端发送的原始数据,并对所述原始数据进行处理得到目标数据;

处理单元20,用于从所述目标数据中确定出至少一个关键词,并统计所述至少一个关键词中各个关键词的词频;

所述处理单元20,还用于根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合;

发送单元30,用于发送所述推荐信息集合至所述终端。

在一种可选的实施方式中,处理单元20对所述原始数据进行处理得到目标数据,具体为对所述原始数据进行同义词标准化处理,得到目标数据;和/或对所述原始数据进行错误修复处理,得到目标数据。

在一种可选的实施方式中,处理单元20从所述目标数据中确定出至少一个关键词,具体为对所述目标数据进行命名实体识别处理,得到至少一个命名实体;对所述至少一个命名实体进行分词,得到至少一个关键词。

在一种可选的实施方式中,处理单元20根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息模型以构成推荐信息集合,具体为根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度;根据计算得到的相似度,从所述各个待推荐信息中确定出目标待推荐信息;所述目标待推荐信息与所述各个关键词的相似度大于或等于预设相似度;利用所述目标待推荐信息构成推荐信息集合。

在一种可选的实施方式中,处理单元20根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度,具体为根据所述各个关键词的词频计算出各个关键词的权重,并利用所述各个关键词的权重构成目标向量;根据所述目标向量与数据库中每一个待推荐信息模型,计算出所述各个关键词与数据库中各个待推荐信息的相似度。其中,所述每一个待推荐信息模型对应一组向量,每一组向量对应至少一个待推荐信息。

在一个可选的实施方式中,所述接收单元10,还用于在发送单元30发送所述推荐信息集合至所述终端之后,接收终端反馈的由用户从所述推荐信息集合选取的目标推荐信息。

在一个可选的实施方式中,所述处理单元30,还用于根据所述目标推荐消息更新所述数据库中所述待推荐信息模型和/或所述目标向量。所述待推荐信息模型至少包括所述目标推荐消息对应的向量。

在一种可选的实施方式中,处理单元20利用所述目标待推荐信息模型构成推荐信息集合,具体为根据计算得到的相似度对所述目标待推荐信息中各个待推荐信息进行排序;利用排序好的所述目标待推荐信息构成推荐信息集合。

可见,图4所示的实施例中,服务器可以接收终端发送的原始数据,并对该原始数据进行处理得到目标数据,并可以统计出从该目标数据中确定出的至少一个关键词中各个关键词的词频,从而根据该各个关键词的词频,从数据库中为该各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合以发送该推荐信息集合至该终端,使得为用户推送的消息更为精确。

请参阅图5,为本申请实施例提供的另一种服务器的结构示意图。如图5所示的本实施例中的服务器可以包括:一个或多个处理器501;一个或多个输入设备502,一个或多个输出设备503和存储器504。上述处理器501、输入设备502、输出设备503和存储器504通过总线505连接。存储器502用于存储计算机程序,所述计算机程序包括程序指令,处理器501用于执行存储器502存储的程序指令。可选地,该输入设备502可以是上述申请实施例中的接收单元10,该输出设备503可以是上述申请实施例中的发送单元30。

在本申请实施例中,由处理器501加载并执行计算机存储介质中存放的一条或一条以上指令,以实现上述图2-图3所示方法流程的相应步骤;具体实现中,计算机存储介质中的一条或一条以上指令由处理器501加载并执行如下步骤:

通过输入设备502接收终端发送的原始数据,并对所述原始数据进行处理得到目标数据;

从所述目标数据中确定出至少一个关键词,并统计所述至少一个关键词中各个关键词的词频;

根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息以构成推荐信息集合;

通过输出设备503发送所述推荐信息集合至所述终端。

可选地,该至少一条程序指令由该处理器501加载并执行对所述原始数据进行处理得到目标数据,具体用于执行以下步骤:对所述原始数据进行同义词标准化处理,得到目标数据;和/或对所述原始数据进行错误修复处理,得到目标数据。

可选地,该至少一条程序指令由该处理器501加载并执行所述从所述目标数据中确定出至少一个关键词,具体用于执行以下步骤:对所述目标数据进行命名实体识别处理,得到至少一个命名实体;对所述至少一个命名实体进行分词,得到至少一个关键词。

可选地,该至少一条程序指令由该处理器501加载并执行所述根据所述各个关键词的词频,从数据库中为所述各个关键词匹配出满足预设条件的目标待推荐信息模型以构成推荐信息集合,具体用于执行以下步骤:根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度;根据计算得到的相似度,从所述各个待推荐信息中确定出目标待推荐信息;所述目标待推荐信息与所述各个关键词的相似度大于或等于预设相似度;利用所述目标待推荐信息构成推荐信息集合。

可选地,该至少一条程序指令由该处理器501加载并执行所述根据所述各个关键词的词频,计算所述各个关键词与数据库中各个待推荐信息的相似度,具体用于执行以下步骤:根据所述各个关键词的词频计算出各个关键词的权重,并利用所述各个关键词的权重构成目标向量;根据所述目标向量与数据库中每一个待推荐信息模型,计算出所述各个关键词与数据库中各个待推荐信息的相似度;其中,所述每一个待推荐信息模型对应一组向量,每一组向量对应至少一个待推荐信息。

可选地,通过输出设备503发送所述推荐信息集合至所述终端进行输出之后,该至少一条程序指令由该处理器501加载,还用于执行以下步骤:通过输入设备502接收终端反馈的由用户从所述推荐信息集合选取的目标推荐信息;根据所述目标推荐消息更新所述数据库中所述待推荐信息模型和/或所述目标向量;所述待推荐信息模型至少包括所述目标推荐消息对应的向量。

可选地,该至少一条程序指令由该处理器501加载并执行所述利用所述目标待推荐信息模型构成推荐信息集合,具体用于执行以下步骤:根据计算得到的相似度对所述目标待推荐信息中各个待推荐信息进行排序;利用排序好的所述目标待推荐信息构成推荐信息集合。

应当理解,所称处理器501可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备502可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备503可以包括显示器(lcd等)、扬声器等。该输入设备502与输出设备503还可以为标准的有线或无线通信接口。

该存储器504可以包括只读存储器和随机存取存储器,并向处理器501提供指令和数据。存储器504的一部分还可以包括非易失性随机存取存储器。例如,存储器504还可以存储数据库。

在本申请的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现本申请实施例提供的图2和图3所描述的数据处理方法的实现方式。

该计算机可读存储介质可以是前述任一实施例的终端的内部存储单元,例如终端的硬盘或内存。该计算机可读存储介质也可以是终端的外部存储设备,例如终端上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,该计算机可读存储介质还可以既包括终端的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机程序以及所述终端所需的其他程序和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、服务器和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1