一种相似用户识别方法及装置的制造方法_2

文档序号：9727470阅读：来源：国知局

及所述状态信息，根据预先定义的特性因子以及权重数值的对应关系，分别确定所述当前用户的各特性因子对应的当前权重数值；
[0056]其中，特性因子为满足预设数据规则的标签信息，用于反映用户相似度的标签，如“精力充沛”、“粗心”等标签信息。可以预先对特性因子对应条件的数据规则进行定义，例如将上午6点接收到连续数据定义为条件1，晚上11点接收到连续数据定义为条件2。
[0057]并且预先对特性因子对应条件的权重数值进行定义，例如条件1对应“精力充沛”特性因子的权重为0.2，条件2对应“精力充沛”特性因子的权重为0.2。
[0058]可预先建立特性因子数据库，包含特性因子、数据规则以及权重因子的对应关系。在接收到用户信息以及状态信息后，可将将接收到的数据依次匹配条件库中的因子条件的数据规则，确定对应的权重数值，得到判断结果。
[0059]作为一种优选实施方式，本步骤在确定当前权重数值时还可以进一步包括:
[0060]根据预设规则对预设周期内的数值进行筛选，选取的数值作为所述当前用户的各特性因子对应的当前权重数值。这样设置的目的可以按照算法计算一定周期内具有代表性的数值，从而进一步提高识别的准确性。
[0061]具体地，可以将一段周期内的数值去掉其中的最大值以及最小值以后，再取各数值的平均值，作为最终的权重数值。并将该最终的权重数值存入到数据库中。
[0062]步骤S103:将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，确定所述当前用户与所述目标用户的相似度。
[0063]目标用户的权重数值可以根据需求自行定义，如将精力充沛定为0.3，粗心定为
0.2。
[0064]具体地，可利用相似用户分析算法，对当前用户的权重数值以及目标用户的权重数值的相似度进行分析。在得到分析结果之后，还可以进一步包括:根据预定的数据格式，输出序列化的用户数据，可以供其他过程进行调用。
[0065]本发明所提供的相似用户识别方法，通过采集当前用户的用户信息以及状态信息;根据预先定义的特性因子以及权重数值的对应关系，分别确定当前用户的各特性因子对应的当前权重数值;将当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，从而确定当前用户与目标用户的相似度。可见，本发明提供了一种通过特性因子的权重关系对当前用户以及目标用户进行比较，得到二者相似度的方法，与现有技术相比，本申请的效率较高、准确度也较高。
[0066]在上一实施例的基础上，本发明所提供的相似用户识别方法可以预先建立数据库，用于存储用户的用户信息以及状态信息。这样，在对用户的状态信息进行采集后，根据采集到的数据中用户的标识，查找用户数据库，能够获取到用户的用户信息。在此过程中，也可以将当前用户的更新的用户信息或状态信息存储到数据库中，方便后续的数据处理。
[0067]具体地，如图2将采集到的数据存储至数据库的过程流程图所示，在采集到当前用户的用户信息以及状态信息之后，还可以进一步包括有:
[0068]步骤S201:将所述用户信息以及所述状态信息转换为预设格式的数据；
[0069]步骤S202:将所述预设格式的数据缓存至第一消息队列中，按照先进先出的规则将缓存数据发送至指定的第一计算单元；
[0070]步骤S203:计算所述第一消息队列的缓存数据量，动态调整所述第一计算单元的数量;并根据所述第一计算单元反馈的计算结果，动态调整从所述第一消息队列中获取数据的数量；
[0071 ]步骤S204:将所述预设格式的数据存储于预先建立的数据库中。
[0072]在上述实施例的基础上，步骤S102中通过所述用户信息以及所述状态信息，根据预先定义的特性因子以及权重数值的对应关系，分别确定所述当前用户的各特性因子对应的当前权重数值的过程也可以采用消息队列以及弹性计算相结合的方式进行处理。
[0073]如图3确定当前用户的各特性因子对应的当前权重数值的过程流程图所示，该过程具体包括:
[0074]步骤S301:将所述用户信息以及所述状态信息缓存至第二消息队列中，按照先进先出的规则将缓存数据发送至指定的第二计算单元；
[0075]步骤S302:计算所述第二消息队列中的缓存数据量，动态调整所述第二计算单元的数量;并根据所述第二计算单元反馈的计算结果，动态调整从所述第二消息队列中获取数据的数量；
[0076]步骤S303:根据预先定义的特性因子以及权重数值的对应关系，分别确定所述当前用户的各特性因子对应的当前权重数值。
[0077]在上述任一实施例的基础上，步骤S103中将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，确定所述当前用户与所述目标用户的相似度的过程同样可通过消息队列以及弹性计算相结合的方式实现。如图4确定当前用户与目标用户的相似度的过程流程图所示，该过程包括:
[0078]步骤S401:将所述当前用户的各当前权重数值以及所述目标用户的各权重数值缓存至第三消息队列中，按照先进先出的规则将缓存数据发送至指定的第三计算单元；
[0079]步骤S402:计算所述第三消息队列中的缓存数据量，动态调整所述第三计算单元的数量;并根据所述第三计算单元反馈的计算结果，动态调整从所述第三消息队列中获取数据的数量；
[0080]步骤S403:将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，确定所述当前用户与所述目标用户的相似度。
[0081]下面对上述实施例中用到的消息队列以及弹性计算相结合的方式的工作过程进行进一步详细阐述。消息队列可对接收到的数据信息进行本地缓存，在接收或发送数据后实时更新本地缓存数据量，并将缓存数据量信息发送至弹性计算单元。接收到弹性计算单元的数据请求后，按照先进先出的规则将所请求定量数据发送至指定的计算单元。
[0082]如图5消息队列缓存数据的工作流程图所示，该过程包括:
[0083]步骤S501:判断消息队列是否已满；
[0084]步骤S502:如果否，则从数据源对数据进行采集或获取；
[0085]步骤S503:消息队列接收并缓存数据；
[0086]步骤S504:更新消息队列的状态。
[0087]如图6弹性计算单元的工作流程图所示，该过程包括:
[0088]步骤S601:判断消息队列中是否具有数据；
[0089]步骤S602:如果有，则获取消息队列状态；
[0090]步骤S603:根据缓存数据量对计算单元的数目进行调整；
[0091]步骤S604:判断计算单元当前是否在计算；
[0092]步骤S605:如果否，则计算单元从消息队列中获取数据进行计算。
[0093]本实施例所提供的相似用户识别方法，采用消息队列对数据进行缓存，使得数据读取速度更快，并通过弹性计算单元动态调整计算单元的数目，使得计算单元的利用率高，从而使得整体识别方法的处理速度更快、效率更高。
[0094]下面对本发明实施例提供的相似用户识别装置进行介绍，下文描述的相似用户识别装置与上文描述的相似用户识别方法可相互对应参照。图7为本发明实施例提供的相似用户识别装置的结构框图，参照图7相似用户识别装置可以包括:
[0095]采集模块100，用于采集当前用户的用户信息以及状态信息；
[0096]确定模块200，用于通过所述用户信息以及所述状态信息，根据预先定义的特性因子以及权重数值的对应关系，分别确定所述当前用户的各特性因子对应的当前权重数值，所述特性因子为满足预设数据规则的标签信息；
[0097]识别模块300，用于将所述当前用户的各当前权重数值分别与预先设定的目标用户的各权重数值进行比较，确定所述当前用户与所述目标用户的相似度。
[0098]作为一种【具体实施方式】，上述采集模块100具体用于:
[0099]通过数据适配器周期性采集可穿戴设备、机器爬虫程序或人工手动输入的当前用户的用户信息以及状态信息。
[0100]作为一种【具体实施方式】，该采集模块100还可以进一步包括有:
[0101]转换单元，用于将所述用户信息以及所述状态信息转换为预设格式的数据；
[0102]第一消息队列单元，用于将所述预设格式的数据缓存至第一消息队列中，按照先进先出的规则将缓存数据发送至指定的第一计算单元；
[0103]第一弹性计算单元，用于计算所述第一消息队列的缓存数据量，动态调整所述第一计算单元的数量

完整全部详细技术资料下载

当前第2页1 2 3