本公开涉及数据分析领域,尤其涉及一种信息处理方法及装置。
背景技术:
1、对于抽样方法,可为所有的样本分配抽取概率,进而可进行期望的目标样本的抽取。但是,这种抽样的过程是由随机事件组成的时间序列,不能保证目标样本的抽取时间以及能否抽取到目标样本。例如,对于内容平台上的用户账户抽取期望的目标对象的情况,可为能够抽取到的所有对象分配抽取概率,进而进行对象的抽取。相关技术中,可对用户账户进行分类,从而针对每一类别确定一个期望抽取到的目标对象,对于任一用户账户,可设置预设抽取轮次抽取到的对象是目标对象。但是,这种方法不能针对性地对每一用户账户确定期望抽取到的目标对象,且不能针对性地制定用户账户的目标对象抽取策略。
2、举例来说,对于内容平台上的用户账户从一定数量的视频中随机抽取视频进行播放,每一视频都有被抽取到的概率。针对于用户账户的不同,每一用户账户可能有期望抽取播放的视频。相关技术中可基于历史数据对用户账户进行分类,如播放“搞笑视频”在总播放视频占比超过分类阈值的用户账户被直接分类为期望抽取到某一“搞笑视频”,而占比低于分类阈值的用户账户被直接分类为期望抽取到某一“舞蹈视频”。而对于抽取的过程可能会设置预设的抽取次数抽取到的是分类到的视频。但是,这种方法不能映射到每一用户账户的期望,且不能准确预测抽取到期望视频后的用户账户会继续抽取视频的次数。
技术实现思路
1、本公开提供一种信息处理方法及装置,以至少解决上述相关技术中的问题,也可不解决任何上述问题。本公开的技术方案如下:
2、根据本公开实施例的第一方面,提供一种信息处理方法,包括:根据用户账户的抽取对象的历史行为信息,得到所述用户账户抽取对象的参与度时间序列;在所述参与度时间序列中确定异常的抽取时间,获取所述异常的抽取时间对应的对象,并将所述异常的抽取时间对应的对象作为所述用户账户的目标抽取对象;根据所述用户账户在预定历史时期的对象抽取信息,得到所述用户账户在抽取到所述目标抽取对象之后的预测抽取次数,其中,所述对象抽取信息包括所述用户账户在所述预定历史时期抽取到的对象信息。
3、可选地,所述根据用户账户的抽取对象的历史行为信息,得到所述用户账户抽取对象的参与度时间序列,包括:根据所述历史行为信息,得到所述用户账户抽取每一对象的特征信息;根据所述特征信息,构建所述用户账户抽取每一对象的衍生特征信息;根据所述衍生特征信息,得到所述用户账户抽取每一对象的参与度,并将所述参与度按照所述每一对象的抽取时间的顺序排布成参与度时间序列。
4、可选地,所述根据所述衍生特征信息,得到所述用户账户抽取每一对象的参与度,包括:根据所述衍生特征信息,得到所述用户账户抽取每一对象时的各衍生特征信息的特征值;根据所述特征值和各衍生特征信息的第一预设权重,计算得到所述用户账户抽取每一对象的参与度。
5、可选地,所述在所述参与度时间序列中确定异常的抽取时间,获取所述异常的抽取时间对应的对象,并将所述异常的抽取时间对应的对象作为所述用户账户的目标抽取对象,包括:通过至少一种异常检测算法对所述参与度时间序列进行异常检测,得到每一异常检测算法检测出的异常时间;从所述每一异常检测算法检测出的异常时间中确定所述异常的抽取时间,获取所述异常的抽取时间对应的对象,并将所述异常的抽取时间对应的对象作为所述用户账户的目标抽取对象。
6、可选地,所述从所述每一异常检测算法检测出的异常时间中确定所述异常的抽取时间,包括:基于所述每一异常检测算法的第二预设权重,从所述每一异常检测算法检测出的异常时间中确定待验收异常时间;根据所述待验收异常时间抽取的对象的置信度确定是否将所述待验收异常时间作为所述异常的抽取时间。
7、可选地,所述根据所述待验收异常时间抽取的对象的置信度确定是否将所述待验收异常时间作为所述异常的抽取时间,包括:在所述待验收异常时间抽取的对象的置信度大于或等于预设阈值的情况下,将所述待验收异常时间作为所述异常的抽取时间;在所述待验收异常时间抽取的对象的置信度小于所述预设阈值的情况下,调整所述第二预设权重并重新确定待验收异常时间,直至待验收异常时间抽取的对象的置信度大于或等于预设阈值,其中,所述置信度表征将所述待验收异常时间抽取的对象作为所述用户账户的目标抽取对象的置信度。
8、可选地,在所述参与度时间序列中确定异常的抽取时间,获取所述异常的抽取时间对应的对象,并将所述异常的抽取时间对应的对象作为所述用户账户的目标抽取对象之后,还包括:在未检测到所述用户账户的对象抽取信息的情况下,构建所述用户账户的相似度模型;根据所述相似度模型,确定所述用户账户的相似用户账户,并将所述相似用户账户对应的预测抽取次数作为所述用户账户在抽取到所述目标抽取对象之后的预测抽取次数。
9、根据本公开实施例的第二方面,提供一种信息处理装置,包括:序列获取单元,被配置为:根据用户账户的抽取对象的历史行为信息,得到所述用户账户抽取对象的参与度时间序列;对象确定单元,被配置为:在所述参与度时间序列中确定异常的抽取时间,获取所述异常的抽取时间对应的对象,并将所述异常的抽取时间对应的对象作为所述用户账户的目标抽取对象;次数预测单元,被配置为:根据所述用户账户在预定历史时期的对象抽取信息,得到所述用户账户在抽取到所述目标抽取对象之后的预测抽取次数,其中,所述对象抽取信息包括所述用户账户在所述预定历史时期抽取到的对象信息。
10、可选地,序列获取单元被配置为:根据所述历史行为信息,得到所述用户账户抽取每一对象的特征信息;根据所述特征信息,构建所述用户账户抽取每一对象的衍生特征信息;根据所述衍生特征信息,得到所述用户账户抽取每一对象的参与度,并将所述参与度按照所述每一对象的抽取时间的顺序排布成参与度时间序列。
11、可选地,序列获取单元被配置为:根据所述衍生特征信息,得到所述用户账户抽取每一对象时的各衍生特征信息的特征值;根据所述特征值和各衍生特征信息的第一预设权重,计算得到所述用户账户抽取每一对象的参与度。
12、可选地,对象确定单元被配置为:通过至少一种异常检测算法对所述参与度时间序列进行异常检测,得到每一异常检测算法检测出的异常时间;从所述每一异常检测算法检测出的异常时间中确定所述异常的抽取时间,获取所述异常的抽取时间对应的对象,并将所述异常的抽取时间对应的对象作为所述用户账户的目标抽取对象。
13、可选地,对象确定单元被配置为:基于所述每一异常检测算法的第二预设权重,从所述每一异常检测算法检测出的异常时间中确定待验收异常时间;根据所述待验收异常时间抽取的对象的置信度确定是否将所述待验收异常时间作为所述异常的抽取时间。
14、可选地,对象确定单元被配置为:在所述待验收异常时间抽取的对象的置信度大于或等于预设阈值的情况下,将所述待验收异常时间作为所述异常的抽取时间;在所述待验收异常时间抽取的对象的置信度小于所述预设阈值的情况下,调整所述第二预设权重并重新确定待验收异常时间,直至待验收异常时间抽取的对象的置信度大于或等于预设阈值,其中,所述置信度表征将所述待验收异常时间抽取的对象作为所述用户账户的目标抽取对象的置信度。
15、可选地,还包括相似构建单元,被配置为:在未检测到所述用户账户的对象抽取信息的情况下,构建所述用户账户的相似度模型;根据所述相似度模型,确定所述用户账户的相似用户账户,并将所述相似用户账户对应的预测抽取次数作为所述用户账户在抽取到所述目标抽取对象之后的预测抽取次数。
16、根据本公开实施例的第三方面,提供一种电子设备,包括:至少一个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行根据本公开的信息处理方法。
17、根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中存储的指令被至少一个处理器运行时,促使所述至少一个处理器执行根据本公开的信息处理方法。
18、根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机指令,所述计算机指令被至少一个处理器执行时实现根据本公开的信息处理方法。
19、本公开的实施例提供的技术方案至少带来以下有益效果:
20、根据本公开的信息处理方法及装置,可通过数据分析得到用户账户的目标抽取对象,并结合历史的对象抽取信息,得到用户账户在抽取到目标抽取对象之后的耐受度(预测抽取次数),从而能够针对性地对每一用户账户确定期望抽取到的目标对象,且可以灵活调整用户账户的对象抽取策略。本公开能准确、高效地发现用户账户的目标抽取对象的个性化差异,同时量化用户账户的耐受度,整个过程实时化、自适应,便于对得到的目标抽取对象和预测抽取次数进行后续数据信息分析处理。
21、另外,根据本公开的信息处理方法及装置,在使用多种数据分析算法的情况下,并非直接将算法拼接使用,而是将算法环环相扣、灵活组合,发挥各个算法的优势来得到的目标抽取对象和预测抽取次数。
22、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。