用于数据处理的方法、装置和介质与流程

文档序号:31676251发布日期:2022-09-28 02:10阅读:66来源:国知局
用于数据处理的方法、装置和介质与流程

1.本公开的实施例涉及机器学习领域,并且更具体地,涉及用于数据处理的方法、装置和计算机可读存储介质。


背景技术:

2.随着信息技术的飞速发展,数据规模迅速增长。在这样的背景和趋势下,机器学习受到越来越广泛的关注。其中,因果发现在现实生活中具有广泛的应用,例如在用户服务、医疗健康和在线广告等领域。在此所述的因果发现是指从关于多个特征的样本数据中发现多个特征间存在的因果关系。例如,在用户服务领域,因果发现的结果能够被用来辅助了解用户满意度等;在医疗健康领域,因果发现的结果能够被用来辅助了解患者的康复情况等;在在线广告领域,因果发现的结果能够被用来辅助了解用户对在线广告的兴趣等。


技术实现要素:

3.本公开的实施例提供了用于数据处理的方法、装置和计算机可读存储介质。
4.在本公开的第一方面,提供一种用于数据处理的方法。该方法包括:获取多个环境下的多个训练数据集,其中每个训练数据集包括对应环境下的用户的一组特征的观测数据,一组特征包括目标特征和与目标特征有关的多个特征;基于多个训练数据集,根据因果关系在不同环境下的不变性,从多个特征中确定影响目标特征并且具有因果不变性的至少一个特征;以及利用多个训练数据集中的至少一个训练数据集,针对至少一个特征来训练预测模型,预测模型用于基于目标环境下的目标用户的至少一个特征的观测数据来生成针对目标用户的目标特征的预测结果。
5.在本公开的第二方面,提供一种用于数据处理的方法。该方法包括:获取目标环境下的目标用户的用户数据,其中用户数据包括目标用户的多个特征的观测数据;从用户数据中提取至少部分用户数据,其中至少部分用户数据包括多个特征中影响目标特征并且具有因果不变性的至少一个特征的观测数据;以及基于至少部分用户数据,根据针对至少一个特征所训练的预测模型,生成针对目标用户的目标特征的预测结果。
6.本公开的第三方面,提供一种用于数据处理的装置。该装置包括至少一个处理单元和至少一个存储器。至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令当由至少一个处理单元执行时,使得该装置执行动作,动作包括:获取多个环境下的多个训练数据集,其中每个训练数据集包括对应环境下的用户的一组特征的观测数据,一组特征包括目标特征和与目标特征有关的多个特征;基于多个训练数据集,根据因果关系在不同环境下的不变性,从多个特征中确定影响目标特征并且具有因果不变性的至少一个特征;以及利用多个训练数据集中的至少一个训练数据集,针对至少一个特征来训练预测模型,预测模型用于基于目标环境下的目标用户的至少一个特征的观测数据来生成针对目标用户的目标特征的预测结果。
7.本公开的第四方面,提供一种用于数据处理的装置。该装置包括至少一个处理单
元和至少一个存储器。至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令当由至少一个处理单元执行时,使得该装置执行动作,动作包括:获取目标环境下的目标用户的用户数据,其中用户数据包括目标用户的多个特征的观测数据;从用户数据中提取至少部分用户数据,其中至少部分用户数据包括多个特征中影响目标特征并且具有因果不变性的至少一个特征的观测数据;以及基于至少部分用户数据,根据针对至少一个特征所训练的预测模型,生成针对目标用户的目标特征的预测结果。
8.本公开的第五方面,提供一种计算机可读存储介质,该计算机可读存储介质具有在其上存储的机器可执行指令,该机器可执行指令在由设备执行时使该设备执行根据本公开的第一方面所描述的方法。
9.本公开的第六方面,提供一种计算机可读存储介质,该计算机可读存储介质具有在其上存储的机器可执行指令,该机器可执行指令在由设备执行时使该设备执行根据本公开的第二方面所描述的方法。
10.提供发明内容部分是为了以简化的形式来介绍一系列概念,它们在下文的具体实施方式中将被进一步描述。发明内容部分不旨在标识本公开的关键特征或必要特征,也不旨在限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
11.从下文的公开内容和权利要求中,本发明的目的、优点和其他特征将变得更加明显。这里仅出于示例的目的,参考附图来给出优选实施例的非限制性描述,在附图中:
12.图1示出了本公开的一些实施例能够在其中实现的数据处理环境的示例的示意图;
13.图2示出了根据本公开的实施例的用于训练预测模型的示例方法的流程图;
14.图3示出了根据本公开的实施例的用于使用预测模型的示例方法的流程图;
15.图4示出了根据本公开的实施例的用于预测用户满意度的示例方法的流程图;
16.图5示出了根据本公开的实施例的用于预测患者的康复情况的示例方法的流程图;
17.图6示出了根据本公开的实施例的用于预测用户对在线广告的兴趣的示例方法的流程图;以及
18.图7示出了可以用来实施本公开的实施例的示例计算设备的示意性框图。
19.在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
20.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
21.在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等可以指代不同的或相同的对
象。下文还可能包括其他明确的和隐含的定义。
22.如上所述,在实际生活中,期望快速且准确地发现大量特征间存在的因果关系。
23.例如,在用户服务领域中,运营商为了解用户满意度,可以收集大量用户数据(诸如,用户的年龄、每月消费的上网流量、免费流量的比率、每月消费的上网流量的总费用等)。由于收集到的数据可能来自不同环境(例如,时间、地域等),因此收集到的数据可能不属于同一分布。在这种情况下,将收集到的数据假设为来自同一分布无法良好地预测用户满意度。此外,运营商可能更希望了解在新环境下的用户满意度。然而,新环境下的数据分布可能和训练数据不属于同一分布,从而无法良好地预测新环境下的用户满意度。
24.类似地,在医疗健康领域中,医生为了解患者的康复情况,可以收集大量患者数据(诸如,患者的性别、年龄、职业、治疗方案等)。由于收集到的数据可能来自不同环境(例如,年龄、性别等),因此收集到的数据可能不属于同一分布。在这种情况下,将收集到的数据假设为来自同一分布无法良好地预测患者的康复情况。此外,医生可能更希望了解在新环境下的患者的康复情况。然而,新环境下的数据分布可能和训练数据不属于同一分布,从而无法良好地预测新环境下的患者的康复情况。
25.进一步地,在在线广告领域中,广告提供商为了解用户对在线广告的兴趣,可以收集大量用户数据(诸如,用户的性别、年龄、职业等)以及大量在线广告数据(诸如,在线广告的大小、时长、显示位置、内容、质量等)等。由于收集到的数据可能来自不同环境(例如,年龄、性别、地域等),因此收集到的数据可能不属于同一分布。在这种情况下,将收集到的数据假设为来自同一分布无法良好地预测用户对在线广告的兴趣。此外,广告提供商可能更希望了解在新环境下的用户对在线广告的兴趣。然而,新环境下的数据分布可能和训练数据不属于同一分布,从而无法良好地预测新环境下的用户对在线广告的兴趣。
26.本公开的实施例提出了一种用于数据处理的方案,以解决上述问题和/或其他潜在问题中的一个或多个。在该方案中,可以发现在不同环境下影响目标特征的具有因果不变性的特征,并且针对这些特征来训练预测模型,从而可以根据经训练的预测模型在新环境下准确地预测目标特征。
27.以下将结合用户服务领域的示例场景来详细描述本公开的各实施例。应当理解,这仅仅是出于说明的目的,不旨在以任何方式限制本发明的范围。
28.图1示出了本公开的一些实施例能够在其中实现的数据处理环境100的示例的示意图。环境100包括计算设备110。计算设备110可以是具有计算能力的任何设备,例如个人计算机、平板计算机、可穿戴设备、云服务器、大型机和分布式计算系统等。
29.计算设备110可以获取目标环境下的目标用户的用户数据120。计算设备110可以基于用户数据120,利用经训练的预测模型130,生成针对目标用户的目标特征(例如,用户满意度)的预测结果140(例如,满意或不满意,满意度是多少)。
30.该经训练的预测模型130能够基于用户数据120中影响目标特征的具有因果不变性的至少一个特征的观测数据来生成预测结果140。具有因果不变性的特征是指这样的特征:在不同环境下,给定这些特征的观测数据,目标特征的分布将保持不变。也就是说,如果特征在不同环境下具有因果不变性,则这些特征在不同环境下对目标特征的影响是一致的。由此,给定这些特征的观测数据,目标特征在不同环境下属于同一分布。
31.鉴于此,相比于使用其中可能包括不具有因果不变性的特征的观测数据的全部用
户数据120,使用具有因果不变性的至少一个特征的观测数据可以获得更准确的预测结果。
32.在下文中,将参考图2来描述影响目标特征并且具有因果不变性的特征的确定和预测模型130的训练,并且参考图3来描述经训练的预测模型130的使用。
33.图2示出了根据本公开的实施例的用于训练预测模型130的示例方法200的流程图。例如,方法200可以由如图1所示的计算设备110来执行。应当理解,方法200还可以包括未示出的附加框和/或可以省略所示出的某些框。本公开的范围在此方面不受限制。
34.在框210处,计算设备110获取多个环境下的多个训练数据集。多个环境可以被视为特定分类下的多种分组。所述特定分类可以基于应用场景来确定。例如,多个环境可以是地域分类下的多种分组(例如,北京、上海等)、年龄段分类下的多种分组(例如,青年年龄段、中年年龄段、老年年龄段等)、数据获取时间分类下的多种分组(例如,一月份、二月份等)。每个训练数据集包括对应环境下的用户的一组特征的观测数据。该一组特征包括目标特征和与目标特征有关的多个特征。
35.例如,在用户服务领域的示例场景中,假设多个环境为多个地域。在这种情况下,一个训练数据集可以包括北京的用户的一组特征的观测数据,而另一个训练数据集可以包括上海的用户的一组特征的观测数据,以此类推。
36.此外,假设多个环境为多个年龄段。在这种情况下,一个训练数据集可以包括青年年龄段(例如,18-30岁)的用户的一组特征的观测数据,另一个训练数据集可以包括中年年龄段(例如,30-60岁)的用户的一组特征的观测数据,而再一个训练数据集可以包括老年年龄段(例如,大于60岁)的用户的一组特征的观测数据,以此类推。
37.进一步地,假设多个环境为多个数据获取时间。在这种情况下,一个训练数据集可以包括一月份获取的用户的一组特征的观测数据,而另一个训练数据集可以包括二月份获取的用户的一组特征的观测数据,以此类推。
38.在某些实施例中,用户的一组特征可以包括用户的行为特征和用户满意度特征等。作为示例,用户的行为特征可以包括用户的属性特征(诸如,用户的性别、年龄、等级等)、套餐特征(诸如,套餐名称、套餐费用、套餐流量等)、月度消费特征(诸如,主叫/被叫通话时长、主叫/被叫通话次数、免费流量使用量、应用流量使用量、补充流量次数等),月度费用特征(诸如,语音费用、套餐外语音费用、流量费用、国际漫游流量费用等)、和/或服务特征(诸如,客服请求次数、账户登录次数、业务办理次数、投诉次数等)等。此外,用户的行为特征还可以包括用户的文本信息特征(诸如,用户的评论、投诉内容等)、和/或网页浏览信息特征等。
39.进一步地,作为示例,用户满意度特征可以包括用户的整体满意度、费用满意度、网络质量满意度、语音通话质量满意度、业务宣传满意度、业务办理满意度、营业厅服务满意度、需要改进的方面、和/或满意的方面等。
40.由此,一组特征的观测数据可以是上述特征的值。
41.在某些实施例中,为了获取多个训练数据集,计算设备110可以收集来自多个环境的用户的一组特征的观测数据。计算设备110可以基于标识不同环境的环境参数,对所收集的观测数据进行分组,以得到与多个环境相对应的多个训练数据集。
42.例如,如上所述,可以收集来自多个地域(例如,北京、上海等)的用户的一组特征的观测数据,并且基于不同地域,对所收集的观测数据进行分组,以得到与多个地域相对应
的多个训练数据集。也可以收集来自多个年龄段(例如,青年年龄段、中年年龄段、老年年龄段等)的用户的一组特征的观测数据,并且基于不同年龄段,对所收集的观测数据进行分组,以得到与多个年龄段相对应的多个训练数据集。进一步地,也可以收集来自多个数据获取时间(例如,一月份、二月份等)的用户的一组特征的观测数据,并且基于不同数据获取时间,对所收集的观测数据进行分组,以得到与多个数据获取时间相对应的多个训练数据集。
43.进一步地,在某些实施例中,计算设备110可以对多个训练数据集进行预处理、特征工程和/或特征选择等,来增强多个训练数据集。例如,在预处理过程中,计算设备110可以基于套餐名称,得到指示套餐是否为不限流量套餐的新的特征。作为另一示例,计算设备110可以基于投诉内容,得到指示是否为针对费用的投诉、针对服务的投诉,针对网络质量的投诉等的新的特征。进一步地,计算设备110还可以基于投诉内容的观测数据(例如,投诉内容的文本)中的词语的词性,得到这些新的特征的观测数据,诸如0-100之间的数值化表示,其中0表示没有投诉,100表示极度不满。作为再一示例,计算设备110可以基于网页浏览信息特征,得到指示流量查询次数的新的特征。
44.在某些实施例中,在特征工程过程中,计算设备110可以对已有的特征进行加工以生成指示新的特性(例如,占比、边际比等)的新的特征。例如,这些特征可以包括语音费用占比(其为语音费用除以总费用)、主叫通话次数占比(其为主叫通话次数除以总通话次数)、和/或语音边际比(其为主叫通话时长除以语音费用)等。附加地或备选地,计算设备110还可以对周期性特征进行加工以生成指示某段时间内的新的特性(例如,均值、方差、波动等)的新的特征。例如,这些特征可以包括平均语音费用(其为0.5*(上一月语音费用+上两月语音费用))、和/或语音费用占比波动(其为上一月语音费用占比-上两月语音费用占比)等。
45.在某些实施例中,可以对特征进行筛选,以选择出与目标特征(例如,用户满意度)相关的特征。在特征选择过程中,计算设备110例如可以采用lasso(least absolute shrinkage and selection operator,最小绝对收缩和选择)算法、random forest(随机森林)算法等特征选择方法,来选择出与目标特征相关的特征。
46.在框220处,计算设备110基于多个训练数据集,根据因果关系在不同环境下的不变性,从多个特征中确定影响目标特征并且具有因果不变性的至少一个特征。
47.如上所述,具有因果不变性的特征是指这样的特征:在不同环境下给定这些特征的观测数据,目标特征的分布将保持不变。也就是说,如果特征在不同环境下具有因果不变性,则给定这些特征的观测数据,目标特征在不同环境下属于同一分布。。假设套餐特征能够影响目标特征并且具有因果不变性,而月度费用特征无法影响目标特征和/或不具有因果不变性,则至少一个特征将包括套餐特征,而不包括月度费用特征。
48.在某些实施例中,为了从多个特征中确定至少一个特征,计算设备110可以利用各种因果技术,例如因果迁移学习技术、不变因果预测(invariant causal prediction,icp)技术等。
49.在框230处,计算设备110利用多个训练数据集中的至少一个训练数据集,针对至少一个特征来训练预测模型。预测模型用于基于目标环境下的目标用户的至少一个特征的观测数据来生成针对目标用户的目标特征的预测结果。
50.预测模型是针对具有因果不变性的特征而被训练的,从而预测模型能够基于目标
环境下的目标用户的具有因果不变性的特征的观测数据来生成针对目标用户的目标特征的预测结果。
51.在某些实施例中,预测模型可以指示至少一个特征与目标特征之间具有线性因果关系和非线性因果关系中的一项。例如,取决于至少一个特征与目标特征之间具有线性因果关系还是非线性因果关系,预测模型可以是线性的或非线性的。
52.在某些实施例中,为了训练预测模型,计算设备110可以从至少一个训练数据集中获取一组训练样本。每个训练样本包括对应用户的至少一个特征的观测数据和目标特征的观测数据。例如,如上所述,假设套餐特征能够影响目标特征并且具有因果不变性,则一个训练样本可以是对应用户的套餐特征的观测数据和用户满意度的观测数据。
53.由此,计算设备110可以利用机器学习算法,基于一组训练样本来训练预测模型。机器学习算法可以是任何适当的机器学习算法,例如k近邻算法、svm(support vector machine,支持向量机)算法等。以此方式,由于使用在不同环境下具有因果不变性的特征的观测数据来训练预测模型,因此经训练的预测模型可以在目标环境下获得更准确的预测结果。
54.此外,在某些实施例中,为了基于一组训练样本来训练预测模型,计算设备110可以确定对一组训练样本中的每个训练样本进行数据变换的变换方式。变换方式可以基于各种适当算法来确定,例如基于核的优化算法,诸如dica(domain-invariant component analysis,领域不变成分分析)算法、sca(scatter component analyis,散射成分分析)算法等。基于核的优化算法可以通过使跨领域的差异最小化来学习不变的变换,同时保留输入和输出变量之间的函数关系。在这种情况下,经变换的训练样本可以具有独立同分布。由此,计算设备110可以基于变换方式,得到一组经变换的训练样本,并且基于一组经变换的训练样本来训练预测模型。
55.进一步地,在某些实施例中,计算设备110可以针对不同的环境分类,分别训练相应的预测模型。例如,计算设备110可以针对地域、年龄段和数据获取时间,分别训练各自的预测模型。该多个训练后的预测模型以及对应的环境信息可存储在存储设备中。
56.图3示出了根据本公开的实施例的用于使用预测模型130的示例方法300的流程图。例如,方法300可以由如图1所示的计算设备110来执行。应当理解,方法300还可以包括未示出的附加框和/或可以省略所示出的某些框。本公开的范围在此方面不受限制。
57.在框310处,计算设备110获取目标环境下的目标用户的用户数据120。用户数据120包括目标用户的多个特征的观测数据。所述用户数据120包括但不限于对产品或服务使用的用户行为数据、属性数据以及调研数据中的至少一种。例如,在用户服务领域的示例场景中,目标用户的多个特征可以包括目标用户的行为特征。在上文中已经描述了行为特征的示例,因此在此省略其详细描述。多个特征的观测数据可以是上述特征的值。
58.在框320处,计算设备110从用户数据120中提取至少部分用户数据。至少部分用户数据包括多个特征中影响目标特征并且具有因果不变性的至少一个特征的观测数据。作为示例,在用户服务领域的示例场景中,目标特征可以是用户满意度。在上文中已经描述了用户满意度的示例,因此在此省略其详细描述。目标特征的预测结果可以是目标特征的预测值。
59.如上所述,具有因果不变性的特征是指这样的特征:在不同环境下,给定这些特征
的观测数据,目标特征的分布将保持不变。也就是说,如果特征在不同环境下具有因果不变性,则给定这些特征的观测数据,目标特征在不同环境下属于同一分布。假设套餐特征能够影响目标特征并且具有因果不变性,而月度费用特征无法影响目标特征或不具有因果不变性,则至少一个特征将包括套餐特征,而不包括月度费用特征。
60.在框330处,计算设备110基于至少部分用户数据,生成针对目标用户的目标特征的预测结果140。
61.在上文中,预测模型被描述为针对在不同环境下具有因果不变性的特征进行了训练。由于这些特征在不同环境下具有因果不变性,因此其在目标环境下也具有因果不变性。在这种情况下,经训练的预测模型可以在目标环境下基于具有因果不变性的特征的观测数据,准确预测出目标特征的预测结果。由此,在某些实施例中,计算设备110基于至少部分用户数据,根据针对至少一个特征所训练的预测模型130,生成针对目标用户的目标特征的预测结果140。
62.进一步地,在某些实施例中,计算设备110可以从多个环境中确定目标环境。在某些实施例中,目标环境的确定可以是计算设备110自动进行的,也可以是用户手动选择的。例如,在用户服务领域的示例场景中,用户可以选择其期望的目标环境。例如,如果用户期望对深圳的用户满意度进行预测,则用户可以输入或选择深圳作为目标环境。在这种情况下,由于针对不同的环境分类,训练了相应的预测模型,因此计算设备110可以接收输入的所述目标环境信息,并基于目标环境,确定对应于目标环境的分类的预测模型。例如,假设针对地域、年龄段和数据获取时间,分别训练了各自的预测模型。由于用户选择的目标环境属于地域分类,因此计算设备110可以选择与地域相对应的预测模型进行预测。
63.由此,可以在各种不同的环境分类下,提高预测结果的准确性。此外,由于可以由用户选择目标环境,因此可以提高系统的灵活性和用户体验。
64.在某些实施例中,预测结果140可以用于后续分析。例如,在用户服务领域,用户满意度的预测结果能够被运营商用于对不同用户采用不同策略,以提高用户满意度。在医疗健康领域,患者的康复情况的预测结果能够被医生用于对不同患者制定不同医疗方案,以提高治愈率。在在线广告领域,用户对在线广告的兴趣能够被广告提供商用于对不同用户投放不同广告,以提高广告收益。
65.为此,在某些实施例中,方法300可以进一步包括基于预测结果140输出第一信息或执行第一操作。第一信息可以包括但不限于基于预测结果140确定的一种或多种指示信息、策略信息、推荐信息等。第一操作可以包括但不限于基于预测结果执行策略指令操作、识别操作、分析操作等。
66.此外,基于预测结果140采取的后续动作所生成的数据可以被进一步用于改进预测模型130。因此,可以进一步提高预测结果的准确性,以及使得预测模型可以动态更新。为此,在某些实施例中,计算设备110可以获取基于预测结果140采取的后续动作所生成的数据,并且基于这样的数据更新预测模型130。
67.图4示出了根据本公开的实施例的用于预测用户满意度的示例方法的流程图400。例如,方法400可以由如图1所示的计算设备110来执行。应当理解,方法400还可以包括未示出的附加框和/或可以省略所示出的某些框。本公开的范围在此方面不受限制。
68.在框410处,计算设备110可以获取目标环境(例如,目标地域,诸如深圳)下的目标
用户的用户行为数据。用户行为数据可以包括目标用户的多个行为特征的观测数据。在上文中已经描述了行为特征的示例,因此在此省略其详细描述。多个行为特征的观测数据可以是上述行为特征的值。
69.在框420处,计算设备110可以从用户行为数据中提取至少部分用户行为数据。至少部分用户行为数据可以包括多个行为特征中影响用户满意度并且具有因果不变性的至少一个行为特征的观测数据。
70.在框430处,计算设备110可以基于至少部分用户行为数据,生成针对目标用户的用户满意度的预测结果。由此,可以提高所预测的用户满意度的准确性。
71.方法400可以进一步包括利用用户满意度的预测结果,确定对该一个或多个目标用户的策略信息。方法400可以进一步包括输出策略信息或基于策略信息执行策略操作。
72.图5示出了根据本公开的实施例的用于预测患者的康复情况的示例方法的流程图500。例如,方法500可以由如图1所示的计算设备110来执行。应当理解,方法500还可以包括未示出的附加框和/或可以省略所示出的某些框。本公开的范围在此方面不受限制。
73.在框510处,计算设备110可以获取目标环境(例如,目标年龄段,诸如幼年年龄段)下的目标患者的患者数据。患者数据可以包括目标患者的多个特征的观测数据。例如,多个特征可以包括患者的性别、地域、治疗方案等。多个特征的观测数据可以是上述特征的值。
74.在框520处,计算设备110可以从患者数据中提取至少部分患者数据。至少部分患者数据可以包括多个特征中影响患者的康复情况并且具有因果不变性的至少一个特征的观测数据。
75.在框530处,计算设备110可以基于至少部分患者数据,生成针对目标患者的康复情况的预测结果。由此,可以提高所预测的患者的康复情况的准确性。
76.方法500可以进一步包括利用目标患者的康复情况的预测结果,确定对该一个或多个目标患者的治疗方案信息或辅助治疗信息。方法500可以进一步包括输出治疗方案信息或辅助治疗信息。此外,方法500可以进一步包括对治疗方案信息或辅助治疗信息进行后续分析。由此,可以辅助医生对该一个或多个目标患者的治疗方案进行决策,或者对该一个或多个目标患者进行治疗。
77.图6示出了根据本公开的实施例的用于预测用户对在线广告的兴趣的示例方法的流程图600。例如,方法600可以由如图1所示的计算设备110来执行。应当理解,方法600还可以包括未示出的附加框和/或可以省略所示出的某些框。本公开的范围在此方面不受限制。
78.在框610处,计算设备110可以获取目标环境(例如,目标性别,诸如女性)下的目标用户的用户数据。用户数据可以包括与目标用户相关联的多个特征的观测数据。例如,多个特征可以包括用户的年龄、职业、地域等、以及用户观看的在线广告的大小、时长、显示位置、内容、质量等。多个特征的观测数据可以是上述特征的值。
79.在框620处,计算设备110可以从用户数据中提取至少部分用户数据。至少部分用户数据可以包括多个特征中影响目标用户对在线广告的兴趣并且具有因果不变性的至少一个特征的观测数据。
80.在框630处,计算设备110可以基于至少部分用户数据,生成目标用户对在线广告的兴趣的预测结果。由此,可以提高所预测的用户对在线广告的兴趣的准确性。
81.方法600可以进一步包括利用用户对在线广告的兴趣的预测结果,确定对该一个
或多个目标用户的在线广告推荐策略信息,或确定向该一个或多个目标用户推荐的在线广告。方法600可以进一步包括输出在线广告推荐策略信息或基于在线广告推荐策略信息推荐在线广告。进一步地,方法600还可以包括向该一个或多个目标用户呈现所推荐的在线广告。
82.图7示出了可以用来实施本公开的实施例的示例设备700的示意性框图。例如,如图1所示的计算设备110可以由设备700来实施。如图所示,设备700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的计算机程序指令或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序指令,来执行各种适当的动作和处理。在ram 703中,还可存储设备700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
83.设备700中的多个部件连接至i/o接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
84.处理单元701可被配置为执行上文所描述的各个过程和处理,例如方法200、300、400、500和/或600。例如,在一些实施例中,方法200、300、400、500和/或600可以被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由rom 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序被加载到ram 703并由cpu 701执行时,可以执行上文描述的方法200、300、400、500和/或600中的一个或多个步骤。
85.本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
86.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
87.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
88.用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、
机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
89.这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
90.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
91.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
92.附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
93.以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1