一种网页数据推送方法、系统及云平台与流程

文档序号:30507195发布日期:2022-06-25 00:42阅读:134来源:国知局
一种网页数据推送方法、系统及云平台与流程

1.本技术涉及数据处理技术领域,具体而言,涉及一种网页数据推送方法、系统及云平台。


背景技术:

2.随着互联网进行不断地发展,用户经常采用互联网的方式在线获得需要的相关数据,能够快速和准确的得到相关数据,这样不仅降低数据获取的周期,提高数据的获取效率。在实际操作过程中,发明人经过长期研究发现,通过网页进行数据推送时,存在推送数据不可靠和缺失的问题。因此,亟需一种技术来改善网页数据推送不可靠以及信息缺失的问题。


技术实现要素:

3.鉴于此,本技术提供了一种网页数据推送方法、系统及云平台。
4.第一方面,提供一种网页数据推送方法,包括:对待进行优化的第一实时网页互动数据进行延展处理,获得第二实时网页互动数据;确定所述第二实时网页互动数据的实时网页显著事件序列,并对所述第二实时网页互动数据进行描述挖掘操作,获得第一页面描述分布;对所述实时网页显著事件序列与所述第一页面描述分布进行全局化处理,获得第二页面描述分布;对所述第一页面描述分布进行描述抽取操作,获得第三页面描述分布;对所述第一页面描述分布进行描述抽取操作,获得第三页面描述分布;对所述第二页面描述分布与所述第三页面描述分布进行全局化处理,获得第四页面描述分布;借助所述第四页面描述分布,生成第三实时网页互动数据,其中,所述第三实时网页互动数据的特征识别度超过所述第一实时网页互动数据的特征识别度;将所述第三实时网页互动数据进行推送。
5.在本公开实施例中,对待进行优化的第一实时网页互动数据进行延展处理,可以获得特征识别度更高的第二实时网页互动数据,对实时网页显著事件序列与第一页面描述分布进行全局化处理,获得第二页面描述分布,使得该第二页面描述分布涵盖了第一实时网页互动数据的实时网页显著事件,对第二实时网页互动数据进行描述挖掘操作和描述抽取操作,获得第三页面描述分布,该第三页面描述分布相当于结合了第一实时网页互动数据的内容属性,对第二页面描述分布与第三页面描述分布进行全局化处理,也就相当于结合了第一实时网页互动数据的实时网页显著事件和互动数据内容属性,相较于仅依据实时网页显著事件生成实时网页互动数据的方式,本公开实施例中参阅了实时网页互动数据的显著事件和更加完整的互动数据内容属性,以提高生成的第三实时网页互动数据的互动数据评价得分,从而能够有效地提高网页数据推送的可靠性和完整性。
6.在一种独立实施的实施例中,对所述第一页面描述分布进行描述抽取操作,获得第三页面描述分布,包括:利用第一描述挖掘单元,对所述第一页面描述分布进行描述挖掘操作,获得第五页面描述分布;利用第二描述挖掘单元,对所述第一页面描述分布进行描述挖掘操作,获得第六页面描述分布,其中,所述第一描述挖掘单元和所述第二描述挖掘单元的参数配置存在差异;对所述第五页面描述分布和所述第六页面描述分布进行组合,获得第七页面描述分布;借助所述第五页面描述分布、所述第六页面描述分布和所述第七页面描述分布,确定所述第三页面描述分布。
7.本公开实施例中,利用不同参数配置的描述挖掘单元对第一页面描述分布分别进行描述挖掘操作,可以获得第一实时网页互动数据的不同的网页数据推送意图,并等于挖掘到第一实时网页互动数据的不同推送数据特征,在最后通过第三页面描述分布生成的实时网页互动数据能够更加可靠地进行表示第一实时网页互动数据的推送特征,进一步提高了生成的实时网页互动数据的评价得分。
8.在一种独立实施的实施例中,借助所述第五页面描述分布、所述第六页面描述分布和所述第七页面描述分布,确定所述第三页面描述分布,包括:对所述第七页面描述分布逐一进行描述精简处理和分类处理,获得第八页面描述分布;对于所述第五页面描述分布中的各个页面描述内容,分别实施如下步骤:将所述第五页面描述分布中的一个页面描述内容的量化描述指标与所述第八页面描述分布中对应区域的页面描述内容的量化描述指标加权,获得第九页面描述分布;对于所述第六页面描述分布中的各个页面描述内容,分别实施如下步骤:将所述第五页面描述分布中的一个页面描述内容的量化描述指标与所述第八页面描述分布中对应区域的页面描述内容的量化描述指标加权,获得第十页面描述分布;对于所述第九页面描述分布中的各个页面描述内容,分别实施如下步骤:将所述第九页面描述分布中的一个页面描述内容的量化描述指标与所述第十页面描述分布中对应区域的页面描述内容的量化描述指标整合,确定所述第三页面描述分布。
9.本公开实施例中,对第七页面描述分布逐一进行描述精简处理和分类处理,获得第八页面描述分布,通过描述精简处理可以缓解梳理处理压力,以削弱互动数据处理过程中存在的处理网页描述紊乱问题,且,将第八页面描述分布分别和第五页面描述分布、第六页面描述分布加权,获得第九页面描述分布和第十页面描述分布,并将第九页面描述分布和第十页面描述分布整合,并对页面描述分布进行了若干次全局化处理,使所得第三页面描述分布涵盖更为全面的层面,使生成的第三实时网页互动数据能够更加可靠地表示第一实时网页互动数据的内容属性。
10.在一种独立实施的实施例中,利用第一描述挖掘单元,对所述第一页面描述分布进行描述挖掘操作,获得第五页面描述分布,和利用第二描述挖掘单元,对所述第一页面描述分布进行描述挖掘操作,获得第六页面描述分布,包括:
对所述第一页面描述分布进行描述挖掘操作和触发处理,获得第十一页面描述分布;利用第一描述挖掘单元,对所述第一页面描述分布和所述第十一页面描述分布进行描述挖掘操作,确定所述第五页面描述分布;利用第二描述挖掘单元,对所述第一页面描述分布和所述第十一页面描述分布进行描述挖掘操作,确定所述第六页面描述分布。
11.本公开实施例中,对第一页面描述分布进行描述挖掘操作和触发处理,获得第十一页面描述分布,对第一页面描述分布和第十一页面描述分布进行描述挖掘操作,后续不仅能够挖掘第十一页面描述分布的内容属性,还能够挖掘到进行描述挖掘操作和触发处理之前的第一页面描述分布的内容属性,从而挖掘到更加完整的内容属性。
12.在一种独立实施的实施例中,对所述实时网页显著事件序列与所述第一页面描述分布进行全局化处理,获得第二页面描述分布,包括:对于所述实时网页显著事件序列中的各个页面描述内容,分别实施如下步骤:将所述实时网页显著事件序列中的一个页面描述内容的量化描述指标与所述第一页面描述分布中对应区域的页面描述内容的量化描述指标加权,确定所述第二页面描述分布;和/或,借助所述第四页面描述分布,生成第三实时网页互动数据,包括:对于所述第四页面描述分布中的各个页面描述内容,分别实施如下步骤:将所述第四页面描述分布中的一个页面描述内容的量化描述指标与所述第二实时网页互动数据中对应区域的页面描述内容的量化描述指标整合,确定所述第三实时网页互动数据。
13.本公开实施例中,将实时网页显著事件序列和第一页面描述分布加权,获得第二页面描述分布,将第二页面描述分布和第三页面描述分布组合,获得第四页面描述分布,将第四页面描述分布和第二实时网页互动数据整合,获得第三实时网页互动数据,可以理解的是通过实际操作要求对不同的页面描述分布,利用不同的拼接方式进行处理,从而所得内容属性更能达到设定的标准实际操作要求。
14.在一种独立实施的实施例中,对待进行优化的第一实时网页互动数据进行延展处理,获得第二实时网页互动数据,包括:对于所述第一实时网页互动数据中的各个页面描述标签,分别实施如下步骤,确定所述第二实时网页互动数据:在一个页面描述标签的关联标签集添加页面描述标签;将添加的页面描述标签的词向量指标定义为所述一个页面描述标签的词向量指标。
15.本公开实施例中,提供一种延展处理的方法,该方法精简,可以尽快对第一实时网页互动数据进行衍生处理,获得第二实时网页互动数据,提高后续的生成第三实时网页互动数据的处理效率。
16.在一种独立实施的实施例中,所述第三实时网页互动数据是将所述第一实时网页互动数据传入完成调试的智能化线程得到的,所述完成调试的智能化线程基于以下方式调试所得:挑选范例实时网页互动数据二元组队列中的第一范例实时网页互动数据二元组,
其中,每个范例实时网页互动数据二元组包括第一范例实时网页互动数据,和第一范例实时网页互动数据对应的第二范例实时网页互动数据,所述第一范例实时网页互动数据和所述第二范例实时网页互动数据对应相同实时网页的两个互动数据,所述第二范例实时网页互动数据的特征识别度超过所述第一范例实时网页互动数据的特征识别度;将所述第一范例实时网页互动数据二元组中的第一范例实时网页互动数据传入所述智能化线程,生成第四实时网页互动数据;将所述第四实时网页互动数据传入特征处理线程,对所述第四实时网页互动数据逐一进行特征提取处理和特征翻译处理,获得第一目标实时网页互动数据;确定所述第四实时网页互动数据与所述第一范例对中的第二范例实时网页互动数据之间的第一比较结果,和所述第四实时网页互动数据与所述第一目标实时网页互动数据之间的第二比较结果;借助所述第一比较结果和所述第二比较结果,确定所述智能化线程的第一线程评价;借助所述第一线程评价,改进所述智能化线程的线程变量,直至所述智能化线程处于设定状态,获得完成调试的智能化线程。
17.在本公开实施例中,特征处理线程可以基于智能化线程生成的第四实时网页互动数据,生成第一目标实时网页互动数据,根据第四实时网页互动数据和第二范例实时网页互动数据之间的第一比较结果和第四实时网页互动数据与第一目标实时网页互动数据之间的第二比较结果,调试智能化线程,相较于仅根据第四实时网页互动数据和第二范例实时网页互动数据之间的第一比较结果调试智能化线程的方式,即单独调试智能化线程的方式,本公开实施例中基于特征处理线程辅助调试智能化线程,可以参阅尽可能丰富的信息改进智能化线程的线程变量,使得智能化线程可以尽快处于设定状态,提高调试智能化线程的处理效率和调试效果。
18.在一种独立实施的实施例中,借助所述第一线程评价,改进所述智能化线程的线程变量时,所述方法还包括:将所述第一范例实时网页互动数据二元组中的第二范例实时网页互动数据传入所述特征处理线程,对所述第一范例实时网页互动数据二元组中的第二范例实时网页互动数据逐一进行特征提取处理和特征翻译处理,获得第二目标实时网页互动数据;确定所述第一范例实时网页互动数据二元组中的第二范例实时网页互动数据与所述第二目标实时网页互动数据之间的第三比较结果;借助所述第二比较结果和所述第三比较结果,确定所述特征处理线程的第二线程评价,其中,所述第二线程评价与所述第二比较结果存在第一对应关系,所述第二线程评价与第三比较结果存在第二对应关系;借助所述第二线程评价,改进所述特征处理线程的线程变量,直至所述特征处理线程处于设定状态,获得完成调试的特征处理线程。
19.在本公开实施例中,特征处理线程的第二线程评价与第二比较结果存在第一对应关系,与第三比较结果存在第二对应关系,在调试的过程中维持第二比较结果和第三比较结果的去值化处理结果,使得特征处理线程更加容易处于设定状态,提高了调试特征处理线程调试的效率。
20.第二方面,提供一种网页数据推送系统,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
21.第二方面,提供一种云平台,所述云平台包括存储有程序的可读存储介质,以执行所述的方法。
附图说明
22.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
23.图1为本技术实施例所提供的一种网页数据推送方法的流程图。
24.图2为本技术实施例所提供的一种网页数据推送装置的框图。
25.图3为本技术实施例所提供的一种网页数据推送系统的架构图。
具体实施方式
26.为了更好的理解上述技术方案,下面通过附图以及具体实施例对本技术技术方案做详细的说明,应当理解本技术实施例以及实施例中的具体特征是对本技术技术方案的详细的说明,而不是对本技术技术方案的限定,在不冲突的情况下,本技术实施例以及实施例中的技术特征可以相互组合。
27.请参阅图1,示出了一种网页数据推送方法,该方法可以包括以下step210-step270所描述的技术方案。
28.step210,对待进行优化的第一实时网页互动数据进行延展处理,获得第二实时网页互动数据。
29.待进行优化的第一实时网页互动数据可以是网页数据推送系统记录所得,也可以是其他采集设备记录后发送给网页数据推送系统的,其他采集设备为具有记录功能的采集设备,比如交互平台等。网页数据推送系统在获得待进行优化的第一实时网页互动数据之后,可以对待进行优化的第一实时网页互动数据进行延展处理,获得第二实时网页互动数据。延展处理可以理解为对第一实时网页互动数据进行衍生处理。
30.在一种可替换的实施例中,为了缓解处理量,网页数据推送系统可以利用精简的人工智能模型对第一实时网页互动数据进行延展处理,可以尽快获得第二实时网页互动数据,从而提高整个实时网页互动数据获取效率。
31.进一步地,网页数据推送系统可以对第一实时网页互动数据中的一个页面描述标签的关联标签集添加页面描述标签,将添加的页面描述标签的词向量指标定义为该一个页面描述标签的词向量指标,网页数据推送系统对第一实时网页互动数据中所有页面描述标签处理结束后,获得第二实时网页互动数据。
32.在一种独立实施的实施例中,第二实时网页互动数据的特征识别度可以为第一实时网页互动数据的特征识别度的4的系数。比如,第二实时网页互动数据的特征识别度可以为第一实时网页互动数据的特征识别度的16倍,由于对第一实时网页互动数据的衍生系数越大,该第二实时网页互动数据的互动数据评价分数会越低,而当第二实时网页互动数据
的特征识别度可以为第一实时网页互动数据的特征识别度的16倍时,第二实时网页互动数据在具有比较高的特征识别度的同时,还可以维持一定的互动数据评价分数。
33.比如,第一实时网页互动数据的特征识别度为32*32,将第一实时网页互动数据的特征识别度衍生16倍,所得第二实时网页互动数据的特征识别度为256*256。
34.step220,获得第二实时网页互动数据的实时网页显著事件序列,并对第二实时网页互动数据进行描述挖掘操作,获得第一页面描述分布。
35.示例性的,可以先对第二实时网页互动数据进行显著事件提取的过程进行说明。
36.网页数据推送系统可以通过完成调试的显著事件进行识别,获得实时网页互动数据显著事件序列。
37.网页数据推送系统可以将第二实时网页互动数据传入完成调试的显著事件进行识别,获得多个显著事件页面描述分布。其中,每个显著事件页面描述分布对应一个实时网页显著事件,每个显著事件页面描述分布中每个页面描述标签的量化描述指标表示该页面描述标签属于该一个实时网页显著事件的出现频率。实时网页显著事件用于标识实时网页的重要部分,比如,第一实时网页互动数据为网页互动数据,网页显著事件数目为34个,对应可以所得显著事件页面描述分布的数目也为34个。
38.网页数据推送系统可以将这多个显著事件页面描述分布进行累积,获得实时网页互动数据显著事件序列。或者,有可能存在多个显著事件页面描述分布中的多个显著事件交叉的情况,因此为了获得更为准确的实时网页互动数据显著事件序列,在本公开实施例中,网页数据推送系统可以对多个显著事件页面描述分布中相同区域的页面描述标签的量化描述指标进行指标处理,比如,通过指标处理,得到每个页面描述标签属于实时网页显著事件的出现频率,取出现频率目标量化系数对应的页面描述标签作为实时网页显著事件,获得第二实时网页互动数据的实时网页显著事件序列,即一个涵盖实时网页显著事件序列的页面描述分布,该页面描述分布用于表征各个页面描述标签为实时网页显著事件的出现频率。
39.网页数据推送系统还可以对第二实时网页互动数据进行描述挖掘操作,获得第一页面描述分布,比如,将第二实时网页互动数据传入一6*6的描述挖掘单元,输出第一页面描述分布。
40.step230,对实时网页显著事件序列与第一页面描述分布进行全局化处理,获得第二页面描述分布。
41.对实时网页显著事件序列与第一页面描述分布进行全局化处理的方式有多种,如下步骤进行描述。
42.第一种,对实时网页显著事件序列与第一页面描述分布进行加权操作。
43.进一步地,网页数据推送系统可以将实时网页显著事件序列中的一个页面描述内容的量化描述指标与第一页面描述分布中对应区域的页面描述内容的量化描述指标加权,网页数据推送系统对实时网页显著事件序列中的所有页面描述内容处理结束后,获得第二页面描述分布。其中,页面描述内容可以理解为网页数据推送系统处理的最小互动数据单元,页面描述内容可以是一个页面描述标签或多个页面描述标签,在此不进行一一赘述。
44.第二种,对实时网页显著事件序列与第一页面描述分布进行结合处理。
45.进一步地,网页数据推送系统可以将实时网页显著事件序列中的一个页面描述内
容的量化描述指标与第一页面描述分布中对应区域的页面描述内容的量化描述指标整合,网页数据推送系统对实时网页显著事件序列中的所有页面描述内容处理结束后,获得第二页面描述分布。页面描述内容的含义参考上述描述的内容,在此不再进行一一赘述。
46.第三种,对实时网页显著事件序列与第一页面描述分布进行组合操作。
47.进一步地,网页数据推送系统可以对实时网页显著事件序列和第一页面描述分布按设定维度进行组合,获得第二页面描述分布。
48.实时网页显著事件序列相当于标记了实时网页的关键特征的区域,而第一页面描述分布相当于标记了实时网页的关键内容属性,因此在本公开实施例中,网页数据推送系统可以对实时网页显著事件序列与第一页面描述分布进行全局化处理,获得第二页面描述分布,使得第二页面描述分布可以涵盖更加可靠、可读性的信息,有利于提高确定的特征识别度的互动数据实时网页的评价分数。
49.step240,对第一页面描述分布进行描述抽取操作,获得第三页面描述分布。
50.利用单一的描述挖掘单元对互动数据进行处理,可能会遗漏一些特征进行分析,因此,本公开实施例中网页数据推送系统可以利用不同参数配置的描述挖掘单元分别对第一页面描述分布进行描述抽取操作,获得第五页面描述分布和第六页面描述分布。
51.进一步地,网页数据推送系统利用第一描述挖掘单元对第一页面描述分布进行描述挖掘操作,获得第五页面描述分布,利用第二描述挖掘单元对第一页面描述分布进行描述挖掘操作,获得第六页面描述分布,其中,第一描述挖掘单元和第二描述挖掘单元的参数配置存在差异。
52.在本实施例中,本公开实施例基于卷积调试模型(可以理解为特征提取模型),将第一页面描述分布传卷积调试模型,获得第十一页面描述分布,输出第一页面描述分布和第十一页面描述分布,分别利用不同参数配置的描述挖掘单元对卷积调试模型的输出进行描述挖掘操作,获得第五页面描述分布和第六页面描述分布。本公开实施例中不仅能够提取到第十一页面描述分布的特征,还能够提取到传卷积调试模型的第一页面描述分布的特征,使后续所得页面描述分布涵盖更加可靠的特征。
53.进一步地,第一页面描述分布通过卷积调试模型进行描述挖掘操作,和通过卷积调试模型进行触发处理,获得第十一页面描述分布,将第一页面描述分布和第十一页面描述分布一起作为卷积调试模型的输出。利用第一描述挖掘单元对第一页面描述分布和第十一页面描述分布进行描述挖掘操作,获得第五页面描述分布,利用第二描述挖掘单元对第一页面描述分布和第十一页面描述分布进行描述挖掘操作,获得第六页面描述分布。
54.当卷积调试模型包括一个异常单元时,第一页面描述分布通过描述挖掘单元进行描述挖掘操作,和通过触发单元进行触发处理,获得第十一页面描述分布,对第一页面描述分布和第十一页面描述分布进行全局化处理后,即第一页面描述分布和第十一页面描述分布全局化处理后的结合结果为异常单元的目标量化异常分析结果。进一步可以分别利用不同的描述挖掘单元对该拼接情况进行描述挖掘操作,获得第五页面描述分布和第六页面描述分布。
55.比如,对第一页面描述分布和第十一页面描述分布进行加权处理后,获得第一整合结果,利用第一描述挖掘单元对第一整合结果进行描述挖掘操作,获得第五页面描述分布,利用第二描述挖掘单元对第一整合结果进行描述挖掘操作,获得第六页面描述分布。
56.当卷积调试模型包括多个异常单元时,第一页面描述分布逐一通过多个异常单元,将最后一个异常单元的输出作为目标量化异常分析结果。
57.进一步地,第一页面描述分布通过第一个异常单元,获得第一量化异常分析结果,第一量化异常分析结果通过第二个异常单元,获得第二量化异常分析结果,第二量化异常分析结果通过下一个异常单元,直至通过最后一个异常单元,获得目标量化异常分析结果。进一步地,分别利用第一描述挖掘单元和第二描述挖掘单元对目标量化异常分析结果进行描述挖掘操作,获得第五页面描述分布和第六页面描述分布。
58.进一步地,网页数据推送系统可以对第五页面描述分布和第六页面描述分布进行组合操作,获得第七页面描述分布,其中,组合操作的方式请结合上述的对实时网页显著事件序列与第一页面描述分布进行组合操作的内容,在此不再进行一一赘述。进一步地,基于第五页面描述分布、第六页面描述分布和第七页面描述分布,获得第三页面描述分布。
59.其中,网页数据推送系统基于第五页面描述分布、第六页面描述分布和第七页面描述分布获得第三页面描述分布的方式有多种,如下步骤进行描述。
60.(1),网页数据推送系统可以对第五页面描述分布、第六页面描述分布和第七页面描述分布进行全局化处理,获得第三页面描述分布。
61.其中,全局化处理的方式有多种,请参照前文论述的对实时网页显著事件序列与第一页面描述分布进行全局化处理的内容,在此不再进行一一赘述。比如,网页数据推送系统对第五页面描述分布和第六页面描述分布进行加权处理之后,再将加权结果和第七页面描述分布进行加权处理,从而获得第三页面描述分布。
62.本公开实施例中,直接对第五页面描述分布、第六页面描述分布和第七页面描述分布进行全局化处理,其过程精简,可以尽快地获得第三页面描述分布。
63.(2),网页数据推送系统可以对第七页面描述分布逐一进行描述精简处理和分类处理,获得第八页面描述分布,对第八页面描述分布与第五页面描述分布进行全局化处理,获得第九页面描述分布,对第八页面描述分布与第六页面描述分布进行全局化处理,获得第十页面描述分布,进一步地对第九页面描述分布和第十页面描述分布进行全局化处理,获得第三页面描述分布。
64.进一步地,网页数据推送系统可以对第七页面描述分布逐一进行描述精简处理和分类处理,描述精简处理比如max描述精简处理、ave描述精简处理等,获得第八页面描述分布。对第八页面描述分布与第五页面描述分布进行加权操作,获得第九页面描述分布,对第八页面描述分布与第六页面描述分布进行加权操作,获得第十页面描述分布,和对第九页面描述分布和第十页面描述分布进行加权处理,获得第三页面描述分布。
65.本公开实施例中,通过多次的全局化处理,所得第三页面描述分布可以涵盖尽可能丰富的特征,使基于第三页面描述分布所得实时网页互动数据也能涵盖尽可能丰富的特征,从而提高最终所得实时网页互动数据的评价得分。
66.step250,对第二页面描述分布与第三页面描述分布进行全局化处理,获得第四页面描述分布。
67.网页数据推送系统获得第二页面描述分布和第三页面描述分布之后,可以对第二页面描述分布与第三页面描述分布进行组合操作或加权操作,获得第四页面描述分布。
68.step260,基于第四页面描述分布,生成第三实时网页互动数据。
69.网页数据推送系统获得第四页面描述分布之后,可以直接将第四页面描述分布作为第三实时网页互动数据。其中,第三实时网页互动数据的特征识别度超过第一实时网页互动数据的特征识别度。
70.或者,为了使生成的第三实时网页互动数据涵盖尽可能丰富的特征,本公开实施例中,网页数据推送系统可以对第四页面描述分布和第二实时网页互动数据进行组合操作或加权操作,获得第三实时网页互动数据。
71.step270,将所述第三实时网页互动数据进行推送。
72.在本实施例中,网页数据推送系统可以通过智能化线程执行网页数据推送方法,通过智能化线程对第一实时网页互动数据进行处理,生成第三实时网页互动数据。
73.其中,智能化线程可以是智能化线程从其他采集设备所得,或者智能化线程自行调试的,下面对调试智能化线程的方式进行示例介绍。
74.可以理解,在执行上述step210-strp270所描述的内容时,对待进行优化的第一实时网页互动数据进行延展处理,可以获得特征识别度更高的第二实时网页互动数据,对实时网页显著事件序列与第一页面描述分布进行全局化处理,获得第二页面描述分布,使得该第二页面描述分布涵盖了第一实时网页互动数据的实时网页显著事件,对第二实时网页互动数据进行描述挖掘操作和描述抽取操作,获得第三页面描述分布,该第三页面描述分布相当于结合了第一实时网页互动数据的内容属性,对第二页面描述分布与第三页面描述分布进行全局化处理,也就相当于结合了第一实时网页互动数据的实时网页显著事件和互动数据内容属性,相较于仅依据实时网页显著事件生成实时网页互动数据的方式,本公开实施例中参阅了实时网页互动数据的显著事件和更加完整的互动数据内容属性,以提高生成的第三实时网页互动数据的互动数据评价得分。从而能够有效地提高网页数据推送的可靠性和完整性。
75.网页数据推送系统通过范例实时网页互动数据二元组智能化线程进行调试,改进智能化线程的各个线程变量的取值,直至智能化线程处于设定状态,获得完成调试的智能化线程。调试过程具体包括如下步骤。
76.step1-1,网页数据推送系统挑选范例实时网页互动数据二元组队列中的第一范例实时网页互动数据二元组,其中,范例实时网页互动数据二元组队列可以从可用的数据资源中获得,范例实时网页互动数据二元组队列包括多个范例实时网页互动数据二元组,每个范例实时网页互动数据二元组包括第一范例实时网页互动数据,和第一范例实时网页互动数据对应的第二范例实时网页互动数据,第一范例实时网页互动数据和第二范例实时网页互动数据对应相同实时网页的两个互动数据,且第二范例实时网页互动数据的特征识别度超过第一范例实时网页互动数据的特征识别度。
77.step1-2,网页数据推送系统将第一范例实时网页互动数据二元组中的第一范例实时网页互动数据作为智能化线程的传入,智能化线程输出的互动数据与第二范例实时网页互动数据的比较结果作为智能化线程的响应,通过响应,不断改进智能化线程的线程变量的参数。
78.反复执行上述step1-1-step1-2的步骤,直至智能化线程处于设定状态,获得完成调试的智能化线程。
79.在一种可替换的实施例中,网页数据推送系统可以借助特征处理线程调试智能化
线程。
80.进一步地,特征处理线程可以基于智能化线程的输出,再目标实时网页互动数据。比如,特征处理线程可以对传入的实时网页互动数据逐一进行特征提取处理和特征翻译处理,获得目标互动数据,可以通过目标比较结果,判断特征处理线程传入的实时网页互动数据是智能化线程生成的实时网页互动数据还是真实的实时网页互动数据。特征处理线程和智能化线程通过扰动调试,使智能化线程生成的实时网页互动数据逐渐逼近实际的实时网页互动数据。
81.在一种可替换的实施例中,特征处理线程可以包括若干个描述挖掘单元和若干个描述精简单元。
82.本公开实施例提供的特征处理线程可以通过以下网页数据推送系统共同调试智能化线程和特征处理线程为例,对智能化线程和特征处理线程的调试步骤进行描述。
83.step2-1,挑选范例实时网页互动数据二元组队列中的第一范例实时网页互动数据二元组。
84.其中,范例实时网页互动数据二元组队列和第一范例实时网页互动数据二元组的具体意思请参阅上述描述内容,在此不再进行一一赘述。
85.step2-2,将第一范例实时网页互动数据二元组中的第一范例实时网页互动数据传入智能化线程,生成第四实时网页互动数据。
86.网页数据推送系统将第一范例实时网页互动数据传入智能化线程,智能化线程执行网页数据推送方法,生成第四实时网页互动数据。
87.step2-3,将第四实时网页互动数据传入特征处理线程,对第四实时网页互动数据逐一进行特征提取处理和特征翻译处理,获得第一目标实时网页互动数据。
88.网页数据推送系统将第四实时网页互动数据传入特征处理线程,对第四实时网页互动数据进行特征提取处理后,对特征提取处理后的互动数据进行特征翻译处理,从而获得第一目标实时网页互动数据。
89.step2-4,确定第四实时网页互动数据与第一范例对中的第二范例实时网页互动数据之间的第一比较结果,和第四实时网页互动数据与第一目标实时网页互动数据之间的第二比较结果。
90.网页数据推送系统根据第四实时网页互动数据的页面描述内容与第二范例实时网页互动数据中对应区域的页面描述内容之间词向量指标的比较结果,确定第一比较结果,并根据第四实时网页互动数据的页面描述内容与第一目标实时网页互动数据中对应区域的页面描述内容之间词向量指标的比较结果,确定第二比较结果,页面描述内容的意思请参阅上述描述内容,在此不再进行一一赘述。
91.step2-6,基于第一线程评价,改进智能化线程的线程变量,直至智能化线程处于设定状态,获得完成调试的智能化线程。
92.比如,网页数据推送系统可以利用人工智能模型筛选第一线程评价,直至智能化线程处于设定状态。
93.进一步地,网页数据推送系统在改进智能化线程的线程变量时,还可以同步改进特征处理线程的线程变量。
94.step3-1,将第一范例实时网页互动数据二元组中的第二范例实时网页互动数据
传入特征处理线程,对第一范例实时网页互动数据二元组中的第二范例实时网页互动数据逐一进行特征提取处理和特征翻译处理,获得第二目标实时网页互动数据。
95.网页数据推送系统将第二范例实时网页互动数据传入特征处理线程,对第二范例实时网页互动数据进行特征提取处理后,对特征提取处理后的互动数据进行特征翻译处理,从而获得第二目标实时网页互动数据。若智能化线程基于第一范例实时网页互动数据生成的第四实时网页互动数据与第二范例实时网页互动数据相同,则第一目标实时网页互动数据和第二目标实时网页互动数据可以是相同的。若智能化线程基于第一范例实时网页互动数据生成的第四实时网页互动数据与第二范例实时网页互动数据不同,则第一目标实时网页互动数据和第二目标实时网页互动数据也不同。
96.step3-2,确定第一范例实时网页互动数据二元组中的第二范例实时网页互动数据与第二目标实时网页互动数据之间的第三比较结果。
97.网页数据推送系统根据第二范例实时网页互动数据的页面描述内容与第二目标实时网页图种对应区域的页面描述内容之间词向量指标的比较结果,确定第三比较结果,页面描述内容的意思请参阅上述描述内容,在此不再进行一一赘述。
98.step3-4,基于第二线程评价,改进特征处理线程的线程变量,直至特征处理线程处于设定状态,获得完成调试的特征处理线程。
99.比如,网页数据推送系统利用人工智能模型筛选第二线程评价,直至特征处理线程处于设定状态。
100.在上述基础上,请结合参阅图2,提供了一种网页数据推送装置200,应用于网页数据推送系统,所述装置包括:分布获得模块210,用于对待进行优化的第一实时网页互动数据进行延展处理,获得第二实时网页互动数据;确定所述第二实时网页互动数据的实时网页显著事件序列,并对所述第二实时网页互动数据进行描述挖掘操作,获得第一页面描述分布;分布描述模块220,用于对所述实时网页显著事件序列与所述第一页面描述分布进行全局化处理,获得第二页面描述分布;对所述第一页面描述分布进行描述抽取操作,获得第三页面描述分布;对所述第二页面描述分布与所述第三页面描述分布进行全局化处理,获得第四页面描述分布;数据生成模块230,用于借助所述第四页面描述分布,生成第三实时网页互动数据,其中,所述第三实时网页互动数据的特征识别度超过所述第一实时网页互动数据的特征识别度;数据推送模块240,用于将所述第三实时网页互动数据进行推送。
101.在上述基础上,请结合参阅图3,示出了一种网页数据推送系统300,包括互相之间通信的处理器310和存储器320,所述处理器310用于从所述存储器320中读取计算机程序并执行,以实现上述的方法。
102.在上述基础上,还提供一种云平台,所述云平台包括存储有程序的可读存储介质,以执行所述的方法。。
103.综上,基于上述方案,对待进行优化的第一实时网页互动数据进行延展处理,可以获得特征识别度更高的第二实时网页互动数据,对实时网页显著事件序列与第一页面描述分布进行全局化处理,获得第二页面描述分布,使得该第二页面描述分布涵盖了第一实时
网页互动数据的实时网页显著事件,对第二实时网页互动数据进行描述挖掘操作和描述抽取操作,获得第三页面描述分布,该第三页面描述分布相当于结合了第一实时网页互动数据的内容属性,对第二页面描述分布与第三页面描述分布进行全局化处理,也就相当于结合了第一实时网页互动数据的实时网页显著事件和互动数据内容属性,相较于仅依据实时网页显著事件生成实时网页互动数据的方式,本公开实施例中参阅了实时网页互动数据的显著事件和更加完整的互动数据内容属性,以提高生成的第三实时网页互动数据的互动数据评价得分,从而能够有效地提高网页数据推送的可靠性和完整性。
104.应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本技术的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
105.需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
106.上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本技术的限定。虽然此处并没有明确说明,本领域技术人员可能会对本技术进行各种修改、改进和修正。该类修改、改进和修正在本技术中被建议,所以该类修改、改进、修正仍属于本技术示范实施例的精神和范围。
107.同时,本技术使用了特定词语来描述本技术的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本技术至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本技术的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
108.此外,本领域技术人员可以理解,本技术的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本技术的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本技术的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
109.计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介
质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、rf、或类似介质,或任何上述介质的组合。
110.本技术各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如java、scala、smalltalk、eiffel、jade、emerald、c++、c#、vb.net、python等,常规程序化编程语言如c语言、visual basic、fortran 2003、perl、cobol 2002、php、abap,动态编程语言如python、ruby和groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(lan)或广域网(wan),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(saas)。
111.此外,除非权利要求中明确说明,本技术所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本技术流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本技术实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
112.同理,应当注意的是,为了简化本技术披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本技术实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本技术对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
113.一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本技术一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
114.针对本技术引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本技术作为参考。与本技术内容不一致或产生冲突的申请历史文件除外,对本技术权利要求最广范围有限制的文件(当前或之后附加于本技术中的)也除外。需要说明的是,如果本技术附属材料中的描述、定义、和/或术语的使用与本技术所述内容有不一致或冲突的地方,以本技术的描述、定义和/或术语的使用为准。
115.最后,应当理解的是,本技术中所述实施例仅用以说明本技术实施例的原则。其他的变形也可能属于本技术的范围。因此,作为示例而非限制,本技术实施例的替代配置可视为与本技术的教导一致。相应地,本技术的实施例不仅限于本技术明确介绍和描述的实施
例。
116.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1