一种关键词投放的处理方法和装置与流程

文档序号:31751205发布日期:2022-10-11 21:50阅读:55来源:国知局
一种关键词投放的处理方法和装置与流程

1.本发明涉及互联网搜索技术领域,更具体地说,涉及一种关键词投放的处理方法和装置。


背景技术:

2.在互联网搜索技术领域中,许多网站为了获得访问量,就会在搜索引擎平台投放一些关键词,但在实际应用场景中,如果新建了网站或者网站新增了产品,那么已投放的关键词跟新网站或者新增了产品的网站的关联性就会比较差,这时候就需要对这些已投放的关键词进行拓词/下线处理。
3.在现有技术中,对新网站或新产品进行关键词拓词时,一般依赖于运营人员自己的知识库或者其它方式进行联想拓词,从而扩充关键词的覆盖度。但是,这种人工联想的关键词拓词方式,不仅耗费人工且拓词效率低,拓词维度狭窄,关键词的覆盖度不够广泛,拓词效果不佳。


技术实现要素:

4.本发明要解决的技术问题在于,针对上述技术的缺陷,提供一种关键词投放的处理方法和装置。
5.本发明解决其技术问题所采用的技术方案是:构造一种关键词投放的处理方法,包括下述步骤:
6.s1、获取高消费关键词列表,在预设文档集中查询包含所述高消费关键词列表中高消费关键词的文档,得到第一文档集,其中所述高消费关键词列表包括多个高消费关键词,所述预设文档集包括多个文档;
7.s2、将所述第一文档集中每个文档对应的分词与所述高消费关键词列表进行匹配,根据第一匹配结果从所述第一文档集中选取第二文档集;
8.s3、将所述第二文档集中所有文档的内容分词与预设词库进行匹配,根据第二匹配结果从所述第二文档集中的内容分词中选取第一数量的内容分词作为内容分词列表;
9.s4、组合所述内容分词列表中的内容分词与所述高消费关键词列表中的高消费关键词得到组合关键词,根据所述组合关键词生成组合关键词列表,基于预设算法计算所述组合关键词列表中每个组合关键词的积分;
10.s5、基于所述组合关键词的积分,从所述组合关键词列表中选取第二数量的组合关键词作为目标关键词列表进行投放。
11.进一步,在本发明所述的关键词投放的处理方法中,在所述s1之后,所述s2之前,还包括步骤:
12.基于所述第一文档集中每个文档的语义,对每个所述文档的内容执行分词操作,得到每个所述文档的分词。
13.进一步,在本发明所述的关键词投放的处理方法中,所述将所述第一文档集中每
个文档对应的分词与所述高消费关键词列表进行匹配,包括:
14.统计所述高消费关键词列表中高消费关键词在所述第一文档集的每个文档中出现的次数,计算所述次数占所述第一文档集中对应文档的所有分词个数的比重。
15.进一步,在本发明所述的关键词投放的处理方法中,所述根据第一匹配结果从所述第一文档集中选取第二文档集,包括:
16.判断所述比重是否大于预设比重;
17.若是,则将所述第一文档集中的对应文档选入第二文档集。
18.进一步,在本发明所述的关键词投放的处理方法中,所述将所述第二文档集中所有文档的内容分词与预设词库进行匹配,包括:
19.统计所述第二文档集中所有文档的内容分词在所述预设词库中出现的次数。
20.进一步,在本发明所述的关键词投放的处理方法中,所述根据第二匹配结果从所述第二文档集中的内容分词中选取第一数量的内容分词作为内容分词列表,包括:
21.将所述次数作为所述第二文档集中对应内容分词的权重进行降序排序,选取排序靠前的第一数量的内容分词作为内容分词列表。
22.进一步,在本发明所述的关键词投放的处理方法中,所述基于预设算法计算所述组合关键词列表中每个组合关键词的积分,包括:
23.将所述组合关键词列表中的组合关键词与所述预设词库进行匹配,将所述组合关键词在所述预设词库中出现的次数作为第一积分;
24.将所述组合关键词恢复为原始双词,在所述预设文档集的文档中查找同时包含原始双词的文档,将原始双词之间间隔的字符数作为第二积分,所述第二积分与字符数成反相关;
25.将所述第一积分和所述第二积分进行加和得到第三积分,将所述第三积分作为所述组合关键词的积分。
26.进一步,在本发明所述的关键词投放的处理方法中,所述s5包括:
27.判断所述组合关键词的积分是否大于预设值;
28.若是,则将所述积分作为所述组合关键词的权重进行降序排序;
29.选取排序靠前的第二数量的组合关键词作为目标关键词列表进行投放。
30.进一步,在本发明所述的关键词投放的处理方法中,所述选取排序靠前的第二数量的组合关键词作为目标关键词列表进行投放,包括:
31.选取排序靠前的第二数量的组合关键词作为目标关键词列表,将所述目标关键词列表更新为高消费关键词列表进行投放,下线原高消费关键词列表。
32.本发明还一种关键词投放的处理方法的装置,包括:
33.查询模块:用于获取高消费关键词列表,在预设文档集中查询包含所述高消费关键词列表中高消费关键词的文档,得到第一文档集,其中所述高消费关键词列表包括多个高消费关键词,所述预设文档集包括多个文档;
34.第一选取模块:用于将所述第一文档集中每个文档对应的分词与所述高消费关键词列表进行匹配,根据第一匹配结果从所述第一文档集中选取第二文档集;
35.第二选取模块:用于将所述第二文档集中所有文档的内容分词与预设词库进行匹配,根据第二匹配结果从所述第二文档集中的内容分词中选取第一数量的内容分词作为内
容分词列表;
36.计算模块:用于组合所述内容分词列表中的内容分词与所述高消费关键词列表中的高消费关键词得到组合关键词,根据所述组合关键词生成组合关键词列表,基于预设算法计算所述组合关键词列表中每个组合关键词的积分;
37.投放模块:用于基于所述组合关键词的积分,从所述组合关键词列表中选取第二数量的组合关键词作为目标关键词列表进行投放。
38.实施本发明的一种关键词投放的处理方法和装置,具有以下有益效果:本发明通过对已投放的关键词进行自动拓词/下线处理,可以进一步解放人力,提升拓词效率,扩大拓词维度和覆盖度,达到更精准的成本控制效果。
附图说明
39.下面将结合附图及实施例对本发明作进一步说明,附图中:
40.图1是本发明实施例提供的一种关键词投放的处理方法的流程图;
41.图2是本发明实施例提供的一种关键词投放的装置的结构示意图。
具体实施方式
42.为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
43.在一优选实施例中,参考图1,本实施例的一种关键词投放的处理方法,包括下述步骤:
44.s1、获取高消费关键词列表,在预设文档集中查询包含高消费关键词列表中高消费关键词的文档,得到第一文档集,其中高消费关键词列表包括多个高消费关键词,预设文档集包括多个文档。
45.具体的,预设文档集可以是行业内部文档,服务器根据接收到关键词投放平台的反馈信息,筛选出一批高消费关键词,然后在行业内部文档中查询含有高消费关键词的文档,将这些含有高消费关键词的文档作为第一文档集。例如关键词投放平台的反馈信息中包含了上千个关键词的排名和消费信息等,从这些关键词中筛选出一批点击率/搜索率/定价较高的关键词生成高消费关键词列表。遍历高消费关键词列表,在行业内部文档中查询内容包含有高消费关键词的文档。例如基于高消费关键词“汽车”在行业部文档中进行查询,查询出包含关键词“汽车”的文档n个,则将这n个文档选入第一文档集。高消费关键词是指搜索率或者点击率或者定价较高的关键词。
46.s2、将第一文档集中每个文档对应的分词与高消费关键词列表进行匹配,根据第一匹配结果从第一文档集中选取第二文档集。
47.具体的,服务器将第一文档集中每个文档的分词与高消费关键词列表进行匹配,比如匹配可以是统计高消费关键词在每个文档中出现的次数,或者统计每个文档中出现了多少个高消费关键词,又或者计算每个文档中高消费关键词出现的个数占高消费关键词列表中高消费关键词的比例等,再选取出跟匹配结果相关的文档,比如选取高消费关键词在每个文档中出现的次数高于某个数值的文档,或者选取文档中出现了a个高消费关键词的文档,又或者选取高消费关键词在某个文档中出现的个数占高消费关键词列表中高消费关
键词的比例大于某个值的文档等,将这些文档作为第二文档集。
48.s3、将第二文档集中所有文档的内容分词与预设词库进行匹配,根据第二匹配结果从第二文档集中的内容分词中选取第一数量的内容分词作为内容分词列表。
49.具体的,预设词库可以是行业词库,服务器需要把第二文档集中的所有分词跟行业词库进行匹配,匹配完后再从中选取一定数量的分词生成分词列表。例如,匹配可以是统计分词在行业词库中出现的次数,或者统计每个文档所有分词个数占词库词总个数的比例等,再根据匹配结果选取一定数量的分词,比如选取出现次数排前c的分词,或者选取文档中分词个数占词库词总个数比例大于某个值的文档的分词等,将这些分词选入内容分词列表。
50.s4、组合内容分词列表中的内容分词与高消费关键词列表中的高消费关键词得到组合关键词,根据组合关键词生成组合关键词列表,基于预设算法计算组合关键词列表中每个组合关键词的积分。
51.具体的,服务器将内容分词和高消费关键词进行组合,生成组合关键词,例如,内容分词为“电动”,高消费关键词为“汽车”,则组合关键词就是“电动汽车”和“汽车电动”,再根据预设的算法计算“电动汽车”和“汽车电动”的积分。
52.s5、基于组合关键词的积分,从组合关键词列表中选取第二数量的组合关键词作为目标关键词列表进行投放。
53.具体的,服务器会根据组合关键词的积分选取一定数量的组合关键词投放。例如,选取组合关键词积分排名靠前的b个组合关键词,或者选取积分为中位数的组合关键词,又或者选取积分为众数的组合关键词,将这些选出来的组合关键词作为目标关键词列表进行投放。
54.本实施例通过设置算法对高消费关键词进行自动拓词,可得到比高消费关键词更精准的组合关键词,进一步解放人力的同时还提升了拓词的效率,扩大了拓词维度和覆盖度,达到了更精准的成本控制效果。
55.在一些实施例的关键词投放的处理方法中,在s1之后,s2之前,还包括步骤:
56.基于第一文档集中每个文档的语义,对每个文档的内容执行分词操作,得到每个文档的分词。具体的,每个文档的内容并不相同,在每个文档里根据语义对文档内容进行拆分,例如,一个文档中有很多句话,每句话由很多个字组成,根据单/双/多个字所能独立表达的意思对一句话进行拆分,得到多个分词。
57.在上一实施例的基础上,本实施例对分词的由来做了限定,简化了文档的内容组成,使得文档内容的组成变得更加的直观,方便了高消费关键词与文档内容的匹配。
58.在一些实施例的关键词投放的处理方法中,将第一文档集中每个文档对应的分词与高消费关键词列表进行匹配,包括:统计高消费关键词列表中高消费关键词在第一文档集的每个文档中出现的次数,计算次数占第一文档集中对应文档的所有分词个数的比重。
59.具体的,将高消费关键词在对应文档中出现的次数占对应文档所有分词的比重作为匹配方法,例如,高消费关键词为“汽车”,第一文档集共有m1、m2
······
mn个文档,m1文档中有m1个分词,“汽车”出现的次数为a,m2文档中有m2个分词,“汽车”出现的次数为b,则a/m1即为“汽车”这个高消费关键词占m1文档的所有分词的比重,b/m2为“汽车”这个高消费关键词占m2文档的所有分词的比重。
60.在上述实施例的基础上,本实施例对匹配方法进行了限定,可直观查看到每个高消费关键词在每个文档中所占的比重,进一步了解到每个关键词与每个文档的相关性。
61.在一些实施例的关键词投放的处理方法中,根据第一匹配结果从第一文档集中选取第二文档集,包括:判断比重是否大于预设比重;若是,则将第一文档集中的对应文档选入第二文档集。
62.具体的,在第一文档集中,选取高消费关键词在对应文档中出现的次数占对应文档所有分词的比重大于预设比重的文档,例如,高消费关键词为“汽车”,第一文档集共有m1、m2
······
mn个文档,m1文档中有m1个分词,“汽车”出现的次数为a,m2文档中有m2个分词,“汽车”出现的次数为b,则判断a/m1、b/m2是否大于预设比重,如果两者均大于预设比重,则将m1、m2文档选入第二文档集;若a/m1大于预设比重,b/m2小于预设比重,则将m1文档选入第二文档集;若a/m1小于预设比重,b/m2大于预设比重,则将m2文档选入第二文档集;若两者均小于预设比重,则都不选入第二文档集。作为选择,预设比重可以是30%,40%,50%等数值。
63.在上述实施例的基础上,本实施例通过每个高消费关键词在每个文档中所占的比重,可以筛选出与高消费关键词相关性较高的文档,得到与高消费关键词相关度较高的文档的分词。
64.在一些实施例的关键词投放的处理方法中,将第二文档集中所有文档的内容分词与预设词库进行匹配,包括:统计第二文档集中所有文档的内容分词在预设词库中出现的次数。
65.具体的,将第二文档集中所有文档的内容分词在行业词库中出现的次数作为匹配方法,例如,第二文档集中有n1、n2
······
nm个文档,n1文档中有q个内容分词,计算这q个内容分词分别在行业词库中出现的次数,比如内容分词中包含“电气”和“组件”这两个内容分词,“电气”内容分词在行业词库中出现的次数为q1,“组件”在行业词库中出现的次数为q2。
66.在上述实施例的基础上,本实施例对匹配方法进行了限定,可直观查看到在行业词库中出现次数靠前的第二文档集中的内容分词,进一步了解到每个内容分词与行业词库的相关性。
67.在一些实施例的关键词投放的处理方法中,根据第二匹配结果从第二文档集中的内容分词中选取第一数量的内容分词作为内容分词列表,包括:将次数作为第二文档集中对应内容分词的权重进行降序排序,选取排序靠前的第一数量的内容分词作为内容分词列表。
68.具体的,将第二文档集中所有文档的内容分词在行业词库中出现的次数作为对应的内容分词的权重进行排序,例如,第二文档集中有n1、n2
······
nm个文档,n1文档中有q个内容分词,计算这q个内容分词分别在行业词库中出现的次数,比如内容分词中包含“电气”和“组件”这两个内容分词,“电气”内容分词在行业词库中出现的次数为q1,“组件”在行业词库中出现的次数为q2,则q1为“电气”这个内容分词的权重,q2则为“组件”这个内容分词的权重。如果q1大于q2,则q1对应的内容分词“电气”排在q2对应的内容分词“组件”的前面。排序完成后再选取排序靠前的一定数量的内容分词生成内容分词列表,例如选取排在前40/50/60的内容分词作为内容分词列表。
69.在上述实施例的基础上,本实施例通过对第二文档中内容分词权重进行排序后筛选靠前的内容分词,可以得到与行业词库相关性较高的内容分词,提高内容分词的精准性。
70.在一些实施例的关键词投放的处理方法中,基于预设算法计算组合关键词列表中每个组合关键词的积分,包括:将组合关键词列表中的组合关键词与预设词库进行匹配,将组合关键词在预设词库中出现的次数作为第一积分。
71.具体的,服务器将内容分词和高消费关键词进行组合,生成组合关键词,例如,内容分词为“电动”,高消费关键词为“汽车”,则组合关键词就是“电动汽车”和“汽车电动”,将组合词“汽车电动”或“电动汽车”在行业词库中进行精准匹配,匹配命中的次数则为该词的积分,则该积分就为该组合关键词的第一积分。
72.将组合关键词恢复为原始双词,在预设文档集的文档中查找同时包含原始双词的文档,将原始双词之间间隔的字符数作为第二积分,第二积分与字符数成反相关。
73.具体的,按照组合顺序将组合关键词恢复为原始双词,例如组合关键词分别为“电动汽车”和“汽车电动”,则“电动汽车”的原始双词为“电动”“汽车”,“汽车电动”原始双词为“汽车”“电动”。在行业内部文档中查找同时包含该原始双词的文档,且需严格遵循双词的前后顺序,例如原始双词为“汽车”“电动”,则在行业内部文档查询时,文档中的“汽车”必定会在“电动”之前。遍历“汽车”在“电动”之前的行业内部文档,在该文档内容中查询该双词之间的间隔字符,需忽略标点符号,将该双词间隔的字符数作为第二积分。第二积分与字符数成反相关,即间隔字符越多,所获得的积分越少,例如间隔字符数x《=5,则获得积分5;若5《x《=15,则获得积分3;若15《x《=30,则获得积分1;若30《x,则无积分获得。
74.将第一积分和第二积分进行加和得到第三积分,将第三积分作为组合关键词的积分。
75.具体的,将组合关键词的第一积分和该组合关键词的原始分词对应的第二积分相加得到第三积分,例如,“汽车电动”获得的第一积分为5,“汽车”“电动”获得的第二积分为35,则第三积分等于40,将第三积分作为组合关键词的积分,即“汽车电动”这个组合关键词的积分就为40。
76.在上述实施例的基础上,本实施例对组合关键词的积分作了限定,可直观查看到每个组合关键词的积分,有助于筛选出与高消费关键词相关性较高的组合关键词。
77.在一些实施例的关键词投放的处理方法中,s5包括:判断组合关键词的积分是否大于预设值;若是,则将积分作为组合关键词的权重进行降序排序;选取排序靠前的第二数量的组合关键词作为目标关键词列表进行投放。
78.具体的,如果组合关键词的积分大于预设值则将积分作为组合关键词的权重降序排序,例如,“汽车电动”这个组合关键词的积分为40;“电动汽车”这个组合关键词的积分为205;“电气组件”这个组合关键词的积分为235;“组件电气”这个组合关键词的积分为60。作为选择,预设值可以是200/230/250等数值。若预设值是200的时候,则将“汽车电动”和“组件电气”剔除,根据积分“电气组件”排在“电动汽车”的前面。根据已降序排序好的组合关键词,选取排序靠前的一定数量的组合关键词进行投放。例如选取排在前4/5/6个关键词进行投放。
79.在上述实施例的基础上,本实施例通过筛选积分排序靠前的组合关键词,扩大了拓词维度和覆盖度,达到了更精准的成本控制效果。
80.在一些实施例的关键词投放的处理方法中,选取排序靠前的第二数量的组合关键词作为目标关键词列表进行投放,包括:选取排序靠前的第二数量的组合关键词作为目标关键词列表,将目标关键词列表更新为高消费关键词列表进行投放,下线原高消费关键词列表。
81.具体的,将选取的组合关键词更新为高消费关键词,下线原高消费关键词。例如,原高消费关键词有10个,选取的组合关键词为5个,则把该组合关键词作为新的高消费关键词进行投放,下线原来的10个高消费关键词。
82.在上述实施例的基础上,本实施例通过对高消费关键词的更新及原高消费关键词的下线,避免了关键词的重复投放,降低了投放成本,提高了投放的精准性。
83.在一优选实施例中,参考图2,本实施例的一种关键词投放的处理方法的装置,包括:
84.查询模块:用于获取高消费关键词列表,在预设文档集中查询包含高消费关键词列表中高消费关键词的文档,得到第一文档集,其中高消费关键词列表包括多个高消费关键词,预设文档集包括多个文档。
85.具体的,预设文档集可以是行业内部文档,服务器根据接收到关键词投放平台的反馈信息,筛选出一批高消费关键词,然后在行业内部文档中查询含有高消费关键词的文档,将这些含有高消费关键词的文档作为第一文档集。例如关键词投放平台的反馈信息中包含了上千个关键词的排名和消费信息等,从这些关键词中筛选出一批点击率/搜索率/定价较高的关键词生成高消费关键词列表。遍历高消费关键词列表,在行业内部文档中查询内容包含有高消费关键词的文档。例如基于高消费关键词“汽车”在行业部文档中进行查询,查询出包含关键词“汽车”的文档n个,则将这n个文档选入第一文档集。高消费关键词是指搜索率或者点击率或者定价较高的关键词。
86.第一选取模块:用于将第一文档集中每个文档对应的分词与高消费关键词列表进行匹配,根据第一匹配结果从第一文档集中选取第二文档集。
87.具体的,服务器将第一文档集中每个文档的分词与高消费关键词列表进行匹配,比如匹配可以是统计高消费关键词在每个文档中出现的次数,或者统计每个文档中出现了多少个高消费关键词,又或者计算每个文档中高消费关键词出现的个数占高消费关键词列表中高消费关键词的比例等,再选取出跟匹配结果相关的文档,比如选取高消费关键词在每个文档中出现的次数高于某个数值的文档,或者选取文档中出现了a个高消费关键词的文档,又或者选取高消费关键词在某个文档中出现的个数占高消费关键词列表中高消费关键词的比例大于某个值的文档等,将这些文档作为第二文档集。
88.第二选取模块:用于将第二文档集中所有文档的内容分词与预设词库进行匹配,根据第二匹配结果从第二文档集中的内容分词中选取第一数量的内容分词作为内容分词列表。
89.具体的,预设词库可以是行业词库,服务器需要把第二文档集中的所有分词跟行业词库进行匹配,匹配完后再从中选取一定数量的分词生成分词列表。例如,匹配可以是统计分词在行业词库中出现的次数,或者统计每个文档所有分词个数占词库词总个数的比例等,再根据匹配结果选取一定数量的分词,比如选取出现次数排前c的分词,或者选取文档中分词个数占词库词总个数比例大于某个值的文档的分词等,将这些分词选入内容分词列
表。
90.计算模块:用于组合内容分词列表中的内容分词与高消费关键词列表中的高消费关键词得到组合关键词,根据组合关键词生成组合关键词列表,基于预设算法计算组合关键词列表中每个组合关键词的积分。
91.具体的,服务器将内容分词和高消费关键词进行组合,生成组合关键词,例如,内容分词为“电动”,高消费关键词为“汽车”,则组合关键词就是“电动汽车”和“汽车电动”,再根据预设的算法计算“电动汽车”和“汽车电动”的积分。
92.投放模块:用于基于组合关键词的积分,从组合关键词列表中选取第二数量的组合关键词作为目标关键词列表进行投放。
93.具体的,服务器会根据组合关键词的积分选取一定数量的组合关键词投放。例如,选取组合关键词积分排名靠前的b个组合关键词,或者选取积分为中位数的组合关键词,又或者选取积分为众数的组合关键词,将这些选出来的组合关键词作为目标关键词列表进行投放。
94.本实施例通过设置算法对高消费关键词进行自动拓词,可得到比高消费关键词更精准的组合关键词,进一步解放人力的同时还提升了拓词的效率,扩大了拓词维度和覆盖度,达到了更精准的成本控制效果。
95.在一优选实施例中,本实施例的一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序适于处理器进行加载,以执行如上述关键词投放的处理方法的步骤。
96.在一优选实施例中,本实施例的一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,处理器通过调用存储器中存储的计算机程序,执行上述关键词投放的处理方法的步骤。
97.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
98.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
99.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
100.以上实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据此实施,并不能限制本发明的保护范围。凡跟本发明权利要求范围所做的均等变化与修饰,均应属于本发明权利要求的涵盖范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1