一种提高热词曝光覆盖率的方法和装置与流程

文档序号:12802730阅读:186来源:国知局
一种提高热词曝光覆盖率的方法和装置与流程
本发明涉及信息处理
技术领域
,具体而言涉及一种提高热词曝光覆盖率的方法和装置。
背景技术
:随着互联网技术和智能移动终端技术的快速发展,很多在计算机终端上实现的功能(例如购物、阅读)也都可以在智能移动终端上实现,例如使用智能手机或平板电脑等。另外,这些功能的实现需要在智能移动终端上安装相应的应用程序。例如,网上购物,需要安装例如淘宝客户端,听音乐需要安装音乐播放器客户端等。由此,很多软件公司提供了应用商店或应用市场,例如豌豆荚或者pp助手等。用户可以打开应用商店或者应用市场,从而能够快速搜索和下载所需要的各种应用程序,包括影音播放类、系统工具类、通讯社交类、网上购物类、阅读类等,当然还可以下载游戏等休闲娱乐类应用程序(app)。在应用商店或者应用市场中,搜索是应用下载来源的最重要的入口。在应用搜索首页中往往会展示搜索热词,以帮助用户发现感兴趣应用,提高搜索效率。所展示热词通常的做法是应用商店或者应用市场开发商们在后台建立热词库,热词库里收集一些热门搜索词,从热词库里选择热词向用户推荐。但现有的热词库的建立由运营工作人员来选热词,选择热词有两种方式:1是人工收集一些热门搜索词,然后根据经验判断哪些热词是用户最受欢迎的,将其纳入热词库里;2是通过一些指标选择热词,例如通过统计用户输入的搜索词,输入最多的搜索词作为热词。但是现在的热词推荐方法存在一些弊端,例如1人工挑选热词的方式主观因素比较大,会遗漏一些潜在的高质量热词,而且可展示的热词数量太少;而为了保证推荐效果,通常的做法是展示搜索量排名最靠前的前几个热词,这样就会导致热词曝光覆盖率很低,很多有价值的热词没有曝光机会。技术实现要素:本发明的目的在于提供一种提高热词曝光覆盖率的方法和装置,以改善上述问题。本发明实施例提供了一种提高热词曝光覆盖率的方法,其包括:a)初始化热词备选池和热词推荐池,使热词备选池里包含多个热词,热词推荐池为空;b)按一定比例分别从热词备选池和热词推荐池里随机选择一组或多组热词向用户推荐;c)分别确定从热词备选池中所推荐热词的转化率和从热词推荐池中所推荐热词的转化率;d)将热词推荐池中的热词的转化率排名数小于等于第一预定阈值的热词放入热词备选池,同时将热词备选池中的热词的转化率排名数大于等于第二预定阈值的热词放入热词推荐池;e)周期性重复步骤b至步骤d。优选的,所述比例的选择是:从热词推荐池里随机选择的热词占比大于从热词备选池里随机选择的热词占比。优选的,在步骤d)之后且周期性重复步骤b之前先更新所述热词备选池,即每个周期将搜索量排在面前且不在热词备选池和热词推荐池中的m个搜索词初始化后加入到热词备选池中,初始化的结果是:该热词展示的次数为0,该热词被点击的次数为0,该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;同时将热词备选池中的热词的转化率排名数小于第三预定阈值的热词剔除掉。优选的,在步骤d)之后且周期性重复步骤b之前先更新所述热词推荐池中的每个热词的转化率,更新方法为:当一个热词展示的历史累计次数大于热词最少展示次数时该热词的转化率为该热词转化的历史累计次数/该热词展示的历史累计次数;当一个热词展示的历史累计次数小于等于热词最少展示次数时该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;其中:一个热词展示的历史累计次数=该热词在上一个周期之前展示的历史累计次数+上一个周期中向用户展示该热词的用户数量;一个热词转化的历史累计次数=该热词在上一个周期之前转化的历史累计次数+上一个周期中用户通过该热词进行下载的用户数量;所述平均转化率=在热词推荐池和热词备选池中所有热词的转化率之和除以在热词推荐池和热词备选池中的所有热词的数目;所述热词最少展示次数为预先设定。优选的,所述第一预定阈值是所述热词推荐池中的热词数量减n,所述第二预定阈值是n,其中n为所述热词推荐池中的热词数量乘以0.1的值或者是所述热词推荐池中的热词数量乘以0.2的值,和所述周期为1天。本发明实施例还提供了一种提高热词曝光覆盖率的装置,其包括:热词库初始化单元,用于初始化热词备选池和热词推荐池,使热词备选池里包含多个热词,热词推荐池为空;热词推荐单元,用于按一定比例分别从热词备选池和热词推荐池里随机选择一组或多组热词向用户推荐;热词转化率确定单元,用于分别确定从热词备选池中所推荐热词的转化率和从热词推荐池中所推荐热词的转化率;热词转移单元,用于将热词推荐池中的热词的转化率排名数小于等于第一预定阈值的热词放入热词备选池,同时将热词备选池中的热词的转化率排名数大于等于第二预定阈值的热词放入热词推荐池;循环单元,用于使热词推荐单元、热词转化率确定单元和热词转移单元周期性地工作。优选的,所述装置还包括更新单元,用于在热词转移单元每工作完一次之后,更新热词备选池、和更新热词推荐池中的每个热词的转化率,更新热词备选池的方法为:每个周期将搜索量排在面前且不在热词备选池和热词推荐池中的m个搜索词初始化后加入到热词备选池中,初始化的结果是:该热词展示的次数为0,该热词被点击的次数为0,该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;同时将热词备选池中的热词的转化率排名数小于第三预定阈值的热词剔除掉;更新热词推荐池中的每个热词的转化率的方法为:当一个热词展示的历史累计次数大于热词最少展示次数时该热词的转化率为该热词转化的历史累计次数/该热词展示的历史累计次数;当一个热词展示的历史累计次数小于等于热词最少展示次数时该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;其中:一个热词展示的历史累计次数=该热词在上一个周期之前展示的历史累计次数+上一个周期中向用户展示该热词的用户数量;一个热词转化的历史累计次数=该热词在上一个周期之前转化的历史累计次数+上一个周期中用户通过该热词进行下载的用户数量;所述平均转化率=在热词推荐池和热词备选池中所有热词的转化率之和除以在热词推荐池和热词备选池中的所有热词的数目;所述热词最少展示次数为预先设定。优选的,所述比例的选择是:从热词推荐池里随机选择的热词占比大于从热词备选池里随机选择的热词占比。优选的,所述第一预定阈值是所述热词推荐池中的热词数量减n,所述第二预定阈值是n,其中n为所述热词推荐池中的热词数量乘以0.1的值或者是所述热词推荐池中的热词数量乘以0.2的值,和所述周期为1天。根据本发明实施例提供的提高热词曝光覆盖率的方法和装置,采用了淘汰和晋升的技术手段,按不同比例分别从两个热词池里随机选择热词进行推荐展示,提高了热词的曝光覆盖率,这让更多的热词有曝光机会,同时通过用户的点击行为发现优质热词,能够让优质热词有更多的曝光机会,从而提高了应用商店或应用市场的搜索首页推荐的热词的整体转化率。附图说明图1是本发明实施例提供的提高热词曝光覆盖率的方法的流程图;图2是本发明的一个实施例提供的提高热词曝光覆盖率的装置的示意性框图;图3是本发明的另一实施例提供的提高热词曝光覆盖率的装置的示意性框图。具体实施方式下面将结合本发明实施例和附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。下面将结合具体实施例描述本发明的技术方案。术语解释:热词转化率:是指在应用商店或应用市场搜索首页上,通过推荐的热词产生下载应用行为的用户数与将该热词向用户推荐展示的所有用户数之比。热词覆盖率:是指在应用商店或应用市场搜索首页上推荐热词的过程中,推荐展示过的热词数量与热词库里保存的所有热词数量之比。图1是本发明实施例提供的提高热词曝光覆盖率的方法的流程图。如图1所示,本发明的提高热词曝光覆盖率的方法包括:s1:初始化热词备选池和热词推荐池,使热词备选池里包含多个热词,热词推荐池为空。使热词备选池里包含多个热词的实现方法可以采用本领域公知的方法来选择待推荐的多个热词。即,在应用商店或者应用市场具有了推荐功能之后,开发商都会建立热词池,用于从中选择出一定数量的热词向用户推荐。建立热词池的方法可以有很多种,例如方法之一:选择用户搜索关键词的搜索量排名靠前的多个词作为热词放入热词池;方法之二:选择用户搜索关键词后的关键词转化率排名靠前的多个词作为热词放入热词池;方法之三:人工收集的多个词作为热词放入热词池;除此之外,其他任何已知的用于选择推荐热词的方法都可以在这里使用。这样,在初始化热词备选池和热词推荐池过程中,建立热词备选池和热词推荐池,基于现有已知的用于选择推荐热词的方法在热词备选池里放置多个待推荐的热词;而热词推荐池为空,即该热词推荐池在初始化时不放置热词。s2:按一定比例分别从热词备选池和热词推荐池里随机选择一组或多组热词向用户推荐。所述的一定比例可以根据实践需要预先设定。优选的,从热词推荐池里随机选择的热词占比大于从热词备选池里随机选择的热词占比;即应用商店或应用市场搜索首页显示的推荐热词更多的来自于热词推荐池里的热词;较少的来自于热词备选池里的热词。例如,假设应用商店或应用市场搜索首页一次可以展示10个推荐热词,热词备选池里随机选择的热词占比为10%,热词推荐池里随机选择的热词占比为90%,则所展示的10个推荐热词中有1个热词来自于热词备选池,有9个热词来自于热词推荐池。当然,本领域技术人员都理解,当热词推荐池里的热词数初始为0个时,此时应用商店或应用市场搜索首页显示的推荐热词更多的来自于热词备选池里的热词。s3:分别确定从热词备选池中所推荐热词的转化率和从热词推荐池中所推荐热词的转化率。热词备选池和热词推荐池里的每个热词的转化率的计算方法如下:热词的转化率=用户通过该热词产生下载应用的用户数/该热词被推荐展示给用户的所有用户数。例如,假设将一个热词a向浏览了应用商店或应用市场搜索首页的10个用户进行了推荐展示,其中有4个用户通过热词a下载了相关应用,则该热词a的转化率为4/10=0.4,或者说40%。s4:将热词推荐池中的热词的转化率排名数小于等于第一预定阈值的热词放入热词备选池,同时将热词备选池中的热词的转化率排名数大于等于第二预定阈值的热词放入热词推荐池。当确定了热词备选池和热词推荐池里的每个热词的转化率后,将热词推荐池中的热词的转化率与第一预定阈值相比较,将热词推荐池中的热词的转化率排名数小于等于第一预定阈值的那些热词放入热词备选池;将热词备选池中的热词的转化率与第二预定阈值相比较,将热词备选池中的热词的转化率排名数大于等于第二预定阈值的热词放入热词推荐池。热词备选池和热词推荐池里的满足条件的热词相互转移的操作可以同时进行,也可以通过缓存分步操作,例如先挑选出热词备选池或热词推荐池里的满足条件的热词并放入缓存,然后挑选出热词推荐池或热词备选池里的满足条件的热词,最后将挑选出的热词相互转移。所述第一预定阈值可以根据实践需要任意预先设定,优选为所述热词推荐池中的热词数量减去n,所述第二预定阈值可以根据实践需要任意预先设定,优选为n,其中n是自定义值,优选为所述热词推荐池中的热词数量乘以0.1的值或者是所述热词推荐池中的热词数量乘以0.2的值或者其他值。即,将热词推荐池里的热词的转化率排名为倒数n个的热词转移到热词备选池中,将热词备选池里的热词的转化率排名为n个的热词转移到热词推荐池中。s5:周期性重复步骤s2至步骤s4。所述周期可以以天为单位,例如所述周期为1天或2天等。例如,设定每天的一个固定时间重复执行一遍步骤s2至步骤s4,例如每天早上7点开始重复执行一遍。这里所述热词在热词备选池和热词推荐池中存放的数据格式如下字段说明word热词show_nums该热词展示的次数down_nums该热词点击的次数dtr该热词的转化率上述实施例提供的提高热词曝光覆盖率的方法采用了淘汰和晋升的技术手段,提高了热词的曝光覆盖率,这让更多的热词有曝光机会,从而提高了应用商店或应用市场的搜索首页推荐的热词的整体转化率。为了保证热词备选池里时常有新的热词,同时为了进一步提高热词的曝光覆盖率,这里还提供了优选方案。在第一优选实施例中,在执行完步骤s4之后,并且周期性重复执行步骤s2之前,更新所述热词备选池,即每个周期将搜索量排在面前且不在热词备选池和热词推荐池中的m个搜索词初始化后加入到热词备选池中,初始化的结果是:该热词展示的次数为0,该热词被点击的次数为0,该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;同时将热词备选池中的热词的转化率排名数小于第三预定阈值的热词剔除掉。所述m为自定义值,可以根据实践需要选取任意值。优选的,m为热词备选池中的热词数量的5%、10%或20%。第三预定阈值也是自定义值,可以根据实践需要选取任意值。优选的,第三预定阈值为热词备选池中的热词数量的95%、90%或80%,例如假设热词备选池中的热词数量有100个,则第三预定阈值为95,则将热词备选池中的热词的转化率排名小于95的热词剔除掉,即剔除掉转化率排名为96-100的5个热词。注意,为了保证热词备选池中的热词数量保持平衡,选择适当的m值和第三预定阈值,以便在更新所述热词备选池时,要使得有多少个热词加入到热词备选池中,就有多少个转化率排名靠后的热词从热词备选池中剔除掉。另外,搜索量排在面前且不在热词备选池和热词推荐池中的m个搜索词是指从用户输入的搜索词的数据中统计出m个搜索量排在前面而且热词备选池和热词推荐池中没有的搜索词。在热词推荐池和热词备选池中所有热词的平均转化率是指:在热词推荐池和热词备选池中所有热词的转化率之和/在热词推荐池和热词备选池中所有热词的数量。例如,所述周期为1天,假设每天早上7点开始重复执行步骤s2至步骤s4,则在每天早上7点执行步骤s2之前先更新所述热词备选池。在第二优选实施例中,在执行完步骤s4之后,并且周期性重复执行步骤s2之前,先更新所述热词推荐池中的每个热词的转化率,更新方法为:当一个热词展示的历史累计次数大于热词最少展示次数时该热词的转化率为该热词转化的历史累计次数/该热词展示的历史累计次数;当一个热词展示的历史累计次数小于等于热词最少展示次数时该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;其中:一个热词展示的历史累计次数=该热词在上一个周期之前展示的历史累计次数+上一个周期中向用户展示该热词的用户数量;一个热词转化的历史累计次数=该热词在上一个周期之前转化的历史累计次数+上一个周期中用户通过该热词进行下载的用户数量;所述平均转化率=在热词推荐池和热词备选池中所有热词的转化率之和除以在热词推荐池和热词备选池中的所有热词的数量。所述热词最少展示次数为预先设定,其可以是自定义值。优选的,取热词最少展示次数=n/热词推荐池和热词备选池中所有热词的平均转化率,其含义是在平均转化率下将一个热词展示了所述热词最少展示次数,才会产生n次转化,n为自定义的整数值,例如可以是50、100、200等。下面举一个例子来说明,设n=100,热词推荐池和热词备选池中里面共有三个热词,热词1的转化率为0.01,热词2的转化率为0.02,热词3的转化率为0.03,那么平均转化率=0.02,那么热词最少展示次数为100/0.02=5000,即在平均转化率为0.02时将一个热词展示了5000次,才会产生100次的转化,即通过该热词下载应用100次。例如,所述周期为1天,则一个热词展示的历史累计次数为该热词在昨天以前展示的历史累计次数+昨天向用户展示该热词的用户数量;一个热词转化的历史累计次数=该热词在昨天之前转化的历史累计次数+昨天用户通过该热词进行下载的用户数量。例如,所述周期为1天,假设每天早上7点开始重复执行步骤s2至步骤s4,则在每天早上7点执行步骤s2之前先更新所述热词推荐池中的每个热词的转化率。另外,该第一优选实施例和第二优选实施例也可以组合在一起形成第三优选实施例,即同时更新所述热词备选池、和所述热词推荐池中的每个热词的转化率。这里不再重复描述。根据本发明实施例提供的提高热词曝光覆盖率的方法,采用了淘汰和晋升的技术手段,按不同比例分别从两个热词池里随机选择热词进行推荐展示,提高了热词的曝光覆盖率,这让更多的热词有曝光机会,同时通过用户的点击行为发现优质热词,能够让优质热词有更多的曝光机会,从而提高了应用商店或应用市场的搜索首页推荐的热词的整体转化率。图2是本发明实施例提供的提高热词曝光覆盖率的装置的示意性框图。如图2所示,本发明的提高热词曝光覆盖率的装置包括:热词库初始化单元,用于初始化热词备选池和热词推荐池,使热词备选池里包含多个热词,热词推荐池为空;热词推荐单元,用于按一定比例分别从热词备选池和热词推荐池里随机选择一组或多组热词向用户推荐;热词转化率确定单元,用于分别确定从热词备选池中所推荐热词的转化率和从热词推荐池中所推荐热词的转化率;热词转移单元,用于将热词推荐池中的热词的转化率排名数小于等于第一预定阈值的热词放入热词备选池,同时将热词备选池中的热词的转化率排名数大于等于第二预定阈值的热词放入热词推荐池;循环单元,用于使热词推荐单元、热词转化率确定单元和热词转移单元周期性地工作。优选的,所述比例的选择是:从热词推荐池里随机选择的热词占比大于从热词备选池里随机选择的热词占比。即应用商店或应用市场搜索首页显示的推荐热词更多的来自于热词推荐池里的热词;较少的来自于热词备选池里的热词。在一个优选实施例中,如图3所示,还包括更新单元,用于在热词转移单元每工作完一次之后,更新热词备选池、和更新热词推荐池中的每个热词的转化率,更新热词备选池的方法为:每个周期将搜索量排在面前且不在热词备选池和热词推荐池中的m个搜索词初始化后加入到热词备选池中,初始化的结果是:该热词展示的次数为0,该热词被点击的次数为0,该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;同时将热词备选池中的热词的转化率排名数小于第三预定阈值的热词剔除掉;所述m和第三预定阈值为自定义值,可以根据实践需要选取任意值。注意,为了保证热词备选池中的热词数量保持平衡,选择适当的m值和第三预定阈值,以便在更新所述热词备选池时,要使得有多少个热词加入到热词备选池中,就有多少个转化率排名靠后的热词从热词备选池中剔除掉。在热词推荐池和热词备选池中所有热词的平均转化率是指:在热词推荐池和热词备选池中所有热词的转化率之和/在热词推荐池和热词备选池中所有热词的数量。更新热词推荐池中的每个热词的转化率的方法为:当一个热词展示的历史累计次数大于热词最少展示次数时该热词的转化率为该热词转化的历史累计次数/该热词展示的历史累计次数;当一个热词展示的历史累计次数小于等于热词最少展示次数时该热词的转化率为在热词推荐池和热词备选池中所有热词的平均转化率;其中:一个热词展示的历史累计次数=该热词在上一个周期之前展示的历史累计次数+上一个周期中向用户展示该热词的用户数量;一个热词转化的历史累计次数=该热词在上一个周期之前转化的历史累计次数+上一个周期中用户通过该热词进行下载的用户数量;所述平均转化率=在热词推荐池和热词备选池中所有热词的转化率之和除以在热词推荐池和热词备选池中的所有热词的数目;所述热词最少展示次数为预先设定,其可以是自定义值。优选的,取热词最少展示次数=n/热词推荐池和热词备选池中所有热词的平均转化率。优选的,所述第一预定阈值可以根据实践需要任意预先设定,优选为所述热词推荐池中的热词数量减去n,所述第二预定阈值可以根据实践需要任意预先设定,优选为n,其中n是自定义值,优选为所述热词推荐池中的热词数量乘以0.1的值或者是所述热词推荐池中的热词数量乘以0.2的值或者其他值。即,将热词推荐池里的热词的转化率排名为倒数n个的热词转移到热词备选池中,将热词备选池里的热词的转化率排名为n个的热词转移到热词推荐池中。所述周期可以以天为单位,例如所述周期为1天或2天等。例如,设定每天的一个固定时间重复使热词推荐单元、热词转化率确定单元和热词转移单元工作,例如每天早上7点开始重复执行。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,前述方法实施例中列举的例子,同样适用于解释装置的工作过程,在此不再重复描述。根据本发明实施例提供的提高热词曝光覆盖率的装置,采用了淘汰和晋升的技术手段,按不同比例分别从两个热词池里随机选择热词进行推荐展示,提高了热词的曝光覆盖率,这让更多的热词有曝光机会,同时通过用户的点击行为发现优质热词,能够让优质热词有更多的曝光机会,从而提高了应用商店或应用市场的搜索首页推荐的热词的整体转化率。本发明实施例所提供的提高热词曝光覆盖率的方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,平板电脑,智能手机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom)、随机存取存储器(ram)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1