关键词推荐方法、系统、电子设备和计算机可读介质与流程

文档序号:16609738发布日期:2019-01-14 21:30阅读:246来源:国知局
关键词推荐方法、系统、电子设备和计算机可读介质与流程

本公开涉及计算机、互联网、大数据等技术领域,具体涉及一种关键词推荐方法、系统、电子设备和计算机可读介质。



背景技术:

目前,用户在浏览网络内容时,浏览需求通常是多变的,为了提高浏览的效率和精准程度,在一些网络内容页面中设计了搜索框,以供用户搜索期望获取的内容,但是现有技术中在网络内容页面设计的搜索框中通常在搜索空框内并不呈现搜索推荐词,通常需要用户人工输入搜索词进行搜索,用户人工输入关键词存在的问题在于有时候用户未必能够选择到准确的关键词,可能存在词不达意的情形,人工输入严重影响用户对内容的浏览效率,降低了用户体验;另外在多数情况下用户浏览内容时其浏览需求是多变的、有时甚至是不确定的,人工输入关键词的方式不利于对用户浏览内容的引导。



技术实现要素:

鉴于现有技术中存在的问题,本公开的目的之一在于提供一种关键词推荐方法、系统、装置和计算机可读介质,其能够实现提高浏览效率、结合用户的浏览兴趣进行浏览引导、精准信息推送、增加用户体验等多个目的中的至少一个。

为达此目的,本公开采用以下技术方案:

作为本公开的第一方面,提供一种关键词推荐方法,包括:

根据历史搜索数据获取搜索关键词之间的关联关系;

根据用户浏览行为提取与该浏览行为对应的关键词;

根据关键词关联关系和所提取的用户浏览行为对应的关键词生成关联搜索词,并将所述关联搜索词作为推荐词展示在浏览页面的搜索框内。

作为本公开的第二方面,提供一种关键词推荐系统,包括:

关键词提取分析模块,用于根据历史搜索数据获取搜索关键词之间的关联关系;

用户浏览行为关键词提取模块,用于根据用户浏览行为提取与该浏览行为对应的关键词;

搜索词推荐模块,用于根据关键词提取分析模块提供的关键词关联关系和用户浏览行为关键词提取模块提取的用户浏览行为对应的关键词生成关联搜索词,并将所述关联搜索词作为推荐词展示在浏览页面的搜索框内。

作为本公开的第三方面,提供一种电子设备,包括:处理器和存储器,所述存储器具有存储有程序代码的介质,当所述处理器读取所述介质存储的程序代码时,所述电子设备能够执行本公开实施例所述的方法。

作为本公开的第四方面,提供一种计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本公开实施例所述的方法。

与现有技术方案相比,本公开至少具有以下有益效果:

本公开通过根据用户历史搜索数据建立关键词关联关系,通过用户浏览行为提取与浏览行为对应的关键词,并将与所提取的用户浏览行为对应的关键词的关联搜索词展示在浏览页面的搜索框内,从而实现了用户在浏览某个页面时,页面内的搜索框内自动呈现用户使用可能性最大的搜索关键词,节省了用户人工输入搜索关键词的步骤,减少了用户自行选择关键词可能存在的词不达意的情形,在一些特定的情况下还可以对用户的浏览行为进行引导,提高了浏览效率,提升了用户体验。

附图说明

图1是本公开实施例所述的方法的流程示意图;

图2是本公开实施例所述的关键词推荐系统的结构示意图;

图3是根据本公开的实施例的计算机可读存储介质的示意图;

图4是本公开实施例所述的电子设备结构示意图。

下面对本公开进一步详细说明。但下述的实例仅仅是本公开的简易例子,并不代表或限制本公开的权利保护范围,本公开的保护范围以权利要求书为准。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本公开的技术方案。

为更好地说明本公开,便于理解本公开的技术方案,本公开的典型但非限制性的实施例如下:这里需要特别说明的是本公开说明书所列的实施方式仅是为了说明问题方便而给出的示例性实施方法,其不得理解为是本公开唯一正确的实施方式,更不得理解为是对本公开保护范围的限制性说明。

图1是本公开实施例所述的关键词推荐方法的流程示意图,所述关键词推荐方法包括:s1:根据历史搜索数据获取搜索关键词之间的关联关系;

s2:根据用户浏览行为提取与该浏览行为对应的关键词;

s3:根据关键词关联关系和所提取的用户浏览行为对应的关键词生成关联搜索词,并将所述关联搜索词作为推荐词展示在浏览页面的搜索框内。

本公开所述根据历史搜索数据获取搜索关键词之间的关联关系中所述的历史搜索数据不局限于当前用户的历史数据,其可以为所有搜索用户的历史搜索数据,也可以为部分特定用户群体的历史搜索数据,还可以为从所有搜索用户的历史搜索数据中抽取的满足特定特征的历史搜索数据。

作为优选实施例,所述根据历史搜索数据获取搜索关键词之间的关联关系的步骤包括:根据用户访问的网页、点击的内容、使用的搜索词、用户访问的网页、点击的内容和/或使用的搜索词的先后顺序中的至少一个获取搜索关键词之间的关联关系。

例如:用户首先访问了“问题产品”相关网页,进一步点击了该网页内的“问题产品去向”的用户占比为85%、“产品安全性问题”的用户占比为80%、“xxx负责人介绍xxxx相关情况”的用户占比为60%、“产品监管制度”的用户占比为40%,同时在浏览网页内容时还使用了搜索关键词“aa产品”的用户占比为95%、“bb产品”的用户占比为90%、“不良反应+产品”的用户占比为96%、“生产销售伪劣产品罪”的用户占比为30%、“赔偿”的用户占比为20%,则根据上述用户的访问数据、搜索数据等历史数据可以获知,“问题产品”、“问题产品去向”、“产品安全性问题”、“相关情况”、“产品监管制度”、“aa产品”、“bb产品”、“不良反应+产品”、“生产销售伪劣产品罪”、“赔偿”等关键词之间的关联关系,上述关联关系是指一个特定的关键词与其他关键词的相关程度,举例来说,访问“问题产品”相关网页的用户90%以上的用户又进一步访问了“aa产品”、“bb产品”、“不良反应+产品”等相关网页,则可以认为“问题产品”与“aa产品”、“bb产品”、“不良反应+产品”等关键词具有极强的关联关系,在一些优选的实施例中所述关联关系可以采用等级标注或明确的定量的数字化标注,例如将“问题产品”与“aa产品”、“bb产品”、“不良反应+产品”之间的关联关系标注为“极强”、“a级”、“一级”或其它任何可以识别的字符,在满足特定条件的情况下,将所述关联关系也可以采用数字化定量的标注方式,例如将“问题产品”与“aa产品”的关联度标注为95%、“问题产品”与“bb产品”的关联度标注为90%、将“问题产品”与“不良反应+产品”的关联度标注为96%。再另外一些更优选的实施例中,通过特定的关联算法可可以计算出“aa产品”、“bb产品”、“不良反应+产品”等关键词任意两者之间的关联关系。另外需要特别说明的是在一些优选的实施例中,所述关联关系是有方向性的,即:“问题产品”与“aa产品”的关联度为95%并不表明“aa产品”与“问题产品”的关联度为95%,也就是说访问“问题产品”的95%的用户会访问“aa产品”相关网页,但是并不表明访问“aa产品”相关网页的用户95%的会访问“问题产品”相关网页。上述方向性指标可以通过用户访问的网页、点击的内容和/或使用的搜索词的先后顺序等相关历史数据获得。

前面提到通过历史搜索数据可以获得关键词之间的关联关系,但是,计算所有关键词两者之间的关联关系需要的计算量过大、耗费资源、影响效率,在一些历史数据缺失的情况下,计算所有关键词之间的关联关系可能会存在一定的困难。作为优选实施例,可以根据用户访问的网页、点击的内容和/或使用的搜索词及用户访问的网页、点击的内容和/或使用的搜索词先后顺序首先确定核心词;还是以前面提到的例子为例可以将“问题产品”确定为核心词,然后根据历史数据仅计算“问题产品”与“问题产品去向”、“产品安全性问题”、“相关情况”、“产品监管制度”、“aa产品”、“bb产品”、“不良反应+产品”、“生产销售伪劣产品罪”、“赔偿”等关键词之间的关联关系,然后将所述关联关系生成关联关系列表以方便系统调用。

为了提高所述列表的利用效率对于一些重复的、冗余的和/或相关度较低的数据可以采用数据清洗、去重、过滤的方式予以去除。

作为进一步的优选实施例,根据用户浏览行为提取与该浏览行为对应的关键词的步骤包括:根据用户的浏览的具体内容、浏览时长、浏览时使用的搜索词提取与所述浏览行为对应的关键词。例如:用户浏览了“问题产品”的相关网页内容,在文章中提到“aa产品”、“bb产品”、“不良反应”、“安全性”、“上市公司”,用户进一步使用关键词或点击了链接“aa产品”、“bb产品”、“不良反应”相关网页,并使用了较长的时间浏览相关页面内容,则认为“问题产品”与“aa产品”、“bb产品”、“不良反应”之间具有较强的关联性。

作为优选实施例,上述关联关系可以采用定性和定量的标注方式予以标记,定性可以为关联等级,例如:极强、较强、一般、较差、弱关联等,当然在具体的使用过程中所述关联等级可以采用其它任何合适的字符,例如a、b、c、d…,1、2、3、4…等任何可识别字符。对于定量的标注方式,可以通过具体的用户访问概率、具体网页的浏览时长等相关数据计算获得。

步骤s2中:根据用户浏览行为提取与该浏览行为对应的关键词;这里的用户是指当前用户,例如当前用户浏览了“xxx生物不合格xxx产品流向”相关网页的内容,假设根据该浏览行为提取出的与该浏览行为对应的关键词为“问题产品”。则,在步骤s3中根据关键词关联关系和所提取的用户浏览行为对应的关键词生成关联搜索词,例如:“aa产品”、“bb产品”、“不良反应”、“安全性”;同时将所述关联搜索词作为推荐词展示在浏览页面的搜索框内,这种情况下,对于大多数用户来说不需要进一步手动输入关键词,直接点击相关的关键词搜索即可实现进一步浏览的目的。

作为优选实施例,根据用户浏览行为提取与该浏览行为对应的关键词的步骤为通过对用户浏览的具体页面内容语义分析的方式提取所述对应的关键词。所述语义分析是指计算机根据整个文章内容所要表达的核心含义分析提取相关的关键词,具体可以根据整个文章中使用的特定术语的词频、位置、与某些特定词语的间隔关系等提取关键词。进一步举例而言,例如某篇文章中“产品”出现的次数最多,在标题中还出现了“不合格”用语,则可以将与该浏览行为对应的关键词提取为“问题产品”。当然上面仅是列举性说明,对于某一浏览行为提取的关键词不限于一个,可以根据需要选择或设定多个对应的关键词。

在现实的用户浏览搜索时,通常其浏览需求是不确定的,搜索需要也是多变的,可能需要频繁改写更换需要使用的关键词。在一些优选的实施例中,推荐给所述浏览页面内的搜索框内的关键词是实时的,并且根据浏览行为和内容的变化实时更新所推荐的关键词。其优势在于所述搜索框内的根据用户的浏览行为实时动态变化,实时推荐与用户兴趣点紧密相关的关键词,极大限度地方便了用户的搜索需求,同时能够起到及时有目的地引导用户浏览特定内容的作用。这里提到引导用户浏览行为的构思,在公开中可以通过设定特定的关键关联词得以实现,即,根据引导浏览行为的需要,有目的地改写与浏览行为相对应的关键词的关联关键词,并通过调整关联程度控制相关关键词显示在搜索框内的时机。

作为本公开的另外一个方面,本公开还提供一种与前述方法步骤对应的系统,对于在前面描述所述方法中提交的诸多技术细节同样包括在与所述方法对应的系统中,为节约篇幅,在对系统的描述中不在一一展开。

本公开所述系统可以为实体硬件系统、软件功能模块构成的虚拟系统或者硬件和软件相互结合的系统,但是本领域技术人员应该理解任何软件功能模块构成的虚拟系统其功能的实现都离不开实体硬件装置的支持。

图2是本公开所述的关键词推荐系统的结构示意图,所述关键词推荐系统100,包括:

关键词提取分析模块101,用于根据历史搜索数据获取搜索关键词之间的关联关系;

用户浏览行为关键词提取模块102,用于根据用户浏览行为提取与该浏览行为对应的关键词;

搜索词推荐模块103,用于根据关键词提取分析模块提供的关键词关联关系和用户浏览行为关键词提取模块提取的用户浏览行为对应的关键词生成关联搜索词,并将所述关联搜索词作为推荐词展示在浏览页面的搜索框内。

作为优选实施例,所述关键词提取分析模块101能够根据用户访问的网页、点击的内容、使用的搜索词及用户访问的网页、点击的内容和/或使用的搜索词的先后顺序的至少一个获取搜索关键词之间的关联关系。

作为更优选的实施例,所述关键词提取分析模块101包括:核心词提取子模块,用于根据用户访问的网页、点击的内容、使用的搜索词、用户访问的网页、点击的内容和/或使用的搜索词先后顺序中的至少一个确定核心词;

关联关系提取子模块,用于提取所述核心词与其它关键词之间的协同关系;

关联关系列表生成子模块,用于生成所述核心词与其它关键词之间的关联关系列表。

作为进一步的优选实施方式,所述关联关系列表生成子模块,包括:数据清洗、去重、过滤单元,用于采用数据清洗、去重、过滤的方式予以去除一些重复的、冗余的和/或相关度较低的数据以提高所述列表的利用效率。

作为优选的实施方式,所述关键词提取分析模块101还能够根据用户的浏览的具体内容、浏览时长、浏览时使用的搜索词提取与所述浏览行为对应的关键词。进一步地,根据用户浏览行为提取与该浏览行为对应的关键词包括:根据用户浏览的具体页面内容的标题、内容词频提取对应的关键词。

作为优选的实施方式,用户浏览行为关键词提取模块102包括语义分析子模块,通过对用户浏览的具体页面内容语义分析的方式提取与用户浏览行为对应的关键词。所述语义分析是指计算机根据整个文章内容所要表达的核心含义分析提取相关的关键词,具体可以根据整个文章中使用的特定术语的词频、位置、与某些特定词语的间隔关系等提取关键词。进一步举例而言,例如某篇文章中“产品”出现的次数最多,在标题中还出现了“不合格”用语,则可以将与该浏览行为对应的关键词提取为“问题产品”。当然上面仅是列举性说明,对于某一浏览行为提取的关键词不限于一个,可以根据需要选择或设定多个对应的关键词。

在现实的用户浏览搜索时,通常其浏览需求是不确定的,搜索需要也是多变的,可能需要频繁改写更换需要使用的关键词。作为优选实施例,所述搜索词推荐模块103能够实时将推荐词展示在浏览页面的搜索框内,进一步而言,可以根据用户后续网页访问行为进行动态实时更新搜索框内的推荐词。其优势在于所述搜索框内的根据用户的浏览行为实时动态变化,实时推荐与用户兴趣点紧密相关的关键词,极大限度地方便了用户的搜索需求,同时能够起到及时有目的地引导用户浏览特定内容的作用。这里提到引导用户浏览行为的构思,在公开中可以通过设定特定的关键关联词得以实现,即,根据引导浏览行为的需要,有目的地改写与浏览行为相对应的关键词的关联关键词,并通过调整关联程度控制相关关键词显示在搜索框内的时机。

作为本公开的另一个方面,还提供一种电子设备,包括:处理器和存储器,所述存储器具有存储有程序代码的介质(计算机可读存储介质),当所述处理器读取所述介质存储的程序代码时,所述电子设备能够执行如下方法步骤:根据历史搜索数据获取搜索关键词之间的关联关系;根据用户浏览行为提取与该浏览行为对应的关键词;根据关键词关联关系和所提取的用户浏览行为对应的关键词生成关联搜索词,并将所述关联搜索词作为推荐词展示在浏览页面的搜索框内。

进一步地:当所述处理器读取所述介质存储的程序代码时,所述电子设备还能够执行本公开所述的其它任何方法。

图4是图示根据本公开的实施例的计算机可读存储介质的示意图。如图4所示,根据本公开实施例的计算机可读存储介质300,其上存储有非暂时性计算机可读指令301。当该非暂时性计算机可读指令301由处理器运行时,执行前述的本公开各实施例的关键词推荐方法的全部或部分步骤。

图3是图示根据本公开实施例的电子设备的硬件结构示意图。电子设备可以以各种形式来实施,本公开中的电子设备可以包括但不限于诸如移动电话、智能电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、导航装置、车载终端设备、车载显示终端、车载电子后视镜等的移动终端设备以及诸如数字tv、台式计算机等等的固定设备。

如图3所示,电子设备1100可以包括处理器1120、输入单元1130、存储器1140、输出单元1150等。图3示出了具有各种组件的电子设备,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。

其中,处理器1120用于执行本公开所公开的方法,输入单元1130可以根据用户输入的命令生成键输入数据以控制电子设备的各种操作,输出单元1150提供输出信号。存储器1140可以存储由处理器1120执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据。存储器1140可以包括至少一种类型的存储介质。而且,电子设备1100可以与通过网络连接执行存储器1140的存储功能的网络存储装置协作。处理器1120通常控制电子设备的总体操作。

本公开提出的关键词推荐方法的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。

对于硬件实施,本公开提出的关键词推荐方法的各种实施方式可以通过使用特定用途集成电路(asic)、数字信号处理器(dsp)、数字信号处理装置(dspd)、可编程逻辑装置(pld)、现场可编程门阵列(fpga)、处理器、控制器、微处理器、微控制器被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,本公开提出的关键词推荐方法的各种实施方式可以在处理器1120中实施。对于软件实施,本公开提出的关键词推荐方法的各种实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器1140中并且由处理器1120执行。

申请人声明,本公开通过上述实施例来说明本公开的详细结构特征,但本公开并不局限于上述详细结构特征,即不意味着本公开必须依赖上述详细结构特征才能实施。所属技术领域的技术人员应该明了,对本公开的任何改进,对本公开所选用部件的等效替换以及辅助部件的增加、具体方式的选择等,均落在本公开的保护范围和公开范围之内。

以上详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。

此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1