信息提供方法、装置、设备以及存储介质与流程

文档序号:11729411阅读:227来源:国知局
信息提供方法、装置、设备以及存储介质与流程

本发明实施例涉及信息处理技术,尤其涉及一种信息提供方法、装置、设备以及存储介质。



背景技术:

搜索引擎(searchengine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,并将用户检索相关的信息展示给用户的系统,其已经成为广大用户获取网络信息的一项不可或缺的方式。

目前,搜索引擎用户获取资讯或者答案的方式是:输入查询式(也可称为查询词)触发搜索,在搜索引擎返回的搜索结果页面中点击一条结果项进入某个文章页面浏览,返回搜索结果页面,继续点击新的结果项,如此循环往复。

发明人在实现本发明的过程中发现:当用户需要查询的问题非常个性化或具体时,例如:离婚起诉这一法律问题,涉及到家庭经济状态,个人经济工作状况,年龄,是否有小孩,婚姻状态,双方过错史等多个因素,此时互联网中已有的信息资源无法给予用户很好的参考和指导,用户查询的问题无法得到有效解决,也就是说,现有的互联网资源及搜索方式无法满足用户的这类需求。



技术实现要素:

本发明实施例提供一种信息提供方法、装置、设备以及存储介质,以优化现有搜索引擎的信息提供方法,提高搜索引擎返回的搜索结果对用户实际需求的命中率。

第一方面,本发明实施例提供了一种信息提供方法,包括:

获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别;

如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片,其中,所述专家卡片用于指引用户将页面跳转至专家服务平台上进行定制化提问;

根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户。

第二方面,本发明实施例还提供了一种信息提供装置,包括:

需求识别模块,用于获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别;

专家卡片召回模块,用于如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片,其中,所述专家卡片用于指引用户将页面跳转至专家服务平台上进行定制化提问;

查询展现结果提供模块,用于根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户。

第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本发明实施例中任一所述的信息提供方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的信息提供方法。

本发明实施例提供了一种信息提供方法、装置、设备以及存储介质,通过获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别;在对用户需求的识别结果为目标行业类目的提问需求时,召回与所述目标行业类目相匹配的专家卡片;根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户,优化了现有搜索引擎的信息提供方法,根据用户的个性化信息获取需求,为用户提供匹配的专家卡片指引用户在相应的专家服务平台上进行定制化提问,提高了搜索结果对用户实际需求的命中率。

附图说明

图1a是本发明实施例一中的一种信息提供方法的流程图;

图1b是本发明实施例一所适用的一种专家卡片的界面示意图;

图1c是本发明实施例一所适用的一种用户点击专家卡片后,页面跳转至的专家服务平台的界面示意图;

图2a是本发明实施例二中的一种信息提供方法的流程图;

图2b是本发明实施例二所适用的一种卡片的界面示意图;

图2c是本发明实施例二所适用的另一种卡片的界面示意图;

图3是本发明实施例三中的一种信息提供方法的流程图;

图4是本发明实施例四中的一种信息提供装置的结构图;

图5是本发明实施例五中的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1a为本发明实施例一提供的一种信息提供方法的流程图,本实施例可适用于根据用户通过搜索引擎输入的查询式,向用户提供相应的查询展示结果情况,该方法可以由本发明实施例提供的信息提供的装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在搜索引擎服务器中,与搜索引擎客户端(移动终端客户端或者pc客户端)配合使用。如图1a所示,本实施例的方法具体包括:

110、获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别。

其中,所述目标查询式可以是用户通过搜索引擎提供的搜索输入框输入的一个或者多个查询关键词。其中,用户输入的不同类型的查询式表明了用户的不同查询需求,搜索引擎通过分析用户输入的目标查询式可以对用户进行相应的用户需求识别。

在本实施例中,主要识别的是用户输入的目标查询式是否为目标行业类目的提问需求。其中,所述目标行业类目具体是指从业人员需要掌握一定的行业基础知识才能进行的特定的经济活动类别,例如:金融、法律、医疗以及计算机等行业。

将提问需求限定在设定行业类目中的目的在于:将用户的一般化提问(例如:最近哪部电影好看)与需要业内专家解答的个性化提问(例如,在具体的离婚纠纷中,如何分配财产)进行区分,用户的一般化提问,一般很容易在浩瀚的网络资源中获取想要的答案;但是用户的个性化提问,往往只有相关领域的从业人员具体问题具体分析才能给出一个比较准确的答案。本发明实施例的一个创新点在于:识别出用户上述个性化提问需求,并在一定的条件下,向所述用户提供设定行业类目的专家卡片。

120、如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片。

在本实施例中,如果对用户需求的识别结果为目标行业类目的提问需求,则会召回与该目标行业类目相匹配的专家卡片。例如:如果对用户需求的识别结果为法律类的提问需求,则会召回法律行业类目的专家卡片;如果对用户需求的识别结果为医疗类的提问需求,则会召回医疗行业类目的专家卡片。

所述专家卡片用于指引用户将页面跳转至专家服务平台上进行定制化提问。其中,在图1b中示出了一种法律行业类目的专家卡片的界面示意图。可以看出,该专家卡片与一般的基于查询式的返回结果不同,从其所提供的显示内容看出,专家卡片中并没有针对用户的查询式返回关联结果,而是向用户提供了一个可以进行法律类相关提问入口。如果用户选择该专家卡片,则可以将页面跳转至专家服务平台中,引导用户在该专家服务平台中进行个性化提问,其中,在图1c中示出了一种用户点击专家卡片后,页面跳转至的专家服务平台的界面示意图。

可选的,搜索引擎平台可以搭建一个专家服务平台,接入多个第三方的优质专家问答服务。用户可以根据自己的喜好和专家服务平台的口碑来选择,直接向第三方平台的专家发起提问。如果在该专家服务平台中选择接入承诺应答快的第三方平台的优质专家,可以实现比用户直接选择第三方平台网站上发起提问的响应速度快。同时,提问结果也会有很大保障,这将是本方案的巨大优势。

130、根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户。

在本实施例中,在召回所述专家卡片之后,并不是直接将该专家卡片提供给用户,而是通过参考与该目标查询式对应的常规召回结果,最终确定是否将该专家卡片作为查询展现结果提供给用户。

其中,所述常规召回结果,是指将目标查询式提交至搜索引擎服务器后,该搜索引擎服务器基于现有的搜索技术召回的搜索结果。所述查询展现结果,是指针对用户输入的目标查询式最终返回给用户查看的搜索结果。

其中,本实施例的方案引入了行业专家,可以直接1对1的解决用户的个性化问题,用户可点击专家服务平台提供的咨询页面提交自己的具体问题,提交成功后,专家服务平台会将问题提交给各专家并将专家答案反馈(例如:短信提醒)给用户,用户在查看答案的同时可在即时聊天界面进行中追问,确保解决用户的问题。

本发明实施例提供了的信息提供方法,通过获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别;在对用户需求的识别结果为目标行业类目的提问需求时,召回与所述目标行业类目相匹配的专家卡片;根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户,优化了现有搜索引擎的信息提供方法,根据用户的个性化信息获取需求,为用户提供匹配的专家卡片指引用户在相应的专家服务平台上进行定制化提问,提高了搜索结果对用户实际需求的命中率。

实施例二

图2a为本发明实施例二提供的一种信息提供方法的流程图,本实施例以上述实施例为基础进行优化,在本实施例中,将对所述目标查询式进行用户需求识别,具体优化为:根据样本查询式,以及与所述样本查询式对应的至少一个识别特征向量的标注结果构造与所述目标行业类目相匹配的标注样本,并使用所述标注样本训练生成需求识别模型;获取与所述目标查询式对应的识别特征向量,并将所述目标查询式的识别特征向量输入至所述需求识别模型中;根据所述需求识别模型的输出结果,识别所述用户需求是否为目标行业类目的提问需求。相应的,本发明实施例的方法包括:

210、根据样本查询式,以及与所述样本查询式对应的至少一个识别特征向量的标注结果构造与所述目标行业类目相匹配的标注样本,并使用所述标注样本训练生成需求识别模型。

在本实施例中,为了识别用户输入的目标查询式是否为某一个行业类目的提问需求,可以预先针对不同的行业类目(典型的,法律以及医疗)训练生成一个或者多个需求识别模型,以实现当有用户的目标查询式输入至该需求识别模型中之后,该模型可以自动确定用户的需求是否为某一行业类目的提问需求。

其中,所述识别特征向量可以包括:与所述样本查询式关联的历史点击url的行业关联权重值、与查询式对应的关联词组、以及查询式命中的样式模板中的一个或者多个。

在本实施例的一个可选的实施方式中,所述识别特征向量的类型可以包括:与所述样本查询式关联的历史点击url的行业关联权重值;

相应的,根据样本查询式,以及与所述样本查询式对应的至少一个识别特征向量的标注结果构造与所述目标行业类目相匹配的标注样本,可以包括:

获取设定数量的种子查询式,其中,所述种子查询式为预先选取的,与所述目标行业类目相匹配的查询式;根据所述种子查询式以及用户的历史查询日志,对所述种子查询式进行扩散处理,获取扩散查询式;记录与所述种子查询式关联的历史点击url,标注所述历史点击url的行业关联权重值,记录扩散处理过程中获取的新的历史点击url,并标注所述新的历史点击url的行业关联权重值;根据对所述扩散查询式的识别结果,更新已标注的所述历史点击url的行业关联权重值;使用所述扩散查询式进行重复迭代,继续获取新的扩散查询式以及记录新的历史点击url,并更新已标注的所述历史点击url的行业关联权重值,直至新记录的历史点击url满足预设的节点收敛条件;根据所述种子查询式、所述扩散查询式以及所述历史点击url的行业关联权重值构造url标注样本。

在一个具体的例子中,产品开发人员预先确定一些与法律问答相关的种子查询式,例如,查询式aa,之后在用户的历史查询日志(包括查询式,以及点击url)中,获取包括aa的历史查询日志b和c;其中,b中包括历史点击url1,c中包括历史点击url2;记录url1以及url2,并分别标注url1以及url2的行业关联权重值,例如,均标注为50;然后在用户的历史查询日志中,继续获取包括url1以及url2的新的历史查询日志d以及e;其中,d中包括查询式bb,e中包括查询式cc,则可以进一步将查询式bb以及cc作为扩散查询式。

产品开发人员进一步识别所述查询式bb以及cc是否为法律问答相关的查询式,例如,将bb识别为法律问答查询式,将cc识别为非法律问答查询式,而cc对应于url2,则可以进而在扩散查询式中去除cc,并更新url2的行业关联权重值,例如,更新为30。接着,使用查询式bb继续查找并记录新的url,使用该新的url查找新的扩散查询式,由产品开发人员继续识别新的查询式,更新记录的历史点击url的行业关联权重值,…,按照这个方式重复迭代,直至新记录的历史点击url满足预设的节点收敛条件,例如,在迭代过程中无法再记录新的历史点击url了。

进一步的,根据所述种子查询式、所述扩散查询式以及所述历史点击url的行业关联权重值构造url标注样本,可以包括:

根据扩散查询式以及与所述扩散查询式对应的历史点击url的行业关联权重值,构造第一url标注样本;获取随机查询式,并根据所述随机查询式以及与所述随机查询式对应的历史点击url的行业关联权重值,构造第二url标注样本;在所述种子查询式中获取第一数量(例如20%)的第一种子查询式,并根据所述第一种子查询式以及与所述第一种子查询式对应的历史点击url的行业关联权重值,构造第三url标注样本。

这样设置的好处是:随机游走出来的标注样本(由扩散查询式构造的样本),该样本具有丰富的特征,能够使得模型参数得到丰富的训练;随机查询式的标注样本,该样本是为了拟合数据的显示分布,使得模型训练能够有效避免过拟合;由部分种子查询式构造的标注样本,这部分标注样本使训练出的模型更能满足实际的需求。

进一步的,在根据所述种子查询式、所述扩散查询式以及所述历史点击url的行业关联权重值构造url标注样本之后,还可以包括:在所述种子查询式中获取第二数量(典型的,种子查询式的总量减去所述第一数量)的第二种子查询式,并根据所述第二种子查询式以及与所述第二种子查询式对应的历史点击url的行业关联权重值,计算所述需求识别模型的识别性能参数(典型的,准确率和召回率)。

在本实施例的另一个可选的实施方式中,所述识别特征向量的类型还可以包括:与查询式对应的关联词组;

相应的,根据样本查询式,以及与所述样本查询式对应的至少一个识别特征向量的标注结果构造与所述目标行业类目相匹配的标注样本,可以包括:

获取设定数量的种子查询式,其中,所述种子查询式为预先选取的,与所述目标行业类目相匹配的查询式;获取一个种子查询式进行分词处理,并剔除分词处理后的无意义分词;将保留的分词进行设定组合,生成与所述种子查询式对应的至少一个关联词组,并记录与生成的所述关联词组对应的标注结果,其中,一个关联词组中包括至少两个分词;返回执行获取一个种子查询式进行分词处理,并剔除分词处理后的无意义分词的操作,直至满足预设的结束标注条件;根据所述种子查询式,以及与所述种子查询式对应的关联词组的标注结果构造词组标注样本。

在上述各实施例的基础上,所述识别特征向量的类型还可以包括:查询式命中的样式模板(典型的,xx怎么判,或者xx怎么治等);

相应的,根据样本查询式,以及与所述样本查询式对应的至少一个识别特征向量的标注结果构造与所述目标行业类目相匹配的标注样本,还可以包括:

获取设定数量的种子查询式,其中,所述种子查询式为预先选取的,与所述目标行业类目相匹配的查询式;对各种子查询式所命中的样式模板进行打分,并将打分值作为所述样式模板的标注结果;根据所述种子查询式,以及与所述种子查询式对应的样式模板的标注结果构造样式标注样本。

在上述各可选实施方式的基础上,所述使用所述标注样本训练生成需求识别模型,可以包括:

将所述标注样本输入至一个机器学习模型中,典型的,svm(supportvectormachine,支持向量机),将该机器学习模型训练生成所述需求识别模型。

220、获取与所述目标查询式对应的识别特征向量,并将所述目标查询式的识别特征向量输入至所述需求识别模型中。

在本实施例中,根据训练所述需求识别模型所使用的识别特征向量的类型,获取与所述目标查询式对应的一个或者多个识别特征向量。

230、根据所述需求识别模型的输出结果,识别所述用户需求是否为目标行业类目的提问需求。

在本实施例的一个可选的实施方式中,可以将目标查询式的识别特征向量分别输入至对应不同行业类目的需求识别模型中,如果某一个需求识别模型输出相应行业类目的身份标识,则确定所述用户需求为相应行业类目的提问需求。

240、如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片。

其中,所述专家卡片用于指引用户将页面跳转至专家服务平台上进行定制化提问。

250、根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户。

在本实施例的中,可以首先验证所述常规召回结果中的自然语言搜索结果是否满足预设的相关度阈值:若是,则不提供所述专家卡片给用户;否则,提供所述专家卡片给用户;

还可以首先验证所述常规召回结果中的卡片类搜索结果是否能够对目标查询式摘要满足:若是,则不提供所述专家卡片给用户;否则,提供所述专家卡片给用户。

当然,本领域技术人员可以理解的是,还可以采取其他的策略确定是否将所召回的专家卡片提供给用户,本实施例对此并不进行限制。

本实施例的技术方案通过构造与不同行业类目对应的需求识别模型,可以准确识别出与用户输入的目标查询式对应的目标行业类目的提问需求,进而可以准确判断是否有需要召回对应行业类目的专家卡片,根据用户的个性化信息获取需求,为用户提供匹配的专家卡片指引用户将在相应的专家服务平台上进行定制化提问,提高了搜索结果对用户实际需求的命中率。

在上述各实施例的基础上,将如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片,具体优化为:

如果对用户需求的识别结果为目标行业类目的提问需求,则获取与所述目标行业类目的提问需求相匹配的绑定查询式;根据所述绑定查询式在卡片资源库中进行查找,获取与所述绑定查询式对应的卡片作为专家卡片。

其中,所述卡片资源库中包括至少一个卡片,一个卡片对应至少一个查询式,所述卡片为具有设定展示样式的结构化数据。在图2b以及图2c中示出了两种不同卡片的界面示意图。显然,卡片不同于一般的网页类的搜索结果,其具有丰富的展示样式,可以满足用户不同的查询需求,典型的,所述卡片具体可以为百度的阿拉丁卡片。

在本实施例的一个可选的实施方式中,如果对用户需求的识别结果为目标行业类目的提问需求,则需求识别模型会相应返回该目标行业类目的身份标识,进而可以将该身份标识发送至卡片资源接口中召回相应的专家卡片。

一般来说,卡片资源的召回是查询式粒度的,就是说召回后端是根据查询式来请求召回卡片的,查询式能召回卡片,前提是这个查询式在卡片资源表里已经被配置进去了,是以查询式为键(也可以称为key)去查询的。但是可以理解的是,用户的提问查询式是多种多样,事先并不能枚举全部查询式配置相应的专家卡片。

在本实施例中,发明人提出了一种在兼容现有的卡片召回方式的基础上,简单、快速召回专家卡片的方法,即:针对专家卡片只配置了一个查询式作为绑定查询式,然后根据卡片资源接口中接收的目标行业类目的身份标识,将查询卡片资源的查询式强行更改为预先配置的和该目标行业类目的身份标识所绑定的绑定查询式,这样,当用户的查询式被识别为某行业类目的提问需求后,就可以直接召回这个行业类目的卡片资源了。

实施例三

图3为本发明实施例三提供的一种信息提供方法的流程图,本实施例以上述实施例为基础进行优化。在本实施例中,将根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户,具体优化为:如果所述常规召回结果中的自然搜索结果不满足相关度阈值条件,且所述常规召回结果中不包括摘要满足的其他卡片,则在所述查询展现结果中提供所述专家卡片;以及

如果所述常规召回结果中的自然搜索结果满足相关度阈值条件,或者所述常规召回结果中包括摘要满足的其他卡片,则对所述常规召回结果中包括的除去所述专家卡片之外的其他卡片进行聚类处理;如果聚类结果为包括设定数量的属于目标类别的卡片,则在所述查询展现结果中提供所述专家卡片。

相应的,本实施例的方法包括:

310、获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别。

320、判断对用户需求的识别结果是否为目标行业类目的提问需求:若是,则执行330;否则,执行340。

330、获取与所述目标行业类目的提问需求相匹配的绑定查询式,执行350。

340、将与所述目标查询式对应的常规召回结果作为查询展现结果提供给所述用户。

在本实施例中,所述常规召回结果是指将目标查询式提交至搜索引擎服务器后,该搜索引擎服务器基于现有的搜索技术召回的搜索结果。其中,常规召回结果中可以包括自然搜索结果,也即:现有的样式较单一的网页类搜索结果(主要包括网页标题以及部分网页正文);还可以包括除去所述专家卡片之外的其他卡片。本实施例对上述常规召回结果的召回方式不进行限定。

350、根据所述绑定查询式在卡片资源库中进行查找,获取与所述绑定查询式对应的卡片作为专家卡片。

360、判断常规召回结果中的自然搜索结果是否满足相关度阈值条件,若是,执行370;否则,执行390。

一般来说,搜索引擎会计算召回的每个自然搜索结果与用户输入的目标查询式之间的相关度评分值,进而可以对自然搜索结果对用户实际搜索需求的命中程度进行预判。可以理解的是,如果判断常规召回结果可以满足用户的实际需求,则没有必要召回专家卡片。进而可以预先确定一个相关度阈值条件,例如:返回的前n项(n可以为2、3或者4等)自然搜索结果的相关度评分值均大于80分。

370、对所述常规召回结果中包括的除去所述专家卡片之外的其他卡片进行聚类处理,执行380。

在本实施例中,在验证自然搜索结果满足用户的实际搜索需求后,并不是直接确定不向用户提供该专家卡片,而是引入了一个卡片豁免干预过程,即:根据常规召回结果中是否出现某一类型的其他卡片来确定是否保留该专家卡片。

即:对除去所述专家卡片之外的其他卡片进行聚类处理,如果聚类结果包括设定数量的属于目标类别的卡片。典型的,所述目标类别的卡片可以为问答类卡片。例如:如果对除去所述专家卡片之外的其他卡片进行聚类处理后,确定包括了3个以上的问答类卡片,则仍然将该专家卡片提供给用户。

这样设置的原因是:综合考虑了召回结果中设定类别(典型的,问答类)卡片聚合结果,如果召回结果中出现了多个问答类的卡片,说明此类问题常见,那么可以考虑保留专家问答卡片,为用户保留多一个需求查找渠道,满足搜索展示结果的多样性。

380、判断聚类结果是否包括设定数量的属于目标类别的卡片,若是,执行3100;否则,执行3110。

390、判断所述常规召回结果中是否包括摘要满足的其他卡片:若是,返回执行370;否则,执行3100。

在本实施例中,在确定常规召回结果中的自然搜索结果不满足相关度阈值条件后,并不是直接提供所述专家卡片,而是进一步验证所述常规召回结果中包括的除去所述专家卡片之外的其他卡片是否能够满足(或者说摘要满足)用户的查询需求。其中,如果用户从查询展示结果的摘要展现就可以找到所求,则可以将当前的查询展现结果确定为摘要满足。

发明人通过从分析大量日志发现:如果一个查询展现结果属于摘要满足,则用户很大概率在获取当前的查询展现结果后,停止查看其他的结果,结束针对当前输入查询式的搜索行为。因此,如果常规召回搜索结果中已经存在摘要满足的卡片,那么就断定当前搜索结果比较好,用户会比较满意,没必要提供专家卡片,当然,具体是否提供该专家卡片,还可以继续通过卡片豁免干预过程确定;但是,如果所述常规召回结果中仍然没有包括摘要满足的其他卡片,则会直接在所述查询展现结果中提供所述专家卡片。

3100、在所述查询展现结果中提供所述专家卡片。

3110、不在所述查询展现结果中提供所述专家卡片。

本实施例的技术方案在根据用户输入的目标查询式召回专家卡片后,并不是直接在查询展现结果中提供该专家卡片,而是首先综合分析常规召回结果是否能够满足用户的实际查询需求,并同时引入了卡片豁免干预过程,以使得最终专家卡片的推送更加合理,更能满足用户的实际的个性化提问需求,在最大程度的对减少对现有的查询展现结果改动下,能够准确针对用户实际的面向某个特定领域的提问需求,提供相匹配的专家卡片,以满足用户的个性化提问需求。

实施例四

图4为本发明实施例四提供的一种信息提供装置的结构示意图,如图4所示,所述装置包括:需求识别模块410、专家卡片召回模块420以及查询展现结果提供模块430,其中:

需求识别模块410,用于获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别。

专家卡片召回模块420,用于如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片,其中,所述专家卡片用于指引用户将页面跳转至专家服务平台上进行定制化提问。

查询展现结果提供模块430,用于根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户。

本发明实施例提供了的信息提供装置,通过获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别;在对用户需求的识别结果为目标行业类目的提问需求时,召回与所述目标行业类目相匹配的专家卡片;根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户,优化了现有搜索引擎的信息提供方法,根据用户的个性化信息获取需求,为用户提供匹配的专家卡片指引用户在相应的专家服务平台上进行定制化提问,提高了搜索结果对用户实际需求的命中率。

在上述各实施例的基础上,需求识别模块,可以包括:

需求识别模型训练单元,用于根据样本查询式,以及与所述样本查询式对应的至少一个识别特征向量的标注结果构造与所述目标行业类目相匹配的标注样本,并使用所述标注样本训练生成需求识别模型;

目标向量输入单元,用于获取与所述目标查询式对应的识别特征向量,并将所述目标查询式的识别特征向量输入至所述需求识别模型中;

识别单元,用于根据所述需求识别模型的输出结果,识别所述用户需求是否为目标行业类目的提问需求。

在上述各实施例的基础上,所述识别特征向量的类型可以包括:与所述样本查询式关联的历史点击url的行业关联权重值;

所述需求识别模型训练单元,可以具体包括:

种子查询式获取子单元,用于获取设定数量的种子查询式,其中,所述种子查询式为预先选取的,与所述目标行业类目相匹配的查询式;

扩散查询式获取子单元,用于根据所述种子查询式以及用户的历史查询日志,对所述种子查询式进行扩散处理,获取扩散查询式;

行业关联权重值标注子单元,用于记录与所述种子查询式关联的历史点击url,标注所述历史点击url的行业关联权重值,记录扩散处理过程中获取的新的历史点击url,并标注所述新的历史点击url的行业关联权重值;

行业关联权重值更新子单元,用于根据对所述扩散查询式的识别结果,更新已标注的所述历史点击url的行业关联权重值;

重复迭代标注子单元,用于使用所述扩散查询式进行重复迭代,继续获取新的扩散查询式以及记录新的历史点击url,并更新已标注的所述历史点击url的行业关联权重值,直至新记录的历史点击url满足预设的节点收敛条件;

url标注样本构造子单元,用于根据所述种子查询式、所述扩散查询式以及所述历史点击url的行业关联权重值构造url标注样本。

在上述各实施例的基础上,所述url标注样本构造子单元,具体可以用于:

根据扩散查询式以及与所述扩散查询式对应的历史点击url的行业关联权重值,构造第一url标注样本;

获取随机查询式,并根据所述随机查询式以及与所述随机查询式对应的历史点击url的行业关联权重值,构造第二url标注样本;

在所述种子查询式中获取第一数量的第一种子查询式,并根据所述第一种子查询式以及与所述第一种子查询式对应的历史点击url的行业关联权重值,构造第三url标注样本。

在上述各实施例的基础上,还可以包括,性能参数识别子单元,用于:

在根据所述种子查询式、所述扩散查询式以及所述历史点击url的行业关联权重值构造url标注样本之后,在所述种子查询式中获取第二数量的第二种子查询式,并根据所述第二种子查询式以及与所述第二种子查询式对应的历史点击url的行业关联权重值,计算所述需求识别模型的识别性能参数。

在上述各实施例的基础上,所述识别特征向量的类型可以包括:与查询式对应的关联词组;

所述需求识别模型训练单元,可以具体用于:

获取设定数量的种子查询式,其中,所述种子查询式为预先选取的,与所述目标行业类目相匹配的查询式;

获取一个种子查询式进行分词处理,并剔除分词处理后的无意义分词;

将保留的分词进行设定组合,生成与所述种子查询式对应的至少一个关联词组,并记录与生成的所述关联词组对应的标注结果,其中,一个关联词组中包括至少两个分词;

返回执行获取一个种子查询式进行分词处理,并剔除分词处理后的无意义分词的操作,直至满足预设的结束标注条件;

根据所述种子查询式,以及与所述种子查询式对应的关联词组的标注结果构造词组标注样本。

在上述各实施例的基础上,所述识别特征向量的类型可以包括:查询式命中的样式模板;

所述需求识别模型训练单元,可以具体用于:

获取设定数量的种子查询式,其中,所述种子查询式为预先选取的,与所述目标行业类目相匹配的查询式;

对各种子查询式所命中的样式模板进行打分,并将打分值作为所述样式模板的标注结果;

根据所述种子查询式,以及与所述种子查询式对应的样式模板的标注结果构造样式标注样本。

在上述各实施例的基础上,专家卡片召回模块,可以具体用于:如果对用户需求的识别结果为目标行业类目的提问需求,则获取与所述目标行业类目的提问需求相匹配的绑定查询式;

根据所述绑定查询式在卡片资源库中进行查找,获取与所述绑定查询式对应的卡片作为专家卡片;

其中,所述卡片资源库中包括至少一个卡片,一个卡片对应至少一个查询式,所述卡片为具有设定展示样式的结构化数据。

在上述各实施例的基础上,所述查询展现结果提供模块,可以具体用于:

如果所述常规召回结果中的自然搜索结果不满足相关度阈值条件,且所述常规召回结果中不包括摘要满足的其他卡片,则在所述查询展现结果中提供所述专家卡片。

在上述各实施例的基础上,所述查询展现结果提供模块,可以具体用于:

如果所述常规召回结果中的自然搜索结果满足相关度阈值条件,或者所述常规召回结果中包括摘要满足的其他卡片,则对所述常规召回结果中包括的除去所述专家卡片之外的其他卡片进行聚类处理;

如果聚类结果为包括设定数量的属于目标类别的卡片,则在所述查询展现结果中提供所述专家卡片。

上述信息提供装置可执行本发明任意实施例所提供的信息提供方法,具备执行的信息提供方法相应的功能模块和有益效果。

实施例五

图5为本发明实施例五提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图5显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图5中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的信息提供方法。

也即,所述处理单元执行所述程序时实现:获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别;如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片,其中,所述专家卡片用于指引用户将页面跳转至专家服务平台上进行定制化提问;根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户。

实施例六

本发明实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的信息提供方法:

也即,该程序被处理器执行时实现:获取用户输入的目标查询式,并对所述目标查询式进行用户需求识别;如果对用户需求的识别结果为目标行业类目的提问需求,则召回与所述目标行业类目相匹配的专家卡片,其中,所述专家卡片用于指引用户将页面跳转至专家服务平台上进行定制化提问;根据召回的所述专家卡片以及与所述目标查询式对应的常规召回结果,确定与所述目标查询式对应的查询展现结果提供给所述用户。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1