目标知识点的获取方法及装置与流程

文档序号:11250885阅读:291来源:国知局
目标知识点的获取方法及装置与流程

本申请涉及计算机技术领域,尤其涉及一种目标知识点的获取方法及装置。



背景技术:

知识点可以是指互联网中的一些热门话题,通常在未接收到用户输入的任何信息的情况下,就可以将这些知识点推送给用户,如,在自动问答平台中,在开启自动问答平台的聊天窗口后,就可以将这些知识点的标题显示到聊天窗口中,若这些知识点中包含了用户想了解的内容,则用户只需要点击相应知识点的标题从而链接到该知识点的相关内容,即可对这些知识点进行了解,由此方便了用户对互联网中热门话题的了解,进而提升了用户的体验。

现有技术中,获取目标知识点(如,热门话题)的过程为:在预设时间段内统计多个知识点的点击数;之后根据点击数,从多个知识点中获取目标知识点。然而该方法并未考虑知识点对用户问题的解答效果,有可能用户只是误点击或者出于好奇点击了某些知识点,用户误点击或者出于好奇点击知识点的情况,会影响知识点的点击数统计的准确性,进而会影响目标知识点获取的准确性,由此会造成所推荐的目标知识点与用户的实际诉求存在偏差,从而用户需要手动输入问题来寻求解答,这使得用户了解热门知识点的过程比较繁琐,不能满足用户想要快速了解热门知识点的需求。



技术实现要素:

本申请实施例提供了一种目标知识点的获取方法及装置,可以提高目标 知识点获取的准确性,从而可以满足用户想要快速了解热门知识点的需求。

第一方面,提供了一种目标知识点的获取方法,该方法包括:

收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案,每个知识点归属于一个预设类目;

根据预设的算法,确定所述多次会话内容中各个知识点与对应的问题的匹配度值,并将所述匹配度值作为所述各个知识点的第一分数值;

根据所述各个知识点的第一分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

第二方面,提供了一种目标知识点的获取方法,该方法包括:

收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值;

对每次会话内容中的每个知识点,根据该知识点所属的类目以及该知识点的前一知识点所属的类目,确定所述每个知识点的类目衰减因子;

根据该知识点的类目衰减因子以及该知识点的后续知识点的类目衰减因子,对所述每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第二分数值;

根据所述各个知识点的第二分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

第三方面,提供了一种目标知识点的获取方法,该方法包括:

收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值;

对每次会话内容中的每个知识点,根据当前时间、该知识点所属问答对的创建时间以及预设阈值,确定所述每个知识点的时间衰减因子;

根据所述每个知识点的时间衰减因子,对所述每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第三分数值;

根据所述各个知识点的第三分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

第四方面,提供了一种目标知识点的获取装置,该装置包括:

收集单元,用于收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案,每个知识点归属于一个预设类目;

确定单元,用于根据预设的算法,确定所述收集单元收集的所述多次会话内容中各个知识点与对应的问题的匹配度值,并将所述匹配度值作为所述各个知识点的第一分数值;

获取单元,用于根据所述确定单元确定的所述各个知识点的第一分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

第五方面,提供了一种目标知识点的获取装置,该装置包括:

收集单元,用于收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值;

确定单元,用于对每次会话内容中的每个知识点,根据该知识点所属的类目以及该知识点的前一知识点所属的类目,确定所述每个知识点的类目衰减因子;

更新单元,用于根据所述确定单元确定的该知识点的类目衰减因子以及该知识点的后续知识点的类目衰减因子,对所述每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第二分数值;

获取单元,用于根据所述更新单元更新得到的所述各个知识点的第二分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

第六方面,提供了一种目标知识点的获取装置,该装置包括:

收集单元,用于收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值;

确定单元,用于对每次会话内容中的每个知识点,根据当前时间、该知识点所属问答对的创建时间以及预设阈值,确定所述每个知识点的时间衰减因子;

更新单元,用于根据所述确定单元确定的所述每个知识点的时间衰减因子,对所述每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第三分数值;

获取单元,用于根据所述更新单元更新得到的所述各个知识点的第三分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

本申请提供的目标知识点的获取方法及装置,收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,该知识点是指对应于所述问题的答案,每个知识点归属于一个预设类目;根据预设的算法,获得多次会话内容中各个知识点与对应的问题的匹配度值,并将该匹配度值作为各个知识点的第一分数值;根据各个知识点的第一分数值,从多次会话内容中的多个知识点中获取目标知识点。也即本申请中,考虑了知识点对用户问题的实际解答效果,由此可以提高目标知识点获取的准确性,进而可以满足用户想要快速了解热门知识点的需求。

附图说明

图1为本申请一种实施例提供的目标知识点的获取方法流程图;

图2为本申请另一种实施例提供的目标知识点的获取方法流程图;

图3为本申请再一种实施例提供的目标知识点的获取方法流程图;

图4为本申请又一种实施例提供的目标知识点的获取方法流程图;

图5为本申请一种实施例提供的目标知识点的获取装置示意图;

图6为本申请另一种实施例提供的目标知识点的获取装置示意图;

图7为本申请再一种实施例提供的目标知识点的获取装置示意图。

具体实施方式

下面结合附图,对本发明的实施例进行描述。

本申请实施例提供的目标知识点的获取方法及装置,适用于对互联网中的热门知识点进行获取的场景,尤其适用于对自动问答平台中的热门知识点进行获取的场景。其中,自动问答平台主要是通过具有即时通讯功能的问答机器人来对用户问题进行解答,问答机器人是在对大量预先收集的问答语料学习的基础上来对实时接收的用户问题进行解答的;其可以具有一定的业务背景。如,其可以为支付宝系统中的自动问答平台,也可以为淘宝网中的自动问答平台等。

本申请的知识点可以理解为自动问答平台根据用户问题推送的答案。在具有业务背景的自动问答平台中,知识点通常具有以下三个特点:

1)长尾效应:不同知识点的点击数服从长尾分布,热门知识点集中了较高点击数,而冷门知识点依然存在少量点击;

2)时效性:部分知识点具有时效性,在特定的时间段内会被大量点击,而其余时间段内的点击数明显降低;

3)关联性:不同知识点间存在关联性,当某些知识点被大量点击时,与其具有相似主题或业务背景的知识点也将会有较大的点击数。

如果依赖人工进行热门知识点的统计,会存在如下问题:

1)人力消耗:用户会话涉及大量的数据,依赖人工会带来较大的工作量;

2)主观性:人工会不可避免地带有主观感情色彩,导致统计出的热门知识点不一定能真实反映出用户的诉求;

3)滞后性:人工统计的时间周期较长,统计出的知识点往往滞后于当下的热点话题,无法反映出知识点的时效性;

4)趋同性:人工统计较难避免知识点间的关联性,因此统计出的知识点具有相同或相似的主题背景,导致不同业务的覆盖率差异较大。

针对上述的知识点的特点以及人工统计存在的问题,通过技术手段对热门知识点的获取方法进行研究存在一定的实际价值。

图1为本申请一种实施例提供的目标知识点的获取方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如图1所示,所述方法具体可以包括:

步骤110,收集用户与问答机器人的多次会话内容。

其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,该知识点是指对应于问题的答案,每个知识点归属于一个预设类目。

此处,问答机器人是指自动问答平台中能实时对接收的用户问题进行解答的机器模型,其可以是在对大量预先收集的问答对(包括问题和答案)学习的基础上得到的,如,阿里巴巴集团的小蜜以及百度的度秘等。具体地,可以由服务器预先从自动问答平台的后台数据库中收集在预设时间段内(如,01:00-24:00)的用户与问答机器人的多次会话内容。

本申请的一次会话可以以用户在自动问答平台中开启一个聊天窗口开始,至用户关闭该聊天窗口结束。在一个聊天窗口开启至结束的过程中,用户可以与问答机器人进行至少一次聊天,其中,每次聊天会形成一条聊天记录,该聊天记录也可以称为一个问答对,该问答对可以包括用户提问的一个问题以及问答机器人推送的一个知识点,或者也可以包括用户提问的一个问 题以及问答机器人推送的多个知识点。具体地,如果问答机器人能对用户问题进行准确定位,也即问答机器人预先学习了与用户问题相关的问答语料,则可以向用户推送与该用户问题对应的一个知识点,否则可以向用户推送多个知识点。

需要说明的是,本申请中可以预先为收集的多个知识点中每个知识点设置其所属的类目。此处,预设的类目的个数可以为一个或多个,以预设的类目的个数为两个为例来说,该两个类目可以包括一级子类目和二级子类目。以支付宝系统中的知识点为例来说,假设某个知识点为“余额宝收益计算”,那么其归属的一级子类目可以为“余额宝”,而其归属的二级子类目则可以为“余额宝收益”。

可选地,在收集到多次会话内容中的多个知识点之后,可以将每个知识点的初始分数值设置为1。

在一个例子中,收集的多次会话内容可以如表1所示。

表1

在此说明,受限于篇幅,表1只列出了较少的例子,实际上收集的会话内容可能包含上万个知识点。

步骤120,根据预设的算法,确定多次会话内容中各个知识点与对应的问题的匹配度值,并将匹配度值作为各个知识点的第一分数值。

此处,预设的算法可以为词频位置加权排序算法等,通过该预设的算法确定的知识点与对应的问题的匹配度值,可以用于衡量知识点与对应的问题的相关性。具体地,当匹配度值较大时,则知识点与对应的问题的相关性较高;而当匹配度值较小时,则知识点与对应的问题的相关性较弱。此处,知识点与对应的问题的匹配度值的获取过程属于预设的算法的一个简单应用,本申请在此不复赘述。

在确定各个知识点与对应的问题的匹配度值之后,可以直接将该匹配度值作为各个知识点的第一分数值;或者,在已经为各个知识点设置初始分数值时,直接将其初始分数值更新为上述匹配度值。

需要说明的是,上述步骤120主要是为了解决现有技术在对知识点进行打分时,不考虑问题与知识点的相关性,从而影响目标知识点获取的准确性的问题。

步骤130,根据各个知识点的第一分数值,从多次会话内容中的多个知识点中获取目标知识点。

具体地,在确定各个知识点的第一分数值之后,可以按照第一分数值从大到小的顺序对各个知识点进行排序,将排序靠前的前k个知识点作为目标知识点。需要说明的是,对不同会话内容中的相同知识点,可以直接将该知识点的多个第一分数值进行求和、求平均值求、加权平均值或者贝叶斯评分等方式,来获得该知识点的最终分数值。

需要说明的是,本申请中收集的知识点具有类目属性,这些类目可被看作是知识点的主题,同时,用户一次会话内容中的聊天记录存在一定的依赖关系且主题相近。一次会话内容中的知识点所属的类目跳转时表明:1)前文 答复的知识点与用户原意不符;2)用户随手点击了推荐知识点。因此可将会话内容中后续知识点的类目跳转作为度量前文知识点分数值的因素之一,即随着知识点的类目跳转对前续知识点的分数值进行衰减,可以提高目标知识点获取的准确性。因此,在执行本申请实施例中的步骤130之前,还可以执行如下步骤:

步骤a:对每次会话内容中的每个知识点,根据该知识点所属的类目以及该知识点的前一知识点所属的类目,确定每个知识点的类目衰减因子。

以下将对确定一次会话内容中的一个知识点的类目衰减因子的过程进行说明:

以支付宝系统中的自动问答平台为例来说,预先收集的一次会话内容可以如下所示:

问题1:红包的规则是什么?

知识点1:支付宝春晚红包活动一共送出8亿现金红包,其中,前四轮咻一咻拼手气红包,每一轮红包都超过1亿现金。

问题2:怎么没有敬业福?

知识点2:集五福活动结束后,到目前为止已经有超过78万人集齐五福,…,游戏强较强。非常感谢您参与支付宝抢红包活动。

问题3:我集齐五福了,但是没有分到现金?

知识点3:活动结束后,78万人统计准确,目前2.15亿现金已全部送出,由于目前是现金周转的高峰期,所以可能会延迟到账,请您耐心等候。

在上述例子中,“知识点1”即为“知识点2“的前一知识点。可以理解的是,“知识点1”没有前一知识点。

在一个例子中,可以根据公式1确定一次会话内容中一个知识点的类目衰减因子:

(公式1)

其中,jumpj为一次会话内容中某个知识点的类目衰减因子,以该知识点为第i个知识点为例来说,j表示第i个知识点在一次会话内容中出现的顺序,如前述例子,“知识点3”在一次会话内容中的排序为第三位,因此,j的值就为3;catj为一次会话内容中排在第j位的知识点所属的类目,也即第i个知识点所述的类目,catj-1为一次会话内容中排在第j-1位的知识点所属的类目,也即一次会话内容中位于第i个知识点之前的前一知识点所属的类目,lcp(catj-1,catj)为一次会话内容中排在第j位的知识点所属的类目与排在第j-1位的知识点所属的类目的最长公共前缀,minlen(catj-1,catj)为一次会话内容中排在第j位的知识点所属的类目与排在第j-1位的知识点所属的类目的最小字符串长度。

关于前述最长公共前缀以及最小字符串长度将通过以下例子进行说明。以表1中会话内容1中的知识点1和知识点2为例来说,该两个知识点均具有三级子类目,且其一级子类目和二级子类目相同,三级子类目不相同,所以该两个知识点的最长公共前缀为“余额宝+余额宝收益”,也即lcp(知识点1,知识点2)=8。再以表1中会话内容1中的知识点2和知识点3为例来说,知识点2具有三级子类目,而知识点3只有两级子类目,且前两级子类目均相同,因此该两个知识点的最小字符串为“余额宝+余额宝收益”,也即minlen(知识点2,知识点3)=8。

需要说明的是,当某个知识点排在一次会话内容的首位时,也即当j=0时,因为该知识点在该次会话内容中不存在前一知识点,因此,可以将该次会话内容中该知识点的类目衰减因子设置为一个阈值,该阈值的取值范围可以为[0,1]。

根据上述一次会话内容中一个知识点的类目衰减因子的确定方法,就可以确定多次会话内容中各个知识点的类目衰减因子。如根据公式1,可以获得表1中会话内容1中知识点1、知识点2和知识点3的类目衰减因子;并且可以获得会话内容2中知识点4的类目衰减因子等。当然,在实际应用中,因 为知识点1和知识点4不存在前一知识点,无法应用公式1,因此可以将其类目衰减因子设定为一个阈值,也即当某个知识点排在一次会话内容的首位时,则将该次会话内容中该知识点的类目衰减因子设置为一个阈值。

步骤b:根据该知识点的类目衰减因子以及该知识点的后续知识点的类目衰减因子,对每个知识点的第一分数值进行更新,得到多次会话内容中的各个知识点的第二分数值。

在一个例子中,可以根据公式2获得一次会话内容中某个知识点的第二分数值。

(公式2)

其中,score2(i)为第i个知识点的第二分数值,score1(i)为第i个知识点的第一分数值,m为一次会话内容中知识点的个数,jumpn为一次会话内容中排在第n位的知识点的类目衰减因子。可以理解的是,上述公式即为:score2(i)=score1(i)*jumpj*jumpj+1*...*jumpm,也即在计算一次会话内容中第i个知识点的第二分数值时,综合考虑了同一会话内容中后续知识点的类目跳转情况,如,考虑了一次会话内容中排在第j+1、j+2、…、m位的知识点的类目跳转情况,其中,j为第i个知识点在该会话内容中的排序位置,也即增加了目标知识点的衡量因素。

根据上述一次会话内容中一个知识点的第二分数值的确定方法,就可以确定多次会话内容中各个知识点的第二分数值。如根据公式2,可以获得表1中会话内容1中知识点1、知识点2和知识点3的第二分数值;并且可以获得会话内容2中知识点4的第二分数值等。

在获得各个知识点的第二分数值之后,则可以将步骤130替换为步骤c:根据各个知识点的第二分数值,从多次会话内容中的多个知识点中获取目标知识点。

此处,根据各个知识点的第二分数值,获取目标知识点的过程与步骤130中根据各个知识点的第一分数值,获取目标知识点的过程类似,本申请在此 不复赘述。

由于热门知识点具有时效性,若单纯计数则统计粒度过大,导致知识点的时效属性被湮没,因此本申请的实施例中在确定各知识点的最终分数值时,还可以考虑时间衰减因子,以保证最近被点击的知识点具有较高的权重。因此,在执行本实施例中的步骤c之前,还可以执行如下步骤:

步骤x:对每次会话内容中的每个知识点,根据当前时间、该知识点所属问答对的创建时间以及预设阈值,确定每个知识点的时间衰减因子。

在一个例子中,可以根据公式3获得一次会话内容中每个知识点的时间衰减因子。

timefactori=(currtime-chattimei+2)g(公式3)

其中,timefactori为一次会话内容中第i个知识点的时间衰减因子,currtime为当前时间,chattimei为一次会话内容中第i个知识点所属问答对的创建时间,g为预设阈值,也可以称为重力因子。

如根据公式3,可以获得表1中会话内容1中知识点1、知识点2和知识点3的时间衰减因子;并且可以获得会话内容2中知识点4的时间衰减因子等。

步骤y:根据每个知识点的时间衰减因子,对每个知识点的第二分数值进行更新,得到多次会话内容中的各个知识点的第三分数值。

在一个例子中,可以根据公式4获得一次会话内容中某个知识点的第三分数值。

score3(i)=score2(i)*timefacteri(公式4)

其中,score3(i)为第i个知识点的第三分数值,score2(i)为第i个知识点的第二分数值,timefactori为一次会话内容中第i个知识点的时间衰减因子。

根据上述一次会话内容中一个知识点的第三分数值的获得方法,就可以获得多次会话内容中各个知识点的第三分数值。如根据公式4,可以获得表1中会话内容1中知识点1、知识点2和知识点3的第三分数值;并且可以获得 会话内容2中知识点4的第三分数值等。

在获得各个知识点的第三分数值之后,则可以将步骤c替换为z:根据各个知识点的第三分数值,从多次会话内容中的多个知识点中获取目标知识点。

此处,根据各个知识点的第三分数值,获取目标知识点的过程与步骤130中根据各个知识点的第一分数值,获取目标知识点的过程类似,本申请在此不复赘述。

考虑到不同类目的知识点均分及点击次数不同,如果依据均分或总分对热门知识点进行排序,会导致获取的热门知识点覆盖面小且集中于少量的类目,因此本申请还可以采用贝叶斯评分对知识点进行加权评分。因此,在执行本申请实施例中的步骤z之前,还可以执行如下步骤:

步骤a:对多次会话内容中的每个知识点,根据多次会话内容中的该知识点的第三分数值以及点击次数,确定每个知识点的第一平均分数值。

在一个例子中,可以根据公式5确定每个知识点的第一平均分数值:

(公式5)

其中,为第i个知识点的第一平均分数值,σiscore3(i)为多次会话内容中的第i个知识点的第三分数值的总和,hiti为预先统计的第i个知识点的点击次数。需要说明的是,多次会话内容中的部分知识点可能是相同的,对于相同的知识点,只计算一次该知识点的第一平均分数值即可,也即只计算一次该知识点的最终分数值即可。如,假设表1中会话内容1中的知识点1与会话内容2中的知识点4相同,则只计算会话内容1中的知识点1的第一平均分数值即可。具体地,假设会话内容1中的知识点1的第三分数值为0.5,会话内容2中的知识点4的第三分数值为0.7,且该知识点的点击次数(知识点1的点击次数+知识点4的点击次数)为20次,则知识点1的第一平均分数值可以为:(0.5+0.7)/20=0.006;可以理解的是,0.006也为知识点4的第一平均分数值。

步骤b:根据每个知识点的第一平均分数值以及多次会话内容中的知识 点的总个数,确定每个知识点的第二平均分数值。

在一个例子中,可以根据公式6确定每个知识点的第二平均分数值:

(公式6)

其中,为第i个知识点的第二平均分数值,为所有知识点的第一平均分数值之和,n为多次会话内容中所有知识点的总个数,这些知识点都是不同的。可以理解的是,对每个知识点,其第二平均值都是相同的。此处,需要对n做一下特别说明,假设总共收集了两个会话内容,其中,会话内容1中有20个知识点,会话内容2中有10个知识点,且两个会话内容中相同的知识点的个数为5个,那么两个会话内容的知识点总个数为25个,也即n的值为25。

步骤c:根据每个知识点的点击次数、第一平均分数值、第二平均分数值以及预设点击次数,确定多次会话内容中的各个知识点的最终分数值。

在一个例子中,可以根据公式7确定多次会话内容中的各个知识点的最终分数值:

(公式7)

其中,finalscorei为第i个知识点的最终分数值,hiti为第i个知识点的点击次数,为第i个知识点的第一平均分数值,为第i个知识点的第二平均分数值,minhit为预设的点击次数。

在表1中各知识点均不相同的情况下,根据上述公式5-公式7,就可以获得表1中会话内容1中知识点1、知识点2和知识点3的最终分数值;并且可以获得会话内容2中知识点4的最终分数值等。

在获得各个知识点的最终分数值之后,则可以将步骤z替换为步骤d:根据各个知识点的最终分数值,从多次会话内容中的多个知识点中获取目标知识点。

此处,根据各个知识点的最终分数值,获取目标知识点的过程与步骤130 中根据各个知识点的第一分数值,获取目标知识点的过程类似,本申请在此不复赘述。

在获取目标知识点之后,就可以将该目标知识点推送给用户。如,在自动问答平台中,在开启自动问答平台的聊天窗口后,就可以将目标知识点的标题显示到聊天窗口中,若目标知识点中包含了用户想了解的内容,则用户只需要点击相应知识点的标题从而链接到该知识点的相关内容,即可对这些知识点进行了解,由此方便了用户对互联网中热门话题的了解,进而提升了用户的体验。

需要说明的是,本申请还提供了如下几种获取目标知识点的方式:

图2为本申请另一种实施例提供的目标知识点的获取方法流程图,如图2所示,所述方法可以包括如下步骤:

步骤210,收集用户与问答机器人的多次会话内容。

其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,知识点是指对应于问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值。

步骤220,对每次会话内容中的每个知识点,根据该知识点所属的类目以及该知识点的前一知识点所属的类目,确定每个知识点的类目衰减因子。

步骤230,根据该知识点的类目衰减因子以及该知识点的后续知识点的类目衰减因子,对每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第二分数值。

步骤240,根据各个知识点的第二分数值,从多次会话内容中的多个知识点中获取目标知识点。

由于步骤210与前述实施例中的步骤110相同,步骤220和步骤240与前述实施例中的步骤a和步骤c相同,在此不复赘述;步骤230与步骤b相似,其中,相同部分在此不复赘述,不同的是,步骤230中可以根据公式2的变形公式8来得到多次会话内容中的各个知识点的第二分数值。

公式8可以为:

(公式8)

其中,score(i)为第i个知识点的初始分数值,公式8中其它参数与公式2相同,其相应的说明可参见公式2中各参数的说明,在此不复赘述。

可以理解的是,在执行本实施例的步骤240之前,还可以执行前述实施例中的步骤x-步骤y,在执行步骤y-步骤y之后,则可以将步骤240替换为步骤z;此外,在执行步骤y-步骤y之后,在替换步骤240之前,还可以执行步骤a-步骤c,在执行步骤a-步骤c之后,则可以直接将步骤240替换为步骤d。上述两个方案的执行可以参见前文所述,在此不复赘述。

本实施中将会话内容中后续知识点的类目跳转作为度量前文知识点分数值的因素之一,即随着知识点的类目跳转对前续知识点的分数值进行衰减,由此,可以提高目标知识点获取的准确性。

图3为本申请再一种实施例提供的目标知识点的获取方法流程图,如图3所示,所述方法可以包括如下步骤:

步骤310,收集用户与问答机器人的多次会话内容。

其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,该知识点是指对应于问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值。

步骤320,对每次会话内容中的每个知识点,根据当前时间、该知识点所属问答对的创建时间以及预设阈值,确定每个知识点的时间衰减因子。

步骤330,根据每个知识点的时间衰减因子,对每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第三分数值。

步骤340,根据各个知识点的第三分数值,从多次会话内容中的多个知识点中获取目标知识点。

由于步骤310与前述实施例中的步骤110相同,步骤320和步骤340与前述实施例中的步骤x和步骤z相同,在此不复赘述;步骤330与步骤y相 似,其中,相同部分在此不复赘述,不同的是,步骤330中可以根据公式4的变形公式9来得到多次会话内容中的各个知识点的第三分数值。

公式9可以为:

score3(i)=score(i)*timefacteri(公式9)

其中,score(i)为第i个知识点的初始分数值,公式9中其它参数与公式4相同,其相应的说明可参见公式4中各参数的说明,在此不复赘述。

可以理解的是,在执行本实施例的步骤340之前,还可以执行前述实施例中的步骤a-步骤c,在执行步骤a-步骤c之后,可以将步骤340替换为步骤d。该方案的执行可以参见前文所述,在此不复赘述。

本实施中在确定各个知识点的最终分数值时,考虑了知识点的时间衰减因子,以保证最近被点击的知识点具有较高的权重,从而提高了目标知识点选取的准确性。

图4为本申请又一种实施例提供的目标知识点的获取方法流程图,如图4所示,该方法可以包括:

步骤410,收集用户与问答机器人的多次会话内容。

其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案,每个知识点归属于一个预设类目

步骤420,根据预设的算法,确定多次会话内容中各个知识点与对应的问题的匹配度值,并将匹配度值作为各个知识点的第一分数值。

步骤430,对每次会话内容中的每个知识点,根据该知识点所属的类目以及该知识点的前一知识点所属的类目,确定每个知识点的类目衰减因子。

步骤440,根据该知识点的类目衰减因子以及该知识点的后续知识点的类目衰减因子,对每个知识点的第一分数值进行更新,得到多次会话内容中的各个知识点的第二分数值。

步骤450,对每次会话内容中的每个知识点,根据当前时间、该知识点所 属问答对的创建时间以及预设阈值,确定每个知识点的时间衰减因子。

步骤460,根据每个知识点的时间衰减因子,对每个知识点的第二分数值进行更新,得到多次会话内容中的各个知识点的第三分数值。

步骤470,对多次会话内容中的每个知识点,根据多次会话内容中的该知识点的第三分数值以及点击次数,确定每个知识点的第一平均分数值。

步骤480,根据每个知识点的第一平均分数值以及多次会话内容中的知识点的总个数,确定每个知识点的第二平均分数值。

步骤490,根据每个知识点的点击次数、第一平均分数值、第二平均分数值以及预设点击次数,确定多次会话内容中的各个知识点的最终分数值。

步骤4100,根据各个知识点的最终分数值,从多次会话内容中的多个知识点中获取目标知识点。

由此,可以提高目标知识点获取的准确性,进而可以满足用户想要快速了解热门知识点的需求。

与上述一种实施例提供的目标知识点的获取方法对应地,本申请实施例还提供的一种目标知识点的获取装置,如图5所示,该装置包括:

收集单元501,用于收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案,每个知识点归属于一个预设类目。

确定单元502,用于根据预设的算法,确定收集单元501收集的所述多次会话内容中各个知识点与对应的问题的匹配度值,并将所述匹配度值作为所述各个知识点的第一分数值。

获取单元503,用于根据确定单元502确定的所述各个知识点的第一分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

可选地,获取单元503具体可以用于:

对每次会话内容中的每个知识点,根据该知识点所属的类目以及该知识点的前一知识点所属的类目,确定所述每个知识点的类目衰减因子;

根据该知识点的类目衰减因子以及该知识点的后续知识点的类目衰减因子,对所述每个知识点的第一分数值进行更新,得到多次会话内容中的各个知识点的第二分数值;

根据所述各个知识点的第二分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

可选地,获取单元503还可以具体用于:

对每次会话内容中的每个知识点,根据当前时间、该知识点所属问答对的创建时间以及预设阈值,确定所述每个知识点的时间衰减因子;

根据所述每个知识点的时间衰减因子,对所述每个知识点的第二分数值进行更新,得到多次会话内容中的各个知识点的第三分数值;

根据所述各个知识点的第三分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

可选地,获取单元还可以具体用于:

对每次会话内容中的每个知识点,根据所述多次会话内容中的该知识点的第三分数值以及点击次数,确定所述每个知识点的第一平均分数值;

根据所述每个知识点的第一平均分数值以及所述多次会话内容中的知识点的总个数,确定所述每个知识点的第二平均分数值;

根据所述每个知识点的点击次数、所述第一平均分数值、所述第二平均分数值以及预设点击次数,确定所述多次会话内容中的各个知识点的最终分数值;

根据所述各个知识点的最终分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

本申请实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本申请提供的装置的具体工作过程,在此不复赘述。

本申请实施例提供的目标知识点的获取装置,收集单元501收集用户与问答机器人的多次会话内容;确定单元502根据预设的算法,确定所述多次 会话内容中各个知识点与对应的问题的匹配度值,并将所述匹配度值作为所述各个知识点的第一分数值;获取单元503根据所述各个知识点的第一分数值,从所述多次会话内容中的多个知识点中获取目标知识点。由此可以提高目标知识点获取的准确性,进而可以满足用户想要快速了解热门知识点的需求。

与上述另一种实施例提供的目标知识点的获取方法对应地,本申请实施例还提供的一种目标知识点的获取装置,如图6所示,该装置包括:

收集单元601,用于收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值。

确定单元602,用于对每次会话内容中的每个知识点,根据该知识点所属的类目以及该知识点的前一知识点所属的类目,确定所述每个知识点的类目衰减因子。

更新单元603,用于根据确定单元602确定的该知识点的类目衰减因子以及该知识点的后续知识点的类目衰减因子,对所述每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第二分数值。

获取单元604,用于根据更新单元603更新得到的所述各个知识点的第二分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

本申请实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本申请提供的装置的具体工作过程,在此不复赘述。

本实施中将会话内容中后续知识点的类目跳转作为度量前文知识点分数值的因素之一,即随着知识点的类目跳转对前续知识点的分数值进行衰减,由此,可以提高目标知识点获取的准确性。

与上述再一种实施例提供的目标知识点的获取方法对应地,本申请实施例还提供的一种目标知识点的获取装置,如图7所示,该装置包括:

收集单元701,用于收集用户与问答机器人的多次会话内容,其中,每次会话内容包括至少一个问答对,每个问答对包括一个问题和至少一个知识点,所述知识点是指对应于所述问题的答案;其中,每个知识点归属于一个预设类目,且对应一个初始分数值。

确定单元702,用于对每次会话内容中的每个知识点,根据当前时间、该知识点所属问答对的创建时间以及预设阈值,确定所述每个知识点的时间衰减因子。

更新单元703,用于根据确定单元702确定的所述每个知识点的时间衰减因子,对所述每个知识点的初始分数值进行更新,得到多次会话内容中的各个知识点的第三分数值。

获取单元704,用于根据更新单元703更新得到的所述各个知识点的第三分数值,从所述多次会话内容中的多个知识点中获取目标知识点。

本申请实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本申请提供的装置的具体工作过程,在此不复赘述。

本实施中在确定各个知识点的最终分数值时,考虑了知识点的时间衰减因子,以保证最近被点击的知识点具有较高的权重,从而提高了目标知识点选取的准确性。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的对象及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器 (ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1