一种新建词条相关内容智能推送方法和系统与流程

文档序号:18193655发布日期:2019-07-17 05:42阅读:208来源:国知局
一种新建词条相关内容智能推送方法和系统与流程

本发明涉及词条结构化的优化技术,尤其涉及帮助用户快速构建自己知识结构的方法和系统。



背景技术:

在树状词条结构中存在很多根词条,根词条下会有多个层级的子词条,每一层次的每一个子词条下衍生出多个子词条,以此构成一个繁杂的词条结构体系。词条结构化平台上注册有很多用户,每一个用户都是属于自身的词条结构体系的创建者。当用户在平台上创建一个新的词条时,往往需要从零开始,只能凭借自己对词条相关知识的理解通过自己的努力一点一点的构建出词条结构体系。

然而,这样的新词条结构的构建方法就不能充分利用平台上已有的词条结构,对于用户来说,构建新词条结构体系的过程非常费时费力。而且知识的一大特点是共享,而传统的新词条结构的构建恰恰无法实现共享机制,造成词条结构化平台用户体验度的下降。



技术实现要素:

以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。

本发明的目的在于解决上述问题,提供了一种新建词条相关内容智能推送方法和系统,能提高在词条结构化平台上创建新词条结构的效率和便利,提升了用户的体验度。

本发明的技术方案为:本发明揭示了一种新建词条相关内容智能推送方法,包括:

在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的原始词条的词条结构,其中词条结构化平台存储多个用户创建的词条结构;

向新词条创建者推荐搜索到的所有的词条结构供选择,将已选择的词条结构插入到所创建的新词条中。

根据本发明的新建词条相关内容智能推送方法的一实施例,在将选择的词条结构插入到所创建的新词条中的过程中对所选择的词条结构进行编辑操作,编辑操作包括对词条结构的删除、增加、词条间逻辑关系的调整。

本发明公开了一种新建词条相关内容智能推送方法,包括:

在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的合成词条的词条结构,其中词条结构化平台存储多个用户创建以及合成词条的词条结构,其中多个相似的原始词条结构合并成一个新的合成词条的词条结构;

将搜索到的合成词条的词条结构插入到新词条的词条结构中。

根据本发明的新建词条相关内容智能推送方法的一实施例,将搜索到的合成词条的词条结构插入到新词条的词条结构中的过程中包括对合成词条的词条结构进行编辑操作,编辑操作包括对词条结构的删除、增加、词条间逻辑关系的调整。

根据本发明的新建词条相关内容智能推送方法的一实施例,基于词条结构和文本格式的相互转化以及文本格式基础上的余弦相似度参数对多个相似的原始词条结构自动合并为一个新的合成词条的词条结构。

本发明还揭示了一种新建词条相关内容智能推送系统,包括:

原始词条搜索模块,在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的原始词条的词条结构,其中词条结构化平台存储多个用户创建的词条结构;

词条插入模块,向新词条创建者推荐搜索到的所有的词条结构供选择,将已选择的词条结构插入到所创建的新词条中。

根据本发明的新建词条相关内容智能推送系统的一实施例,词条插入模块包括:

编辑单元,对所选择的词条结构进行编辑操作,编辑操作包括对词条结构的删除、增加、词条间逻辑关系的调整。

本发明还揭示了一种新建词条相关内容智能推送系统,包括:

合成词条推荐模块,在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的合成词条的词条结构,其中词条结构化平台存储多个用户创建以及合成词条的词条结构,其中多个相似的原始词条结构合并成一个新的合成词条的词条结构;

词条插入模块,将搜索到的合成词条的词条结构插入到新词条的词条结构中。

根据本发明的新建词条相关内容智能推送系统的一实施例,词条插入模块包括:

编辑单元,对需要插入的合成词条结构进行编辑操作,编辑操作包括对词条结构的删除、增加、词条间逻辑关系的调整。

根据本发明的新建词条相关内容智能推送系统的一实施例,基于词条结构和文本格式的相互转化以及文本格式基础上的余弦相似度参数对多个相似的原始词条结构自动合并为一个新的合成词条的词条结构。

本发明对比现有技术有如下的有益效果:本发明通过将平台上搜索到的原始的或者经合成的与新词条相关的词条结构提供给新词条创建者,将选定的词条结构插入到新词条的结构中,并经过编辑处理后形成属于该创建者的词条结构。相较于传统技术,本发明能够利用平台上已有的资源帮助用户迅速建立新词条的结构体系,提升了用户在平台上的工作效率。

附图说明

在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。

图1示出了本发明的新建词条相关内容智能推送方法的第一实施例的流程图。

图2示出了本发明的新建词条相关内容智能推送方法的第二实施例的流程图。

图3示出了本发明的新建词条相关内容智能推送系统的第一实施例的原理图。

图4示出了本发明的新建词条相关内容智能推送系统的第二实施例的原理图。

图5示出了基于余弦相似度进行文本合并的方法的流程图。

具体实施方式

以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。

新建词条相关内容智能推送方法的第一实施例

图1示出了本发明的新建词条相关内容智能推送方法的第一实施例的流程。请参见图1,下面是对本实施例的推送方法的实施步骤的详细描述。

步骤s11:在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的原始词条的词条结构。

其中词条结构化平台存储多个用户创建的词条结构。比如,当创建者输入“物理”时,平台自动在所存储的所有的词条结构中搜索出“核物理|从属根词条读书”、“天体物理|从属根词条读书”、“《物理学》|从属根词条代际简谱”等。

步骤s12:向新词条创建者推荐搜索到的所有的词条结构供选择,将已选择的词条结构插入到所创建的新词条中。

搜索结果展示给新词条创建者以供其选定后插入到新词条中,而在插入新词条的过程中还可以对所选择的词条结构进行编辑操作,包括对词条结构的删除、增加、以及词条间逻辑关系的调整等。

新建词条相关内容智能推送方法的第二实施例

图2示出了本发明的新建词条相关内容智能推送方法的第二实施例的流程。请参见图2,下面是对本实施例的推送方法的实施步骤的详细描述。

步骤s21:在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的合成词条的词条结构。

其中词条结构化平台存储多个用户创建以及合成词条的词条结构,其中多个相似的原始词条结构合并成一个新的合成词条的词条结构。

合成词条的形成依赖于基于词条结构和文本格式的相互转化以及文本格式基础上的余弦相似度参数。更具体而言,是先将原始词条结构格式转化为文本格式,在文本格式的基础上,基于词条与词条的余弦相似度以及词条与文本的余弦相似度将多个文本合并为一个文本,最后将合并后的文本格式再转化成词条结构格式就成为了合成词条。

在词条结构格式转化为文本格式的操作中,词条结构中的词条属性按照键值对以哈希存储方式进行存储,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条,在将词条结构格式转化为文本格式的过程中,将词条结构中的根词条的词条属性以及根词条下所有子词条的词条属性读取出来以形成文本格式。

反过来在将文本格式转化为词条结构格式的过程中,将文本格式涉及的词条属性按照键值对以哈希存储方式存储成词条结构,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条。

而在基于余弦相似度合并文本的过程中,是借助于词条与词条的余弦相似度以及词条与文本的余弦相似度的计算来实现的。下面以对两个文档实施合并为例进行说明,具体步骤如图5所示。

步骤s101:将第一文档作为合并主体,将第二文档作为合并次体。

步骤s102:第二文档的根词条遍历第一文档的所有词条,得到相应的余弦相似度。

步骤s103:比较步骤s102中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s104:若步骤s103得到的最大的余弦相似度的值大于第一阈值(例如80%),则执行步骤s105,否则执行步骤s107。

步骤s105:记录最大余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到所记录的合并主体中的对应词条中。

步骤s106:将合并后的词条(例如新词条1.1.3)的所有子词条进行两两余弦相似度计算,若余弦相似度大于第一阈值(80%),则将两词条合并(合并规则和步骤s105相同),合并后的词条再重复进行步骤s106,直到最后合并后的词条的所有子词条的两两余弦相似度全部小于第一阈值后结束。

步骤s107:将第二文档作为合并主体,将第一文档作为合并次体。

步骤s108:第一文档的根词条遍历第二文档的所有词条,得到相应的余弦相似度。

步骤s109:比较步骤s108中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s110:若步骤s109得到的最大的余弦相似度的值大于第一阈值(80%),则执行步骤s111,否则执行步骤s113。

步骤s111:记录最大的余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到所记录的合并主体中的对应词条中。

步骤s112:将合并后的词条的所有子词条进行两两余弦相似度计算,若余弦相似度大于第一阈值(80%),则将两词条合并(合并规则和步骤s111相同),合并后的词条再重复进行步骤s112,直到最后合并后的词条的所有子词条的两两余弦相似度全部小于第一阈值(80%),合并结束。

步骤s113:重新将第一文档作为合并主体,将第二文档作为合并次体。

步骤s114:第二文档的根词条遍历第一文档的所有词条的文本,得到相应的余弦相似度。

步骤s115:比较步骤s114中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s116:若步骤s115得到的最大的余弦相似度的值大于第二阈值(60%),则执行步骤s117,否则执行步骤s118。

步骤s117:记录最大余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到对应的合并主体中的所记录的词条。

步骤s118:将第二文档作为合并主体,将第一文档作为合并次体。

步骤s119:第一文档的根词条遍历第二文档的所有词条的文本,得到相应的余弦相似度。

步骤s120:比较步骤s119中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s121:若步骤s120得到的最大余弦相似度的值大于第二阈值(60%),则执行步骤s122,否则判断两词条文本无相关性。

步骤s122:记录最大余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到对应的合并主体中的所记录的词条,合并结束。

此外,对于一致或相近的合并词条的搜索,也可以采用和上述类似的基于余弦相似度的自动推荐方法。具体为:接收用户新建的根词条的结构,实时将结构格式转化为文本格式并存储;将转化为文本格式的新建的根词条与其他转化为文本格式的已有根词条进行两两余弦相似度对比;将余弦相似度超过预设阈值的已有根词条的文本格式转化为结构格式后呈现给用户作为推荐,否则不呈现给用户。此处的词条之间的余弦相似度的对比和前述的合并词条的余弦相似度的对比类似,在此不再赘述。

步骤s22:将搜索到的合成词条的词条结构插入到新词条的词条结构中。

在插入过程中包括对合成词条的词条结构进行编辑操作,编辑操作包括对词条结构的删除、增加、词条间逻辑关系的调整。

新建词条相关内容智能推送系统的第一实施例

图3示出了本发明的新建词条相关内容智能推送系统的第一实施例的原理。请参见图3,本实施例的系统包括:原始词条搜索模块、词条插入模块。

原始词条搜索模块用于在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的原始词条的词条结构。

其中词条结构化平台存储多个用户创建的词条结构。比如,当创建者输入“物理”时,平台自动在所存储的所有的词条结构中搜索出“核物理|从属根词条读书”、“天体物理|从属根词条读书”、“《物理学》|从属根词条代际简谱”等。

词条插入模块用于向新词条创建者推荐搜索到的所有的词条结构供选择,将已选择的词条结构插入到所创建的新词条中。

其中词条插入模块包括编辑单元,用于对所选择的词条结构进行编辑操作,编辑操作包括对词条结构的删除、增加、词条间逻辑关系的调整。

新建词条相关内容智能推送系统的第二实施例

图4示出了本发明的新建词条相关内容智能推送系统的第二实施例的原理。请参见图4,本实施例的系统包括:合成词条推荐模块和词条插入模块。

合成词条推荐模块用于在词条结构中创建新的词条时,基于所要创建的新词条在词条结构化平台上搜索与其一致或相近的合成词条的词条结构。

其中词条结构化平台存储多个用户创建以及合成词条的词条结构,其中多个相似的原始词条结构合并成一个新的合成词条的词条结构。

合成词条的形成依赖于基于词条结构和文本格式的相互转化以及文本格式基础上的余弦相似度参数。更具体而言,是先将原始词条结构格式转化为文本格式,在文本格式的基础上,基于词条与词条的余弦相似度以及词条与文本的余弦相似度将多个文本合并为一个文本,最后将合并后的文本格式再转化成词条结构格式就成为了合成词条。

在词条结构格式转化为文本格式的操作中,词条结构中的词条属性按照键值对以哈希存储方式进行存储,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条,在将词条结构格式转化为文本格式的过程中,将词条结构中的根词条的词条属性以及根词条下所有子词条的词条属性读取出来以形成文本格式。

反过来在将文本格式转化为词条结构格式的过程中,将文本格式涉及的词条属性按照键值对以哈希存储方式存储成词条结构,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条。

而在基于余弦相似度合并文本的过程中,是借助于词条与词条的余弦相似度以及词条与文本的余弦相似度的计算来实现的。下面以对两个文档实施合并为例进行说明,具体步骤如图5所示。

步骤s101:将第一文档作为合并主体,将第二文档作为合并次体。

步骤s102:第二文档的根词条遍历第一文档的所有词条,得到相应的余弦相似度。

步骤s103:比较步骤s102中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s104:若步骤s103得到的最大的余弦相似度的值大于第一阈值(例如80%),则执行步骤s105,否则执行步骤s107。

步骤s105:记录最大余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到所记录的合并主体中的对应词条中。

步骤s106:将合并后的词条(例如新词条1.1.3)的所有子词条进行两两余弦相似度计算,若余弦相似度大于第一阈值(80%),则将两词条合并(合并规则和步骤s105相同),合并后的词条再重复进行步骤s106,直到最后合并后的词条的所有子词条的两两余弦相似度全部小于第一阈值后结束。

步骤s107:将第二文档作为合并主体,将第一文档作为合并次体。

步骤s108:第一文档的根词条遍历第二文档的所有词条,得到相应的余弦相似度。

步骤s109:比较步骤s108中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s110:若步骤s109得到的最大的余弦相似度的值大于第一阈值(80%),则执行步骤s111,否则执行步骤s113。

步骤s111:记录最大的余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到所记录的合并主体中的对应词条中。

步骤s112:将合并后的词条的所有子词条进行两两余弦相似度计算,若余弦相似度大于第一阈值(80%),则将两词条合并(合并规则和步骤s111相同),合并后的词条再重复进行步骤s112,直到最后合并后的词条的所有子词条的两两余弦相似度全部小于第一阈值(80%),合并结束。

步骤s113:重新将第一文档作为合并主体,将第二文档作为合并次体。

步骤s114:第二文档的根词条遍历第一文档的所有词条的文本,得到相应的余弦相似度。

步骤s115:比较步骤s114中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s116:若步骤s115得到的最大的余弦相似度的值大于第二阈值(60%),则执行步骤s117,否则执行步骤s118。

步骤s117:记录最大余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到对应的合并主体中的所记录的词条。

步骤s118:将第二文档作为合并主体,将第一文档作为合并次体。

步骤s119:第一文档的根词条遍历第二文档的所有词条的文本,得到相应的余弦相似度。

步骤s120:比较步骤s119中得到的余弦相似度,找到最大的余弦相似度的值。

步骤s121:若步骤s120得到的最大余弦相似度的值大于第二阈值(60%),则执行步骤s122,否则判断两词条文本无相关性。

步骤s122:记录最大余弦相似度的值对应的合并主体中的词条,将合并次体的根词条合并到对应的合并主体中的所记录的词条,合并结束。

此外,对于一致或相近的合并词条的搜索,也可以采用和上述类似的基于余弦相似度的自动推荐方法。具体为:接收用户新建的根词条的结构,实时将结构格式转化为文本格式并存储;将转化为文本格式的新建的根词条与其他转化为文本格式的已有根词条进行两两余弦相似度对比;将余弦相似度超过预设阈值的已有根词条的文本格式转化为结构格式后呈现给用户作为推荐,否则不呈现给用户。此处的词条之间的余弦相似度的对比和前述的合并词条的余弦相似度的对比类似,在此不再赘述。

词条插入模块用于将搜索到的合成词条的词条结构插入到新词条的词条结构中。

词条插入模块包括编辑单元,用于对需要插入的合成词条结构进行编辑操作,编辑操作包括对词条结构的删除、增加、词条间逻辑关系的调整。

尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。

本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。

结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如dsp与微处理器的组合、多个微处理器、与dsp核心协作的一个或多个微处理器、或任何其他此类配置。

结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在asic中。asic可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。

在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括ram、rom、eeprom、cd-rom或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(dsl)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、dsl、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(cd)、激光碟、光碟、数字多用碟(dvd)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。

提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1