一种用于生成内容项的标签的方法和装置的制造方法_3

文档序号:9396915阅读:来源:国知局
>[0090]接着,确定装置3对所述一个或多个候选内容项,分别确定其中各个内容项各自对应的标签信息。
[0091]具体地,对一候选内容项,当该候选内容项未对应标杆标签信息时,确定装置3选择与其内容距离最近的标杆标签信息作为其标杆标签信息。
[0092]优选地,对一候选内容项,当该候选内容项已对应一历史标杆标签信息时,确定装置3基于该候选内容项与所述历史标杆标签的内容距离信息,以及该候选内容项与当前的所述标杆标签信息的内容距离信息,来确定该候选内容项对应的标杆标签信息。
[0093]例如,第一获取装置I获取到一于对应于标杆内容项为content」的标杆标签label_l,并且,第二获取装置2确定的与标杆标签label_l近似的候选内容项包括content_2和content_3。其中,候选内容项content_2未对应标杆标签信息,候选内容项content_3已对应另一标杆标签label_2,并且该标杆标签label_2对应于标杆内容项content_40
[0094]则对于候选内容项content_2,确定装置3将标杆标签label_l作为其标杆标签信息,从而使用标杆标签label_l来标注该候选内容项content_2。
[0095]对于候选内容项content_3,确定装置3获取其与标杆内容项content_l的之间的KNN距离信息dl,以及候选内容项content_3与标杆内容项content_4之间的KNN距离信息d2,并确定dl大于d2,则确定装置3确定候选内容项content_3对应的标杆标签信息为label_20
[0096]优选地,标签生成装置基于预定条件来触发第一获取装置I至确定装置3的操作。
[0097]其中,所述预定条件包括但不限于以下至少任一种:
[0098]I)时间条件;如预定时间点条件,又预定间隔周期等。
[0099]例如,标签生成装置可每隔预定周期来触发第一获取装置I至确定装置3的操作。
[0100]2)内容项条件;例如,新内容项的数量到达预定阈值。
[0101]例如,当标签生成装置检测到未标记内容项的数量大于阈值时,触发第一获取装置I至确定装置3的操作。
[0102]根据本发明的方案,通过获取标杆标签来为与各个标杆标签近似的内容项生成标签,提高了所生成的标签的覆盖率,并且,通过采用用户标注的标签作为标杆标签,能够极大的增加标签信息的准确性;此外,根据本发明的方案,无需如机器学习的方式那样,需要大量人员花费时间来进行纠正机器学习策略等工作,成本较低。
[0103]本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个功能或步骤的电路。
[0104]另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
[0105]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
[0106]虽然前面特别示出并且描述了示例性实施例,但是本领域技术人员将会理解的是,在不背离权利要求书的精神和范围的情况下,在其形式和细节方面可以有所变化。这里所寻求的保护在所附权利要求书中做了阐述。在下列编号条款中规定了各个实施例的这些和其他方面:
[0107]1.一种用于生成内容项的标签的方法,其中,所述方法包括以下步骤:
[0108]-获取一标杆标签信息,其中,所述标杆标签信息对应一组标杆内容项;
[0109]-获取分别与所述标杆标签信息近似的一个或多个候选内容项;
[0110]-对所述一个或多个候选内容项,分别确定其中各个内容项各自对应的标签信息。
[0111]2.根据条款I所述的方法,其中,所述获取一标杆标签信息的包括以下步骤:
[0112]-从被用户标注的一个或多个标签信息中获取一标杆标签信息。
[0113]3.根据条款I所述的方法,其中,所述获取一标杆标签信息的步骤包括以下步骤:
[0114]-获取与所述一个或多个初始内容项对应的一个或多个初始标签信息;
[0115]-对所述一个或多个初始标签信息执行优化选择,以从所述一个或多个初始标签信息中选择部分或全部作为所述标杆标签信息。
[0116]4.根据条款3所述的方法,其中,所述对所述一个或多个初始标签信息执行优化选择,以从所述一个或多个初始标签信息中选择部分或全部作为所述标杆标签信息的步骤包括以下步骤:
[0117]-基于第一选择条件,由所述一个或多个初始标签信息中选择满足所述第一选择条件的至少一个初始标签信息;
[0118]-基于所选择的所述至少一个初始标签信息来确定所述标杆标签信息。
[0119]5.根据条款4所述的方法,其中,所述第一选择条件基于各个标签信息的以下至少任一项来确定:
[0120]-标签信息对应的内容项的内容用户信息;
[0121]-标签信息的属性信息;
[0122]-使用所述标签信息的标签用户信息。
[0123]6.根据条款I至5中任一项所述的方法,其中,所述获取分别与所述标杆标签信息近似的一个或多个候选内容项的步骤进一步包括以下步骤:
[0124]-在所有内容项中,获取各个内容项与所述标杆内容项的内容距离信息;
[0125]-根据各个内容项与标杆内容项的内容距离信息,选择与所述标杆内容项的内容距离信息满足第二选择条件的内容项作为候选内容项。
[0126]7.根据条款I至6中任一项所述的方法,其中,对所述一个或多个候选内容项中的各个候选内容项,所述对所述一个或多个候选内容项,分别确定其中各个内容项各自对应的标签信息的步骤进一步包括以下步骤:
[0127]-对一候选内容项,当该候选内容项未对应标杆标签信息时,选择与其内容距离最近的标杆标签信息作为其标杆标签信息。
[0128]8.根据条款7所述的方法,其中,所述对所述一个或多个候选内容项,分别确定其中各个内容项各自对应的标签信息的步骤进一步包括以下步骤:
[0129]对一候选内容项,当该候选内容项已对应一历史标杆标签信息时,基于该候选内容项与所述历史标杆标签的内容距离信息,以及该候选内容项与当前的所述标杆标签信息的内容距离信息,来确定该候选内容项对应的标杆标签信息。
[0130]9.一种用于生成内容项的标签的标签生成装置,其中,所述标签生成装置包括:
[0131]用于获取一标杆标签信息的装置,其中,所述标杆标签信息对应一组标杆内容项的装置;
[0132]用于获取分别与所述标杆标签信息近似的一个或多个候选内容项的装置;
[0133]用于对所述一个或多个候选内容项,分别确定其中各个内容项各自对应的标签信息的装置。
[0134]10.根据条款9所述的标签生成装置,其中,所述用于获取一标杆标签信息的装置用于:
[0135]-从被用户标注的一个或多个标签信息中获取一标杆标签信息。
[0136]11.根据条款9所述的标签生成装置,其中,所述用于获
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1