信息处理方法及装置的制造方法

文档序号:9687435阅读:419来源:国知局
信息处理方法及装置的制造方法
【技术领域】
[0001]本发明涉及一种信息处理方法及装置,更具体地说,本发明涉及一种使用标签来表征文件特征的信息处理方法及装置。
【背景技术】
[0002]随着信息技术的进一步发展,尤其是互联网技术的发展,信息资源量迅猛增长,给用户带来了丰富的个性化选择,满足了用户多样化的需求。
[0003]然而,现有的内容服务提供商通常对内部文件采用分类、排行、搜索关键词等方式给用户提供查找路径,在面对所含文件比较大时,用户往往因为分类的模糊、搜索功能不强导致用户无法找到。虽然指出了采用排行的方式进行用户推荐,但也仅是把热门应用按顺序排列呈现给用户,无法满足用户的个性化需求。此外有时候用户自己对期望内容也模糊,不清楚希望找什么,在这种情况下上述方式都无法提供有效的资源发现方式,这成为影响用户体验的主要因素。

【发明内容】

[0004]鉴于上述问题,根据本发明的一个方面,提供了一种信息处理方法,应用于电子设备,其中电子设备预先存储多个文件,其特征在于,所述方法包括:通过包含多个标签的标签集合中的至少一个标签对多个文件中的每一个文件进行标识;根据标签形成对多个文件的N级索引,其中N为大于等于2的正整数,其中生成与多个标签一一对应的、N级索引的多个第一级节点;生成位于第一级节点之下的、N级索引的至少一级下级节点,在至少一级下级节点中每个子节点具有多个父节点,通过对于每个子节点的任一父节点增加一个或多个标签生成该子节点,每个子节点包括其所有父节点中的所有标签,以及N级索引的同一级节点所包含的标签数目相同。
[0005]根据本发明的另一个方面,还提供了一种信息处理装置。该信息处理装置包括:存储单元,配置来预先存储多个文件,其中通过包含多个标签的标签集合中的至少一个标签对多个文件中的每一个文件进行标识;节点管理单元,配置来根据标签形成对多个文件的N级索引,其中N为大于等于2的正整数,包括:第一级节点生成模块,配置来生成与多个标签一一对应的、N级索引的多个第一级节点;下级节点生成模块,配置来生成位于第一级节点之下的、N级索引的至少一级下级节点,在至少一级下级节点中每个子节点具有多个父节点,子节点生成模块通过对于每个子节点的任一父节点增加一个或多个标签生成该子节点,每个子节点包括其所有父节点中的所有标签,以及N级索引的同一级节点所包含的标签数目相同。
[0006]通过本发明实施例提供的信息处理方法及信息处理装置,能够通过给文件关联特征标签,建立一个以特征标签为维度的索引结构,供用户无论从哪个父节点开始都在可以具象化的维度上逐步细化,通过单步跳转的方式逐步缩小选择范围,最后找到自己感兴趣的内容,减少由于分类的模糊或者搜索功能不强而导致的用户找到相关感兴趣的应用或文件困难的问题。
【附图说明】
[0007]为了更清楚地说明本发明实施例的技术方案,下面将对实施例的描述中所需要使用的附图作简单地介绍。下面描述中的附图仅仅是本发明的示例性实施例。
[0008]图1是描述了根据本发明实施例的信息处理方法的流程图。
[0009]图2是根据本发明一个实施例的N级索引的示例性说明图。
[0010]图3是根据本发明另一个实施例的N级索引的示例性说明图。图4是描述了根据本发明实施例的利用根据图1中所示的方法构建的N级检索结构来进行文件的检索的方法的流程图。
[0011]图5是根据本发明一个实施例的第一检索界面的示例性说明图。
[0012]图6是示出根据本发明一个实施例的信息处理装置的示范性结构框图。
[0013]图7是示出根据本发明另一实施例的信息处理装置的示范性结构框图。
【具体实施方式】
[0014]在下文中,将参考附图详细描述本发明的优选实施例。注意,在本说明书和附图中,具有基本上相同步骤和元素用相同的附图标记来表示,且对这些步骤和元素的重复解释将被餐略。
[0015]下面,参照图1说明本发明的实施例的信息处理方法。图1是描述了根据本发明实施例的信息处理方法100的流程图。信息处理方法100可应用于电子设备,电子设备预先存储多个文件,该信息处理方法100包括图1所示如下步骤。
[0016]在图1的步骤S101中,通过包含多个标签的标签集合中的至少一个标签对电子设备预先存储的多个文件中的每一个文件进行标识。例如,预先存储的多个文件可包括文档文件、视频文件、音频文件、可被在终端设备上应用的应用等文件。
[0017]根据本发明的示例,标签集合可以是对于预先存储的所有文件进行抽样并经判断抽样文件的内容以建立对用户选择可能有帮助的若干标签而形成的标签列表。例如,标签可以是视频、音频、文本、游戏等。又例如,标签还可以是历史、文学、生活、娱乐、教育等。此夕卜,标签还可以是男性、女性、儿童等。
[0018]在步骤S101中,可基于标签集合中的标签数据训练出每个标签的分类器,对于电子设备中的全部预先存储文件运行一遍,得到每个文件相应的标签。例如,可首先通过人工方式为每个标签标注若干包含标签的文件作为正样本和不包含标签的文件作为负样本。然后从包含某标签的正负样本的训练里集中提取样本特征,包括标题、描述、类别等。最后采用常见的机器学习算法,比如决策树、贝叶斯分类器、SVM等,训练出该标签的分类器。对于未标注的其余文件,可根据每个文件的例如解决的问题、适用的人群等信息之类的属性信息,利用分类器为该文件加上该标签,以此完成对每一个文件进行标识的工作。
[0019]然后在步骤S102中,根据标签形成对多个文件的N级索引,其中N为大于等于2
的正整数。具体地在步骤S102-a中,生成与多个标签--对应的、N级索引的多个第一级节点,即,N级索引的多个根节点。此外,在步骤S102-b中,生成位于第一级节点之下的、N级索引的至少一级下级节点。根据本发明的示例,在至少一级下级节点中,每个子节点具有多个父节点,并且在步骤S102-b中,可通过对于每个子节点的任一父节点增加一个或多个标签生成该子节点。此外,每个子节点包括其所有父节点中的所有标签,并且N级索引的同一级节点所包含的标签数目相同。应注意,在根据本发明的实施例中,父节点和子节点是位于N级索引的相邻两级中的节点。
[0020]图2是根据本发明一个实施例的N级索引200的示例性说明图。在图2所示的示例中,N级索引200为二级索引,并且假设标签集合中包括5个标签,即游戏、男性、娱乐休闲、女性和宗教。如图2所示,二级索引200包括与5个标签一一对应的第一级节点211至215。
[0021]将第一级节点211至215作为父节点,通过对于任一父节点增加一个标签生成第一级节点的子节点221至226。具体地,如图2所示,通过对于第一级节点211增加标签娱乐休闲或者对于第一级节点213增加标签游戏生成第一级节点的子节点221,第一级节点的子节点221包括父节点211和213的所有标签,即,标签游戏和娱乐休闲。通过对于第一级节点211增加标签男性或者对于第一级节点212增加标签游戏生成第一级节点的子节点222,第一级节点的子节点222包括父节点211和212的所有标签,即,标签游戏和男性。通过对于第一级节点211增加标签女性或者对于第一级节点213增加标签游戏生成第一级节点的子节点223,包括父节点211和213的所有标签,即,标签游戏和女性。通过对于第一级节点213增加标签男性或者对于第一级节点212增加标签娱乐休闲生成第一级节点的子节点224,包括父节点212和213的所有标签,S卩,标签娱乐休闲和男性。通过对于第一级节点213增加标签女性或者对于第一级节点214增加标签娱乐休闲生成第一级节点的子节点225,包括父节点213和214的所有标签,即,标签女
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1