基于统一通讯录的号码集合提取方法和装置制造方法

文档序号:6502620阅读:248来源:国知局
基于统一通讯录的号码集合提取方法和装置制造方法
【专利摘要】本发明公开了一种基于统一通讯录的号码集合提取方法和装置,涉及移动互联网【技术领域】。该方法利用现有的统一通讯录资源,通过提供小规模精准的特定类型标签,检索得到对应的号码集合,再利用该号码集合反向扩充特定类型标签集合,利用信息的冗余性校验该特定类型标签集合,并通过反复迭代的方法不断扩充特定类型标签及对应的号码集合。本专利可以快速有效的向用户提供精准的特定类型号码集合,减少用户搜索的工作量,提升用户使用体验。
【专利说明】基于统一通讯录的号码集合提取方法和装置

【技术领域】
[0001] 本发明涉及移动互联网【技术领域】,特别涉及一种基于统一通讯录的号码集合提取 方法和装置。

【背景技术】
[0002] 随着社会进步,人们对特定类型信息(譬如家电维修、送水电话等)的需求呈爆炸 式增长。但是现有的资源难以满足用户的需求,运营商提供的黄页往往是通过认证的具一 定规模的商家信息,而用户日常生活中急需的某些特定类型号码却不在黄页收录范围,或 者没有以显性的方式表现。当前用户要寻找相关信息往往要通过搜索引擎进行人工查找。
[0003] 统一通讯录是中国电信向用户提供的联系人管理服务,支持用户手机通讯录的自 动同步,其中包含着海量的号码,其中不乏用户自行存储的特定类型号码,但是当前统一通 讯录中的信息是无组织的、离散的。


【发明内容】

[0004] 本发明的发明人发现上述现有技术中存在问题,并因此针对所述问题中的至少一 个问题提出了一种新的技术方案。
[0005] 本发明的一个目的是提供一种用于统一通讯录的号码集合提取的技术方案。
[0006] 根据本发明的第一方面,提供了一种基于统一通讯录的号码集合提取方法,包 括:
[0007] 根据号码种子标签检索统一通讯录获得与号码种子标签对应的扩展号码集合;
[0008] 根据扩展号码集合检索统一通讯录中获得与扩展号码集合对应的扩展标签集 合;
[0009] 利用信息的冗余性从扩展标签集合中选择可信任标签集合;
[0010] 根据可信任标签集合检索统一通讯录获得与可信任标签集合对应的可信任号码 集合。
[0011] 可选地,该方法还包括:确定号码种子标签。
[0012] 可选地,利用信息的冗余性从扩展标签集合中选择可信任标签集合包括:
[0013] 获得检索号码PN得到的第i个标签Li的数量C (PN,Li);
[0014] 选取C(PN,Li)最大的N个标签作为号码PN的可信任标签扩展集合;
[0015] 其中,i,N 为整数,N〈=i。
[0016] 可选地,该方法还包括:将可信任标签集合作为号码种子标签,重复迭代根据号码 种子标签获得可信任标签集合的步骤,当〈标签,号码〉集合达到稳定时输出。
[0017] 可选地,〈标签,号码〉集合达到稳定的判断条件为:〈标签,号码〉集合元素不再 增加。
[0018] 根据本发明的另一方面,提供一种基于统一通讯录的号码集合提取装置,包括:
[0019] 扩展号码获取模块,用于根据号码种子标签检索统一通讯录获得与号码种子标签 对应的扩展号码集合;
[0020] 扩展标签获取模块,用于根据扩展号码集合检索统一通讯录中获得与扩展号码集 合对应的扩展标签集合;
[0021] 可信任标签确定模块,用于利用信息的冗余性从扩展标签集合中选择可信任标签 集合;
[0022] 可信任号码获取模块,用于根据可信任标签集合检索统一通讯录获得与可信任标 签集合对应的可信任号码集合。
[0023] 可选地,该装置还包括:种子标签确定模块,用于确定号码种子标签。
[0024] 可选地,可信任标签确定模块包括:
[0025] 标签数量确定单元,用于获取检索号码PN得到的第i个标签Li的数量C(PN,Li);
[0026] 可信任标签选择单元,用于选取C(PN,Li)最大的N个标签作为号码PN的可信任 标签集合;
[0027] 其中,i,N 为整数,N〈=i。
[0028] 可选地,该装置还包括:迭代控制模块,用于将可信任标签集合作为号码种子标 签,重复迭代根据号码种子标签获得可信任标签集合的操作,当〈标签,号码〉集合达到稳 定时输出。
[0029] 可选地,〈标签,号码〉集合达到稳定的判断条件为:〈标签,号码〉集合元素不再 增加。
[0030] 本发明的一个优点在于,快速有效的向用户提供精准的特定类型号码集合,减少 用户搜索的工作量,提升用户使用体验。
[0031] 通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其 优点将会变得清楚。

【专利附图】

【附图说明】
[0032] 构成说明书的一部分的附图描述了本发明的实施例,并且连同说明书一起用于解 释本发明的原理。
[0033] 参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
[0034] 图1示出根据本发明的基于统一通讯录的号码集合提取方法的一个实施例的流 程图。
[0035] 图2示出根据本发明的基于统一通讯录的号码集合提取方法的另一个实施例的 流程图。
[0036] 图3示出根据本发明的基于统一通讯录的号码集合提取装置的一个实施例的结 构图。
[0037] 图4示出根据本发明的基于统一通讯录的号码集合提取装置的另一个实施例的 结构图。
[0038] 图5示出根据本发明的基于统一通讯录的号码集合提取装置的又一个实施例的 结构图。
[0039] 图6示出根据本发明的基于统一通讯录的号码集合提取实现的一个应用例的示 意图。

【具体实施方式】
[0040] 现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具 体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本 发明的范围。
[0041] 同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际 的比例关系绘制的。
[0042] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明 及其应用或使用的任何限制。
[0043] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适 当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
[0044] 在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不 是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
[0045] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一 个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0046] 图1示出根据本发明的基于统一通讯录的号码集合提取方法的一个实施例的流 程图。
[0047] 如图1所示,步骤102,根据号码种子标签检索统一通讯录获得与号码种子标签对 应的扩展号码集合。
[0048] 例如,可以人工选取号码种子标签,如水电工、修锁电话、水暖工、搬家电话等, 在统一通讯录中检索种子标签,得到〈标签,号码〉对,如〈水电工,1234567〉、〈水电工, 2345677〉、〈水电工,3456777〉、〈水电工,78798798〉、〈修锁电话,4322222〉、〈修锁电话, 7999999〉等,从〈标签,号码〉对集合中的号码作为与号码种子标签对应的扩展号码集合。
[0049] 步骤104,根据扩展号码集合检索统一通讯录中获得与扩展号码集合对应的扩展 标签集合。
[0050] 例如,以步骤102中检索到的扩展号码集合中与种子标签"水电工"对应的号码如 1234567、2345677等作为检索关键词,反向检索统一通讯录得到对应〈标签,号码〉对集合, 如〈水电工,1234567〉、〈修水电,1234567〉、〈水电小王,1234567〉、〈水电,1234567〉如等, 从而得到种子标签如"水电工"的扩展标签集合{水电工,修水电,水电小王,水电,......)。
[0051] 步骤106,利用信息的冗余性从扩展标签集合中选择可信任标签集合。上述步骤得 到的扩展标签集合中可能包含噪音信息,进而在后续的过程中使得信息的不准确性进一步 扩散,因此需要对扩展标签集合进行去噪处理。例如,在一个实施例中,利用信息的冗余性, 用C(PN,Li)表示检索号码PN得到的第i个标签的数量,选取排名前N个(例如5个)的标 签添加到可信任标签扩展集合。
[0052] 步骤108,根据可信任标签集合检索统一通讯录获得与可信任标签集合对应的可 信任号码集合。
[0053] 上述实施例中,利用现有的统一通讯录资源,通过提供小规模精准的特定类型号 码标签,检索得到对应的号码集合,再利用该号码集合反向扩充特定类型标签集合,利用信 息的冗余性校验该特定类型标签集合,实现了将统一通讯录中离散、缺少号码属性标签的 联系人号码资源自动组织为有条理、准确的、分类的特定类型号码集合。信息的冗余性通常 表现为海量信息的重复出现,而重复出现的信息往往意味着该信息的准确性,其中,利用信 息的冗余性提取精准信息,充分利用了信息的冗余性来判断信息的可靠性,极大减少了通 过搜索引擎人工检索的工作量,同时提高了安全性、准确性。
[0054] 图2示出根据本发明的基于统一通讯录的号码集合提取方法的另一个实施例的 流程图。
[0055] 如图2所示,步骤202,确定号码种子标签。号码种子标签可以是用户人工选择确 定的标签,或者是系统中经过认证的标签。
[0056] 步骤204,根据号码种子标签检索统一通讯录获得与号码种子标签对应的扩展号 码集合。
[0057] 步骤206,根据扩展号码集合检索统一通讯录中获得与扩展号码集合对应的扩展 标签集合。
[0058] 步骤208,利用信息的冗余性从扩展标签集合中选择可信任标签集合。得到的扩 展标签集合中可能包含噪音信息,进而在后续的迭代过程中使得信息的不准确性进一步扩 散,因此对扩展标签集合进行去噪处理。
[0059] 步骤210,根据可信任标签集合检索统一通讯录获得与可信任标签集合对应的可 信任号码集合。
[0060] 步骤212,判断〈标签、号码〉集合是否已经达到稳定?如果是,则继续步骤216, 否则,继续步骤214。可以设定迭代预定的次数后输出,或者,按照预定的条件判断是否已经 达到稳定:〈标签,号码〉集合元素不再增加。
[0061] 步骤214,将可信任标签集合作为号码种子标签,继续步骤204。
[0062] 步骤216,输出〈标签、号码〉集合。
[0063] 上述实施例中,通过与统一通讯录平台打通可以实现特定类型号码的自动提取。 通过提供小规模精准的特定类型标签,检索得到对应的号码集合,再利用该号码集合反向 扩充特定类型标签集合,利用信息的冗余性校验该特定类型标签集合,并通过反复迭代的 方法不断扩充特定类型标签及对应的号码集合。。
[0064] 图3示出根据本发明的基于统一通讯录的号码集合提取装置的一个实施例的结 构图。如图3所示,该装置包括:扩展号码获取模块31,用于根据号码种子标签检索统一 通讯录获得与号码种子标签对应的扩展号码集合;扩展标签获取模块32,用于根据扩展号 码集合检索统一通讯录中获得与扩展号码集合对应的扩展标签集合;可信任标签确定模块 33, 用于利用信息的冗余性从扩展标签集合中选择可信任标签集合;可信任号码获取模块 34, 用于根据可信任标签集合检索统一通讯录获得与可信任标签集合对应的可信任号码集 合。
[0065] 上述实施例中,通过提供小规模精准的特定类型号码标签,扩展号码获取模块检 索得到对应的号码集合,扩展标签获取模块再利用该号码集合反向扩充特定类型标签集 合,可信任标签确定模块利用信息的冗余性校验该特定类型标签集合,实现了将统一通讯 录中离散、缺少号码属性标签的联系人号码资源自动组织为有条理、准确的、分类的特定类 型号码集合,其中,利用信息的冗余性提取精准信息,充分利用了信息的冗余性来判断信息 的可靠性,极大减少了通过搜索引擎人工检索的工作量,同时提高了安全性、准确性。
[0066] 图4示出根据本发明的基于统一通讯录的号码集合提取装置的另一个实施例的 结构图。如图4所示,该实施例中号码集合提取装置包括种子标签确定单元41、扩展号码获 取模块31、扩展标签获取模块32、可信任标签确定模块33、可信任号码获取模块34。可选 地包括迭代控制模块45。其中,扩展号码获取模块31、扩展标签获取模块32、可信任标签确 定模块33和可信任号码获取模块34的功能和作用可以参见上述实施例的描述,为简洁起 见在此不再详细描述。种子标签确定模块41用于确定号码种子标签。迭代控制模块45将 可信任标签集合作为号码种子标签,重复迭代根据号码种子标签获得可信任标签集合的步 骤,当〈标签,号码〉集合达到稳定时输出。
[0067] 图5示出根据本发明的基于统一通讯录的号码集合提取装置的又一个实施例的 结构图。如图5所示,该实施例中包括扩展号码获取模块31、扩展标签获取模块32、可信任 标签确定模块53、可信任号码获取模块34。其中,可信任标签确定模块53包括标签数量确 定单元531,用于获取检索号码PN得到的第i个标签Li的数量C (PN,Li);可信任标签选择 单元532,用于选取C(PN,Li)最大的N个标签作为号码PN的可信任标签集合;其中,i,N为 整数,N〈=i。
[0068] 图6示出根据本发明的基于统一通讯录的号码集合提取实现的一个应用例的示 意图。
[0069] 如图6所示,S601,在统一通讯录平台检索种子标签。种子标签例如为水电工、修 锁电话等。
[0070] S602,得到与种子标签对应的扩展号码集合,例如,与水电工对应的号码集合 13322222、0211111 等。
[0071] S603,在统一通讯录平台中检索扩展号码集合中的号码。
[0072] S604,得到扩展号码集合中号码对应的扩展标签集合。
[0073] S605,通过信息冗余性对扩展标签集合去噪。
[0074] S606,在统一通讯录平台中检索去噪后的扩展标签集合。
[0075] 本领域普通技术人员可以理解:实现上述实施例的全部或部分步骤/模块可以通 过与统一通讯录平台打通,实现特定类型号码的自动提取。
[0076] 本公开中的实施例,将统一通讯录中离散、缺少号码属性标签的联系人号码资源 自动组织为有条理、准确的、分类的特定类型号码集合。本项目通过提供小规模的精准的特 定类型标签,得到对应的号码集合,再利用号码集合反向扩充特定类型标签集合,通过反复 迭代的方法得到特定类型标签及对应的号码集合;本项目可以快速有效的向用户提供精准 的特定类型号码集合,提高用户使用体验。
[0077] 至此,已经详细描述了根据本发明的基于统一通讯录的号码集合提取方法和装 置。为了避免遮蔽本发明的构思,没有描述本领域所公知的一些细节。本领域技术人员根 据上面的描述,完全可以明白如何实施这里公开的技术方案。
[0078] 可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者 软件、硬件、固件的任何组合来实现本发明的方法和系统。用于所述方法的步骤的上述顺序 仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特 别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序 包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据 本发明的方法的程序的记录介质。
[0079] 虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技 术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技 术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发 明的范围由所附权利要求来限定。
【权利要求】
1. 一种基于统一通讯录的号码集合提取方法,其特征在于,包括: 根据号码种子标签检索所述统一通讯录获得与所述号码种子标签对应的扩展号码集 合; 根据所述扩展号码集合检索所述统一通讯录中获得与所述扩展号码集合对应的扩展 标签集合; 利用信息的冗余性从所述扩展标签集合中选择可信任标签集合; 根据所述可信任标签集合检索所述统一通讯录获得与所述可信任标签集合对应的可 信任号码集合。
2. 根据权利要求1所述的方法,其特征在于,还包括: 确定所述号码种子标签。
3. 根据权利要求1所述的方法,其特征在于,所述利用信息的冗余性从所述扩展标签 集合中选择可信任标签集合包括: 获得检索号码PN得到的第i个标签Li的数量C (PN,Li); 选取C(PN,Li)最大的N个标签作为所述号码PN的可信任标签扩展集合; 其中,i,N为整数,N〈=i。
4. 根据权利要求1所述的方法,其特征在于,还包括: 将可信任标签集合作为号码种子标签,重复迭代根据号码种子标签获得可信任标签集 合的步骤,当〈标签,号码〉集合达到稳定时输出。
5. 根据权利要求1所述的方法,其特征在于,〈标签,号码〉集合达到稳定的判断条件 为: 〈标签,号码〉集合元素不再增加。
6. -种基于统一通讯录的号码集合提取装置,其特征在于,包括: 扩展号码获取模块,用于根据号码种子标签检索所述统一通讯录获得与所述号码种子 标签对应的扩展号码集合; 扩展标签获取模块,用于根据所述扩展号码集合检索所述统一通讯录中获得与所述扩 展号码集合对应的扩展标签集合; 可信任标签确定模块,用于利用信息的冗余性从所述扩展标签集合中选择可信任标签 集合; 可信任号码获取模块,用于根据所述可信任标签集合检索所述统一通讯录获得与所述 可信任标签集合对应的可信任号码集合。
7. 根据权利要求6所述的装置,其特征在于,还包括: 种子标签确定模块,用于确定所述号码种子标签。
8. 根据权利要求6所述的装置,其特征在于,所述可信任标签确定模块包括: 标签数量确定单元,用于获取检索号码PN得到的第i个标签Li的数量C(PN,Li); 可信任标签选择单元,用于选取C(PN,Li)最大的N个标签作为所述号码PN的可信任 标签集合; 其中,i,N为整数,N〈=i。
9. 根据权利要求6所述的装置,其特征在于,还包括: 迭代控制模块,用于将可信任标签集合作为号码种子标签,重复迭代根据号码种子标 签获得可信任标签集合的操作,当〈标签,号码〉集合达到稳定时输出。
10.根据权利要求9所述的装置,,其特征在于,〈标签,号码〉集合达到稳定的判断条 件为: 〈标签,号码〉集合元素不再增加。
【文档编号】G06F17/30GK104142956SQ201310170685
【公开日】2014年11月12日 申请日期:2013年5月10日 优先权日:2013年5月10日
【发明者】康为 申请人:中国电信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1