电话号码识别方法及装置制造方法

文档序号:7814841阅读:155来源:国知局
电话号码识别方法及装置制造方法
【专利摘要】本公开是关于一种电话号码识别方法及装置,属于数字识别领域。所述方法包括:获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签。本公开通过将电话号码的通话规律与预设身份标签的通话规律进行匹配;解决了用户经常发现某些电话号码对应的身份标签已经不正确,需要人工抽检的问题;达到了通过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资源的效果。
【专利说明】电话号码识别方法及装置

【技术领域】
[0001] 本公开涉及数字识别领域,特别涉及一种电话号码识别方法及装置。

【背景技术】
[0002] 随着人们交际的越来越广,电话已成为生活中不可缺少的工具。
[0003] 在用户使用电话进行沟通交流时,越来越多的陌生电话出现,所以,对电话号码的 身份识别就显得尤为重要。相关技术中,用户可以根据黄页中一个电话号码的身份标签来 辨别该电话号码的身份。比如,骚扰电话、广告推销、房产中介、快递送餐或者诈骗电话等 等。
[0004] 公开人在实现本公开的过程中,发现上述方式至少存在如下缺陷:
[0005] 由于黄页中存储着大量的电话号码及其对应的身份标签,且这些电话号码和身份 标签不断地更新变化着,用户在使用黄页时,经常会发现某些电话号码对应的身份标签已 经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而人工抽检浪费 了大量的人力资源且能够达到的效果有限。


【发明内容】

[0006] 为了解决相关技术中用户经常发现某些电话号码对应的身份标签已经不正确,需 要人工抽检的问题,本公开实施例提供了一种电话号码识别方法及装置,所述技术方案如 下:
[0007] 根据本公开实施例的第一方面,提供一种电话号码识别方法,所述方法包括:
[0008] 获取电话号码在一个历史时间段内的通话记录;
[0009] 根据通话记录分析电话号码的通话规律;
[0010] 将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对 电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签。
[0011] 在一个实施例中,将电话号码的通话规律与预设身份标签的通话规律进行匹配, 并根据匹配结果对电话号码的已有身份标签进行重新确认,包括:
[0012] 在电话号码已对应有一个预设身份标签时,计算电话号码的通话规律与预设身份 标签的通话规律之间的匹配指数;
[0013] 若匹配指数大于或等于第一阈值,则电话号码的通话规律与预设身份标签的通话 规律匹配,保持预设身份标签不变;
[0014] 若匹配指数小于第一阈值,则电话号码的通话规律与预设身份标签对应的通话规 律不匹配,将预设身份标签确定为错误的身份标签。
[0015] 可选地,在另一个实施例中,将电话号码的通话规律与预设身份标签的通话规律 进行匹配,并根据匹配结果识别电话号码的身份标签,包括:
[0016] 在电话号码未对应有预设身份标签时,分别计算电话号码的通话规律与至少一个 预设身份标签的通话规律之间的匹配指数;
[0017] 当数值最高的匹配指数大于第二阈值时,将数值最高的匹配指数所对应的预设身 份标签确定为与电话号码对应的身份标签。
[0018] 在一个实施例中,根据通话记录分析电话号码的通话规律,包括:
[0019] 获取通话记录在n个统计维度上的数据,n个统计维度包括指定时段的通话次数、 通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人中的 至少一种;
[0020] 按照n个统计维度分别统计每个统计维度上的通话特点;
[0021] 根据n个维度对应的n个通话特点得出电话号码的通话规律。
[0022] 在一个实施例中,预设身份标签的通话规律包括快递员标签的通话规律、业务咨 询标签的通话规律、业务推销标签的通话规律、订餐标签的通话规律、出租车标签的通话规 律中的至少一种;
[0023] 快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长 低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地 均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第 七阈值;
[0024] 业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时 长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的 比例高于第十一阈值;
[0025] 业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话 时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联 系人的比例高于第十五阈值;
[0026] 订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长 低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所 在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例 高于第二十阈值;
[0027] 出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话 时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通 话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
[0028] 根据本公开实施例的第二方面,提供一种电话号码识别装置,所述装置包括:
[0029] 记录获取模块,被配置为获取电话号码在一个历史时间段内的通话记录;
[0030] 规律分析模块,被配置为根据通话记录分析电话号码的通话规律;
[0031] 规律匹配模块,被配置为将电话号码的通话规律与预设身份标签的通话规律进行 匹配,并根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别 电话号码的身份标签。
[0032] 在一个实施例中,规律匹配模块,包括:
[0033] 第一计算子模块,被配置为在电话号码已对应有一个预设身份标签时,计算电话 号码的通话规律与预设身份标签的通话规律之间的匹配指数;
[0034] 第一匹配子模块,被配置为若匹配指数大于或等于第一阈值,则电话号码的通话 规律与预设身份标签的通话规律匹配,保持预设身份标签不变;
[0035] 第二匹配子模块,被配置为若匹配指数小于第一阈值,则电话号码的通话规律与 预设身份标签对应的通话规律不匹配,将预设身份标签确定为错误的身份标签。
[0036] 可选地,在另一个实施例中,规律匹配模块,包括:
[0037] 第二计算子模块,被配置为在电话号码未对应有预设身份标签时,分别计算电话 号码的通话规律与至少一个预设身份标签的通话规律之间的匹配指数;
[0038] 标签确定子模块,被配置为当数值最高的匹配指数大于第二阈值时,将数值最高 的匹配指数所对应的预设身份标签确定为与电话号码对应的身份标签。
[0039] 在一个实施例中,规律分析模块,包括:
[0040] 数据获取子模块,被配置为获取通话记录在n个统计维度上的数据,n个统计维度 包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通 话号码是否是联系人中的至少一种;
[0041] 特点统计子模块,被配置为按照n个统计维度分别统计每个统计维度上的通话特 占.
[0042] 规律得出子模块,被配置为根据n个维度对应的n个通话特点得出电话号码的通 话规律。
[0043] 在一个实施例中,预设身份标签的通话规律包括快递员标签的通话规律、业务咨 询标签的通话规律、业务推销标签的通话规律、订餐标签的通话规律、出租车标签的通话规 律中的至少一种;
[0044] 快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长 低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地 均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第 七阈值;
[0045] 业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时 长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的 比例高于第十一阈值;
[0046] 业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话 时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联 系人的比例高于第十五阈值;
[0047] 订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长 低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所 在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例 高于第二十阈值;
[0048] 出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话 时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通 话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。 [0049] 根据本公开实施例的第三方面,提供了一种电话号码识别装置,包括 :
[0050] 处理器;
[0051] 用于存储所述处理器的可执行指令的存储器;
[0052] 其中,所述处理器被配置为:
[0053] 获取电话号码在一个历史时间段内的通话记录;
[0054] 根据通话记录分析电话号码的通话规律;
[0055] 将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对 电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标签。
[0056] 本公开实施例提供的技术方案可以包括以下有益效果:
[0057] 通过获取电话号码在一个历史时间段内的通话记录;根据通话记录分析电话号码 的通话规律;将电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结 果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号码的身份标 签;解决了用户经常发现某些电话号码对应的身份标签已经不正确,为了保证电话号码对 应身份标签的正确性,需要进行人工抽检,而人工抽检浪费了大量的资源的问题;达到了通 过电话号码的通话规律就可以识别电话号码的身份标签,避免了人工抽检,节省了人力资 源的效果。
[0058] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本公开。

【专利附图】

【附图说明】
[0059] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施 例,并与说明书一起用于解释本公开的原理。
[0060] 图1是根据一示例性实施例示出的一种电话号码识别方法的流程图;
[0061] 图2是根据另一示例性实施例示出的一种电话号码识别方法的流程图;
[0062] 图3是根据又一示例性实施例示出的一种电话号码识别方法的流程图;
[0063] 图4是根据一示例性实施例示出的一种电话号码识别装置的框图;
[0064] 图5是根据另一示例性实施例示出的一种电话号码识别装置的框图;
[0065] 图6是根据一示例性实施例示出的一种电话号码识别装置的框图。
[0066] 通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图 和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为 本领域技术人员说明本公开的概念。

【具体实施方式】
[0067] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0068] 图1是根据一示例性实施例示出的一种电话号码识别方法的流程图,本实施例以 该电话号码识别方法应用于服务器中来举例说明。该电话号码识别方法可以包括如下几个 步骤:
[0069] 在步骤102中,获取电话号码在一个历史时间段内的通话记录。
[0070] 在步骤104中,根据通话记录分析电话号码的通话规律。
[0071] 在步骤106中,将电话号码的通话规律与预设身份标签的通话规律进行匹配,并 根据匹配结果对电话号码的已有身份标签进行重新确认,或者,根据匹配结果识别电话号 码的身份标签。
[0072] 综上所述,本实施例提供的电话号码识别方法,通过获取电话号码在一个历史时 间段内的通话记录;根据通话记录分析电话号码的通话规律;将电话号码的通话规律与预 设身份标签的通话规律进行匹配,并根据匹配结果对电话号码的已有身份标签进行重新确 认,或者,根据匹配结果识别电话号码的身份标签;解决了用户经常发现某些电话号码对应 的身份标签已经不正确,为了保证电话号码对应身份标签的正确性,需要进行人工抽检,而 人工抽检浪费了大量的资源的问题;达到了通过电话号码的通话规律就可以识别电话号码 的身份标签,避免了人工抽检,节省了人力资源的效果。
[0073] 本公开实施例的实施场景可以分为两种:
[0074] 第一种实施场景是该电话号码预先已对应有预设身份标签,比如该电话号码是黄 页号码中的一个号码;
[0075] 第二种实施场景是该电话号码预先未对应有预设身份标签,比如该电话号码是被 用户举报的垃圾电话号码,但是该垃圾电话号码尚未分类。
[0076] 下面分别通过两个实施例来进行说明。
[0077] 图2是根据另一示例性实施例示出的一种电话号码识别方法的流程图,本实施例 以该电话号码识别方法应用于服务器中且该电话号码已对应有预设身份标签(本实施例 以预设身份标签为快递员标签为例)来举例说明。该电话号码识别方法可以包括如下几个 步骤:
[0078] 在步骤202中,获取电话号码在一个历史时间段内的通话记录。
[0079] 服务器获取电话号码在一个历史时间段内的通话记录。对于一个电话号码,服务 器可以每隔预定时间获取该电话号码在一个历史时间段内的通话记录;也可以在该电话号 码每次有新的通话记录后,获取该电话号码在一个历史时间段内的通话记录。
[0080] 服务器可以从终端获取电话号码的通话记录。在服务器是云端电话本所对应的服 务器时,服务器可以从自身保存的多个电话号码的通话记录中获取某一个电话号码的通话 记录。
[0081] 其中,历史时间段可以是以当前时间为终点,固定时长为长度的时间段;历史时间 段也可以是上一个月、上一季度、上半年等历史时间段。
[0082] 其中,通话记录可以包括:通话时间、通话时长、呼入次数、呼出次数、通话地点、通 话号码所在地和通话号码是否是联系人中的至少一种。
[0083] 如,表1示出了服务器获取的一个电话号码在2014年9月9日10:00-16:00的 通话记录。
[0084] 表 1
[0085]

【权利要求】
1. 一种电话号码识别方法,其特征在于,所述方法包括: 获取电话号码在一个历史时间段内的通话记录; 根据所述通话记录分析所述电话号码的通话规律; 将所述电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对 所述电话号码的已有身份标签进行重新确认,或者,根据所述匹配结果识别所述电话号码 的身份标签。
2. 根据权利要求1所述的方法,其特征在于,所述将所述电话号码的通话规律与预设 身份标签的通话规律进行匹配,并根据匹配结果对所述电话号码的已有身份标签进行重新 确认,包括: 在所述电话号码已对应有一个预设身份标签时,计算所述电话号码的通话规律与所述 预设身份标签的通话规律之间的匹配指数; 若所述匹配指数大于或等于第一阈值,则所述电话号码的通话规律与所述预设身份标 签的通话规律匹配,保持所述预设身份标签不变; 若所述匹配指数小于所述第一阈值,则所述电话号码的通话规律与所述预设身份标签 对应的通话规律不匹配,将所述预设身份标签确定为错误的身份标签。
3. 根据权利要求1所述的方法,其特征在于,所述将所述电话号码的通话规律与预 设身份标签的通话规律进行匹配,并根据所述匹配结果识别所述电话号码的身份标签,包 括: 在所述电话号码未对应有预设身份标签时,分别计算所述电话号码的通话规律与至少 一个预设身份标签的通话规律之间的匹配指数; 当数值最高的匹配指数大于第二阈值时,将所述数值最高的匹配指数所对应的预设身 份标签确定为与所述电话号码对应的身份标签。
4. 根据权利要求1至3任一所述的方法,其特征在于,所述根据所述通话记录分析所述 电话号码的通话规律,包括: 获取所述通话记录在η个统计维度上的数据,所述η个统计维度包括指定时段的通话 次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地和通话号码是否是联系人 中的至少一种; 按照所述η个统计维度分别统计每个统计维度上的通话特点; 根据所述η个维度对应的η个通话特点得出所述电话号码的通话规律。
5. 根据权利要求2或3所述的方法,其特征在于,所述预设身份标签的通话规律包括快 递员标签的通话规律、业务咨询标签的通话规律、业务推销标签的通话规律、订餐标签的通 话规律、出租车标签的通话规律中的至少一种; 所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长 低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地 均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第 七阈值; 所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时 长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的 比例高于第i^一阈值; 所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话 时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联 系人的比例高于第十五阈值; 所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长 低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所 在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例 高于第二十阈值; 所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话 时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通 话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
6. -种电话号码识别装置,其特征在于,所述装置包括: 记录获取模块,被配置为获取电话号码在一个历史时间段内的通话记录; 规律分析模块,被配置为根据所述通话记录分析所述电话号码的通话规律; 规律匹配模块,被配置为将所述电话号码的通话规律与预设身份标签的通话规律进行 匹配,并根据匹配结果对所述电话号码的已有身份标签进行重新确认,或者,根据所述匹配 结果识别所述电话号码的身份标签。
7. 根据权利要求6所述的装置,其特征在于,所述规律匹配模块,包括: 第一计算子模块,被配置为在所述电话号码已对应有一个预设身份标签时,计算所述 电话号码的通话规律与所述预设身份标签的通话规律之间的匹配指数; 第一匹配子模块,被配置为若所述匹配指数大于或等于第一阈值,则所述电话号码的 通话规律与所述预设身份标签的通话规律匹配,保持所述预设身份标签不变; 第二匹配子模块,被配置为若所述匹配指数小于所述第一阈值,则所述电话号码的通 话规律与所述预设身份标签对应的通话规律不匹配,将所述预设身份标签确定为错误的身 份标签。
8. 根据权利要求6所述的装置,其特征在于,所述规律匹配模块,包括: 第二计算子模块,被配置为在所述电话号码未对应有预设身份标签时,分别计算所述 电话号码的通话规律与至少一个预设身份标签的通话规律之间的匹配指数; 标签确定子模块,被配置为当数值最高的匹配指数大于第二阈值时,将所述数值最高 的匹配指数所对应的预设身份标签确定为与所述电话号码对应的身份标签。
9. 根据权利要求6至8任一所述的装置,其特征在于,所述规律分析模块,包括: 数据获取子模块,被配置为获取所述通话记录在η个统计维度上的数据,所述η个统计 维度包括指定时段的通话次数、通话时长、呼入次数、呼出次数、通话地点、通话号码所在地 和通话号码是否是联系人中的至少一种; 特点统计子模块,被配置为按照所述η个统计维度分别统计每个统计维度上的通话特 占. 规律得出子模块,被配置为根据所述η个维度对应的η个通话特点得出所述电话号码 的通话规律。
10. 根据权利要求7或8所述的装置,其特征在于,所述预设身份标签的通话规律包括 快递员标签的通话规律、业务咨询标签的通话规律、业务推销标签的通话规律、订餐标签的 通话规律、出租车标签的通话规律中的至少一种; 所述快递员标签的通话规律包括:指定时段的通话次数高于第三阈值、平均通话时长 低于第四阈值、呼出次数占总通话次数的比例高于第五阈值、通话地点和通话号码所在地 均处于同一固定区域且两者平均距离小于第六阈值、和通话号码不是联系人的比例高于第 七阈值; 所述业务咨询标签的通话规律包括:指定时段的通话次数高于第八阈值、平均通话时 长高于第九阈值、呼出次数占总通话次数的比例低于第十阈值、和通话号码不是联系人的 比例高于第十一阈值; 所述业务推销标签的通话规律包括:指定时段的通话次数高于第十二阈值、平均通话 时长高于第十三阈值、呼出次数占总通话次数的比例高于第十四阈值、和通话号码不是联 系人的比例高于第十五阈值; 所述订餐标签的通话规律包括:指定时段的通话次数高于第十六阈值、平均通话时长 低于第十七阈值、呼出次数占总通话次数的比例低于第十八阈值、通话地点和通话号码所 在地均处于同一固定区域且两者平均距离小于第十九阈值、和通话号码不是联系人的比例 高于第二十阈值; 所述出租车标签的通话规律包括:指定时段的通话次数高于第二十一阈值、平均通话 时长低于第二十二阈值、呼出次数占总通话次数的比例低于第二十三阈值、通话地点和通 话号码所在地均处于同一固定区域、和通话号码不是联系人的比例高于第二十四阈值。
11. 一种电话号码识别装置,其特征在于,包括: 处理器; 用于存储所述处理器的可执行指令的存储器; 其中,所述处理器被配置为: 获取电话号码在一个历史时间段内的通话记录; 根据所述通话记录分析所述电话号码的通话规律; 将所述电话号码的通话规律与预设身份标签的通话规律进行匹配,并根据匹配结果对 所述电话号码的已有身份标签进行重新确认,或者,根据所述匹配结果识别所述电话号码 的身份标签。
【文档编号】H04M1/2745GK104320525SQ201410482122
【公开日】2015年1月28日 申请日期:2014年9月19日 优先权日:2014年9月19日
【发明者】王广健, 王伯天, 乔忠良 申请人:小米科技有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1