骚扰电话号码确定方法、装置和系统的制作方法_4

文档序号:9380543阅读:来源:国知局
>[0225] 其中,骚扰类型表征第一可疑电话号码的骚扰目的,第一通话记录为目标通话记 录集合中的任一通话记录。即服务器在获取了目标通话记录集合之后,可以根据预设的骚 扰特征词与骚扰类型的对应关系,确定目标通话记录集合中每个目标通话记录包含的骚扰 特征词的骚扰类型。示例性的,预设的骚扰特征词与骚扰类型的对应关系可以如表1所示:
[0226] 表 1
[0228] 在表1中,第一行为表头,用于对表1中的两列进行说明,左边一列代表骚扰类型, 右边一列代表每种骚扰类型包含的骚扰特征词,服务器可以根据该表确定第一通话记录包 含的骚扰特征词的骚扰类型,比如第一通话记录中包含的骚扰特征词为"恭喜",则根据表1 可以得知"恭喜"的骚扰类型为"诈骗"。
[0229] 在子步骤4113中,服务器将第一通话记录包含的骚扰特征词的骚扰类型确定为 第一通话记录的骚扰类型。
[0230] 服务器在获取了目标通话记录集合中每个通话记录包含的骚扰特征词的骚扰类 型之后,可以将该骚扰特征词的骚扰类型确定为该通话记录的骚扰类型。示例性的,目标通 话记录集合中的一个通话记录包含有骚扰类型为"诈骗"的骚扰特征词,则服务器可以将该 通话记录的骚扰类型确定为"诈骗"。
[0231] 需要说明的是,在目标通话记录集合中的通话记录包含有多个骚扰类型的骚扰特 征词时,可以将这多个骚扰类型均确定为该通话记录的骚扰类型,示例性的,通话记录A包 含有"诈骗"和"中介"两种骚扰类型的骚扰特征词,则通话记录A的骚扰类型为"诈骗"和 "中介"。
[0232] 在子步骤4114中,服务器统计目标通话记录集合中每种骚扰类型对应的通话记 录的数量。
[0233] 服务器在获取了目标通话记录中每个通话记录的骚扰类型之后,可以统计目标通 话记录集合中每种骚扰类型对应的通话记录的数量。
[0234] 示例性的,通话记录A的骚扰类型为"诈骗"和"中介",通话记录B的骚扰类型为 "推销",通话记录C的骚扰类型为"中介"。则服务器的统计结果为:
[0235] 骚扰类型"中介"对应的通话记录为通话记录A和通话记录C两个,骚扰类型"诈 骗"对应的通话记录为通话记录A -个,骚扰类型"推销"对应的通话记录为通话记录B - 个。
[0236] 在子步骤4115中,服务器根据每种骚扰类型对应的通话记录的数量与目标通话 记录集合中通话记录的总数的比值,确定每种骚扰类型在目标通话记录集合中的比例。
[0237] 服务器在统计了目标通话记录集合中每种骚扰类型对应的通话记录的数量之后, 可以根据每种骚扰类型对应的通话记录的数量与目标通话记录集合中通话记录的总数的 比值,确定每种骚扰类型在目标通话记录集合中的比例。
[0238] 示例性的,目标通话记录集合中骚扰类型"推销"对应的通话记录有60个,骚扰类 型"中介"对应的通话记录有20个,该目标通话记录集合的通话记录共有100个,则骚扰类 型"推销"在该目标通话记录集合中的比例为〇. 6,骚扰类型"中介"在该目标通话记录集合 中的比例为0. 2。
[0239] 在子步骤4116中,若目标通话记录集合中存在比例大于比例阈值的骚扰类型,服 务器则确定第一可疑电话号码为骚扰电话号码。
[0240] 服务器在获取了每种骚扰类型在目标通话记录集合中的比例之后,可以检测这些 比例中是否存在大于比例阈值的值,若存在,则确定该第一可疑电话号码为骚扰电话号码。 示例性的,比例阈值为0. 5,骚扰类型"推销"在目标通话记录集合中的比例为0. 6,大于该 比例阈值,则可以确定该目标通话记录集合对应的第一可疑电话号码为骚扰电话号码。
[0241] 需要说明的是,由于骚扰电话中骚扰方说的内容大都相差不多,因而一个骚扰电 话号码所在的多个通话记录中的骚扰特征词的骚扰类型的相似度会较高,即根据比例阈值 对可疑号码进行筛选能够进一步的提高确定的骚扰电话号码的准确性。
[0242] 在子步骤4117中,服务器将目标通话记录集合中比例最大的骚扰类型作为骚扰 电话号码的骚扰类型。
[0243] 服务器在确定了骚扰电话号码之后,可以将该骚扰电话号码对应的目标通话记录 集合中比例最大的骚扰类型作为该骚扰电话号码的骚扰类型,该骚扰类型可以提供给用户 一个对骚扰电话号码清晰的认识,提高用户体验。示例性的,目标通话记录集合中包含"推 销"和"中介"这两种骚扰类型的通话记录,而骚扰类型"推销"在该目标通话记录集合中的 比例为0. 6,骚扰类型"中介"在该目标通话记录集合中的比例为0. 2,则可以确定该骚扰电 话号码的骚扰类型为"推销"。
[0244] 此外,子步骤4117为对骚扰电话号码分类的步骤,是可选的步骤。
[0245] 需要说明的是,目标通话记录集合中的通话记录均为目标通话记录。
[0246] 在步骤412中,服务器根据确定的骚扰电话号码生成即时骚扰号码表。
[0247] 服务器在获取了骚扰电话号码之后,可以根据骚扰电话号码生成即时骚扰号码 表,示例性的,生成的即时骚扰电话号码表可以如表2所示。
[0248] 表 2
[0249]

[0250] 在表2中,第一行为表头,用于对表2中的数据进行说明,表2中的数字代表骚扰 电话号码。
[0251] 需要说明的是,在服务器确定了骚扰电话号码的骚扰类型时,服务器还可以根据 骚扰电话号码和骚扰类型共同生成即时骚扰号码表,也就是说即时骚扰号码表中不但记录 有骚扰电话号码,还记录有骚扰电话号码的骚扰类型。示例性的,如表3所示:
[0252] 表 3
[0253]
[0254]
[0255] 在表3中,第一行为表头,用于对表3中的两列数据进行说明,左边一列代表骚 扰电话号码,右边一列代表每个骚扰电话号码的骚扰类型。比如第二行的骚扰电话号码 " 111***1111"的骚扰类型为"推销"。
[0256] 在步骤413中,服务器根据即时骚扰号码表更新历史骚扰号码表。
[0257] 服务器在获取了即时骚扰号码表之后,可以以该即时骚扰号码表来更新历史骚扰 号码表,其中历史骚扰号码表可以为服务器根据本次之前获取的即时骚扰号码表生成的, 此外,在本次即为第一次的到即时骚扰号码表时,可以将该即时骚扰号码表作为历史骚扰 号码表。在更新历史骚扰号码表时,可以给每条骚扰电话号码附上时间戳(Timestamp),以 表示该条骚扰电话号码记录进历史骚扰号码表的时间。服务器可以每过一段时间就生成一 次即使骚扰号码表,并根据最新获取的即时骚扰号码表更新一次历史骚扰号码表。
[0258] 需要说明的是,时间戳,或称Unix时间(Unix time),是一种时间表示方式,定义 为从格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08 时00分00秒)起至现在的总秒数。
[0259] 本步骤在更新历史骚扰号码表时,可以遵循下面三条原则:
[0260] 1)历史骚扰号码表中没有而在即时骚扰号码表中有的骚扰电话号码,更新到历史 骚扰号码表中。
[0261] 2)历史骚扰号码表中和即时骚扰号码表中都有的骚扰电话号码,更新历史骚扰号 码表中该骚扰电话号码的时间戳。
[0262] 3)历史骚扰号码表中有而即时骚扰号码表中没有的骚扰电话号码,比较当前时间 与该骚扰电话号码的时间戳,如果时间差大于阈值(可以预先设定),则删除历史骚扰号码 表中的该骚扰电话号码。这样可以删除掉历史骚扰号码表中长时间未使用的骚扰电话号 码,避免骚扰电话号码更换使用者而产生的误判。
[0263] 本步骤结束后,服务器获取的历史骚扰号码表中记录的骚扰电话号码会具有相当 高的准确性。
[0264] 在步骤414中,服务器向终端提供更新后的历史骚扰号码表。
[0265] 服务器在更新历史骚扰号码表之后,可以向终端提供该更新后的历史骚扰号码 表,示例性的服务器可以主动向终端发送该历史骚扰号码表,或者由终端向服务器下载该 历史骚扰号码表。
[0266] 终端在获取了更新后的历史骚扰号码表之后,终端的用户可以根据其中记录的骚 扰电话号码以及骚扰电话号码的骚扰类型来对骚扰电话号码的来电做出进一步的处理。
[0267] 需要补充说明的是,本公开实施例提供的骚扰电话号码确定方法,通过关键词因 子的大小来判断分词结果中的词是否为关键词,达到了提高关键词的准确性的效果。
[0268] 需要补充说明的是,本公开实施例提供的骚扰电话号码确定方法,通过将目标通 话记录中出现次数最多的N个号码确定为可疑号码,达到了增加最终确定的骚扰电话号码 的准确性的效果。
[0269] 需要补充说明的是,本公开实施例提供的骚扰电话号码确定方法,通过目标通话 记录集合中各骚扰类型对应的目标通话记录在目标通话记录集合中的比例来筛选出骚扰 电话号码,达到了进一步增加确定的骚扰电话号码的准确性的效果。
[0270] 综上所述,本公开实施例提供的骚扰电话号码确定方法,通过将通话记录集合中 出现次数最多的N个陌生号码确定为可疑号码,再将可疑号码所在的目标通话记录包含的 关键词中存在骚扰特征词的可疑号码确定为骚扰电话号码,其中关键词为表征通话主题的 词,方便快捷的确定出通话记录集合包含的大量电话号码中的骚扰电话号码,达到了提高 骚扰电话号码的获取效率的效果。
[0271 ] 下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实 施例中未披露的细节,请参照本公开方法实施例。
[0272] 图5-1是根据一示例性实施例示出的一种骚扰电话号码确定装置的框图,本实施 例以该骚扰电话号码确定装置应用于图1所示实施环境中的服务器12中来举例说明,该骚 扰电话号码确定装置可以包括:
[0273] 集合获取模块510,被配置为从至少一个终端获取目标通话记录得到通话记录集 合,通话记录集合中包含有预定个数的目标通话记录,每个目标通话记录中包含有陌生号 码和至少一个关键词,至少一个关键词是终端根据与陌生号码通话的通话内容文本数据得 到的,用于表征通话内容文本数据的通话主题,陌生号码为陌生号码对应的终端的通讯录 中未存储的号码。
[0274] 号码获取模块520,被配置为从集合获取模块510获取的通话记录集合中获取N个 可疑号码,N个可疑号码为预定个数的目标通话记录中包含的陌生号码按出现次数降序排 列,排名前N位的陌生号码。
[0275] 检测模块530,被配置为检测号码获取模块520获取的每个可疑号码所在的目标 通话记录包含的关键词中是否存在预设词典记录的骚扰特征词。
[0276] 确定模块540,被配置为在检测模块530检测出的任一可疑号码所在的目标通话 记录包含的关键词中存在预设词典记录的骚扰特征词时,将所在的目标通话记录中存在骚 扰特征词的可疑号码确定为骚扰电话号码。
[0277] 综上所述,本公开实施例提供的骚扰电话号码确定装置,通过将通话记录集合中 出现次数最多的N个陌生号码确定为可疑号码,再将可疑号码所在的目标通话记录包含的 关键词中存在骚扰特征词的可疑号码确定为骚扰电话号码,其中关键词为表征通话主题的 词,方便快捷的确定出通话记录集合包含的大量电话号码中的骚扰电话号码,达到了提高 骚扰电话号码的获取效率的效果。
[0278] 图5-2是图5-1示出的骚扰电话号码确定装置中确定模块540的框图。
[0279] 可选的,确定模块540,包括:
[0280] 集合获取子模块541,被配置为获取包含第一可疑电话号码的目标通话记录组成 的目标通话记录集合,第一可疑电话号码为任一所在的目标通话记录中存在骚扰特征词的 可疑号码。
[0281] 特征词确定子模块542,被配置为根据预设的骚扰特征词与骚扰类型的对应关系, 确定集合获取子模块541获取的目标通话记录集合中第一通话记录包含的骚扰特征词的 骚扰类型,骚扰类型表征第一可疑电话号码的骚扰目的,第一通话记录为目标通话记录集 合中的任一通话记录。
[0282] 记录确定子模块543,被配置为将特征词确定子模块542确定的第一通话记录包 含的骚扰特征词的骚扰类型确定为第一通话记录的骚扰类型。
[0283] 统计子模块544,被配置为统计记录确定子模块543确定的目标通话记录集合中 每种骚扰类型对应的通话记录的数量。
[0284] 比例确定子模块545,被配置为根据统计子模块544统计的每种骚扰类型对应的 通话记录的数量与目标通话记录集合中通话记录的总数的比值,确定每种骚扰类型在目标 通话记录集合中的比例。
[0285] 号码确定子模块546,被配置为在比例确定子模块545确定的目标通话记录集合 中存在比例大于比例阈值的骚扰类型时,确定所述第一可疑电话号码为骚扰电话号码。
[0286] 如图5-3所示,其为本公开实施例示提供的另一种
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1