骚扰电话号码确定方法、装置和系统的制作方法_2

文档序号:9380543阅读:来源:国知局
包含的关键词中是否存在预设词典记录 的骚扰特征词;
[0086] 若任一可疑号码所在的目标通话记录包含的关键词中存在预设词典记录的骚扰 特征词,将所在的目标通话记录中存在骚扰特征词的可疑号码确定为骚扰电话号码。
[0087] 第六方面,提供一种骚扰电话号码确定装置,该装置包括:
[0088] 处理器;
[0089] 用于存储处理器的可执行指令的存储器;
[0090] 其中,处理器被配置为:
[0091] 获取与陌生号码通话的通话语音数据和通话记录,通话记录中包含有陌生号码, 陌生号码为通讯录中未存储的号码;
[0092] 将通话语音数据转化为通话内容文本数据;
[0093] 获取通话内容文本数据的至少一个关键词,至少一个关键词为表征通话内容文本 数据的通话主题的词;
[0094] 根据至少一个关键词和通话记录生成目标通话记录,目标通话记录中包含有陌生 号码和至少一个关键词;
[0095] 将目标通话记录提供给服务器,服务器用于根据目标通话记录中的陌生号码和至 少一个关键词确定陌生号码是否为骚扰电话号码。
[0096] 第七方面,提供一种骚扰电话号码确定系统,该系统包括:服务器和终端,
[0097] 服务器包括第三方面提供的骚扰电话号码确定装置;
[0098] 终端包括第四方面提供的骚扰电话号码确定装置。
[0099] 第八方面,提供一种骚扰电话号码确定系统,该系统包括:服务器和终端,
[0100] 服务器包括第五方面提供的骚扰电话号码确定装置;
[0101] 终端包括第六方面提供的骚扰电话号码确定装置。
[0102] 本公开的提供的技术方案可以包括以下有益效果:
[0103] 本公开提供的骚扰电话号码确定方法、装置和系统,通过将通话记录集合中出现 次数最多的N个陌生号码确定为可疑号码,再将可疑号码所在的目标通话记录包含的关键 词中存在骚扰特征词的可疑号码确定为骚扰电话号码,其中关键词为表征通话主题的词, 方便快捷的确定出通话记录集合包含的大量电话号码中的骚扰电话号码,达到了提高骚扰 电话号码的获取效率的效果。
[0104] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本 公开。
【附图说明】
[0105] 为了更清楚地说明本公开的实施例,下面将对实施例描述中所需要使用的附图作 简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通 技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0106] 图1是本公开各个实施例提供的骚扰电话号码确定方法所涉及的实施环境的示 意图;
[0107] 图2是根据一示例性实施例示出的一种骚扰电话号码确定方法的流程图;
[0108] 图3是根据一示例性实施例示出的另一种骚扰电话号码确定方法的流程图;
[0109] 图4-1是根据一示例性实施例示出的另一种骚扰电话号码确定方法的流程图;
[0110] 图4-2是图4-1示出的骚扰电话号码确定方法中获取关键词的流程图;
[0111] 图4-3是图4-1示出的骚扰电话号码确定方法中获取关键词因子的流程图;
[0112] 图4-4是图4-1示出的骚扰电话号码确定方法中确定骚扰电话号码的流程图;
[0113] 图5-1是根据一示例性实施例示出的一种骚扰电话号码确定装置的框图;
[0114] 图5-2是图5-1示出的骚扰电话号码确定装置中确定模块的框图;
[0115] 图5-3是本公开实施例提供的另一种骚扰电话号码确定装置的框图;
[0116] 图6-1是根据一示例性实施例示出的另一种骚扰电话号码确定装置的框图;
[0117] 图6-2是图6-1示出的骚扰电话号码确定装置中的关键词获取模块的框图;
[0118] 图7是根据一示例性实施例示出的一种骚扰电话号码确定装置的框图;
[0119] 图8是根据一示例性实施例示出的一种骚扰电话号码确定装置的框图;
[0120] 图9是根据一示例性实施例示出的一种骚扰电话号码确定系统的框图;
[0121] 图10是根据一示例性实施例示出的一种骚扰电话号码确定系统的框图。
[0122] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施 例,并与说明书一起用于解释本公开的原理。
【具体实施方式】
[0123] 为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进 一步地详细描述,显然,所描述的实施例仅仅是本公开一部份实施例,而不是全部的实施 例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其它实施例,都属于本公开保护的范围。
[0124] 图1是本公开各个实施例提供的骚扰电话号码确定方法所涉及的实施环境的示 意图,该实施环境可以包括:终端11和服务器12。
[0125] 终端11可以是手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0126] 服务器12可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一 个云计算服务中心。
[0127] 终端11和服务器12之间可以建立有有线连接或无线连接。此外,本实施环境不 对终端11的数量作出限制。
[0128] 图2是根据一示例性实施例示出的一种骚扰电话号码确定方法的流程图,本实施 例以该骚扰电话号码确定方法应用于图1所示实施环境中的服务器12来举例说明,该骚扰 电话号码确定方法可以包括如下几个步骤:
[0129] 在步骤201中,从至少一个终端获取目标通话记录得到通话记录集合,通话记录 集合中包含有预定个数的目标通话记录,每个目标通话记录中包含有陌生号码和至少一个 关键词,至少一个关键词是终端根据与陌生号码通话的通话内容文本数据得到的,用于表 征通话内容文本数据的通话主题,陌生号码为陌生号码对应的终端的通讯录中未存储的号 码。
[0130] 在步骤202中,获取通话记录集合中N个可疑号码,N个可疑号码为预定个数的目 标通话记录中包含的陌生号码按出现次数降序排列,排名前N位的陌生号码。
[0131] 在步骤203中,检测每个可疑号码所在的目标通话记录包含的关键词中是否存在 预设词典记录的骚扰特征词。
[0132] 在步骤204中,若任一可疑号码所在的目标通话记录包含的关键词中存在预设词 典记录的骚扰特征词,将所在的目标通话记录中存在骚扰特征词的可疑号码确定为骚扰电 话号码。
[0133] 综上所述,本公开实施例提供的骚扰电话号码确定方法,通过将通话记录集合中 出现次数最多的N个陌生号码确定为可疑号码,再将可疑号码所在的目标通话记录包含的 关键词中存在骚扰特征词的可疑号码确定为骚扰电话号码,其中关键词为表征通话主题的 词,方便快捷的确定出通话记录集合包含的大量电话号码中的骚扰电话号码,达到了提高 骚扰电话号码的获取效率的效果。
[0134] 图3是根据一示例性实施例示出的另一种骚扰电话号码确定方法的流程图,本实 施例以该骚扰电话号码确定方法应用于图1所示实施环境中的终端11来举例说明,该骚扰 电话号码确定方法可以包括如下几个步骤:
[0135] 在步骤301中,获取与陌生号码通话的通话语音数据和通话记录,通话记录中包 含有陌生号码,陌生号码为通讯录中未存储的号码。
[0136] 在步骤302中,将通话语音数据转化为通话内容文本数据。
[0137] 在步骤303中,获取通话内容文本数据的至少一个关键词,至少一个关键词为表 征通话内容文本数据的通话主题的词。
[0138] 在步骤304中,根据至少一个关键词和通话记录生成目标通话记录,目标通话记 录中包含有陌生号码和至少一个关键词。
[0139] 在步骤305中,将目标通话记录提供给服务器,服务器用于根据目标通话记录中 的陌生号码和至少一个关键词确定陌生号码是否为骚扰电话号码。
[0140] 综上所述,本公开实施例提供的骚扰电话号码确定方法,通过获取目标通话记录, 该目标通话记录中包含有陌生号码和至少一个关键词,并将该目标通话记录提供给服务 器,服务器用于根据该目标通话记录中的陌生号码和至少一个关键词来确定该陌生号码是 否为骚扰电话号码,达到了提高骚扰电话号码获取效率的效果。
[0141] 图4-1是根据一示例性实施例示出的另一种骚扰电话号码确定方法的流程图,本 实施例以该骚扰电话号码确定方法应用于图1所示实施环境中来举例说明,该骚扰电话号 码确定方法可以包括如下几个步骤:
[0142] 在步骤401中,终端获取与陌生号码通话的通话语音数据和通话记录,该通话记 录中包含有陌生号码,陌生号码为通讯录中未存储的号码。
[0143] 每当终端开始通话时,可以根据通讯录来检测通话对端的电话号码是否为陌生号 码,在通话对端的电话号码为陌生号码时,终端可以同步获取通话语音数据,并生成一个通 话记录,该通话记录中可以记录有通话对端的陌生号码和该终端自身的电话号码,或者该 通话记录中可以仅记录通话对端的陌生号码。
[0144] 在步骤402中,终端将通话语音数据转化为通话内容文本数据。
[0145] 终端在获取通话语音数据后,可以将通话语音数据转化为文本格式的通话内 容文本数据并存储,该文本格式可以为txt或ASCII (American Standard Code for Information Interchange,美国标准信息交换代码)等。
[0146] 示例性的,可以通过自动语音识别技术(Automatic Speech Recognition)将获取 的通话语音数据转化为通话内容文本数据,该自动语音识别技术可以参考现有技术,本公 开实施例不再赘述。
[0147] 可选的,本步骤可以和步骤401同时执行,即终端在与陌生号码通话时,获取与陌 生号码的通话语音数据,并实时的将语音数据转化为通话内容文本数据,这样在通话结束 时终端就可以获取完整的通话内容文本数据。
[0148] 在步骤403中,终端获取通话内容文本数据的至少一个关键词,该至少一个关键 词为表征该通话内容文本数据的通话主题的词。
[0149] 在终端获取了通话内容文本数据之后,终端可以对该通话内容文本数据进行分 析,并获取其中可以表征通话主题的词。示例性的,获取的通话内容文本数据是讨论某一个 明星的一段话,则终端获取的关键词可能是该明星的姓名。
[0150] 如图4-2所示,本步骤分可以为下面4个子步骤:
[0151] 在子步骤4031中,终端对内容文本数据进行分词处理得到包含有至少一个词的 分词结果。
[0152] 终端获取的通话内容文本数据通常包含多个完整的语句,终端想要从中获取关键 词,首先需要对该通话内容文本数据进行分词处理,将其中包含的完整的语句都拆分成一 个个词。
[0153] 其中,进行分词处理的方法可以包括基于字典、词库匹配的分词方法、基于词频度 统计的分词方法和基于知识理解的分词方法这三大类,每一个大类又可以包括多种分词算 法,比如基于字典、词库匹配的分词方法可以包括最大正向匹配法、最大反向匹配法和最短 路径分词法等等,又比如基于词频度统计的分词方法中可以包括建立基于统计的分词模 型,并根据该分词模型来进行分词处理的算法。可选的,本公开实施例可以从该三大类分词 处理的方法中任选至少一种分词算法来对获取的通话内容文本数据进行分词处理。
[0154] 在子步骤4032中,终端获取分词结果中每个词的关键词因子。
[0155] 终端在获取了通话内容文本数据的分词结果之后,可以获取该分词结果中每个词 的关键词因子,该关键词因子可以正相关于每个词的主题相关度,该主题相关度用于指示 一个词与通话内容文本数据的通话主题相关的程度,即一个词的关键词因子越大,则该词 与通话内容文本数据的通话主题的相关程度越高。
[0156] 如图4-3所示,本步骤可以包括下面5个子步骤:
[0157] 在子步骤4032a中,终端根据预设类型词典获取分词结果中每个词的类型,该类 型用于表征每个词的特征。
[0158] 终端在获取了通话内容文本数据的分词结果之后,首先可以根据预设的类型词典 来获取该分词结果中每个词的类型,该类型可以用于表征每个词的特征。示例性的,该类型 可以包括骚扰特征词,专有名词,人物姓名,日期,语气词,人称代词,修饰词和地名等等,预 设类型词典中可以记录有大部分常用词汇的类型。
[0159] 在子步骤4032b中,终端去除分词结果中类型为语气词、人称代词和修饰词的词 得到处理后的分词结果。
[0160] 终端在获取了分词结果中每个词的类型之后,可以去除其中类型为语气词、人称 代
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1