处理文本信息的方法及装置的制造方法

文档序号:8299011阅读:305来源:国知局
处理文本信息的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及计算机通讯技术,尤其涉及一种处理文本信息的方法及装置。
【背景技术】
[0002] 随着计算机及网络通信技术的迅速发展,人们越来越多地通过网络进行文本信息 交流。然而,由于文本信息可以非常容易到达用户手机等用户终端,因此常常被利用作为广 告推广的渠道,某些不法者甚至利用文本信息发送诈骗、色情等垃圾信息,严重影响和骚扰 用户的正常生活。
[0003] 现有的垃圾文本信息过滤技术,主要是通过关键字过滤与黑白名单过滤的方法对 垃圾文本信息进行过滤。然而,基于关键字的垃圾文本信息过滤方法,由于关键字很难包含 所有非法信息,并且恶意用户可通过诸如:在文本信息内容中添加大量的字符、标点符号等 干扰字符的方式来回避关键字,从而避免被过滤。而基于黑白名单过滤的方法,由于是根据 用户来处理文本信息,假如文本信息来自白名单中的用户,则即使该文本信息内容中包含 垃圾信息,也不会被过滤。
[0004] 因此,现有的垃圾文本信息过滤技术的过滤准确性不高,缺乏效率。

【发明内容】

[0005] 有鉴于此,本发明提供一种处理文本信息的方法及装置,可提高垃圾文本信息过 滤的准确性及效率。
[0006] -种处理文本信息的方法,包括:获取文本信息并提取所述文本信息内包括的文 字字符;从所述文字字符中提取符合预定规则的目标字符;根据所述目标字符,计算所述 文本信息的过滤指数;以及当所述过滤指数满足预定条件时,对所述文本信息执行与所述 预定条件对应的操作。
[0007] -种处理文本信息的装置,包括:文字字符提取模块,用于获取文本信息并提取所 述文本信息内包括的文字字符;目标字符提取模块,用于从所述文字字符提取模块提取的 所述文字字符中提取符合预定规则的目标字符;计算模块,用于根据所述目标字符提取模 块提取的所述目标字符,计算所述文本信息的过滤指数;以及处理模块,用于当所述计算 模块计算的所述过滤指数满足预定条件时,对所述文本信息执行与所述预定条件对应的操 作。
[0008] 本发明实施例提供的处理文本信息的方法及装置,通过提取文本信息内包括的文 字字符,从文字字符中提取符合预定规则的目标字符,根据目标字符计算文本信息的过滤 指数,当过滤指数满足预定条件时,对文本信息执行与预定条件对应的操作,由于是根据文 本信息中符合预定规则的目标字符来计算过滤指数,因此可解决现有技术中因非法用户在 文本信息中添加大量的目标字符而导致的垃圾文本信息无法被过滤的问题,从而可提高垃 圾文本信息过滤的准确性及效率。
[0009] 为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例, 并配合所附图式,作详细说明如下。
【附图说明】
[0010] 图1为本发明实施例提供的在用户终端内进行处理文本信息的方法及装置的应 用环境图。
[0011] 图2示出了一种用户终端的结构框图。
[0012] 图3为本发明第一实施例提供的在用户终端内进行处理文本信息的方法的流程 图。
[0013] 图4为本发明第二实施例提供的在用户终端内进行处理文本信息的方法的流程 图。
[0014] 图5为本发明第三实施例提供的处理文本信息的装置的结构示意图。
[0015] 图6为图5的装置的存储环境示意图。
[0016] 图7为本发明第四实施例提供的处理文本信息的装置的结构示意图。
[0017] 图8为本发明第四实施例提供的处理文本信息的装置中部分模块的结构示意图。
[0018] 图9为本发明第四实施例提供的处理文本信息的装置中部分模块的结构示意图。
【具体实施方式】
[0019] 为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合 附图及较佳实施例,对依据本发明的【具体实施方式】、结构、特征及其功效,详细说明如后。
[0020] 本发明实施例所提供的处理文本信息的方法及装置可应用于如图1所示的应用 环境中,实现对垃圾文本信息的有效过滤。如图1所示,多个用户终端100之间可通过利用 基站200转发短信的方式,完成文本信息的收发。可以理解的,基站200可替代的也可为服 务器,多个用户终端1〇〇之间可以通过服务器完成文本信息的收发。
[0021] 图2示出了一种用户终端的结构框图。用户终端可以包括移动电话(如:智能手 机)以及其他具有用户终端功能的计算机,例如,可以是平板电脑、PDA(PersonalDigital Assistant,掌上电脑)等便携式、袖珍式、手持式、计算机内置的或车载的移动装置、以及台 式计算机等非移动装置等等。
[0022] 如图1所示,用户终端100包括存储器102、存储控制器104, 一个或多个(图中仅 示出一个)处理器106、外设接口 108、射频模块110、定位模块112、图像采集设备114、音频 模块116、触控屏幕118以及按键模块120。这些组件通过一条或多条通讯总线/信号线 122相互通讯。
[0023] 可以理解,图1所示的结构仅为示意,用户终端100还可包括比图1中所示更多或 者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件 或其组合实现。
[0024] 存储器102可用于存储软件程序以及模块,如本发明实施例中的在用户终端内进 行处理文本信息的方法及装置对应的程序指令/模块,处理器102通过运行存储在存储器 104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的在用户终 端内进行处理文本信息的方法。
[0025] 存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个 磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器102可进一步 包括相对于处理器106远程设置的存储器,这些远程存储器可以通过网络连接至用户终端 100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处 理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。
[0026] 外设接口 108将各种输入/输入装置耦合至CPU以及存储器102。处理器106运 行存储器102内的各种软件、指令以执行用户终端100的各种功能以及进行数据处理。
[0027] 在一些实施例中,外设接口108,处理器106以及存储控制器104可以在单个芯片 中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
[0028] 射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而 与通讯网络或者其他设备进行通讯。射频模块110可包括各种现有的用于执行这些功能的 电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM) 卡、存储器等等。射频模块110可与各种网络如互联网、企业内部网、无线网络进行通讯或 者通过无线网络与其他设备进行通讯。上述的无线
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1