敏感词替换方法和装置的制造方法

文档序号:9432582阅读:516来源:国知局
敏感词替换方法和装置的制造方法
【技术领域】
[0001]本发明的实施方式涉及通信技术领域,更具体地,本发明的实施方式涉及一种敏感词替换方法和装置。
【背景技术】
[0002]本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]互联网的出现极大地促进了各种信息内容在用户之间的发布和传播。例如,网络即时通信系统因其可以方便、快捷地完成客户端之间的沟通而被越来越多的人们所使用。另外,微博和论坛也具备拥有大量客户群体、发布和收看信息方便、影响面较大等特点。因此,常常会有人利用各种互联网工具大量发送包括“敏感词”的文本信息。例如,所述敏感词可以包括不文明词汇、涉及到国家安全等的敏感词汇等。
[0004]目前,对目标文本的敏感度的识别大多通过人工方式来进行,或者通过人工建立敏感词表,并通过机器基于该敏感词表对目标文本进行匹配查询,以确定目标文本的敏感度。在此情况下,当我们在向互联网发布内容的时候,一旦在文本中夹杂了敏感词,那么一般将会出现下面的两种情况。
[0005]—种情况是系统直接禁止用户提交目标文本并且向用户提示目标文本中夹杂了敏感词。
[0006]另一种情况是系统允许用户提交目标文本,但是在将目标文本真正展示到互联网之前,会进入“人工审核环节”,以人工审核的方式来确认文本内是否真的出现了由系统判断是敏感词的这些词。如果人工审核认为目标文本中包含有敏感词,则不允许将这篇文本发布到互联网,相反地,如果人工审核认为其不包含敏感词,则将这篇文本展示到互联网上。

【发明内容】

[0007]但是,由于在现有技术中,一旦判断出目标文本中包含了敏感词,将绝对地禁止用户将该文本提交到系统或禁止系统将该文本发布到互联网,也就是说,用户将没有任何可能发布自己的想法,所以这导致破坏了用户的发布积极性,降低了用户的参与感。
[0008]因此,在现有技术中,如何改善在发布内容时的用户体验是非常令人烦恼的过程。
[0009]为此,非常需要一种改进的敏感词替换方法和装置,以使得用户在向互联网发布内容的时候,即使在文本中夹杂了敏感词,也能通过对敏感词进行适当的处理来充分保护用户的发布积极性,提升用户的参与感。
[0010]在本上下文中,本发明的实施方式期望提供一种敏感词替换方法和装置。
[0011]在本发明实施方式的第一方面中,提供了一种敏感词替换方法,包括:接收目标文本;根据敏感词库在所述目标文本中查找敏感词;根据敏感词替换规则来确定与所述敏感词对应的非敏感词,所述非敏感词具有比所述敏感词更低的敏感度并且用于表达与所述敏感词相同或相近的含义;以及将所述敏感词替换为所述非敏感词。
[0012]在本发明实施方式的第二方面中,提供了一种敏感词替换装置,包括:目标文本接收单元,用于接收目标文本;敏感词查找单元,用于根据敏感词库在所述目标文本中查找敏感词;非敏感词确定单元,用于根据敏感词替换规则来确定与所述敏感词对应的非敏感词,所述非敏感词具有比所述敏感词更低的敏感度并且用于表达与所述敏感词相同或相近的含义;以及非敏感词替换单元,用于将所述敏感词替换为所述非敏感词。
[0013]在本发明实施方式的第三方面中,提供了一种敏感词替换装置,包括:存储单元和处理单元,在所述存储单元上存储有计算机指令,当所述处理单元执行所述计算机指令时,执行以下步骤:接收目标文本;根据敏感词库在所述目标文本中查找敏感词;根据敏感词替换规则来确定与所述敏感词对应的非敏感词,所述非敏感词具有比所述敏感词更低的敏感度并且用于表达与所述敏感词相同或相近的含义;以及将所述敏感词替换为所述非敏感
Τ.κ| ο
[0014]在本发明实施方式的第四方面中,提供了一种计算机程序产品,包括:程序代码,当在一个或多个计算装置上执行所述程序代码时,所述程序代码用于执行以下步骤:接收目标文本;根据敏感词库在所述目标文本中查找敏感词;根据敏感词替换规则来确定与所述敏感词对应的非敏感词,所述非敏感词具有比所述敏感词更低的敏感度并且用于表达与所述敏感词相同或相近的含义;以及将所述敏感词替换为所述非敏感词。
[0015]根据本发明实施方式的敏感词替换方法和装置,可以对文本中的敏感词进行有意思的处理,以对该敏感词去敏感化。这样做的好处是:在用户方面,降低了用户的负能量,有利于社会和谐;在系统方面,降低了 “人工审核”这类工作的工作量;在文化方面,体现了软件的人文关怀和社会和谐。因此,本发明的方法使得用户在向互联网发布内容的时候,即使在文本中夹杂了敏感词,也能通过对敏感词进行适当的处理来充分保护用户的发布积极性,提升用户的参与感。
【附图说明】
[0016]通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
[0017]图1示意性地示出了本发明的实施方式的一个示例性应用场景的框架示意图;
[0018]图2示意性地示出了本发明的实施方式中敏感词替换方法的一实施例的流程图;
[0019]图3示意性地示出了本发明的实施方式中确定非敏感词步骤的一实施例的流程图;
[0020]图4示意性地示出了本发明的实施方式中确定非敏感词步骤的第一示例的流程图;
[0021]图5示意性地示出了本发明的实施方式中确定非敏感词步骤的第二示例的流程图;
[0022]图6示意性地示出了本发明的实施方式中确定非敏感词步骤的第三示例的流程图;
[0023]图7示意性地示出了本发明的实施方式中确定非敏感词步骤的又一实施例的流程图;
[0024]图8示意性地示出了根据本发明实施方式的敏感词替换装置的示意图。
[0025]在附图中,相同或对应的标号表不相同或对应的部分。
【具体实施方式】
[0026]下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0027]本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
[0028]根据本发明的实施方式,提出了一种敏感词替换方法和装置。
[0029]在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
[0030]下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
[0031]发曰月概沐
[0032]本发明人发现,在现有技术中,一旦判断出目标文本中包含了敏感词,将绝对地禁止用户将该文本提交到系统或禁止系统将该文本发布到互联网,也就是说,用户没有任何方法表达自己的想法,显然,这破坏了用户的发布积极性,降低了用户的参与感。
[0033]基于本发明人的上述发现的分析,本发明的基本设计思想是:在接收到用户提交的目标文本之后,一旦检测到在该目标文本中包括敏感词,则可以将该敏感词替换为具有相同或相近含义的非敏感词,然后再继续进行内容发布。
[0034]在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
[0035]应用场景总览
[0036]图1示意性地示出了本发明的实施方式的一个示例性应用场景的框架示意图。
[0037]参考图1,本发明实施例可以应用在如图1所示的内容发布系统,该内容发布系统包括服务器101、客户端102等。
[0038]例如,用户可以通过用户设备上的用户界面交互设备(例如,客户端102)与用于内容发布的服务器101进行交互。本领域技术人员可以理解,图1所示的框架示意图仅是本发明的实施方式可以在其中得以实现的一个示例。本发明实施方式的适用范围不受到该框架任何方面的限制。例如,本发明的实施方式同样可以应用于单机应用场景中,也就是,仅依靠客户端102即可完成应用,而无需与服务器101进行交互。
[0039]需要注意的是,此处的用户设备可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线或无线连接(例如,Wi_F1、LAN、同轴电缆、蜂窝网络等)与服务器101交互的任何设备。包括但不限于:现有的、正在研发的或将来研发的、台式计算机、膝上型计算机、移动终端(包括智能手机、非智能手机、各种平板电脑)等。
[0040]还需要注意的是,此处的服务器101仅是现有的、正在研发的或将来研发的、能够向用户提供网络发布应用的设备的一个示例。本发明的实施方式在此方面不受任何限制。
[0041]需要注意的是,本发明实施方式的方法可以由客户端102执行,同样地,也可以由服务器101执行,当然也可以部分由客户端102执行、部分由服务器101执行。显然,本发明在执行主体方面不受限制,只要执行了本发明实施方式所公开的方法即可。
[0042]示例件方法
[00
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1