一种语言元素的反馈方法和设备的制作方法

文档序号:7763903阅读:236来源:国知局
专利名称:一种语言元素的反馈方法和设备的制作方法
技术领域
本发明涉及数字数据处理领域,尤其涉及一种语言元素的反馈方法和设备。
背景技术
随着互联网的普及,文本信息爆炸性增长,人们每天需要处理的文本信息也越来越多。因此,很多文本处理系统应运而生,例如文本分类系统。现有的文本分类系统是将待分类文本的语言元素特征固化在工具中,例如,当文本包含某些词语时,就属于某类,当输入新的文本时,即按照词语特征进行匹配。现有的文本处理系统根据语言元素本身处理文本信息,信息较为具体,可扩展性较差;另外针对不同的后续处理,需要修改整个处理系统,改动大,可移植性较差;因此大大影响了用户体验。

发明内容
本发明实施例提供了一种语言元素的反馈方法和设备,用于提高文本处理系统的可扩展性、可移植性,从而提高用户体验。本发明实施例提供了一种语言元素的反馈方法,包括服务器接收待识别的文本信息;所述服务器识别所述文本信息的语言元素,生成语言元素属性信息;所述服务器将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。本发明实施例提供了一种语言元素的反馈设备,包括接收模块,用于接收待识别的文本信息;识别模块,用于识别所述文本信息的语言元素,生成语言元素属性信息;发送模块,用于将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。本发明实施例提供的一种语言元素的反馈方法和设备,通过服务器提取语言元素属性并反馈给客户端,为客户端提供了更多参考信息,因此增强了文本处理系统的可扩展性;再由客户端进行过滤,因此,对于不同的后续处理,可以采用不同的规则,从而提高了文本处理系统的可移植性;最终提高了用户体验。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1所示为本发明实施例一种语言元素的反馈方法的流程图2所示为本发明实施例一种语言元素的反馈设备的结构图。
具体实施例方式图1所示为本发明实施例一种语言元素的反馈方法的流程图,本实施例包括步骤101,服务器接收待识别的文本信息;步骤102,所述服务器识别所述文本信息的语言元素,生成语言元素属性信息;步骤103,所述服务器将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。所述语言元素可以包括标点、符号、字、语素、词、词组、语块、组块、固定搭配、句子成分、子句、和/或句子等。所述语言元素属性信息包括语言元素属性,所述语言元素属性可以包括主语性质的、谓语性质的、宾语性质的、代词性的、名词性的、动词性的、修饰性的、否定意思的、重复出现的、所在位置性质的、和/或是否与所述句子的主题相关的等。所述接收待识别的文本信息可以包括从客户端接收待处理的文本信息,以及请求所述服务器识别的所述文本信息的语言元素属性;从网络爬虫接收待处理的文本信息, 以及设置的请求所述服务器识别的所述文本信息的语言元素属性。接收到文本信息和请求识别的属性后,服务器识别所述文本信息的语言元素,生成语言元素属性信息。最后所述服务器将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。例如在法律文件中,为了描述准确,通常添加很多修饰性的语言元素,例如形容词,然而在阅读者看来,这些文字对于读懂句子并没有太大帮助。因此,服务器可以在将文本发送给客户端的同时,将其中的修饰性语言元素属性信息也发送给客户端。这样,客户端可以根据自己的需求,对语言元素属性为修饰性的语言元素进行处理,例如,不进行显示等等。例如,若服务器发送修饰性的语言元素属性信息,则本专利申请文件权利要求1 “服务器接收待识别的文本信息;所述服务器识别所述文本信息的语言元素,生成语言元素属性信息;所述服务器将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。,,中的修饰性的语言元素依次可以为“待识别的”、“所述文本信息的”、“所述文本信息的”。服务器可以将这些语言元素的属性,即修饰性的,通过语言元素属性信息反馈给客户端。本发明实施例提供的一种语言元素的反馈方法,通过服务器提取语言元素属性并反馈给客户端,为客户端提供了更多参考信息,因此增强了文本处理系统的可扩展性;再由客户端进行过滤,因此,对于不同的后续处理,可以采用不同的规则,从而提高了文本处理系统的可移植性;最终提高了用户体验。图2所示为本发明实施例一种语言元素的反馈设备的结构图,本实施例包括接收模块201,用于接收待识别的文本信息;识别模块202,用于识别所述文本信息的语言元素,生成语言元素属性信息;发送模块203,用于将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。
4
本实施例用于实施图1所示实施例的方法。本发明实施例的接收模块可以用于从客户端接收待处理的文本信息,以及请求所述服务器识别的所述文本信息的语言元素属性;或从网络爬虫接收待处理的文本信息,以及设置的请求所述服务器识别的所述文本信息的语言元素属性。所述语言元素包括标点、符号、字、语素、词、词组、语块、组块、固定搭配、句子成分、子句、和/或句子。所述语言元素属性信息包括语言元素属性,所述语言元素属性包括主语性质的、谓语性质的、宾语性质的、代词性的、名词性的、动词性的、修饰性的、 否定意思的、重复出现的、所在位置性质的、和/或是否与所述句子的主题相关的。本发明实施例提供的一种语言元素的反馈设备,通过服务器提取语言元素属性并反馈给客户端,为客户端提供了更多参考信息,因此增强了文本处理系统的可扩展性;再由客户端进行过滤,因此,对于不同的后续处理,可以采用不同的规则,从而提高了文本处理系统的可移植性;最终提高了用户体验。通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述的方法。以上上述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应上述以权利要求的保护范围为准。
权利要求
1.一种语言元素的反馈方法,其特征在于,包括服务器接收待识别的文本信息;所述服务器识别所述文本信息的语言元素,生成语言元素属性信息;所述服务器将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。
2.如权利要求1所述的方法,其特征在于,所述接收待识别的文本信息包括从客户端接收待处理的文本信息,以及请求所述服务器识别的所述文本信息的语言元素属性;或从网络爬虫接收待处理的文本信息,以及设置的请求所述服务器识别的所述文本信息的语言元素属性。
3.如权利要求1或2所述的方法,其特征在于,所述语言元素包括标点、符号、字、语素、词、词组、语块、组块、固定搭配、句子成分、子句、和/或句子。
4.如权利要求1或2所述的方法,其特征在于,所述语言元素属性信息包括语言元素属性,所述语言元素属性包括主语性质的、谓语性质的、宾语性质的、代词性的、名词性的、动词性的、修饰性的、否定意思的、重复出现的、所在位置性质的、和/或是否与所述句子的主题相关的。
5.一种语言元素的反馈设备,其特征在于,包括接收模块,用于接收待识别的文本信息;识别模块,用于识别所述文本信息的语言元素,生成语言元素属性信息;发送模块,用于将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。
6.如权利要求5所述的设备,其特征在于,所述接收模块用于从客户端接收待处理的文本信息,以及请求所述服务器识别的所述文本信息的语言元素属性;或从网络爬虫接收待处理的文本信息,以及设置的请求所述服务器识别的所述文本信息的语言元素属性。
7.如权利要求5或6所述的设备,其特征在于,所述语言元素包括标点、符号、字、语素、词、词组、语块、组块、固定搭配、句子成分、子句、和/或句子。
8.如权利要求5或6所述的设备,其特征在于,所述语言元素属性信息包括语言元素属性,所述语言元素属性包括主语性质的、谓语性质的、宾语性质的、代词性的、名词性的、动词性的、修饰性的、否定意思的、重复出现的、所在位置性质的、和/或是否与所述句子的主题相关的。
全文摘要
本发明实施例提供的一种语言元素的反馈方法和设备,包括服务器接收待识别的文本信息;所述服务器识别所述文本信息的语言元素,生成语言元素属性信息;所述服务器将所述语言元素和所述语言元素属性信息发送给客户端,以使所述客户端对所述文本信息的语言元素进行过滤。本发明实施例提供的一种语言元素的反馈方法和设备,通过服务器提取语言元素属性并反馈给客户端,为客户端提供了更多参考信息,因此增强了文本处理系统的可扩展性;再由客户端进行过滤,因此,对于不同的后续处理,可以采用不同的规则,从而提高了文本处理系统的可移植性;最终提高了用户体验。
文档编号H04L29/06GK102455994SQ201010528068
公开日2012年5月16日 申请日期2010年10月27日 优先权日2010年10月27日
发明者王博 申请人:王博
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1