一种文字处理方法和装置与流程

文档序号:12063645阅读:202来源:国知局
一种文字处理方法和装置与流程

本发明涉及计算机技术领域,尤指一种文字处理方法和装置。



背景技术:

随着计算机的发展和普及,以及对节能和环保提出的更高要求,用户的阅读形式逐渐由纸质文件变化为电子文件,通常地,用户可以通过计算机或智能终端查看文件,并且在阅读文件的过程中可以对文件中的文本进行实时查询,具有比纸质文件更便捷的查询方式。目前,在查询电子文件中的文本内容时,通常由用户手动选择一些关键词作为查询的对象,终端设备的查询操作具体针对用户选择的关键词,例如可以是一个词组,英文单词或一组数字。

显然地,用户选择的文本可能存在多种词义或词性,终端设备的查询操作很难获取到该文本的准确解释,因此,现有技术中查询文本的方式,由于终端设备针对用户选择的关键词进行查询,而导致查询结果不准确的问题。



技术实现要素:

为了解决上述技术问题,本发明提供了一种文字处理方法和装置,以解决现有技术中查询文本的方式,由于终端设备针对用户选择的关键词进行查询,而导致查询结果不准确的问题。

第一方面,本发明提供一种文字处理方法和装置,包括:

根据用户选择的第一文本信息在文件中的位置,获取待分析的第二文本信息,所述第二文本信息包括所述第一文本信息和与所述第一文本信息相邻的扩充文本信息;

在所述第二文本信息中对所述第一文本信息进行语义分析,并获取所述第一文本信息的分析结果。

在第一方面的第一种可能的实现方式中,所述在所述第二文本信息中对所述第一文本信息进行语义分析之前,还包括:

对比所述第一文本信息和所述第二文本信息,对所述第一文本信息进行字符类型分析;

判断所述第一文本信息与所述扩充文本信息的字符类型是否相同;

当所述第一文本信息与所述扩充文本信息的字符类型不同时,查询所述第一文本信息的解释或者提示用户对所述第一文本信息进行相应的操作;

当所述第一文本信息与所述扩充文本信息的字符类型相同时,在所述第二文本信息中对所述第一文本信息进行语义分析,并获取所述第一文本信息的分析结果。

在第一方面的第二种可能的实现方式中,所述在所述第二文本信息中对所述第一文本信息进行语义分析,包括:

在所述第二文本信息中对所述第一文本信息进行语义分析,并判断所述用户选择的第一文本信息的定位是否准确;

当判断出所述用户选择的第一文本信息的定位准确时,获取所述第一文本信息的分析结果;

当判断出所述用户选择的第一文本信息的定位不准确时,对所述第一文本信息进行重新选择,并获取对所述重新选择的第一文本信息的分析结果。

根据第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述重新选择的第一文本信息包括:所述用户选择的部分第一文本信息;或者,所述用户选择的部分第一文本信息和部分所述扩充文本信息;或者,所述用户选择的第一文本信息和部分所述扩充文本信息。

根据第一方面、第一方面的第一种到第三种可能的实现方式中任意一种,在第四种可能的实现方式中,所述获取所述分析结果之后,还包括:

在图形用户界面GUI上显示所述分析结果,并指示用户对所述分析结果进行相应地操作。

第二方面,本发明提供一种文字处理装置,包括:

获取模块,用于根据用户选择的第一文本信息在文件中的位置,获取待 分析的第二文本信息,所述第二文本信息包括所述第一文本信息和与所述第一文本信息相邻的扩充文本信息;

语义分析模块,用于在所述获取模块获取的第二文本信息中对所述第一文本信息进行语义分析,并获取所述第一文本信息的分析结果。

在第二方面的第一种可能的实现方式中,所述文字处理装置还包括:字符分析模块,用于在所述语义分析模块在第二文本信息中对所述第一文本信息进行语义分析之前,对比所述第一文本信息和所述第二文本信息,对所述第一文本信息进行字符类型分析;

判断模块,用于判断所述第一文本信息与所述扩充文本信息的字符类型是否相同;

所述字符分析模块,还用于在所述判断模块判断出第一文本信息与所述扩充文本信息的字符类型不同时,查询所述第一文本信息的解释或者提示用户对所述第一文本信息进行相应的操作;

所述语义分析模块,具体用于在所述判断模块判断出第一文本信息与所述扩充文本信息的字符类型相同时,在所述第二文本信息中对所述第一文本信息进行语义分析,并获取所述第一文本信息的分析结果。

在第二方面的第二种可能的实现方式中,所述文字处理装置还包括:判断模块,用于在所述语义分析模块在第二文本信息中对所述第一文本信息进行语义分析的过程中,判断所述用户选择的第一文本信息的定位是否准确;

所述语义分析模块,还用于在所述判断模块判断出所述用户选择的第一文本信息的定位准确时,获取所述第一文本信息的分析结果;

所述语义分析模块,还用于在所述判断模块判断出所述用户选择的第一文本信息的定位不准确时,对所述第一文本信息进行重新选择,并获取对所述重新选择的第一文本信息的分析结果。

根据第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述语义分析模块重新选择的第一文本信息包括:所述用户选择的部分第一文本信息;或者,所述用户选择的部分第一文本信息和部分所述扩充文本信息;或者,所述用户选择的第一文本信息和部分所述扩充文本信息。

根据第二方面、第二方面的第一种到第三种可能的实现方式中任意一种,在第四种可能的实现方式中,所述文字处理装置还包括:显示模块,用于在所述语义分析模块获取所述分析结果之后,在图形用户界面GUI上显示所述分析结果,并指示用户对所述分析结果进行相应地操作。。

本发明提供的文字处理方法和装置,通过用户选择的第一文本信息结合该第一文本信息在文件中的具体位置中,获取待分析的第二文本信息,该第二文本信息包括上述用户选择的第一文本信息和扩充文本信息,从而在第二文本信息中对该的第一文本信息进行语义分析,以获取分析结果;本发明提供的方法将对单独文本信息的查询扩展为在语境中进行的具体分析,可以得到文本的具体解释、词性,在语句中的成分等特征,具有更全面和准确的分析结果;解决了现有技术中查询文本的方式,由于终端设备针对用户选择的关键词进行查询,而导致查询结果不准确的问题。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为本发明实施例提供的一种文字处理方法的流程图;

图2为本发明实施例提供的另一种文字处理方法的流程图;

图3为本发明实施例提供的又一种文字处理方法的流程图;

图4为本发明实施例提供的一种文字处理装置的结构示意图;

图5为本发明实施例提供的另一种文字处理装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机 系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1为本发明实施例提供的一种文字处理方法的流程图。本实施例提供的文字处理方法适用于在电子文件中进行文本查询的情况中,该方法可以由文字处理装置来执行,该文字处理装置通常以硬件和软件的方式来实现,通常可以集成在终端设备的处理器中,该终端设备例如为私人计算机(Personal Computer,简称为:PC)或智能终端等。如图1所示,本实施例的方法可以包括:

S110,根据用户选择的第一文本信息在电子文件中的位置,获取待分析的第二文本信息,该第二文本信息包括第一文本信息和与第一文本信息相邻的扩充文本信息。

本实施例的应用场景例如为:用户通过智能终端阅读电子文件,该电子文件例如可以是Word,Excel或PDF等格式的,再例如,还可以应用于用户通过智能终端对短信、即时消息等文字信息的处理中,该智能终端例如可以为具有触摸屏的终端,用户通过触摸操作选择了电子文件中的第一文本信息,该第一文本信息例如为一个词组。现有技术中用户在选择了词组后,通常直接指定查询的方式,比如查词典,搜索网络查询百科知识等。

本实施例提供的方法中,并不直接对用户选择的第一文本信息进行查询,而是根据该第一文本信息在用户当前阅读的电子文件中的位置向左右扩充,即可以结合第一文本信息的上下文内容获取待分析的第二文本信息,向左右扩充的内容可以为与该第一文本信息相邻的内容,本发明各实施例中将上述向左右扩充的内容定义为扩充文本信息;在具体实现中,例如以文件中的出现的标点符号为界限作为执行添加扩充文本信息的标准,将第一文本信息的左右文本作为扩充文本信息,并与该第一文本信息结合构成待分析的第二文本信息。

S120,在第二文本信息中对第一文本信息进行语义分析,并获取该第一文本信息的分析结果。

通常的,一个词组在不同的句子中可以为动词或名称,在不同的语境中可以为褒义词或贬义词,并且无论是中文,还是英文,一个单独出现的词组 可以有多种解释。例如采用现有技术的查询方式,虽然可以获取该词组的多种解释,但不能准确的判断该词组在文件中的意思,如果需要得到该词组在文件中的意思,还需要用户自身结合语境进行主观判断,或者进行一步的与智能终端进行命令提示操作,选择一个适合的解释。

在本实施例中,分析的对象并不局限于用户所选择的文本内容,同时需要结合用户选择的第一文本信息和上下文的语义,通过将用户选择的第一文本信息放置于具体的语境中进行分析,可以得到适合语境的分析结果,该分析结果例如包括:该词组的词性,解释,以及在语句的成分,比如作主语、谓语或宾语等。显然地,本实施例提供的方法可以得到对第一文本信息更全面和准确的分析。

本实施例所提供的文本处理方法,通过用户选择的第一文本信息结合该第一文本信息在文件中的具体位置中,获取待分析的第二文本信息,该第二文本信息包括上述用户选择的第一文本信息和扩充文本信息,从而在第二文本信息中对该的第一文本信息进行语义分析,以获取分析结果;本实施例提供的方法将对单独文本信息的查询扩展为在语境中进行的具体分析,可以得到文本的具体解释、词性,在语句中的成分等特征,具有更全面和准确的分析结果;解决了现有技术中查询文本的方式,由于终端设备针对用户选择的关键词进行查询,而导致查询结果不准确的问题。

可选地,在得到上述分析结果后,本实施例提供的方法还可以进行智能判断,进一步引导用户执行相应地操作,即上述图1所示本实施例提供的方法还包括:S130,在图形用户界面(Graphical User Interface,简称为:GUI)上显示分析结果,并指示用户对该分析结果进行相应地操作;例如若分析结果为一地名,可以提示用户是否需要去该地方以执行导航操作,如果分析结果是一个电话号码,可以提示用户是否需要拨叫该号码,如果分析结果是个成语,可以提示用户是否通过查询词典获取具体解释,另外,还可以指示用户执行复制到剪贴板,或者通过搜索引擎搜索等操作。

需要说明的是,本实施例以上述对分析结果做的一些具体操作的内容为例进行说明,本发明不限制在获取分析结果后,与用户交互执行的操作内容,只要是可以与该第一文本信息相匹配的提示操作,都可以应用与本发明各实 施例中,以提高该方法的智能性,便于用户使用。

图2为本发明实施例提供的另一种文字处理方法的流程图。本实施例以在上述图1所示实施例基础上的进一步地描述,本实施例提供的方法在S120之前可以包括:

S111,对比第一文本信息和第二文本信息,对第一文本信息进行字符类型分析。

S112,判断第一文本信息与扩充文本信息的字符类型是否相同;若不相同,则执行S113,若相同,则执行S120。

具体地,当第一文本信息与扩充文本信息的字符类型不同时,执行S113,查询该第一文本信息的解释或者提示用户对该第一文本信息进行相应的操作。

当第一文本信息与扩充文本信息的字符类型相同时,执行S120,在第二文本信息中对第一文本信息进行语义分析,并获取第一文本信息的分析结果。

本实施例在对第一文本信息进行予以分析前,先执行字符类型的分析,举例来说,如果所选第一文本信息在语种、字符类型上不同于上下文的扩充文本信息,比如所选的第一文本信息是英文单词,而扩充文本信息是中文,则可以直接查询词典数据库给出该第一文本信息的中文解释,也可以引导用户选择词典或网页搜索以获取对该第一文本信息的中文解释;再比如所选的第一文本信息是数字,则进一步根据判断上下文的扩充文本信息是否为电话号码、货币数字等特征数字,便于后续智能终端提示用户执行相应地操作。

本实施例提供的方法,在进行语义分析前,先引入字符类型的分析,由于字符类型更直观,执行判断的内容和工作量都比较少,在复合判断规则后可以直接给出合适的解释,或引导用户执行相应地操作,进一步地降低了通过本实施例提供的方法执行文本查询时的工作量,并且提高了文本处理方法的便捷性。

进一步地,用户在对文件中选择待查询的第一文本信息时,同样以用户在具有触摸屏的智能终端上选择为例予以说明,用户点击屏幕选择第一文本 信息,由于触摸屏的感应系统的问题,或者用户触摸不准确等问题,都有可能造成智能终端识别到的第一文本信息并非用户想选择的文本,即可能造成选词定位不准确的问题,这样,采用现有技术中的方式很难查询到用户所希望查询文本的解释,或者需要由用户重新执行选择操作,以获取所需查询的文本,在文本中进行查询操作需要用户执行复杂的选择过程,并且触摸选择操作的准确性不仅是用户主观的选择问题,有可能是触摸感应的识别问题。

针对上述问题,本实施例提供了一种解决方式,如图3所示,为本发明实施例提供的又一种文字处理方法的流程图。同样以在上述图1所示实施例的基础上为例予以示出,本实施例中的S120可以包括:S121,在第二文本信息中对第一文本信息进行语义分析;S122,判断用户选择的第一文本信息的定位是否准确;若准确,则执行S123,若不准确,执行S124。

S123,获取第一文本信息的分析结果。

S124,对所述第一文本信息进行重新选择,并获取对重新选择的第一文本信息的分析结果。

在本实施例中,将第一文本信息放置于第一文本信息的语境中进行分析的具体方式与上述实施例类似,可以分析该第一文本信息的成分,比如作主语、谓语、宾语,定语、状语或补语等,还可以分析其词性,比如动词、名词或形容词等,在分析的过程中,可以同时结合扩充文本信息判断该第一文本信息的定位是否准确,也就是所选择的文本是否为用户希望选择的文本,若判断出选择的第一文本信息明显不是一个完整的词组,或者其中包括了多余的连词、冠词的内容,可以对第一文本信息进行重新选择,具体可以对该第一文本信息进行断词或补充上下文的内容,例如,用户希望选择的文本是一个四字成语,但是由于点选操作只选择了前面的三个字,在执行S124时,可以将该第一文本信息补充为完整的成语。这样,用户在选择文本时,无论选择的是首字还是尾字,都可以正确的识别出用户希望选择的文本,并根据预定义的规则智能的修改为用户希望选择的正确文本;根据该预定义的规则获取的重新选择的第一文本信息例如包括:用户选择的部分第一文本信息;或者,用户选择的部分第一文本信息和部分扩充文本信息;或者,用户选择的第一文本信息和部分所述扩充文本信息。

本实施例提供的方法,可以智能的判断出用户感兴趣的文本进行分析处理,并且智能的进行引导交互,进一步地简化了用户操作,提升用户体验。

需要说明的是,图3所示实施例中,无论执行S123,还是执行S124,都可以获取到用户需要选择的文本的分析结果,因此,在S123或S124之后,都可以执行S130,执行S130的具体方式与上述图1所示实施例相同,故在此不再赘述。

图4为本发明实施例提供的一种文字处理装置的结构示意图。本实施例提供的文字处理装置适用于在电子文件中进行文本查询的情况中,该文字处理装置通常以硬件和软件的方式来实现,通常可以集成在终端设备的处理器中,该终端设备例如为PC或智能终端等。如图4所示,本实施例的文字处理装置具体包括:获取模块11和语义分析模块12。

其中,获取模块11,用于根据用户选择的第一文本信息在文件中的位置,获取待分析的第二文本信息,该第二文本信息包括第一文本信息和与第一文本信息相邻的扩充文本信息。

语义分析模块12,用于在获取模块11获取的第二文本信息中对第一文本信息进行语义分析,并获取第一文本信息的分析结果。

可选地,本实施例提供的装置还包括:显示模块13,用于在语义分析模块12获取分析结果之后,在图形用户界面GUI上显示分析结果,并指示用户对分析结果进行相应地操作。

本发明实施例提供的文字处理装置用于执行本发明图1所示实施例提供的文字处理方法,具备相应的功能模块,其实现原理和技术效果类似,此处不再赘述。

图5为本发明实施例提供的另一种文字处理装置的结构示意图。本实施例为在上述图4所示实施例基础上的进一步地描述,本实施例提供的装置还包括:字符分析模块14,用于在语义分析模块12在第二文本信息中对第一文本信息进行语义分析之前,对比第一文本信息和第二文本信息,对第一文本信息进行字符类型分析;判断模块15,用于判断第一文本信息与扩充文本信息的字符类型是否相同。

相应地,字符分析模块14,还用于在判断模块15判断出第一文本信息与扩充文本信息的字符类型不同时,查询第一文本信息的解释或者提示用户对第一文本信息进行相应的操作;语义分析模块12,具体用于在判断模块15判断出第一文本信息与扩充文本信息的字符类型相同时,在第二文本信息中对第一文本信息进行语义分析,并获取第一文本信息的分析结果。

进一步地,上述图5所示文字处理装置在具体实现中,判断模块15,还用于在语义分析模块12在第二文本信息中对第一文本信息进行语义分析的过程中,判断用户选择的第一文本信息的定位是否准确。相应地,语义分析模块12,还用于在判断模块15的判断结果为准确时,获取第一文本信息的分析结果;另外,语义分析模块12,还用于在判断模块15的判断结果为不准确时,对第一文本信息进行重新选择,并获取对重新选择的第一文本信息的分析结果。

需要说明的是,本实施例中的语义分析模块12重新选择的第一文本信息例如包括:用户选择的部分第一文本信息;或者,用户选择的部分第一文本信息和部分扩充文本信息;或者,用户选择的第一文本信息和部分扩充文本信息。

本发明实施例提供的文字处理装置用于执行本发明图2和图3所示实施例提供的文字处理方法,具备相应的功能模块,其实现原理和技术效果类似,此处不再赘述。

虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1