一种获取和存储文本内容的方法、装置、终端和存储介质与流程

文档序号:23717843发布日期:2021-01-24 06:21阅读:119来源:国知局
一种获取和存储文本内容的方法、装置、终端和存储介质与流程

[0001]
本申请属于计算机领域,具体而言,涉及一种获取和存储文本内容的方法、装置、终端和存储介质。


背景技术:

[0002]
随着人工智能快速发展,流程自动化应用程序的需求也不断地增加。在流程自动化应用程序中,该程序获取的文本内容需要保存到数据库中,与此同时组件的操作也需要依赖数据支撑。而获取文本内容、存储文本内容和读取文本内容的常规方式为:先获取网页上的文本内容,然后将获取文本内容存储到变量中,再将变量中的数据写入到excel中;当读取数据时,先从excel文件中读取数据,然后将读取到的数据存储到变量中,再将文本内容写入内容组件,从而写入到网页中。
[0003]
显然,由于现有技术获取和存储文本内容的效率过于低下,导致读取文本内容的方法也过于低下。因此,对于本领域技术人员来说,如何提高获取和存储文本内容的效率是急需解决的问题。


技术实现要素:

[0004]
本申请实施例提供一种获取和存储文本内容的方法、装置、终端和存储介质,可以解决现有技术中获取和存储文本内容的效率低下的问题。
[0005]
第一方面,本发明提供一种获取和存储文本内容的方法,所述方法包括:预先定义多个数据表,并定义所述数据表与数据表之间的属性信息;将所述数据表的表字段定义为变量,使所述表字段可用于存储数据;接收用户输入选择目标组件的指令,以将所述表字段和所述目标组件通信连接;设置所述表字段的路径信息,以通过所述路径信息获取文本内容,并将获取到的文本内容存储至所述表字段中。
[0006]
作为本发明另一可选的方案,所述将所述数据表的表字段定义为变量,使所述表字段可用于存储数据的步骤具体包括:接收用户选择变量类型的指令,为所述变量选择变量的类型;若在预设的时间内未接收到用户选择变量类型的指令,则将所述变量的变量类型定义为字符串类型。
[0007]
作为本发明另一可选的方案,所述属性信息包括关联信息和执行顺序信息的一种或两种。
[0008]
作为本发明另一可选的方案,所述所述执行顺序信息具体包括:所述数据表的执行顺序为:从上到下;所述数据表的表字段的执行顺序为:从左到右;所述数据表中的数据行的执行顺序为:从上到下。
[0009]
作为本发明另一可选的方案,所述数据表包括错误处理配置表、参数配置表、组件
配置表、属性配置表和流程配置表的一种或几种。
[0010]
作为本发明另一可选的方案,所述数据表中的前9行为所述目标组件的属性配置行,第10行为所述目标组件的名称行。
[0011]
作为本发明另一可选的方案,所述目标组件包括打开浏览器组件、关闭浏览器组件、打开网页组件、关闭网页组件、页面点击组件、下拉框选择组件、单选按钮组件、复选框按钮组件、获取文本组件、表格组件和写入内容组件的一种或几种。
[0012]
第二方面,本发明提供一种获取和存储文本内容的装置,所述装置包括:数据表定义模块,用于定义多个数据表,并定义所述数据表与数据表之间的属性信息;变量定义模块,用于将所述数据表的表字段定义为变量,使所述表字段可用于存储数据;选择模块,用于接收用户输入选择目标组件的指令,以将所述表字段和所述目标组件通信连接;获取和存储模块,用于设置所述表字段的路径信息,以通过所述路径信息获取文本内容,并将获取到的文本内容存储至所述表字段中。
[0013]
第三方面,本发明还提供一种终端设备,其中,所述终端设备包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述获取和存储文本内容的方法第四方面,本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行所述获取和存储文本内容的方法。
[0014]
通过本发明提供过的方法,能够在流程自动化应用程序中有效提高获取和存储文本内容的效率,从而方便后续的读取文本内容的操作。具体地说,先对数据表进行定义,以及定义各个数据表之间的属性信息;然后将数据表的表字段定义为变量,使得表字段能够存储数据;接着,将表字段和目标组件进行连接,使得表字段和目标组件能够通信;最后,设置表字段的路径信息,这样,当运行自动化应用程序,便可以根据该路径信息自动获取文本内容并对获取到的文本内容进行存储。与现有技术相比,本发明提供的获取和存储文本内容的方法更简单,省去了诸多繁琐步骤,从而大幅度提高了获取和存储文本内容的效率。
附图说明
[0015]
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]
图1为本发明获取和存储文本内容的方法较佳实施例的流程图。
[0017]
图2为本发明一种获取和存储文本内容的装置较佳实施例的结构框图。
[0018]
图3为本发明终端设备较佳实施例的结构框图。
具体实施方式
[0019]
本发明提供一种获取和存储文本内容的方法、装置、终端设备和存储介质,为使得
本申请的特征和优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0021]
在本申请实施例的描述中,需要理解的是,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0022]
请参阅图1,图1为本发明获取和存储文本内容的方法较佳实施例的流程图,如图1所示,所述方法包括:s1、预先定义多个数据表,并定义所述数据表与数据表之间的属性信息。
[0023]
在上述步骤中,通过定义数据表,使得数据表具备多种功能。使得数据表在流程自动化应用程序中能够自动执行多种指令。具体地,所述数据表具体是指错误处理配置表、参数配置表、组件配置表、属性配置表和流程配置表的一种或几种。
[0024]
其中,所述错误处理配置表详细配置了流程自动化应用程序中出错时处理方式,更具体地,处理方式包括:忽略、跳过、跳过此用例、重试(场景恢复用例编号)、重试此用例(场景恢复用例编号)和终止等等。这样,当流程自动化应用程序运行时,能够根据实际的紧急错误,自动选择合适的出错处理方式。
[0025]
所述参数配置表用于配置自动化流程中每个功能数据表(上述中的处理配置表、参数配置表、组件配置表、属性配置表和流程配置表)的参数,且参数包括重新启动系统、关闭并重新启动系统、从主数据重试和从下一条主数据重试的一种或几种。通过配置用例参数,使得流程自动化应用程序运行时,能够根据实际情况,自动进行重启或关闭系统,或者从主数据或下一主数据重试。
[0026]
所述组件配置表用于配置具体的操作指令,所述操作指令具体包括打开浏览器、打开网页、页面点击、写入内容、获取文本、下拉框选择、单选按钮、复选框按钮、表格、粘贴值、热键组件、类型标签、调用代码、关闭网页、关闭浏览器、发送邮件、生成excel和延时等目标组件的配置的一种或几种。通过组件配置表,使得流程自动化应用程序能够根据相应的操作指令执行相应的操作,例如,根据打开网页的操作指令自动打开网页,根据关闭网页的指令,自动关闭网页等等。不仅如此,本发明提供的组件配置表还支持拓展的功能,也就是说,用户可以根据自身的需要在组件配置表中添加多种操作指令,使得流程自动化应用程序的功能更佳高效和便捷。
[0027]
所述属性配置表用于具体配置所选择的浏览器、网址、元素id、元素名称、父元素路径、写入内容、回车、语言、代码、时间、收件人、文件名称和文件路径等等。其中,浏览器主要包括谷歌浏览器、ie浏览器、火狐浏览器、百度浏览器和qq浏览器等等。同样的,本发明提供的属性配置表还支持拓展的功能。
[0028]
所述流程配置表可用于配置单个或多个功能名称,使得功能名称与功能数据表的名称一致。不仅如此,还可以通过流程配置表配置每个功能数据表的功能名称、错误处理方式、执行数据行、执行数据列、执行数据开始行和执行数据开始列(数据行可以默认不进行配置,未配置的情况下执行数据表中所有数据)等等。
[0029]
在完成定义数据表的步骤后,便可以定义各个数据表之间的属性信息。其中,所述属性信息包括关联信息和执行顺序信息的一种或两种。其中,关联信息具体是指数据表之间层级结构关联关系,即数据表之间的包含或被包含的关系。所述所述执行顺序信息具体包括:所述数据表的执行顺序为:从上到下;所述数据表的表字段的执行顺序为:从左到右;所述数据表中的数据行的执行顺序为:从上到下。通过设定执行顺序,使得流程自动化应用程序能够根据设定的执行顺序先后执行各个功能数。不仅如此,还可以判断是从子数据开始重试还是从主数据开始进行执行。
[0030]
需要说明的是,所述数据表中的前9行为所述目标组件的属性配置行,第10行为所述目标组件的名称行。这样,不仅能够规范功能数据表的格式,还能方便用户增加和/或修改目标组件的属性信息,以及修改目标组件的名称,以及方便后续的维护等操作。
[0031]
s2、将所述数据表的表字段定义为变量,使所述表字段可用于存储数据。
[0032]
在上述步骤中,为了能将数据(如后文中的文本内容等)存储在数据表表中,因此,需要将数据表的表字段定义为变量,每个表字段自动默认为一个变量,使得表字段可用于存储数据。
[0033]
作为本发明另一可选的方案,所述步骤s2具体包括:接收用户选择变量类型的指令,为所述变量选择变量的类型。
[0034]
由于变量的类型有很多,例如,数字型(number)、布尔型(boolean)和字符串类型(string)等等,而不同的变量类型,具有不同的含义。用户可以根据自身的需要,在将表字段定义为变量后,选择该变量的数据类型。
[0035]
若在预设的时间内未接收到用户选择变量类型的指令,则将所述变量的变量类型定义为字符串类型。为了防止用户忘记选择变量类型,本发明通过设定一个时间范围,如果用户在该时间范围内并未选择变量类型,那么将自动将该变量的变量类型设置为字符串类型。其中,用户可以自由设定预设的时间,例如,将预设的时间设置为10s,将预设的时间设置为1min等等。
[0036]
s3、接收用户输入选择目标组件的指令,以将所述表字段和所述目标组件通信连接。
[0037]
在上述步骤中,用户可以根据实际需要,选择相应的目标组件,在确定所选择的目标组件后,则建立数据表(表字段)与目标组件的通信连接。
[0038]
s4、设置所述表字段的路径信息,以通过所述路径信息获取文本内容,并将获取到的文本内容存储至所述表字段中。
[0039]
当用户选择目标组件的时,程序将自动带出不同目标组件的不同属性值。以目标组件中的获取文本组件为例,通过设置每个字段的属性值中的路径信息,从而定位到路径信息下的一组文本内容。具体地说,通过设置每个字段的属性值中的元素xpath,从而定位到路径信息下的一组文本内容;或者通过设置“父元素”和“子元素”定位到“父元素”下的一组文本内容。不仅如此,本发明还支持手动输入路径信息,也支持点击选择元素按钮来选择
网页上的元素,从而向用户提供多种定位方式,使得用户能够根据自身的需求正确输入或选择路径信息。
[0040]
本发明提供的获取文本组件具体具有两种获取本文内容的方式。具体地多,方式一,获取单个文本内容:首先,设置获取文本组件对应的元素xpath;然后,设置文本内容的分隔符,如“/”;接着,设置文本内容分隔后需要取第几段文本;当流程自动化应用程序运行时,自动将文本组件所获取到的值写入到相应的数据表中。方式二,获取多个文本内容:首先,设置获取文本组件对应的父元素xpath;然后,设置获取文本组件对应的子元素xpath;当流程自动化应用程序运行时,将自动获取父元素xpath下一组子元素xpath的文本内容,并将子元素xpath所对应的文本内容填写到数据表所对应列中,并且是从数据表第11行开始写,每次循环写入数据的时候“数据行+1”,即从下一行开始写。与现有技术相比,本发明提供的两种文本内容的获取方式均可快速有效地获取本文内容。此外,由于减少了诸多繁琐步骤,降低了出错率,提高了安全率。
[0041]
此外,如果需要将所获取的网页内容(包括上述中的文本内容、网址、图片和表情等等),无需额外设置数据,通过本发明提供的方法,能够自动实现存储网页内容的目标。不仅如此,当需要将数据表中数据录入到系统时,本发明还支持在数据表中新增、修改和删除数据等操作;还支持将excel中数据直接复制到本发明的数据表中;还支持将excel数据导入数据表中,当导入数据时,流程自动化应用程序默认将excel表头导入到第10行,excel中表数据放到第11行之后。通过上述的录入和导入数据方式,能够有效降低相关人员的工作率,并且提高了工作效率,降低了录入数据的错误率。
[0042]
除了上述中的文本组件外,本发明提供的目标组件还包括打开浏览器组件、关闭浏览器组件、打开网页组件、关闭网页组件、页面点击组件、下拉框选择组件、单选按钮组件、复选框按钮组件、表格组件和写入内容组件的一种或几种。
[0043]
其中,打开浏览器组件和关闭浏览器组件,可以设置自动化应用程序在特定的时间打开或关闭浏览器,同时还能选择所使用的浏览器,如,选择使用谷歌浏览器,选择使用ie浏览器等等。
[0044]
打开网页组件和关闭网页组件,可以在在属性中选择或输入网址,以及在在数据表中设置网址的url(统一资源定位符和统一资源标志符);在标签页的属性中选择关系第几个标签页,使得流程自动化应用程序在运行时,自动关闭用户所设置的标签页。
[0045]
页面点击组件主要用于对特定的按钮进行点击。具体地说,根据智能数据表组件中设置的数据表的属性信息,按列从左到右自动判断执行的先后顺序和主从关系;当选择目标组件的时,选择页面点击组件;设置点击操作对应的元素xpath;流程自动化应用程序将自动读取数据表中的字段,然后判断每个字段需要执行操作的组件类型,再找到点击组件对应的元素xpath,这样,便可以对应页面中的特定按钮进行自动点击。
[0046]
下拉框选择组件主要用于对处于下拉框中的数据进行选择。具体地说,当选择目标组件时,选择下拉框选择组件;设置属性中选择元素xpath;在数据表中设置下拉框对应需要选择的数据;当流程自动化应用程序运行时,将自动匹配到下拉框选择组件的属性,点击对应功能页面的元素xpath的下拉框,根据数据表中设置的数据,自动匹配下拉框中的数据并进行选择。
[0047]
复选框按钮组件主要用于选择复选框。具体地说,先设置复选框按钮组件对应的
元素xpath;流程自动化应用程序运行时,将自动匹配到复选框组件的属性,并找到对应功能页面的元素xpath的,从而自动选择复选框。
[0048]
表格组件主要用于将获取到的本文内容存储至相应的数据列中。具体地说,先根据智能数据表组件中设置的数据表的属性信息,从而判断执行的先后顺序和主从关系;如果是获取文本内容的操作,流程自动化应用程序将动读取数据表中的字段,然后判断每个字段需要执行的操作,再读取获取文本组件下的元素路径,并将网页上对应元素路径下的文本内容保存到字段下的数据列中。
[0049]
写入内容组件主要用于将数据表中的数据写入到网页对应的元素路径上。具体地说,先根据智能数据表组件中设置的数据表的属性信息,自动判断执行的先后顺序和主从关系;如果是写入内容的操作,流程自动化应用程序将自动读取数据表中的字段先,然后判断每个字段需要执行的操作,再读取写入内容组件下的元素路径,并将数据表中对应字段下的数据写入到网页对应的元素路径下。
[0050]
本发明提供了多种目标组件,用户可以根据需要选择一个或者多个目标组件,从而达到预期的目的。
[0051]
请参阅图2,本发明提供一种获取和存储文本内容的装置10,所述装置包括:数据表定义模块110,用于定义多个数据表,并定义所述数据表与数据表之间的属性信息;变量定义模块120,用于将所述数据表的表字段定义为变量,使所述表字段可用于存储数据;选择模块130,用于接收用户输入选择目标组件的指令,以将所述表字段和所述目标组件通信连接;获取和存储模块140,用于设置所述表字段的路径信息,以通过所述路径信息获取文本内容,并将获取到的文本内容存储至所述表字段中。
[0052]
需要说明的是,上述实施例提供的获取和存储文本内容的装置10,在执行获取和存储文本内容的方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,关于上述获取和存储文本内容的装置10与获取和存储文本内容的方法实施例属于同一构思,其体现实现过程已在上述方法实施例的步骤中详细论述,故此不做赘述。
[0053]
请参阅图3,本发明还提供一种终端设备20,其中,所述终端设备包括处理器210、存储器220及存储在存储器220上并可在处理器210上运行的计算机程序,所述处理器210执行所述计算机程序时实现所述获取和存储文本内容的方法。
[0054]
所述处理器210可以为通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga) 、单片机、arm(acorn risc machine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器210还可以是任何传统处理器、微处理器或状态机。处理器210也可以被实现为计算设备的组合,例如,dsp 和微处理器的组合、多个微处理器、一个或多个微处理器结合dsp 核、或任何其它这种配置。
[0055]
所述存储器220作为一种非易失性计算机可读存储介质,可用于存储非易失性软
件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的获取和存储文本内容的方法对应的程序指令。处理器210通过运行存储在存储设备中的非易失性软件程序、指令以及单元,从而执行获取和存储文本内容的各种功能应用以及数据处理,即实现上述方法实施例中的获取和存储文本内容的方法。
[0056]
关于上述终端设备20执行所述计算机程序时实现所述的具体技术细节已在前述方法步骤中详细论述,故此不做赘述。
[0057]
本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行所述获取和存储文本内容的方法。
[0058]
所述计算机可读存储介质可以是前述任一实施例所述的系统的内部存储单元,例如系统的硬盘或内存。所述计算机可读存储介质也可以是所述系统的外部存储设备,例如系统上配备的插接式硬盘,智能存储卡(smart media card, smc),安全数字(secure digital, sd)卡,闪存卡(flash card)等。进一步地,所述计算机可读存储介质还可以既包括所述系统的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述系统所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0059]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0060]
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
[0061]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0062]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0063]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机
设备 ( 可以是个人计算机,服务器,或者网络设备等 ) 执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u 盘、移动硬盘、只读存储器 (rom,read-only memory)、随机存取存储器 (ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0064]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1