一种文章关键词筛选类别的方法、装置、设备及存储介质与流程

文档序号:32716836发布日期:2022-12-28 02:38阅读:26来源:国知局
一种文章关键词筛选类别的方法、装置、设备及存储介质与流程

1.本发明涉及智能决策技术领域,尤其涉及一种文章关键词筛选类别的方法、装置、设备及存储介质。


背景技术:

2.我们已经进入了大数据时代,各行各业都需要处理大量的数据,如新闻方面,当前的新闻数据和研报数据,数据量非常大,需按照业务给的匹配规则筛选和分类才能得到想要的数据。当接收一条新闻或者研报数据后,需要根据标题匹配关键词确定该条数据是否是所需要的数据,并按照关键词关联的分类标签确定分类,当前采用字符串匹配的方式筛选文章并确定文章分类的方法,该方法只考虑了标题,未考虑文章的摘要和正文部分的内容,导致分类结果不准确,因此,目前急需一种能够提高文章分类准确性的方法。


技术实现要素:

3.本发明提供一种文章关键词筛选类别的方法、装置、设备及存储介质,其主要目的在于提高文章关键词分类的准确性。
4.为实现上述目的,本发明提供的一种文章关键词筛选类别的方法,包括:
5.获取待分类文本,对所述待分类文本进行预处理,得到目标文本;
6.识别所述目标文本的文本分类因素,查询所述文本分类因素中每个分类因素的文本数据,对所述文本数据进行分词处理,得到文本词语;
7.提取所述文本词语的文本关键词,计算所述文本关键词在所述文本分类因素中的归属度,并计算所述文本关键词在所述目标文本中的权重;
8.根据所述归属度和所述权重计算出所述文本关键词的支持度,选取所述支持度符合预设条件的文本关键词作为目标关键词,并识别所述目标关键词的词语类别,将所述词语类别作为所述待分类文本的文本类别。
9.可选地,所述对所述待分类文本进行预处理,得到目标文本,包括:
10.识别所述待分类文本中的非文本内容;
11.若所述待分类文本中无所述非文本内容,则对所述待分类文本进行转化,得到目标文本;
12.若所述待分类文本中有所述非文本内容,则识别所述非文本内容文本区域;
13.对所述文本区域进行字符提取,得到字符序列;
14.将所述字符序列转换成字符文本,结合所述字符文本与所述待分类文本,得到目标文本。
15.可选地,所述对所述文本数据进行分词处理,得到文本词语,包括:
16.对所述文本数据进行去重处理,得到去重文本;
17.对所述去重文本进行过滤处理,得到过滤文本;
18.按照预设的词语对照表对所述过滤文本进行标注,得到标注文本;
19.对所述标注数据进行分词处理,得到文本词语。
20.可选地,所述提取所述文本词语的文本关键词,包括:
21.对所述文本数据进行语义分析,得到文本语义;
22.对所述文本词语进行语义分析,得到词语语义;
23.计算所述文本语义与所述词语语义的匹配度;
24.在所述匹配度大于预设值时,将所述匹配度对应的所述文本词语作为所述文本数据的文本关键词,并提取所述文本关键词。
25.可选地,所述计算所述文本关键词在所述文本分类因素中的归属度,包括:
26.计算所述文本关键词在所述文本分类因素中的权重值;
27.获取所述文本关键词在所述文本分类因素中出现的频次;
28.根据所述权重值和所述频次计算所述文本关键词在所述文本分类因素中的归属度。
29.可选地,所述并计算所述文本关键词在所述目标文本中的权重,包括:
30.计算所述文本关键词在所述目标文本中的词频;
31.计算所述文本关键词在所述目标文本中的逆向文件频率;
32.根据所述频率和所述逆向文件频率计算出所述文本关键词的权重。
33.可选地,所述根据所述归属度和所述权重计算出所述文本关键词的支持度,包括:
34.计算所述文本关键词在所述文本分类因素中的所占分值,将所述所占分值相加求和,得到所述文本关键词的匹配得分,将所述匹配得分转化成数值,将所述数值与所述归属度和所述权重分别相乘并求和,得到所述文本关键词的支持度。
35.为了解决上述问题,本发明还提供一种文章关键词筛选类别装置,所述装置包括:
36.文本处理模块,用于获取待分类文本,对所述待分类文本进行预处理,得到目标文本;
37.文本分词模块,用于识别所述目标文本的文本分类因素,查询所述文本分类因素中每个分类因素的文本数据,对所述文本数据进行分词处理,得到文本词语;
38.权重计算模块,用于提取所述文本词语的文本关键词,计算所述文本关键词在所述文本分类因素中的归属度,并计算所述文本关键词在所述目标文本中的权重;
39.文本分类模块,用于根据所述归属度和所述权重计算出所述文本关键词的支持度,选取所述支持度符合预设条件的文本关键词作为目标关键词,并识别所述目标关键词的词语类别,将所述词语类别作为所述待分类文本的文本类别。
40.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
41.至少一个处理器;以及,
42.与所述至少一个处理器通信连接的存储器;其中,
43.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的文章关键词筛选类别的方法。
44.为了解决上述问题,本发明还提供一种存储介质,所述存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的文章关键词筛选类别的方法。
45.本发明实施例通过获取待分类文本,对所述待分类文本进行预处理,可以得到目标文本,可以将所述分类文本中的内容全部转化成文本形式,为后续对所述目标文本进行处理提供了便利性,其中,本发明实施例通过对所述目标文本的文本分类因素进行识别,从而查询到所述文本分类因素中每个分类因素的文本数据,为后续对文本数据的处理提供了保障;此外,本发明通过提取所述文本词语的文本关键词,可以将所述文本词语中不重要的词语去除,降低了后续对所述文本关键词计算难度,本发明实施例通过根据所述归属度和所述权重计算出所述文本关键词的支持度,为后续的所述待分类文本的分类提供了保障。因此,本发明实施例提供的一种文章关键词筛选类别的方法、装置、设备及存储介质,能够在于在于提高文章关键词分类的准确性。
附图说明
46.图1为本发明一实施例提供的文章关键词筛选类别的方法的流程示意图;
47.图2为本发明一实施例提供的文章关键词筛选类别的装置的功能模块图;
48.图3为本发明一实施例提供的实现所述文章关键词筛选类别的方法的电子设备的结构示意图。
49.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
50.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
51.本技术实施例提供一种文章关键词筛选类别的方法。本技术实施例中,所述文章关键词筛选类别的方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述文章关键词筛选类别的方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
52.参照图1所示,为本发明一实施例提供的文章关键词筛选类别的方法的流程示意图。在本实施例中,所述文章关键词筛选类别的方法包括步骤s1—s5:
53.s1、获取待分类文本,对所述待分类文本进行预处理,得到目标文本。
54.本发明实施例通过获取待分类文本,对所述待分类文本进行预处理,可以得到目标文本,可以将所述分类文本中的内容全部转化成文本形式,为后续对所述目标文本进行处理提供了便利性。
55.其中,所述待分类文本是新闻数据或研报数据等,所述预处理是对所述待分类文本进行识别和转换,将所述待分类文本中的非文本内容全部转换成文本内容形式。
56.作为本发明的一个实施例,所述对所述待分类文本进行预处理,得到目标文本,包括:识别所述待分类文本中的非文本内容,若所述待分类文本中无所述非文本内容,则对所述待分类文本进行转化,得到目标文本,若所述待分类文本中有所述非文本内容,则识别所述非文本内容文本区域,对所述文本区域进行字符提取,得到字符序列,将所述字符序列转
换成字符文本,结合所述字符文本与所述待分类文本,得到目标文本。
57.其中,所述非文本内容是所述待分类文本中的图片数据或语音数据,不是以文本形式表达的内容,所述目标文本是所述待分类文本中的内容全部以文本形式表达的文本,所述文本区域是所述非文本内容中含有文本的区域,所述字符序列是所述文本区域中的所有字符,所述字符文本是所述字符序列对应的文本形式,进一步的,所述待分类文本中的非文本内容的识别可以通过ai智能识别算法实现,所述ai智能识别算法是由脚本语言编译,所述待分类文本的转化可以通过文本转化工具实现,所述文本转化工具是由java语言构建,所述非文本内容文本区域的识别可以通过ocr识别算法实现,所述文本区域的字符提取可以通过mid函数实现,所述字符序列转化成所述字符文本可以通过字符转换函数实现。
58.s2、识别所述目标文本的文本分类因素,查询所述文本分类因素中每个分类因素的文本数据,对所述文本数据进行分词处理,得到文本词语。
59.本发明实施例通过对所述目标文本的文本分类因素进行识别,从而查询到所述文本分类因素中每个分类因素的文本数据,为后续对文本数据的处理提供了保障。
60.其中,所述文本分类因素是所述目标文本作为分类的要素,如所述目标文本的标题、文章的摘要以及正文内容,所述文本数据是所述文本分类因素中的文字内容,进一步的,所述文本分类因素的识别可以通过上述中的ocr识别算法实现,所述文本分类因素中每个分类因素的文本数据可以通过文本识别器查询。
61.本发明实施例通过对所述文本数据进行分词处理,可以得到所述文本数据中的文本词语,将所述文本数据中的无用数据去除掉,降低了对所述文本数据的处理难度。
62.作为本发明的一个实施例,所述对所述文本数据进行分词处理,得到文本词语,包括:对所述文本数据进行去重处理,得到去重文本,对所述去重文本进行过滤处理,得到过滤文本,按照预设的词语对照表对所述过滤文本进行标注,得到标注文本,对所述标注数据进行分词处理,得到文本词语。
63.其中,所述去重文本是将所述文本数据中的重复文本信息删除得到文本,所述过滤文本是将所述去重文本中的停用词去除得到的文本,所述标注文本是所述过滤文本中的词语经过标注后得到的文本,所述文本词语是所述过滤文本中的所有词语,进一步的,所述文本数据的去重处理可以通过去重函数实现,所述去重文本的过滤处理可以通过set集合法实现,对所述过滤文本的标注可以通过标注工具实现,如颜色标注工具,所述标注数据的分词处理可以通过elasticsearch工具实现,进一步的,所述elasticsearch工具是一个分布式、高扩展、高实时的搜索与数据分析引擎,能很方便的使大量数据具有搜索、分析和探索的能力,所述elasticsearch工具具有水平伸缩性,能使数据在生产环境变得更有价值,所述elasticsearch工具的实现原理主要分为以下几个步骤,先将用户数据提交到elasticsearch数据库中,再通过分词控制器将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户。
64.s3、提取所述文本词语的文本关键词,计算所述文本关键词在所述文本分类因素中的归属度,并计算所述文本关键词在所述目标文本中的权重。
65.本发明通过提取所述文本词语的文本关键词,可以将所述文本词语中不重要的词语去除,降低了后续对所述文本关键词计算难度。其中,所述文本关键词是所述文本词语中较为精炼或出现次数较多的词语。
66.作为本发明的一个实施例,所述提取所述文本词语的文本关键词,包括:对所述文本数据进行语义分析,得到文本语义,对所述文本词语进行语义分析,得到词语语义,计算所述文本语义与所述词语语义的匹配度,在所述匹配度大于预设值时,将所述匹配度对应的所述文本词语作为所述文本数据的文本关键词,并提取所述文本关键词。
67.其中,所述文本语义是代表所述文本数据的中心思想,所述词语语义是所述文本词语的中心思想,所述匹配度是两个不完全相同的物象,在某种分类要求下的契合程度称为匹配度,所述预设值是预先设定的数值,可以作为判断所述文本语义和所述词语语义是否匹配的依据,所述预设值可以是0.8,也可以根据实际业务场景进行设置。
68.本发明通过计算所述文本关键词在所述文本分类因素中的归属度,可以根据所述归属度对所述文本关键词的重要性进行判断,所述归属度是所述文本关键词在所述文本分类因素中的所占百分比。
69.作为本发明的一个实施例,所述计算所述文本关键词在所述文本分类因素中的归属度,包括:计算所述文本关键词在所述文本分类因素中的权重值,获取所述文本关键词在所述文本分类因素中出现的频次,根据所述权重值和所述频次计算所述文本关键词在所述文本分类因素中的归属度。
70.其中,所述权重值是体现所述文本关键词在所述文本分类因素中重要性程度的数值,所述频次是所述文本关键词在所述文本分类因素中出现的次数,进一步的,所述文本关键词在所述文本分类因素中的权重值可以通过权重函数计算,所述文本关键词在所述文本分类因素中出现的频次可以通过countif函数实现,所述文本关键词在所述文本分类因素中的归属度计算可以通过归属度函数计算,所述归属度函数是由脚本语言编译而成。
71.本发明通过计算所述文本关键词在所述目标文本中的权重,可以得到所述文本关键词的权重值,为后续的计算提供了保障,其中,所述权重值是表示所述文本关键词在所述目标文本中的重要性程度。
72.作为本发明的一个实施例,所述并计算所述文本关键词在所述目标文本中的权重,包括:计算所述文本关键词在所述目标文本中的词频,计算所述文本关键词在所述目标文本中的逆向文件频率,根据所述频率和所述逆向文件频率计算出所述文本关键词的权重。
73.其中,所述词频是所述文本关键词在所述目标文本中出现的频率,所述逆向文件频率是所述词频的倒数,进一步的,所述词频可以通过词频算法计算,所述文本关键词在所述目标文本中的逆向文件频率可以通过idf函数计算,所述文本关键词的权重可以通过权重函数计算实现。
74.进一步的,所述词频算法包括:
[0075][0076]
其中,td
a,b
表示文本关键词的词频,w
a,b
表示文本关键词的个数,∑cw
c,b
表示目标文本中的文本关键词的总和
[0077]
s4、根据所述归属度和所述权重计算出所述文本关键词的支持度,选取所述支持度符合预设条件的所述文本关键词作为目标关键词,并识别所述目标关键词的词语类别,
将所述词语类别作为所述待分类文本的文本类别。
[0078]
本发明实施例通过根据所述归属度和所述权重计算出所述文本关键词的支持度,为后续的所述待分类文本的分类提供了保障。
[0079]
其中,所述支持度是所述文本关键词在所述目标文本中支持的程度,通常以百分比表示,所述预设条件是所述支持度大于预设的阈值,所述阈值可以是80%也可以根据实际业务场景进行设置。
[0080]
作为本发明的一个实施例,所述根据所述归属度和所述权重计算出所述文本关键词的支持度,包括:计算所述文本关键词在所述文本分类因素中的所占分值,将所述所占分值相加求和,得到所述文本关键词的匹配得分,将所述匹配得分转化成数值,将所述数值与所述归属度和所述权重分别相乘并求和,得到所述文本关键词的支持度。
[0081]
其中,所述所占分值是所述文本关键词在所述文本分类因素中的重要程度,所述匹配得分是所述所占分值的总和,进一步的,所述文本关键词在所述文本分类因素中的所占分值计算可以通过分值函数实现,所述分值函数是由脚本语言编译。
[0082]
本发明通过选取所述支持度符合预设条件的所述文本关键词作为目标关键词,为后续所述目标文本的分类提供了准确性,其中,所述预设条件是所述支持度大于预设的阈值,所述阈值可以是80%也可以根据实际业务场景进行设置。进一步的,所述目标关键词的选取可以通过left函数实现。
[0083]
本发明通过识别所述目标关键词的词语类别,可以将所述词语类别作为所述待分类文本的文本类别,从而提高了所述分类文本的准确性,其中,所述词语类别是所述目标关键词的属性种类,进一步的,所述目标关键词的词语类别的识别可以通过ocr文字识别实现。
[0084]
本发明实施例通过获取待分类文本,对所述待分类文本进行预处理,可以得到目标文本,可以将所述分类文本中的内容全部转化成文本形式,为后续对所述目标文本进行处理提供了便利性,其中,本发明实施例通过对所述目标文本的文本分类因素进行识别,从而查询到所述文本分类因素中每个分类因素的文本数据,为后续对文本数据的处理提供了保障;此外,本发明通过提取所述文本词语的文本关键词,可以将所述文本词语中不重要的词语去除,降低了后续对所述文本关键词计算难度,本发明实施例通过根据所述归属度和所述权重计算出所述文本关键词的支持度,为后续的所述待分类文本的分类提供了保障。因此,本发明实施例提供的一种文章关键词筛选类别的方法,能够在于在于提高文章关键词分类的准确性。
[0085]
如图2所示,是本发明一实施例提供的文章关键词筛选类别的装置的功能模块图。
[0086]
本发明所述文章关键词筛选类别装置100可以安装于电子设备中。根据实现的功能,所述文章关键词筛选类别装置100可以包括文本处理模块101、文本分词模块102、权重计算模块103及文本分类模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0087]
在本实施例中,关于各模块/单元的功能如下:
[0088]
所述文本处理模块101,用于获取待分类文本,对所述待分类文本进行预处理,得到目标文本;
[0089]
所述文本分词模块102,用于识别所述目标文本的文本分类因素,查询所述文本分类因素中每个分类因素的文本数据,对所述文本数据进行分词处理,得到文本词语;
[0090]
所述权重计算模块103,用于提取所述文本词语的文本关键词,计算所述文本关键词在所述文本分类因素中的归属度,并计算所述文本关键词在所述目标文本中的权重;
[0091]
所述文本分类模块104,用于根据所述归属度和所述权重计算出所述文本关键词的支持度,选取所述支持度符合预设条件的文本关键词作为目标关键词,并识别所述目标关键词的词语类别,将所述词语类别作为所述待分类文本的文本类别。
[0092]
详细地,本技术实施例中所述文章关键词筛选类别的装置100中所述的各模块在使用时采用与上述图1中所述的文章关键词筛选类别的方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
[0093]
如图3所示,是本发明一实施例提供的实现文章关键词筛选类别的方法的电子设备1的结构示意图。
[0094]
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如文章关键词筛选类别的方法程序。
[0095]
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备1的控制核心(control unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行文章关键词筛选类别的方法程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
[0096]
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如文章关键词筛选类别的方法程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0097]
所述通信总线12可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
[0098]
所述通信接口13用于上述电子设备1与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接
口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0099]
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0100]
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
[0101]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0102]
所述电子设备1中的所述存储器11存储的文章关键词筛选类别的方法程序是多个指令的组合,在所述处理器10中运行时,可以实现:
[0103]
获取待分类文本,对所述待分类文本进行预处理,得到目标文本;
[0104]
识别所述目标文本的文本分类因素,查询所述文本分类因素中每个分类因素的文本数据,对所述文本数据进行分词处理,得到文本词语;
[0105]
提取所述文本词语的文本关键词,计算所述文本关键词在所述文本分类因素中的归属度,并计算所述文本关键词在所述目标文本中的权重;
[0106]
根据所述归属度和所述权重计算出所述文本关键词的支持度,选取所述支持度符合预设条件的文本关键词作为目标关键词,并识别所述目标关键词的词语类别,将所述词语类别作为所述待分类文本的文本类别。
[0107]
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
[0108]
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。所述存储介质可以是易失性的,也可以是非易失性的。例如,所述介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
[0109]
本发明还提供一种存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
[0110]
获取待分类文本,对所述待分类文本进行预处理,得到目标文本;
[0111]
识别所述目标文本的文本分类因素,查询所述文本分类因素中每个分类因素的文本数据,对所述文本数据进行分词处理,得到文本词语;
[0112]
提取所述文本词语的文本关键词,计算所述文本关键词在所述文本分类因素中的归属度,并计算所述文本关键词在所述目标文本中的权重;
[0113]
根据所述归属度和所述权重计算出所述文本关键词的支持度,选取所述支持度符
合预设条件的文本关键词作为目标关键词,并识别所述目标关键词的词语类别,将所述词语类别作为所述待分类文本的文本类别。
[0114]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0115]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0116]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0117]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0118]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0119]
本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0120]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
[0121]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1