数据库文本聚合处理方法及装置制造方法

文档序号:6637554阅读:185来源:国知局
数据库文本聚合处理方法及装置制造方法
【专利摘要】本发明公开了一种数据库文本聚合处理方法及装置。该方法用于将多个源文本聚合为目标文本,该方法包括:确定待处理数据库,其中,待处理数据库为需要进行文本聚合的数据库;在待处理数据库中确定需要文本聚合的数据列;在需要文本聚合的数据列中确定需要文本聚合的多个源文本;接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令;根据聚合指令将多个源文本聚合为目标文本。通过本发明,解决了现有技术中在数据库中文本聚合处理效率低的问题。
【专利说明】数据库文本聚合处理方法及装置

【技术领域】
[0001]本发明涉及数据处理领域,具体而言,涉及一种数据库文本聚合处理方法及装置。

【背景技术】
[0002]在数据库系统中聚合操作是必不可少的功能。聚合操作将多条数据〃整合〃为一条数据,比如叠加、取平均值、计数等。其中,有一种特殊的聚合操作,称之为文本聚合,文本聚合为将多条文本数据连接成一条文本的聚合。在现有技术中,在许多数据库系统下,已经提供了现成的文本聚合函数,然而在采用结构化查询语言的结构化查询语言系统(Structured Query Language Server,简称为SQL Server)下,却没有提供文本聚合函数,所以在SQL Server中处理文本聚合时很复杂、处理效率低。
[0003]针对现有技术在数据库中文本聚合处理效率低的问题,目前尚未提出有效的解决方案。


【发明内容】

[0004]本发明的主要目的在于提供一种数据库文本聚合处理方法及装置,以解决现有技术在数据库中文本聚合处理效率低的问题。
[0005]为了实现上述目的,根据本发明的一个方面,提供了一种数据库文本聚合处理方法。
[0006]根据本发明提供是数据库文本聚合处理方法包括:方法用于将多个源文本聚合为目标文本,该方法包括:确定待处理数据库,其中,待处理数据库为需要进行文本聚合的数据库;在待处理数据库中确定需要文本聚合的数据列;在需要文本聚合的数据列中确定需要文本聚合的多个源文本;接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令;以及根据聚合指令将多个源文本聚合为目标文本。
[0007]进一步地,根据聚合指令将多个源文本聚合为目标文本包括:根据聚合指令将多个源文本聚合为文本类型的目标文本。
[0008]进一步地,根据聚合指令将多个源文本聚合为文本类型的目标文本包括:根据聚合指令将多个源文本聚合为第一预设数据类型的目标文本,其中,第一预设数据类型为预设的对目标文本执行聚合操作时目标文本的数据类型;以及将为第一预设数据类型的目标文本转换为文本类型的目标文本。
[0009]进一步地,在根据聚合指令将多个源文本聚合为目标文本之后,该方法还包括:将目标文本的数据类型转换为第二预设数据类型,其中,第二预设数据类型为二进制的数据类型;接收发送指令,其中,发送指令为用于指示发送目标文本的指令;以及根据发送指令将第二预设数据类型的目标文本发送至目标用户。
[0010]进一步地,在根据发送指令将为预设数据类型的目标文本发送至目标用户之后,该方法还包括:客户端获取第二预设数据类型的目标文本;以及客户端将第二预设数据类型的目标文本转换为文本类型的目标文本。
[0011]进一步地,在需要文本聚合的数据列中确定需要文本聚合的源文本之后,在获取聚合指令之前,该方法还包括:获取需要文本聚合的数据列中确定需要文本聚合的源文本;分别在源文本的首或尾添加分隔符,得到已添加分隔符的源文本,分隔符为用于分隔源文本的符号;以及将已添加分隔符的源文本的数据类型转换为第二预设数据类型,其中,第二预设数据类型为二进制的数据类型。
[0012]为了实现上述目的,根据本发明的另一个方面,提供了一种数据库文本聚合处理
>J-U ρ?α装直。
[0013]根据本发明提供是数据库文本聚合处理装置包括:第一确定单元,用于确定待处理数据库,其中,待处理数据库为需要进行文本聚合的数据库;第二确定单元,用于在待处理数据库中确定需要文本聚合的数据列;第三确定单元,用于在需要文本聚合的数据列中确定需要文本聚合的多个源文本;接收单元,用于接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令;以及聚合单元,用于聚合指令将多个源文本聚合为目标文本。
[0014]进一步地,聚合单元包括:第一聚合模块,用于根据聚合指令将多个源文本聚合为文本类型的目标文本。
[0015]进一步地,该第一聚合模块包括:第二聚合子模块,用于根据聚合指令将多个源文本聚合为第一预设数据类型的目标文本,其中,第一预设数据类型为预设的对目标文本执行聚合操作时目标文本的数据类型;以及第一转换子模块,用于将为第一预设数据类型的目标文本转换为文本类型的目标文本。
[0016]进一步地,该装置还包括:第二转换模块,用于将目标文本的数据类型转换为第二预设数据类型,其中,第二预设数据类型为二进制的数据类型;接收模块,用于接收发送指令,其中,发送指令为用于指示发送目标文本的指令;以及发送模块,用于根据发送指令将第二预设数据类型的目标文本发送至目标用户。
[0017]对于上述数据库文本聚合处理方法,通过确定待处理数据库,其中,待处理数据库为需要进行文本聚合的数据库;在待处理数据库中确定需要文本聚合的数据列;在需要文本聚合的数据列中确定需要文本聚合的多个源文本;接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令;根据聚合指令将多个源文本聚合为目标文本。通过本发明,解决了现有技术中在数据库中文本聚合处理效率低的问题,有效地提升了数据库中文本聚合处理效率。

【专利附图】

【附图说明】
[0018]构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0019]图1是根据本发明实施例的数据库文本聚合处理方法的流程图;以及
[0020]图2是根据本发明实施例的数据库文本聚合处理装置的示意图。

【具体实施方式】
[0021]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0022]为了使本【技术领域】的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0023]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0024]图1是根据本发明实施例的数据库文本聚合处理方法的流程图。该方法用于将多个源文本聚合为目标文本,如图1所示,该方法包括如下的步骤SlOl至步骤S102:
[0025]步骤S101,确定待处理数据库。
[0026]确定待处理的数据库,其中,待处理数据库为需要进行文本聚合的数据库。在本发明中,待处理的数据库优选为SQL Server数据库。
[0027]步骤S102,在待处理数据库中确定需要文本聚合的数据列。
[0028]在待处理数据库中确定需要文本聚合的数据列。即在SQL Server数据库中确定需要文本聚合的数据列。
[0029]在本发明实施例提供的数据库文本聚合处理方法中,在需要文本聚合的数据列中确定需要文本聚合的源文本之后,在获取聚合指令之前,该方法还包括:获取需要文本聚合的数据列中确定需要文本聚合的源文本;获取分隔符,其中,分隔符为用于分隔源文本的符号;分别在源文本的首或尾添加分隔符;获取已添加分隔符的源文本;以及将已添加分隔符的源文本的数据类型转换为第二预设数据类型,其中,第二预设数据类型为二进制的数据类型。
[0030]例如,在SQL Server数据库中确定需要文本聚合的数据列的具体代码为:
[0031]SELECT
[0032]hlr—out.LabelType
[0033]convert (nvarchar(max), (SELECT convert (varbinary(max), [Text]I’ )FROM[$(OldDatabase)].db0.HtmlLabelResources hlr
[0034]WHERE hlr.LabelType = hlr—out.LabelType
[0035]For XML P a t h ( " ) , root (J MyStringi ) , type).value (J /MyString[I]’,’ varbinary(max)’))LabelText
[0036]FROM[$(OldDatabase)].[dbo].[HtmlLabelResources]hlr_out
[0037]GROUP BY hlr—out.LabelType
[0038]其中,Text是原始文本,Hlr—out.1nternalPageId是聚合所依据的列。
[0039]在Text后面加了一个I字符,作为分隔符,这样拼接起来后,每个Text文本之间都会有I来分割,便于文本聚合后更方便的查看各个原始文本。
[0040]步骤S103,在需要文本聚合的数据列中确定需要文本聚合的多个源文本。
[0041]在需要文本聚合的数据列中确定需要文本聚合的多个源文本。
[0042]如上述的实例,在SQL Server数据库中确定需要文本聚合的数据列为Hlr_out.1nternalPageId,数据列为Hlr_out.1nternalPageId中需要文本聚合的源文本为text。
[0043]步骤S104,接收聚合指令。
[0044]接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令。
[0045]需要说明的是,上述的聚合指令,可以是接收外部输入的聚合指令,也可以是接收系统根据上一步操作自动生成的用于执行聚合操作的聚合指令。
[0046]步骤S105,根据聚合指令将多个源文本聚合为目标文本。
[0047]根据聚合指令将多个源文本聚合为目标文本。
[0048]优选地,根据聚合指令将多个源文本聚合为目标文本包括:根据聚合指令将多个源文本聚合为文本类型的目标文本。
[0049]具体地,根据聚合指令将多个源文本聚合为文本类型的目标文本包括:根据聚合指令将多个源文本聚合为第一预设数据类型的目标文本,其中,第一预设数据类型为预设的对目标文本执行聚合操作时目标文本的数据类型;以及将第一预设数据类型的目标文本转换为文本类型的目标文本。
[0050]优选地,在本发明实施例提供的数据库文本聚合处理方法中,第一预设数据类型为Xml数据类型。
[0051]需要说明的是,第一预设数据类型为Xml数据类型,根据聚合指令将多个源文本聚合为Xml数据类型。通过将多个源文本转换为Xml数据类型,即实现了在SQL Server数据库中将多个源文本聚合的目的。
[0052]在本发明实施例提供的数据库文本聚合处理方法中,该方法还包括:将目标文本的数据类型转换为第二预设数据类型,其中,第二预设数据类型为二进制的数据类型;接收发送指令,其中,发送指令为用于指示发送目标文本的指令;以及根据发送指令将第二预设数据类型的目标文本发送至目标用户。
[0053]优选地,在本发明实施例提供的数据库文本聚合处理方法中,第二预设数据类型为varbinary数据类型。
[0054]需要说明的是,第二预设数据类型为varbinary数据类型,目标文本中可能有乱码存在,通过将目标文本的数据类型转换为varbinary数据类型,解决了目标文本中存在的乱码问题。
[0055]本发明实施例提供的数据库文本聚合处理方法还包括:在根据发送指令将为预设数据类型的目标文本发送至目标用户之后,该方法还包括:获取第二预设数据类型的目标文本;以及将第二预设数据类型的目标文本转换为文本类型的目标文本。
[0056]优选地,在本发明实施例提供的数据库文本聚合处理方法中,文本类型为nvarchar 类型。
[0057]例如,在SQL Server数据库中根据聚合指令将多个源文本聚合为目标文本的具体代码为:
[0058]Convert(nvarchar(max)), (select Convert(varbinary(max), (Text)+9 I,)from[$(oldDatabase)]dbo htmlabelrources hlr
[0059]Where hlr IabelType = hlr_out.1abelType
[0060]For XML Path(,,),root(’Mystring’),type).value( ‘/MyString[I]’ , ’ varbinary(max)’ ))LabelText
[0061 ] 需要说明的是:从varbinary数据类型转换为文本类型的具体代码为Convert(nvarchar(max));
[0062]转换为varbinary 数据类型的具体代码为 Convert (varbinary (max),(Text)+’ | ’);
[0063]转换为XML类型的具体代码为For XML Path (”);
[0064]以varbinary形式发送至目标地址的具体代码为value ( ‘/MyString[l] ’,’varbinary(max)’))。
[0065]通过以上步骤,有效地提升了在SQL Server数据库中文本聚合处理效率。
[0066]本发明实施例提供的一种数据库文本聚合处理方法,通过确定待处理数据库,其中,待处理数据库为需要进行文本聚合的数据库;在待处理数据库中确定需要文本聚合的数据列;在需要文本聚合的数据列中确定需要文本聚合的多个源文本;接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令;根据聚合指令将多个源文本聚合为目标文本。通过本发明,解决了现有技术中在数据库中文本聚合处理效率低的问题,有效地提升了数据库中文本聚合处理效率。
[0067]需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0068]本发明实施例还提供了一种数据库文本聚合处理装置,需要说明的是,本发明实施例的数据库文本聚合处理装置可以用于执行本发明实施例所提供的用于数据库文本聚合处理方法。以下对本发明实施例提供的数据库文本聚合处理装置进行介绍。
[0069]图2是根据本发明的实施例的数据库文本聚合处理装置的示意图。该装置用于将多个源文本聚合为目标文本,如图2所示,该装置包括:第一确定单元10、第二确定单元20、第三确定单元30、接收单元40和聚合单元50。
[0070]第一确定单元10,用于确定待处理数据库,其中,待处理数据库为需要进行文本聚合的数据库。
[0071]第二确定单元20,用于在待处理数据库中确定需要文本聚合的数据列。
[0072]第三确定单元30,用于在需要文本聚合的数据列中确定需要文本聚合的多个源文本。
[0073]接收单元40,用于接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令。
[0074]聚合单元50,用于聚合指令将多个源文本聚合为目标文本。
[0075]该聚合单元还包括:第一聚合模块,用于根据聚合指令将多个源文本聚合为文本类型的目标文本。
[0076]具体地,该第一聚合模块包括:第二聚合子模块,用于根据聚合指令将多个源文本聚合为第一预设数据类型的目标文本,其中,第一预设数据类型为预设的对目标文本执行聚合操作时目标文本的数据类型;以及第一转换子模块,用于将为第一预设数据类型的目标文本转换为文本类型的目标文本。
[0077]本发明实施例提供的一种数据库文本聚合处理方法,通过第一确定单元10确定待处理数据库,其中,待处理数据库为需要进行文本聚合的数据库;第二确定单元20在待处理数据库中确定需要文本聚合的数据列;第三确定单元30在需要文本聚合的数据列中确定需要文本聚合的多个源文本;接收单元40接收聚合指令,其中,聚合指令为指示对多个源文本进行聚合的指令;以及聚合单元50用于聚合指令将多个源文本聚合为目标文本。通过本发明,解决了现有技术中在数据库中文本聚合处理效率低的问题,有效地提升了数据库中文本聚合处理效率。
[0078]优选地,在本发明实施例提供的数据库文本聚合处理装置中,该装置还包括:第二转换模块,用于将目标文本的数据类型转换为第二预设数据类型,其中,第二预设数据类型为二进制的数据类型;接收模块,用于接收发送指令,其中,发送指令为用于指示发送目标文本的指令;以及发送模块,用于根据发送指令将第二预设数据类型的目标文本发送至目标用户。
[0079]优选地,在本发明实施例提供的数据库文本聚合处理装置中,该装置还包括:第一获取模块,用于获取第二预设数据类型的目标文本;以及第三转换模块,用于将第二预设数据类型的目标文本转换为文本类型的目标文本。
[0080]优选地,在本发明实施例提供的数据库文本聚合处理装置中,该装置还包括:第二获取模块,用于获取需要文本聚合的数据列中确定需要文本聚合的源文本;添加模块,用于分别在源文本的首或尾添加分隔符,得到已添加分隔符的源文本,分隔符为用于分隔源文本的符号;以及第四转换模块,用于将已添加分隔符的源文本的数据类型转换为第二预设数据类型,其中,第二预设数据类型为二进制的数据类型。
[0081]显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0082]以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种数据库文本聚合处理方法,其特征在于,所述方法用于将多个源文本聚合为目标文本,所述方法包括: 确定待处理数据库,其中,所述待处理数据库为需要进行文本聚合的数据库; 在所述待处理数据库中确定需要文本聚合的数据列; 在所述需要文本聚合的数据列中确定需要文本聚合的多个源文本; 接收聚合指令,其中,所述聚合指令为指示对所述多个源文本进行聚合的指令;以及 根据所述聚合指令将所述多个源文本聚合为目标文本。
2.根据权利要求1所述的方法,其特征在于,根据所述聚合指令将所述多个源文本聚合为目标文本包括: 根据所述聚合指令将所述多个源文本聚合为文本类型的目标文本。
3.根据权利要求1所述的方法,其特征在于,根据所述聚合指令将所述多个源文本聚合为文本类型的目标文本包括: 根据所述聚合指令将所述多个源文本聚合为第一预设数据类型的目标文本,其中,所述第一预设数据类型为预设的对所述目标文本执行聚合操作时所述目标文本的数据类型;以及 将所述为第一预设数据类型的目标文本转换为文本类型的目标文本。
4.根据权利要求1所述的方法,其特征在于,在根据所述聚合指令将所述多个源文本聚合为目标文本之后,所述方法还包括: 将所述目标文本的数据类型转换为第二预设数据类型,其中,所述第二预设数据类型为二进制的数据类型; 接收发送指令,其中,所述发送指令为用于指示发送所述目标文本的指令;以及 根据所述发送指令将所述第二预设数据类型的所述目标文本发送至目标用户。
5.根据权利要求3所述的方法,其特征在于,在根据所述发送指令将为所述预设数据类型的所述目标文本发送至目标用户之后,所述方法还包括: 客户端获取所述第二预设数据类型的目标文本;以及 客户端将所述第二预设数据类型的目标文本转换为文本类型的所述目标文本。
6.根据权利要求1所述的方法,其特征在于,在所述需要文本聚合的数据列中确定需要文本聚合的源文本之后,在获取聚合指令之前,所述方法还包括: 获取所述需要文本聚合的数据列中确定需要文本聚合的源文本; 分别在所述源文本的首或尾添加分隔符,得到已添加分隔符的源文本,所述分隔符为用于分隔所述源文本的符号;以及 将所述已添加分隔符的源文本的数据类型转换为第二预设数据类型,其中,所述第二预设数据类型为二进制的数据类型。
7.一种数据库文本聚合处理装置,其特征在于,所述装置用于将多个源文本聚合为目标文本,所述装置包括: 第一确定单元,用于确定待处理数据库,其中,所述待处理数据库为需要进行文本聚合的数据库; 第二确定单元,用于在所述待处理数据库中确定需要文本聚合的数据列; 第三确定单元,用于在所述需要文本聚合的数据列中确定需要文本聚合的多个源文本; 接收单元,用于接收聚合指令,其中,所述聚合指令为指示对所述多个源文本进行聚合的指令;以及 聚合单元,用于所述聚合指令将所述多个源文本聚合为目标文本。
8.根据权利要求6所述的装置,其特征在于,所述聚合单元包括: 第一聚合模块,用于根据所述聚合指令将所述多个源文本聚合为文本类型的目标文本。
9.根据权利要求8所述的装置,其特征在于,所述第一聚合模块包括: 第二聚合子模块,用于根据所述聚合指令将所述多个源文本聚合为第一预设数据类型的目标文本,其中,所述第一预设数据类型为预设的对所述目标文本执行聚合操作时所述目标文本的数据类型;以及 第一转换子模块,用于将所述为第一预设数据类型的目标文本转换为文本类型的目标文本。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括: 第二转换模块,用于将所述目标文本的数据类型转换为第二预设数据类型,其中,所述第二预设数据类型为二进制的数据类型; 接收模块,用于接收发送指令,其中,所述发送指令为用于指示发送所述目标文本的指令;以及 发送模块,用于根据所述发送指令将所述第二预设数据类型的所述目标文本发送至目标用户。
【文档编号】G06F17/30GK104462350SQ201410738379
【公开日】2015年3月25日 申请日期:2014年12月4日 优先权日:2014年12月4日
【发明者】储雨知 申请人:北京国双科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1