软件使用日志的数据挖掘方法及系统与流程

文档序号:26360996发布日期:2021-08-20 20:37阅读:142来源:国知局
软件使用日志的数据挖掘方法及系统与流程

本发明涉及软件使用日志的数据挖掘技术领域,具体而言,涉及一种软件使用日志的数据挖掘方法及系统。



背景技术:

目前,由于实际收集的软件使用日志信息数据结构复杂,导致挖掘难度大,效率低。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种软件使用日志的数据挖掘方法及系统,能够降低挖掘难度,提高挖掘效率。

根据本发明实施例的一个方面,提供一种软件使用日志的数据挖掘方法,应用于服务器,所述服务器与软件服务终端通信连接,所述方法包括:

根据各个软件服务终端传输的软件使用日志信息,分别抽取所述软件使用日志信息中的软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息;

将所述第一软件标签登记日志信息作为待挖掘日志信息,将所述第一软件标签非登记日志信息作为待融合日志信息,融合完整的第一挖掘日志信息,并分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息;

将所述第二软件标签登记日志信息作为待挖掘日志信息,将所述第二软件标签非登记日志信息作为待融合日志信息,融合完整的第二挖掘日志信息,并分时对所述第一挖掘日志信息和第二挖掘日志信息进行软件画像挖掘,得到目标软件画像。

在一种可能的示例中,所述方法还包括:

对软件标签登记日志信息和软件标签非登记日志信息进行抽取及组合的数据处理方式形成包含软件标签非登记日志信息的全部信息的所述第一挖掘日志信息和第二挖掘日志信息,然后将第一挖掘日志信息和第二挖掘日志信息分时输出,输出挖掘日志信息。

在一种可能的示例中,所述分别抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息的步骤,包括:

遍历抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息;

所述分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息的步骤,包括:

遍历抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

在一种可能的示例中,所述遍历抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息的步骤,包括:

分别抽取软件标签登记日志信息及软件标签非登记日志信息的可挖掘信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息;

所述遍历抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息的步骤,包括:

分别抽取软件标签登记日志信息及软件标签非登记日志信息的待挖掘信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

在一种可能的示例中,所述遍历抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息的步骤,包括:

分别抽取软件标签登记日志信息的可挖掘信息及软件标签非登记日志信息的待挖掘信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息;

所述遍历抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息的步骤,包括:

分别抽取软件标签登记日志信息的待挖掘信息及软件标签非登记日志信息的可挖掘信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

根据本发明实施例的另一方面,提供一种软件使用日志的数据挖掘系统,应用于服务器,所述服务器与软件服务终端通信连接,所述系统包括:

抽取模块,用于根据各个软件服务终端传输的软件使用日志信息,分别抽取所述软件使用日志信息中的软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息;

第一融合模块,用于将所述第一软件标签登记日志信息作为待挖掘日志信息,将所述第一软件标签非登记日志信息作为待融合日志信息,融合完整的第一挖掘日志信息,并分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息;

第二融合模块,用于将所述第二软件标签登记日志信息作为待挖掘日志信息,将所述第二软件标签非登记日志信息作为待融合日志信息,融合完整的第二挖掘日志信息,并分时对所述第一挖掘日志信息和第二挖掘日志信息进行软件画像挖掘,得到目标软件画像。

根据本发明实施例的另一方面,提供一种可读存储介质,该可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行上述的软件使用日志的数据挖掘方法的步骤。

相较于现有技术而言,本发明实施例提供的软件使用日志的数据挖掘方法及系统,通过分别抽取软件使用日志信息中的软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息,然后融合完整的第一挖掘日志信息,并分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息,从而融合完整的第二挖掘日志信息,并分时对所述第一挖掘日志信息和第二挖掘日志信息进行软件画像挖掘,得到目标软件画像。如此,通过区分闲时运行信息和非闲时运行信息,并基于可挖掘和待挖掘进行融合数据的操作,能够降低挖掘难度,提高挖掘效率。

为使本发明实施例的上述目的、特征和优点能更明显易懂,下面将结合实施例,并配合所附附图,作详细说明。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例所提供的服务器的组件示意图;

图2示出了本发明实施例所提供的软件使用日志的数据挖掘方法的流程示意图;

图3示出了本发明实施例所提供的软件使用日志的数据挖掘系统的功能模块框图。

具体实施方式

为了使本技术领域的学员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。根据本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1示出了服务器100的示例性组件示意图。服务器100可以包括一个或多个处理器104,诸如一个或多个中央处理单元(cpu),每个处理单元可以实现一个或多个硬件线程。服务器100还可以包括任何存储介质106,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储介质106可以包括以下任一项或多种组合:任何类型的ram,任何类型的rom,闪存设备,硬盘,光盘等。更一般地,任何存储介质都可以使用任何技术来存储信息。进一步地,任何存储介质可以提供信息的易失性或非易失性保留。进一步地,任何存储介质可以表示服务器100的固定或可移除部件。在一种情况下,当处理器104执行被存储在任何存储介质或存储介质的组合中的相关联的指令时,服务器100可以执行相关联指令的任一操作。服务器100还包括用于与任何存储介质交互的一个或多个驱动单元108,诸如硬盘驱动单元、光盘驱动单元等。

服务器100还包括输入/输出110(i/o),其用于接收各种输入(经由输入单元112)和用于提供各种输出(经由输出单元114))。一个具体输出机构可以包括呈现设备116和相关联的图形用户接口(gui)118。服务器100还可以包括一个或多个网络接口120,其用于经由一个或多个通信单元122与其他设备交换数据。一个或多个通信总线124将上文所描述的部件耦合在一起。

通信单元122可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信单元122可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器100等的任何组合。

图2示出了本发明实施例提供的软件使用日志的数据挖掘方法的流程示意图,该软件使用日志的数据挖掘方法可由图1中所示的服务器100执行,该软件使用日志的数据挖掘方法的详细步骤介绍如下。

步骤s110,根据各个软件服务终端传输的软件使用日志信息,分别抽取所述软件使用日志信息中的软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

步骤s120,将所述第一软件标签登记日志信息作为待挖掘日志信息,将所述第一软件标签非登记日志信息作为待融合日志信息,融合完整的第一挖掘日志信息,并分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

步骤s130,将所述第二软件标签登记日志信息作为待挖掘日志信息,将所述第二软件标签非登记日志信息作为待融合日志信息,融合完整的第二挖掘日志信息,并分时对所述第一挖掘日志信息和第二挖掘日志信息进行软件画像挖掘,得到目标软件画像。

基于上述步骤,本实施例通过分别抽取软件使用日志信息中的软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息,然后融合完整的第一挖掘日志信息,并分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息,从而融合完整的第二挖掘日志信息,并分时对所述第一挖掘日志信息和第二挖掘日志信息进行软件画像挖掘,得到目标软件画像。如此,通过区分闲时运行信息和非闲时运行信息,并基于可挖掘和待挖掘进行融合数据的操作,能够降低挖掘难度,提高挖掘效率。

在一种可能的示例中,本实施例还可以对软件标签登记日志信息和软件标签非登记日志信息进行抽取及组合的数据处理方式形成包含软件标签非登记日志信息的全部信息的所述第一挖掘日志信息和第二挖掘日志信息,然后将第一挖掘日志信息和第二挖掘日志信息分时输出,输出挖掘日志信息。

在一种可能的示例中,针对步骤s110,可以遍历抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

例如,可以分别抽取软件标签登记日志信息及软件标签非登记日志信息的可挖掘信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

又例如,还可以分别抽取软件标签登记日志信息的可挖掘信息及软件标签非登记日志信息的待挖掘信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

针对步骤s120,可以遍历抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

例如,可以分别抽取软件标签登记日志信息及软件标签非登记日志信息的待挖掘信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

又例如,还可以分别抽取软件标签登记日志信息的待挖掘信息及软件标签非登记日志信息的可挖掘信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

图3示出了本发明实施例提供的软件使用日志的数据挖掘系统200的功能模块图,该软件使用日志的数据挖掘系统200实现的功能可以对应上述方法执行的步骤。该软件使用日志的数据挖掘系统200可以理解为上述服务器100,或服务器100的处理器,也可以理解为独立于上述服务器100或处理器之外的在服务器100控制下实现本发明功能的组件,如图3所示,下面分别对该软件使用日志的数据挖掘系统200的各个功能模块的功能进行详细阐述。

抽取模块210,用于根据各个软件服务终端传输的软件使用日志信息,分别抽取所述软件使用日志信息中的软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

第一融合模块220,用于将所述第一软件标签登记日志信息作为待挖掘日志信息,将所述第一软件标签非登记日志信息作为待融合日志信息,融合完整的第一挖掘日志信息,并分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

第二融合模块230,用于将所述第二软件标签登记日志信息作为待挖掘日志信息,将所述第二软件标签非登记日志信息作为待融合日志信息,融合完整的第二挖掘日志信息,并分时对所述第一挖掘日志信息和第二挖掘日志信息进行软件画像挖掘,得到目标软件画像。

在一种可能的示例中,所述抽取模块210还用于对软件标签登记日志信息和软件标签非登记日志信息进行抽取及组合的数据处理方式形成包含软件标签非登记日志信息的全部信息的所述第一挖掘日志信息和第二挖掘日志信息,然后将第一挖掘日志信息和第二挖掘日志信息分时输出,输出挖掘日志信息。

在一种可能的示例中,所述抽取模块210通过以下方式分别抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息:

遍历抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

在一种可能的示例中,所述抽取模块210通过以下方式分别抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息:

遍历抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

在一种可能的示例中,所述抽取模块210通过以下方式遍历抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息:

分别抽取软件标签登记日志信息及软件标签非登记日志信息的可挖掘信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

在一种可能的示例中,所述抽取模块210通过以下方式遍历抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息:

分别抽取软件标签登记日志信息及软件标签非登记日志信息的待挖掘信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

在一种可能的示例中,所述抽取模块210通过以下方式遍历抽取软件标签登记日志信息和软件标签非登记日志信息的设定日志元素信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息:

分别抽取软件标签登记日志信息的可挖掘信息及软件标签非登记日志信息的待挖掘信息,形成第一软件标签登记日志信息和第一软件标签非登记日志信息。

在一种可能的示例中,所述抽取模块210通过以下方式遍历抽取软件标签登记日志信息和软件标签非登记日志信息的其他设定日志元素信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息:

分别抽取软件标签登记日志信息的待挖掘信息及软件标签非登记日志信息的可挖掘信息,形成第二软件标签登记日志信息和第二软件标签非登记日志信息。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的根据硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

可以替换的,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其它的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图进销存确认视为限制所涉及的权利要求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1