一种信息处理方法和服务器的制造方法_3

文档序号:9865720阅读:来源:国知局
作;其中,所述预设处理规则包括:直接将所述单原子特征数据作为处理结果;和/或,将所述单原子特征数据按预设运算规则进行运算处理。
[0068]本发明实施例的服务器用于基于离线特征抽取的特定参数的估算。
[0069]图3为本发明实施例的服务器的另一种应用示意图;具体可参照图3所示,所述特征生成器11获得的离线来源数据包括:历史日志数据;其中,所述历史日志数据包含有在当前时刻之前的用户相关数据、终端设备相关数据、多媒体信息展示页面的相关数据、多媒体信息的相关数据以及所述多媒体信息的离线数据等等;其中,所述用户相关数据例如用户的性别、年龄等等;所述终端设备(例如手机)相关数据例如终端设备型号、终端设备的联网类型等等;所述多媒体信息展示页面的相关数据例如展示位、展示页面信息(如关键字、分类、主题等)等;所述多媒体信息的相关数据例如多媒体信息的属性信息(如多媒体信息的标识码(ID)、多媒体信息的类型等等);所述多媒体信息的离线数据为计算获得的数据,例如所述多媒体信息在预设时间范围内(例如一天之内)的平均点击率、平均转换率等等。
[0070]本实施例中,所述特征生成器11中预先配置至少一个特征类别(即所述预设类别);所述特征生成器11依据所述至少一个特征类别对所述历史日志数据进行识别;获得满足所述至少一个特征类别的第三特征数据。所述第三特征数据通常包括特征类别和特征取值两部分,例如特征数据可以为“性别为男性”,其中,“性别”表示特征类别,“男性”表征特征取值。进一步地,所述特征生成器11将所述第三特征数据解析为单原子特征数据;所述单原子特征数据表示某一类特征类别的取值,以上述特征数据为“性别为男性”为例,则解析后的单原子特征数据为“男性”。则本实施例中,所述特征生成器11将满足预设类别的第三特征数据全部解析为第三单原子特征数据,将所述第三单原子特征数据发送至特征池12进行存储。
[0071]本实施例中,所述特征处理器13从所述特征池12中读取存储的所述第三单原子特征数据,按预设规则进行处理,获得处理结果,以将所述处理结果发送至预估模块,由所述预估模块基于所述处理结果进行预估参数的计算。具体的,所述特征处理器13预先配置一模型,所述模型例如CVR模型;所述模型中进行数据处理所需要的特征类别与所述特征生成器11中预先配置的特征类别相匹配。所述特征处理器13基于所述模型中的处理规则对所述第三单原子特征数据进行处理,可以为直接读取第三单原子特征数据,和/或对所述第三单原子特征数据按预设的运算规则进行运算处理生成组合特征数据,所述运算规则例如交集处理、并集处理、差集处理等等。以所述第三单原子特征数据分别为:“男性”、“25岁”、“游戏”为例,以所述运算规则为交集处理为例,则按交集处理规则获得的组合特征数据为“男性and25岁and游戏”。
[0072]采用本发明实施例的技术方案,通过服务器中包含的特征生成器、特征池和特征处理器的抽取架构,在海量的源数据中,抽取并存储预估参数相关的特征数据,大大提高了特征数据的抽取效率,为后续的特定参数的估算提供了便利。
[0073]在本发明实施例一至实施例三中,所述服务器中的特征生成器11、特征池12和特征处理器13,在实际应用中,均可由所述服务器中的中央处理器(CPU,Central ProcessingUnit)、数字信号处理器(DSP,Digital Signal Processor)或可编程门阵列(FPGA,Field —Programmable Gate Array)实现。
[0074]实施例四
[0075]本发明实施例还提供了一种信息处理方法。图4为本发明实施例的信息处理方法的流程示意图;如图4所示,所述信息处理方法包括:
[0076]步骤401:获得源数据,识别所述源数据获得满足预设类别的特征数据。
[0077]步骤402:将所述特征数据解析为单原子特征数据,将所述单原子特征数据存储至特征池。
[0078]步骤403:从所述特征池中读取所述单原子特征数据,对所述单原子特征数据按照预设处理规则进行处理,以基于处理结果确定预估参数。
[0079]本发明实施例的信息处理方法应用于服务器中,所述服务器中预先配置第一业务逻辑和第二业务逻辑,所述第一业务逻辑用于步骤401和步骤402的操作流程,即获得源数据,识别所述源数据获得满足预设类别的特征数据,将所述特征数据解析为单原子特征数据,将所述单原子特征数据发送至特征池;在本实施例中,所述第一业务逻辑记为特征生成器。所述第二业务逻辑用于步骤403的操作流程,即从所述特征池中读取所述单原子特征数据,对所述单原子特征数据按照预设处理规则进行处理,所述第二业务逻辑记为特征处理器。可以理解为,所述特征生成器、所述特征池和所述特征处理器均为所述服务器中的单元模块。本发明实施例的信息处理方法主要用于特定参数的估算时,对所需要的特征数据进行抽取。
[0080]具体的,步骤401中,所述特征生成器获得的源数据包括:用户相关数据、终端设备相关数据、多媒体信息展示页面的相关数据、多媒体信息的相关数据以及所述多媒体信息的离线数据等等;其中,所述用户相关数据例如用户的性别、年龄等等;所述终端设备(例如手机)相关数据例如终端设备型号、终端设备的联网类型等等;所述多媒体信息展示页面的相关数据例如展示位、展示页面信息(如关键字、分类、主题等)等;所述多媒体信息的相关数据例如多媒体信息的属性信息(如多媒体信息的标识码(ID)、多媒体信息的类型等等);所述多媒体信息的离线数据为计算获得的数据,例如所述多媒体信息在预设时间范围内(例如一天之内)的平均点击率、平均转换率等等。其中,所述特征生成器可从历史日志中获得所述源数据,也可以实时在线获得用户相关数据以及调用离线词表,具体的实施方式可分别参见后续实施方式的描述,这里不详细描述。
[0081]具体的,步骤402中,所述特征生成器中预先配置至少一个特征类别(即所述预设类别);所述特征生成器依据所述至少一个特征类别对所述源数据进行识别,获得满足所述至少一个特征类别的特征数据。所述特征数据通常包括特征类别和特征取值两部分,例如特征数据可以为“性别为男性”,其中,“性别”表示特征类别,“男性”表征特征取值。进一步地,所述特征生成器将所述特征数据解析为单原子特征数据;所述单原子特征数据表示某一类特征类别的取值,以上述特征数据为“性别为男性”为例,则解析后的单原子特征数据为“男性”。则本实施例中,所述特征生成器将满足预设类别的特征数据全部解析为单原子特征数据,将所述单原子特征数据发送至特征池进行存储。
[0082]具体的,步骤403中,所述特征处理器从所述特征池中读取存储的所述单原子特征数据,按预设规则进行处理,获得处理结果,以将所述处理结果发送至预估模块,由所述预估模块基于所述处理结果进行预估参数的计算。具体的,所述特征处理器预先配置一模型,所述模型例如CVR模型;所述模型中进行数据处理所需要的特征类别与所述特征生成器中预先配置的特征类别相匹配。所述特征处理器基于所述模型中的处理规则对所述单原子特征数据进行处理,可以为直接读取单原子特征数据,和/或对所述单原子特征数据按预设的运算规则进行运算处理生成组合特征数据,所述运算规则例如交集处理、并集处理、差集处理等等。以单原子特征数据分别为:“男性”、“25岁”、“游戏”为例,以所述运算规则为交集处理为例,则按交集处理规则获得的组合特征数据为“男性and25岁and游戏”。
[0083]采用本发明实施例的技术方案,一方面,通过服务器中包含的特征生成器、特征池和特征处理器的抽取工具,实现了在线特征数据和离线特征数据的抽取,整合了现有技术中对于在线特征数据需要对应的一套特征抽取工具、离线特征数据需要对应的一套特征抽取工具,大大降低了特征抽取工具(例如软件工具或代码工具)的维护成本;另一方面,在海量的源数据中,抽取并存储预估参数相关的特征数据,大大提高了特征数据的抽取效率,为后续的特定参数的估算提供了便利。
[0084]作为一种实施方式,所述特征生成器获得的数据为在线来源数据,则相应的,图5为本发明实施例的信息处理方法的另一种流程示意图;如图5所示,本实施方式提供的信息处理方法包括:
[0085]步骤501:获得在线来源数据,所述在线来源数据包括:客户端传输的特征数据和离线特征数据;
[0086]步骤502:识别出所述客户端传输的特征数据中满足预设类别的第一特征数据,以及识别出所述离线特征数据中满足预设类别的第二特征数据。
[0087]步骤503:分别将所述第一特征数据解析为第一单原子特征数据,以及将所述第二特征数据解析为第二单原子特征数据;其中,所述第一单
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1