基于语义分析的精确目标用户消息推送方法及系统与流程

文档序号:12596602阅读:209来源:国知局
基于语义分析的精确目标用户消息推送方法及系统与流程

本申请涉及消息推送技术领域,具体地说,涉及一种基于语义分析的精确目标用户消息推送方法及系统。



背景技术:

随着整个社会信息化程度的加深,各种各样的信息化应用在我们的日常生活中占据了越来越重要的地位,而在这些应用中,用户消息推送几乎是一个必不可少的功能。伴随着消息推送需求的发展,该功能也经历了模块化、平台化甚至第三方服务化的发展变化。在当前形形色色的消息推送功能中,主要有一下几种实现方式:

单独用户推送。用于向系统中的具体某个用户推送消息数据,该种方式基于应用系统本身的用户管理,多用于用户操作信息的反馈,无法主动化自动化推送消息,由此产生的时间成本非常大。

1、全局推送。

用于向系统中全部用户推送消息数据,该种方式多用来推送系统中的新闻、广告等消息内容,缺点是无法精确推送到目标用户群体中,推送效果较差,大量无用信息也会引起非目标用户的反感。

2、分组推送。

通过应用系统中的用户分组界定,向特定用户分组中的用户推送消息数据,是单独用户推送与全局推送方式的结合。该种设计方式使得消息推送模块与应用系统的耦合度非常高,难以做通用性扩展与移植工作。另外用户分组的界定受分组粒度、层级限制,无法满足所有精确推送要求。

3、标签推送。

该种方式多用于第三方消息服务平台,通过对全部用户多次发送消息,对用户针对不同消息内容的习惯性反馈进行分析,从而对不同用户分组贴上关联标签。使用该方式可避免与应用系统的耦合性关联,完全通过用户数据分析进行标签标识,相比其他方式更加灵活,但是也存在系统学习成本高、时间开销大,标签设置粘贴需要人工参与,无法有效利用应用系统中现有数据的问题。



技术实现要素:

有鉴于此,本申请所要解决的技术问题是提供了一种基于语义分析的精确目标用户消息推送方法及系统,适用于应用系统内部针对全局、精确用户推送新闻、通知、短信等情况;也适用于作为第三方服务平台,为不同的应用系统提供精确用户消息推送服务。

为了解决上述技术问题,本申请有如下技术方案:

一种基于语义分析的精确目标用户消息推送方法,包括:

分析描述用户身份界定的用户属性,形成用户属性列表;

针对所述用户属性列表中的每条用户属性,定义多个用于文本描述的标签,生成标签库;

将所述用户属性和对应的标签进行一一对应的关联配置,并将关联配置结果写入数据库中,完成系统初始化工作;

等待输入目标用户群体的用户描述文本;

对输入的所述用户描述文本进行语义分析,将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词;

计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示;

将语义分析结果与用户属性标签进行关联;

通过用户属性关联标签进行用户建模,获取用户属性及用户属性对应值的列表;

根据将所述用户属性和对应的标签进行一一对应的关联配置的关联配置结果生成查询条件,将用户属性及用户属性对应值的列表中的全部用户属性生成查询条件整合,生成目标用户查询语句;

根据所述目标用户查询语句查询用户数据库,获取用户列表;

根据数据库的配置信息,将待发送的消息与所述用户列表中的用户标识进行关联,并将关联结果写入到数据库中对应的用户消息关联表中;

向用户列表中的各用户进行消息推送。

优选地,其中:

所述消息推送方法,进一步包括:在所述计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示之后,

将所述关键字与所述标签库进行比对,若所述关键字内容与用户属性内容符合,则将关键字加入到所述标签库中作为扩展标签,否则抛弃所述关键字,直至完成所有关键字的判断。

优选地,其中:

对输入的所述用户描述文本进行语义分析,将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词,进一步为:

对输入的所述用户描述文本进行语义分析,利用汉语语言模型将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词。

优选地,其中:

计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示,进一步为:

利用有监督机器学习方法来计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示。

优选地,其中:

所述预设阈值为0.3。

一种基于语义分析的精确目标用户消息推送系统,其特征在于,包括:用户属性管理模块、数据配置模块、数据接收模块、语义分析模块、机器学习模块、用户查询模块和消息发送模块,

所述用户属性管理模块,用于分析描述用户身份界定的用户属性,形成用户属性列表;并用于针对所述用户属性列表中的每条用户属性,定义多个用于文本描述的标签,生成标签库;

所述数据库配置模块,用于将所述用户属性和对应的标签进行一一对应的关联配置,并将关联配置结果写入数据库中;

所述数据接收模块,用于等待输入目标用户群体的用户描述文本;

所述语义分析模块,用于对输入的所述用户描述文本进行语义分析,将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词;并用于计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示;

所述机器学习模块,用于将语义分析结果与用户属性标签进行关联;

所述用户查询模块,用于通过用户属性关联标签进行用户建模,获取用户属性及用户属性对应值的列表;并用于根据将所述用户属性和对应的标签进行一一对应的关联配置的关联配置结果生成查询条件,将用户属性及用户属性对应值的列表中的全部用户属性生成查询条件整合,生成目标用户查询语句;还用于根据所述目标用户查询语句查询用户数据库,获取用户列表;

所述消息发送模块,用于根据数据库的配置信息,将待发送的消息与所述用户列表中的用户标识进行关联,并将关联结果写入到数据库中对应的用户消息关联表中;并用于向用户列表中的各用户进行消息推送。

优选地,其中:

所述机器学习模块,进一步用于将所述关键字与所述标签库进行比对,若所述关键字内容与用户属性内容符合,则将关键字加入到所述标签库中作为扩展标签,否则抛弃所述关键字,直至完成所有关键字的判断。

优选地,其中:

所述语义分析模块,进一步用于对输入的所述用户描述文本进行语义分析,利用汉语语言模型将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词。

优选地,其中:

所述语义分析模块,进一步用于利用有监督机器学习方法来计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示。

优选地,其中:

所述预设阈值为0.3。

与现有技术相比,本申请所述的方法及系统,达到了如下效果:

第一,本发明所提供的基于语义分析的精确目标用户消息推送方法及系统,适用于应用系统内部针对全局、精确用户推送新闻、通知、短信等情况;也适用于作为第三方服务平台,为不同的应用系统提供精确用户消息推送服务。

第二,本发明所提供的基于语义分析的精确目标用户消息推送方法及系统,利用分析条件配置、语义分析算法、有监督的机器学习方法、用户分析建模与精确用户推送等方法,通过对用户群体的文本描述,实现了针对应用系统中特定用户的消息推送机制。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本发明的所述一种基于语义分析的精确目标用户消息推送方法的流程图;

图2为本发明的所述一种基于语义分析的精确目标用户消息推送系统的结构图;

图3为本发明的所述一种基于语义分析的精确目标用户消息推送方法的实施例的流程图。

具体实施方式

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。

实施例1

参见图1所示为本申请所述一种基于语义分析的精确目标用户消息推送方法的具体实施例,该方法包括:

步骤101、分析描述用户身份界定的用户属性,形成用户属性列表;

步骤102、针对所述用户属性列表中的每条用户属性,定义多个用于文本描述的标签,生成标签库;

步骤103、将所述用户属性和对应的标签进行一一对应的关联配置,并将关联配置结果写入数据库中,完成系统初始化工作;

步骤104、等待输入目标用户群体的用户描述文本;

步骤105、对输入的所述用户描述文本进行语义分析,将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词;

步骤106、计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示;

步骤107、将语义分析结果与用户属性标签进行关联;

步骤108、通过用户属性关联标签进行用户建模,获取用户属性及用户属性对应值的列表;

步骤109、根据将所述用户属性和对应的标签进行一一对应的关联配置的关联配置结果生成查询条件,将用户属性及用户属性对应值的列表中的全部用户属性生成查询条件整合,生成目标用户查询语句;

步骤110、根据所述目标用户查询语句查询用户数据库,获取用户列表;

步骤111、根据数据库的配置信息,将待发送的消息与所述用户列表中的用户标识进行关联,并将关联结果写入到数据库中对应的用户消息关联表中;

步骤112、向用户列表中的各用户进行消息推送。

本申请所提供的基于语义分析的精确目标用户消息推送方法,进一步包括:在步骤106之后,即在计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示之后,将所述关键字与所述标签库进行比对,若所述关键字内容与用户属性内容符合,则将关键字加入到所述标签库中作为扩展标签,否则抛弃所述关键字,直至完成所有关键字的判断。

通过上述方式,可将相关的关键字进行抽取,将其纳入描述标签中,从而实现持续化的机器学习与关键字扩展。

本申请所提供的基于语义分析的精确目标用户消息推送方法中,上述步骤105将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词,进一步为:

对输入的所述用户描述文本进行语义分析,利用N-Gram(汉语语言模型)将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词。汉语语言模型利用上下文中相邻词间的搭配信息,在需要把连续无空格的拼音、笔画,或代表字母或笔划的数字,转换成汉字串(即句子)时,可以计算出具有最大概率的句子,从而实现到汉字的自动转换,无需用户手动选择,避开了许多汉字对应一个相同的拼音(或笔划串、或数字串)的重码问题。

本申请所提供的基于语义分析的精确目标用户消息推送方法中,上述步骤106,计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示,进一步为:

利用有监督机器学习方法来计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块中进行展示。

本申请利用有监督机器学习方法来计算各分词(term)的权重(weight),类似于机器学习的分类任务,对于文本串的每个term,预测一个[0,1]的得分,得分越大则代表term重要性越高。既然是有监督小恶习,那么久需要训练数据。如果采用人工标注的话,极大耗费人力,所以可以采用训练数据自提取的方法,利用程序从搜索日志里自动挖掘。从海量日志数据里提取隐含的用户对于term重要性的标注,得到的训练数据将综合亿级用户的“标注结果”,覆盖面更广,且来自于真实搜索数据,训练结果与标注的目标基分步接近,训练数据更精确。

上述步骤106中,预设阈值为0.3,也就是说,将权重超过0.3的term选为关键字。当然除了0.3外,用户还可根据实际情况对预设阈值进行灵活设置。

本申请中可通过现有技术中的成熟语义分析算法对管理员输入的用户群体描述文本进行语义分析,从而找到目标用户群体。此处不再对现有技术中的成熟语义分析算法进行赘述。

本申请中的用户精确界定通过分析条件配置与语义分析算法共同实现。根据针对应用系统的业务分析,抽取每个用户的不同界定属性形成界定属性列表,对每个界定属性贴上描述标签,并与用户数据进行关联。

本发明中通过现行的成熟语义分析算法对管理员输入的用户群体描述文本进行语义分析,从而找到目标用户群体。首先通过N-Gram语言模型对输入的文本描述进行全切分分词,接下来对每个分词term进行权重计算获取term weight,并将其与上面配置的描述标签进行比对获取文本关键字。

本发明采用监督式机器学习方法,在完成描述文本的语义分析后形成的term中,根据不同的term weight管理员可对其中关键字进行抽取,将其纳入描述标签中,从而实现持续化的机器学习与关键字扩展。

在用户分析建模的过程中,本发明中根据完成语义分析后形成的关键字形成用户属性,并且通过关键字与用户数据进行的关联进行用户建模。完成用户分析建模后即生成用户精确查询条件。

在进行精确用户推送的过程中,本发明中为避免与应用系统的过分耦合,数据与应用系统进行分离,通过建模获得的用户精确查询条件获取用户列表后,根据数据配置将用户与消息的关联写入到对应的数据库表中,从而完成消息推送。

实施例2

参见图2所示为本申请所述一种基于语义分析的精确目标用户消息推送系统的具体实施例,该系统包括:用户属性管理模块10、数据配置模块20、数据接收模块30、语义分析模块40、机器学习模块50、用户查询模块60和消息发送模块70,

所述用户属性管理模块10,用于分析描述用户身份界定的用户属性,形成用户属性列表;并用于针对所述用户属性列表中的每条用户属性,定义多个用于文本描述的标签,生成标签库;

所述数据库配置模块,用于将所述用户属性和对应的标签进行一一对应的关联配置,并将关联配置结果写入数据库中;

所述数据接收模块30,用于等待输入目标用户群体的用户描述文本;

所述语义分析模块40,用于对输入的所述用户描述文本进行语义分析,将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词;并用于计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块50中进行展示;

所述机器学习模块50,用于将语义分析结果与用户属性标签进行关联;

所述用户查询模块60,用于通过用户属性关联标签进行用户建模,获取用户属性及用户属性对应值的列表;并用于根据将所述用户属性和对应的标签进行一一对应的关联配置的关联配置结果生成查询条件,将用户属性及用户属性对应值的列表中的全部用户属性生成查询条件整合,生成目标用户查询语句;还用于根据所述目标用户查询语句查询用户数据库,获取用户列表;

所述消息发送模块70,用于根据数据库的配置信息,将待发送的消息与所述用户列表中的用户标识进行关联,并将关联结果写入到数据库中对应的用户消息关联表中;并用于向用户列表中的各用户进行消息推送。

本申请中的机器学习模块50,进一步用于将所述关键字与所述标签库进行比对,若所述关键字内容与用户属性内容符合,则将关键字加入到所述标签库中作为扩展标签,否则抛弃所述关键字,直至完成所有关键字的判断。

本申请中的语义分析模块40,进一步用于对输入的所述用户描述文本进行语义分析,利用汉语语言模型将所述用户描述文本进行全切分分词,获取含有正确语义的多个分词。

本申请中的语义分析模块40,进一步用于利用有监督机器学习方法来计算各个所述分词的权重,将权重超过预设阈值的分词作为关键字,并将所述关键字在机器学习模块50中进行展示。

本申请中的预设阈值为0.3。也就是说,将权重超过0.3的term选为关键字。当然除了0.3外,用户还可根据实际情况对预设阈值进行灵活设置。

本申请中可通过现有技术中的成熟语义分析算法对管理员输入的用户群体描述文本进行语义分析,从而找到目标用户群体。此处不再对现有技术中的成熟语义分析算法进行赘述。

总体来讲,本申请中的数据接收模块30,用于实现管理员的待发送消息、用户描述文本信息录入功能,完成录入数据交由语义分析模块40进行处理。

本申请中的语义分析模块40,使用现有成熟语义算法,通过获取用户属性管理模块10中的标签库配置信息,对数据录入模块传入的文本信息进行处理,实现语义建模、文本切分、权重计算等功能。

本申请中的机器学习模块50,将语义分析结果与用户属性标签进行关联,在管理员监督下实现标签识别与标签库扩展,将处理结果更新到用户属性管理模块10中。

本申请中的用户属性管理模块10,管理员通过该模块定义用户界定属性与属性对应的标签库,并写入数据库配置模块中,在完成用户属性建模后将用户属性模型传递到用户查询模块60。

本申请中的用户查询模块60,获取用户属性模型后,通过读取数据库配置模块中用户界定属性在数据库中的对应字段、字段数据类型等配置信息,生成用户查询语句并查询目标用户列表。

本申请中的消息发送模块70,根据数据库配置模块中消息用户关联表的配置信息将消息写入到对应关联表中完成消息推送。

本申请中的数据配置模块20,记录用户属性与数据库字段的对应关系、消息用户关联表信息等数据库配置。

实施例3

以下提供一种本发明基于语义分析的精确目标用户消息推送方法的应用实施例,具体包括:

步骤201、分析用户属性形成属性列表。

管理员分析应用系统中描述用户身份界定的属性,将界定属性添加到用户属性管理模块10中形成属性列表。

步骤202、定义标签。

针对属性列表中的每条属性定义多个用于文本描述的标签,在用户属性管理模块10中生成标签库。

步骤203、建立数据库关联。

将界定属性与数据库中对应的表与字段进行一一对应的关联配置,写入数据库配置模块,完成系统初始化工作。

步骤204、输入用户描述文本。

在消息发送流程中,管理员完成消息编辑后录入目标用户群的描述文本,如“居住在市中区的老年人”。

步骤205、进行语义分析。

对管理员录入的描述文本N-Gram模型建模,进行全切分分词获取含有正确语义的多个Term。

步骤206、权重计算,获取关键字。

计算各个Term的Term Weighting,超过阈值0.3的Term作为关键字在机器学习模块中进行展示。

步骤207、进行标签对比,监督式机器学习。

步骤208、判断Term的Term Weighting是否符合标准。

步骤209、若符合标准,则扩展标签库。

对于步骤207-步骤209,主要是监督式机器学习。获取文本中的关键字后,与现有标签库进行对比,若判断关键字与界定属性内容符合,则加入到标签库中作为标签扩展,否则抛弃该关键字直至所有关键字判断完成,进入用户属性建模流程。

步骤210、分析用户属性,建立用户模型。

通过对用户属性关联标签进行用户建模,获取用户属性及属性对应值的列表。例如,“性别”属性与对应值“男”。

步骤211、生成查询条件。

根据前面配置的用户属性与数据库字段的一一对应关系生成查询条件,将列表中全部属性生成的查询条件整合,生成目标用户查询语句。例如,查询“性别”属性对应的数据库中“sex”字段,获取其中值为“男”的用户。

步骤212、获取用户列表。

根据上面形成的查询语句查询用户数据库,获取用户列表。

步骤213、建立用户与消息关联。

根据数据库的配置信息将管理员发送的消息与用户表中的用户标识进行关联,写入到数据库中对应的用户消息关联表中。

步骤214、消息推送。

通过以上各实施例可知,本申请存在的有益效果是:

第一,本发明所提供的基于语义分析的精确目标用户消息推送方法及系统,适用于应用系统内部针对全局、精确用户推送新闻、通知、短信等情况;也适用于作为第三方服务平台,为不同的应用系统提供精确用户消息推送服务。

第二,本发明所提供的基于语义分析的精确目标用户消息推送方法及系统,利用分析条件配置、语义分析算法、有监督的机器学习方法、用户分析建模与精确用户推送等方法,通过对用户群体的文本描述,实现了针对应用系统中特定用户的消息推送机制。

本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1