一种网络和手机游戏的广告推荐系统的制作方法

文档序号:12748740阅读:204来源:国知局

本发明属于网络设备的信息推送技术领域,特别涉及一种网络和手机游戏的广告推荐系统。



背景技术:

随着网络游戏(网游)和手机游戏(手游)的发展,越来越多的用户在网游和手游中进行消费。同时,也有广告商在游戏中加入广告。然而,加入广告和时机和内容很大程度影响了广告点击和用户消费的效果。因此,适时适地的加入合适的广告内容是一个亟待解决的问题。

目前的手机游戏广告,还大多使用用户竞价的关键词来为网络或手机游戏推荐关键词。另外,还会通过用户点击数据来预测什么样的关键词会得到多少单位时间的点击量。这些方法都是基于用户的数据形成的方法。通常较少考虑到游戏内容和用户对游戏的感官,以及对关键词和广告产生的影响和反馈。



技术实现要素:

发明目的:本发明提供一种网络和手机游戏的广告推荐系统,基于网络游戏和手机游戏的上下文表达方式,同时对关键词或整体广告的表示进行学习,得到的新的关键词或整体广告,用于广告推荐、关键词游戏匹配、关键词查询等应用问题,能够为广告推荐给出一个考虑游戏内容的解决方案,能够大大提高用户体验,进而提高点击率。不仅考虑到关键词的建模,同时考虑到游戏界面的相关度。解决了现有技术中用户感官体验较差的问题。

技术方案:为实现上述目的,本发明采用的技术方案为:

一种网络和手机游戏的广告推荐系统,包括网络文本处理模块、游戏文本处理模块、游戏界面处理模块、游戏关键词向量学习模块、游戏关键词预测模块;网络文本处理模块用于抓取大量网络文本文件,生成关键词学习的训练数据;游戏文本处理模块用于获取游戏中的文本或游戏用户的文本,生成关键词学习的训练数据;游戏界面处理模块用于获取大量游戏图像或视频,生成关键词学习的训练数据;游戏关键词向量学习模块用于学习游戏的关键词特征;游戏关键词预测模块用于根据新的游戏界面和用户问题,计算广告关键词匹配度,推荐广告。

进一步,所述网络文本处理模块的操作步骤为:

步骤(A1),使用网络数据的种子URL,通过其超级链接得到网络相关文本;

步骤(A2),使用Hadoop平台并行抓取数据,通过开源的中文分词工具将网络相关文本分词并存储和索引;

其中,所述网络数据为游戏相关的社交网络平台以及通用社交平台的贴吧、论坛。

进一步,所述游戏文本处理模块的操作步骤为:

步骤(B1),通过游戏及游戏发布平台得到游戏相关文本文件;

步骤(B2),使用Hadoop平台并行抓取数据,通过开源的中文分词工具将游戏相关文本分词并存储和索引;

所述游戏及游戏发布平台提供的信息包括:大量游戏描述、游戏内关键词、游戏用户对话记录。

进一步,所述游戏界面处理模块的操作步骤为:

步骤(C1),通过游戏及游戏发布平台得到游戏界面相关图片文件和游戏界面图片相关文本文件;

步骤(C2),使用Hadoop平台并行抓取数据,通过开源的中文分词工具将游戏界面图片相关文本文件分词并存储和索引;

所述游戏及游戏发布平台提供的信息包括:游戏界面图像或视频;所述游戏还提供游戏截图。

进一步,所述游戏关键词向量学习模块,其操作步骤包括:

步骤(D1),通过网络、游戏、游戏界面图片文本数据,训练基于上下文的词向量词典,获取用户关键词;

步骤(D2),通过游戏界面相关图片,使用深度学习工具对图像进行特征提取,获得对于游戏界面相关图片的向量表示;

步骤(D3),根据网络、游戏、游戏界面图片文本的游戏关键词和游戏界面相关图片向量的相关性进行训练,得到包含用户关键词以及向量的信息;

其中,所述网络、游戏、游戏界面图片文本描述作为输入,其加权求和结果可以作为中间向量,该中间向量用于预测新游戏中相关的图片是否出现。

进一步,所述游戏关键词预测模块的具体操作步骤包括:

步骤(E1),对广告的关键词进行提取,在新的游戏中通过用户关键词以及向量的信息提取新游戏中出现的游戏关键词;

步骤(E2),将游戏关键词和广告的关键词进行匹配,进行关键词相似度匹配排序,根据关键词排序结果预测用户点击以及广告兑现金额,结合广告内容和用户数据进行加权,对广告进行排序,得到最终的广告排名,并将排名第一的广告推送给客户。

有益效果:与现有技术相比,本发明具有以下优点:

提出了对游戏关键词和图片进行向量表达的方法,可以从大量非结构化中文文本和图片中提取有用的内容。这些内容可以对游戏中的场景和用户对话进行很好的理解,从而使游戏广告更加精准有效。

附图说明

图1是本发明的结构示意图。

具体实施方式

一种网络和手机游戏的广告推荐系统,包括网络文本处理模块、游戏文本处理模块、游戏界面处理模块、游戏关键词向量学习模块、游戏关键词预测模块;网络文本处理模块用于抓取大量网络文本文件,生成关键词学习的训练数据;游戏文本处理模块用于获取游戏中的文本或游戏用户的文本,生成关键词学习的训练数据;游戏界面处理模块用于获取大量游戏图像或视频,生成关键词学习的训练数据;游戏关键词向量学习模块用于学习游戏的关键词特征;游戏关键词预测模块用于根据新的游戏界面和用户问题,计算广告关键词匹配度,推荐广告。

前述网络文本处理模块的操作步骤为:

步骤(A1),使用网络数据的种子URL,通过其超级链接得到网络相关文本;

步骤(A2),使用Hadoop平台并行抓取数据,通过开源的中文分词工具将网络相关文本分词并存储和索引;

其中,所述网络数据为游戏相关的社交网络平台以及通用社交平台的贴吧、论坛。

进一步,所述游戏文本处理模块的操作步骤为:

步骤(B1),通过游戏及游戏发布平台得到游戏相关文本文件;

步骤(B2),使用Hadoop平台并行抓取数据,通过开源的中文分词工具将游戏相关文本分词并存储和索引;

所述游戏及游戏发布平台提供的信息包括:大量游戏描述、游戏内关键词、游戏用户对话记录。

前述游戏界面处理模块的操作步骤为:

步骤(C1),通过游戏及游戏发布平台得到游戏界面相关图片文件和游戏界面图片相关文本文件;

步骤(C2),使用Hadoop平台并行抓取数据,通过开源的中文分词工具将游戏界面图片相关文本文件分词并存储和索引;

所述游戏及游戏发布平台提供的信息包括:游戏界面图像或视频;所述游戏还提供游戏截图。

前述游戏关键词向量学习模块,其操作步骤包括:

步骤(D1),通过网络、游戏、游戏界面图片文本数据,训练基于上下文的词向量词典,获取用户关键词;

步骤(D2),通过游戏界面相关图片,使用深度学习工具对图像进行特征提取,获得对于游戏界面相关图片的向量表示;

步骤(D3),根据网络、游戏、游戏界面图片文本的游戏关键词和游戏界面相关图片向量的相关性进行训练,得到包含用户关键词以及向量的信息;

其中,所述网络、游戏、游戏界面图片文本描述作为输入,其加权求和结果可以作为中间向量,该中间向量用于预测新游戏中相关的图片是否出现。

前述游戏关键词预测模块的具体操作步骤包括:

步骤(E1),对广告的关键词进行提取,在新的游戏中通过用户关键词以及向量的信息提取新游戏中出现的游戏关键词;

步骤(E2),将游戏关键词和广告的关键词进行匹配,进行关键词相似度匹配排序,根据关键词排序结果预测用户点击以及广告兑现金额,结合广告内容和用户数据进行加权,对广告进行排序,得到最终的广告排名,并将排名第一的广告推送给客户。

下面结合实施例对本发明作更进一步的说明。

如图1所示,为本发明的结构示意图。包括:

网络文本处理:抓取大量网络文本文件,作为关键词学习的训练数据之一。本专利主要使用网络数据包括,游戏相关的社交网络平台以及通用社交平台如贴吧、论坛等。通过数据抓取得到大量文本数据。首先使用一些种子URL,然后通过其超级链接得到相关文本。我们使用Hadoop平台并行抓取数据,再通过开源的中文分词工具将文本分词并存储和索引。中文分词通过使用(但不限于)Lucene斯坦福或中科院的分词器(但不限于)对中文进行分词处理。例如:把“猴子吃香蕉。”这句话分成“猴子吃香蕉。”经过分词的文章和句子同样存储到Lucene的数据库中。

游戏文本处理:获取游戏中的文本或游戏用户的文本。本专利通过游戏及游戏发布平台可以获取大量游戏描述、游戏内关键词、游戏用户对话记录。从而可以得到大量的游戏相关文本文件。对于游戏描述,我们进而通过获取高频关键词在搜索引擎中进行搜索,得到更多的文本数据。获得的文本数据通过与2.1节中相同的技术,对其进行分词和索引。

游戏界面数据处理:获取大量游戏图像或视频。本专利通过游戏及游戏发布平台可以获取大量游戏界面图像或视频。同时本专利可通过游戏获取大量游戏截图。对于游戏截图,本专利通过搜索引擎的图片搜索功能获得大量的图片以及相关文字描述,并对相关文字依据2.1节的方法进行处理。

游戏关键词向量学习:通过机器学习方法来学习游戏的关键词特征表示。关键词向量学习分为以下几步:

第一步:通过大量的文本数据(游戏描述、游戏中文本、游戏中对话历史记录等),训练一个基于上下文的词向量词典。例如,可以使用(但不限于)词向量,神经网络语言模型等等的方法得到。

第二步:通过大量的文本图片,获得对于图片的向量表示。例如,使用深度学习工具来对图像进行特征提取。

第三步,根据文字和图片的相关性(如游戏图片和描述、从搜索引擎中获得的大量图片和描述等)进行训练。例如,可以使用所展示的方法对文本和图片的数据进行训练。对于一张图片,它相关的文本描述可以作为输入,其加权求和结果可以作为中间向量,用这个向量来预测其相关的图片是否会出现。训练可以使用负采样的方法将不相关图片引入训练目标,进而可以进行监督学习。

游戏关键词预测:根据新的游戏界面和用户问题,预测使用广告关键词。对于一个新的游戏界面,我们通过不用的关键词进行试错,最终可以对所有关键词进行排序,得到最好的关键词。进而,如果需要在游戏中进行关键词预测或广告描述预测时,我们可根据游戏内容对广告进行排序。同时,如果考虑到用户点击以及可能的兑现金额,我们也可以通过结合基于内容的方法和基于用户数据的方法进行加权,得到最终的广告排名。

以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1