信息推送方法和装置的制造方法

文档序号:9922080阅读:404来源:国知局
信息推送方法和装置的制造方法
【技术领域】
[0001]本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及信息推送方法和装置。
【背景技术】
[0002]随着互联网技术的飞速发展,每天在各个网络平台上都会新增大量的信息。如何从海量的新增信息中,快速确定出向用户推荐的信息是现有技术中需要解决的一个重要问题。
[0003]在现有技术中,那些在单机模式下运行的信息推荐系统,很容易受到处理器速度、存储容量等诸多计算机硬件性能的限制;而那些在Hadoop (—个能够对大量数据进行分布式处理的软件框架)集群上运行的信息推荐系统,其处理海量数据时读写磁盘花费的时间过长,因此都难以实现快速的信息推荐。

【发明内容】

[0004]本申请的目的在于提出一种信息推送方法和装置,来解决以上【背景技术】部分提到的技术问题。
[0005]第一方面,本申请提供了一种信息推送方法,所述方法包括:获取多个候选信息;通过Spark平台对所述候选信息进行主题模型分析,确定各所述候选信息的主题;将所述候选信息推送给与其主题对应的用户。
[0006]在一些实施例中,所述获取多个候选信息包括:实时获取网络中新增的文本信息,作为所述候选信息。
[0007]在一些实施例中,在通过Spark平台对候选信息进行主题模型分析之前,所述方法还包括:将所述候选信息转换为所述Spark平台中的弹性分布式数据集RDD输入。
[0008]在一些实施例中,所述方法还包括:基于多个用户的历史浏览记录,确定用户主题;将所述用户主题配置为所述Spark平台中主题模型的主题。
[0009]在一些实施例中,所述方法还包括:基于所述用户的个性化信息,确定所述用户的用户标签;将所述候选信息推送给其主题对应的用户,包括:确定与所述用户标签匹配的主题;将所述候选信息推送给与其主题匹配的用户标签指定的用户。
[0010]在一些实施例中,所述个性化信息包括:年龄、性别、职业、地理位置和历史浏览记录中的至少一项。
[0011]第二方面,本申请提供了一种信息推送装置,所述装置包括:获取模块,用于获取多个候选信息;分析模块,用于通过Spark平台对所述候选信息进行主题模型分析,确定各所述候选信息的主题;推送模块,用于将所述候选信息推送给与其主题对应的用户。
[0012]在一些实施例中,所述分析模块在通过Spark平台对候选信息进行主题模型分析之前,还进一步用于:将所述候选信息转换为所述Spark平台中的弹性分布式数据集RDD输入。
[0013]在一些实施例中,还包括:主题确定模块,用于基于多个用户的历史浏览记录,确定用户主题;配置模块,用于将所述用户主题配置为所述Spark平台中主题模型的主题。
[0014]在一些实施例中,还包括:标签确定模块,用于基于所述用户的个性化信息,确定所述用户的用户标签;所述推送模块进一步用于:确定与所述用户标签匹配的主题;将所述候选信息推送给与其主题匹配的用户标签指定的用户。
[0015]在一些实施例中,所述个性化信息包括:年龄、性别、职业、地理位置和历史浏览记录中的至少一项。
[0016]本申请提供的信息推送方法和装置,可以通过搭建Spark平台对候选信息进行主题模型分析,并将候选信息推送给与其主题对应的用户,由于Spark平台可以大幅减少读写磁盘所花费的时间,因此可以实现快速及时的信息推荐。
【附图说明】
[0017]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0018]图1是本申请可以应用于其中的示例性系统架构图;
[0019]图2是根据本申请的信息推送方法的一个实施例的流程图;
[0020]图3是根据本申请的信息推送方法的又一个实施例的流程图;
[0021]图4是根据本申请的信息推送装置的一个实施例的结构示意图;
[0022]图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
【具体实施方式】
[0023]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0024]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0025]图1示出了可以应用本申请的信息推送方法或信息推送装置的实施例的示例性系统架构100。
[0026]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0027]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、搜索类应用、购物类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0028]终端设备101、102、103可以是各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Aud1 Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Aud1 Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
[0029]服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上运行的应用提供支持的后台服务器。后台服务器可以向终端推送信息。
[0030]需要说明的是,本申请实施例所提供的信息推送方法一般由基于Spark平台的服务器105执行,相应地,信息推送装置一般设置于服务器105中。
[0031]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0032]继续参考图2,示出了根据本申请的信息推送方法的一个实施例的流程200。所述的信息推送方法,包括以下步骤:
[0033]步骤201,获取多个候选信息。
[0034]在本实施例中,信息推送方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式从各个网络平台上获取多个候选信息。候选信息可以是发布在各个网络平台中的原始信息,包括各种文字信息、音频信息或多媒体信息等。例如,电子设备可以从各大门户网站获取文字形式的新闻信息作为候选信息。可选地,如果获取的信息中包括有语音信息,例如音频或视频中的语音信息,可以首先通过语音识别技术将语音信息转换为文字信息,然后再将文字信息作为候选信息。
[0035]在本实施例的一些可选的实现方式中,可以实时获取网络中新增的文本信息,作为候选信息。具体地,上述电子设备还可以通过有线连接方式或者无线连接方式,实时获取各个网络平台上新增的文本信息,例如新发布的文章、影评、微博和商品描述信息,作为候选信息。实时获取可以是指以很小的时间间隔,例如每分钟一次的频率,去网络中获取那些新发布或更新过的文本信息。这样,获取到的候选信息会具有较强的时效性。
[0036]需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
[0037]步骤202,通过Spark平台对候选信息进行主题模型分析,确定各候选信息的主题。
[0038]在本实施例中,上述
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1