基于人工智能的推送信息的方法和装置与流程

文档序号:12271456阅读:391来源:国知局
基于人工智能的推送信息的方法和装置与流程

本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及基于人工智能的推送信息的方法和装置。



背景技术:

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

现阶段,搜索引擎的默认语言是该国家的官方语言,对于一般的信息检索,官方语言的检索结果已经能够满足大部分用户的需求。考虑到大多数用户的语言偏好以及阅读能力,即使搜索引擎收录了一些其它语言的高度相关的检索结果(比如英文资料),可能也不会展现。这种策略显然降低了小部分人群的搜索体验,导致该部分用户来回切换语言选项,或者转向国外搜索引擎。

目前大部分搜索引擎只是提供了搜索语言的设置选项,当用户需要其它语言的搜索结果时需要手动去设置,手动来回切换语言选项,对于用户来说是非常繁琐的操作,极大的降低了用户体验,且语言设置后,只能通篇展示该语言的搜索结果。有的情景下,用户对语言没有一个明确的限制条件,各种语言只要是相关的、满足用户需求的都可以展现。设置语言选项对于用户来说是一种非常生硬的方式,因此无法更细致、准确的满足用户需求。



技术实现要素:

本申请的目的在于提出一种改进的基于人工智能的推送信息的方法和装置,来解决以上背景技术部分提到的技术问题。

第一方面,本申请提供了一种基于人工智能的推送信息的方法,所述方法包括:接收用户通过终端发送的查询信息,以第一语言为搜索所用的默认语言对所述查询信息进行搜索得到查询结果,其中,所述查询信息是用户使用第二语言输入的信息,所述查询结果包括至少一条第一语言查询结果和至少一条第二语言查询结果;根据所述用户所属的用户群的历史搜索点击数据确定所述用户为第二语言用户;对所述用户群的历史搜索点击数据进行分析,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第一需求级别;将所述用户群中的用户进行分类,分析所述用户所属类别中的、除所述用户外的其他用户对所述查询信息的查询结果的点击信息,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第二需求级别;根据所述第一需求级别和所述第二需求级别对所述查询结果中的第一语言查询结果和第二语言查询结果进行调整,并将调整后的结果推送到所述终端。

在一些实施例中,所述根据所述第一需求级别和所述第二需求级别对所述查询结果中的第一语言查询结果和第二语言查询结果进行调整,包括:根据所述第一需求级别和所述第二需求级别调整查询结果中的第一语言查询结果和第二语言查询结果的展示条数和排序。

在一些实施例中,所述根据所述用户所属的用户群的历史搜索点击数据确定所述用户为第二语言用户,包括:统计设定时长内所述用户的历史搜索点击数据中使用第二语言进行信息搜索的数量和所占比例,得到第一统计信息;统计设定时长内所述用户的历史搜索点击数据中所述用户点击的第二语言网址的数量和所占比例,以及不同第二语言网址显现比例下的第二语言网址点击情况,得到第二统计信息;统计所述用户群中的用户分别在指定的、使用第二语言输入的查询信息的查询结果上的第二语言网址点击信息,得到第三统计信息;根据所述第一统计信息、第二统计信息和第三统计信息确定所述用户为第二语言用户。

在一些实施例中,所述对所述用户群的历史搜索点击数据进行分析,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第一需求级别,包括:将所述查询信息切分为至少一个片段;统计设定时长内所述用户群中的用户对各个片段的查询结果中的第二语言网址的第一点击信息;抽取所述查询信息中的至少一个专有名词,并统计设定时长内所述用户群中的用户对各个专有名词,以及各个专有名词类别上的查绚结果中的第二语言网址的第二点击信息;将所述第一点击信息和所述第二点击信息进行合并,得到所述查询信息的综合点击信息;将所述综合点击信息输入预先训练的语言需求预测模型,得到所述用户对所述查询信息的第一需求级别。

在一些实施例中,所述将所述第一点击信息和所述第二点击信息进行合并,得到所述查询信息的综合点击信息,包括:采用加权平均法对所述第一点击信息和所述第二点击信息中包括的统计数据进行计算,得到所述查询信息的综合点击信息。

在一些实施例中,所述语言需求预测模型的训练步骤包括:根据第一历史设定时长内所述用户对通过第二语言输入的各个查询信息的查询结果中的第二语言网址的点击频次,将所述用户通过第二语言输入的查询信息划分为强第二语言需求的查询信息、中第二语言需求的查询信息和无第二语言需求的查询信息;统计第二历史设定时长内所述用户群对通过第二语言输入的各个片段的查询结果中的第二语言网址的片段点击信息;统计第二历史设定时长内所述用户群对通过第二语言输入的各个专有名词的查询结果中的第二语言网址的专名点击信息;通过统计得到的片段点击信息和专名点击信息得到所述用户对通过第二语言输入的各个查询信息的查询结果的点击信息;将得到的所述用户对通过第二语言输入的各个查询信息的查询结果的点击信息作为输入,将第一历史设定时长内对通过第二语言输入的各个查询信息的划分结果作为输出,利用机器学习方法训练语言需求预测模型。

在一些实施例中,所述将所述用户群中的用户进行分类,分析所述用户所属类别中的、除所述用户外的其他用户对所述查询信息的查询结果的点击信息,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第二需求级别,包括:统计所述用户群点击过的至少一个第二语言片段,并以独热码方式构建用户群中各个用户的第二语言需求向量,其中,第二语言需求向量的各个维度分别代表该用户在各个第二语言片段上的第二语言点击比例;采用聚类算法将所述用户群中的用户进行聚类,得到至少一个分类;统计每一类别的用户在搜索过的使用第二语言输入的查询信息的查询结果上的点击信息,其中,点击信息包括以下至少一项:点展比、有点比、点击量;查询所述用户所属类别中的、除所述用户外的其他用户对所述查询信息的查询结果的点击信息,对查询结果进行统计分析确定所述用户针对所述查询信息对第二语言查询结果的第二需求级别。

第二方面,本申请提供了一种基于人工智能的推送信息的装置,所述装置包括:接收单元,用于接收用户通过终端发送的查询信息,以第一语言为搜索所用的默认语言对所述查询信息进行搜索得到查询结果,其中,所述查询信息是用户使用第二语言输入的信息,所述查询结果包括至少一条第一语言查询结果和至少一条第二语言查询结果;第一确定单元,用于根据所述用户所属的用户群的历史搜索点击数据确定所述用户为第二语言用户;第二确定单元,用于对所述用户群的历史搜索点击数据进行分析,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第一需求级别;第三确定单元,用于将所述用户群中的用户进行分类,分析所述用户所属类别中的、除所述用户外的其他用户对所述查询信息的查询结果的点击信息,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第二需求级别;推送单元,用于根据所述第一需求级别和所述第二需求级别对所述查询结果中的第一语言查询结果和第二语言查询结果进行调整,并将调整后的结果推送到所述终端。

在一些实施例中,所述推送单元进一步用于:根据所述第一需求级别和所述第二需求级别调整查询结果中的第一语言查询结果和第二语言查询结果的展示条数和排序。

在一些实施例中,所述第一确定单元进一步用于:统计设定时长内所述用户的历史搜索点击数据中使用第二语言进行信息搜索的数量和所占比例,得到第一统计信息;统计设定时长内所述用户的历史搜索点击数据中所述用户点击的第二语言网址的数量和所占比例,以及不同第二语言网址显现比例下的第二语言网址点击情况,得到第二统计信息;统计所述用户群中的用户分别在指定的、使用第二语言输入的查询信息的查询结果上的第二语言网址点击信息,得到第三统计信息;根据所述第一统计信息、第二统计信息和第三统计信息确定所述用户为第二语言用户。

在一些实施例中,所述第二确定单元包括:切分单元,用于将所述查询信息切分为至少一个片段;第一统计单元,用于统计设定时长内所述用户群中的用户对各个片段的查询结果中的第二语言网址的第一点击信息;第二统计单元,用于抽取所述查询信息中的至少一个专有名词,并统计设定时长内所述用户群中的用户对各个专有名词,以及各个专有名词类别上的查绚结果中的第二语言网址的第二点击信息;合并单元,用于将所述第一点击信息和所述第二点击信息进行合并,得到所述查询信息的综合点击信息;输入单元,用于将所述综合点击信息输入预先训练的语言需求预测模型,得到所述用户对所述查询信息的第一需求级别。

在一些实施例中,所述合并单元进一步用于:采用加权平均法对所述第一点击信息和所述第二点击信息中包括的统计数据进行计算,得到所述查询信息的综合点击信息。

在一些实施例中,所述语言需求预测模型的训练步骤包括:根据第一历史设定时长内所述用户对通过第二语言输入的各个查询信息的查询结果中的第二语言网址的点击频次,将所述用户通过第二语言输入的查询信息划分为强第二语言需求的查询信息、中第二语言需求的查询信息和无第二语言需求的查询信息;统计第二历史设定时长内所述用户群对通过第二语言输入的各个片段的查询结果中的第二语言网址的片段点击信息;统计第二历史设定时长内所述用户群对通过第二语言输入的各个专有名词的查询结果中的第二语言网址的专名点击信息;通过统计得到的片段点击信息和专名点击信息得到所述用户对通过第二语言输入的各个查询信息的查询结果的点击信息;将得到的所述用户对通过第二语言输入的各个查询信息的查询结果的点击信息作为输入,将第一历史设定时长内对通过第二语言输入的各个查询信息的划分结果作为输出,利用机器学习方法训练语言需求预测模型。

在一些实施例中,所述第三确定单元进一步用于:统计所述用户群点击过的至少一个第二语言片段,并以独热码方式构建用户群中各个用户的第二语言需求向量,其中,第二语言需求向量的各个维度分别代表该用户在各个第二语言片段上的第二语言点击比例;采用聚类算法将所述用户群中的用户进行聚类,得到至少一个分类;统计每一类别的用户在搜索过的使用第二语言输入的查询信息的查询结果上的点击信息,其中,点击信息包括以下至少一项:点展比、有点比、点击量;查询所述用户所属类别中的、除所述用户外的其他用户对所述查询信息的查询结果的点击信息,对查询结果进行统计分析确定所述用户针对所述查询信息对第二语言查询结果的第二需求级别。

本申请提供的基于人工智能的推送信息的方法和装置,首先接收用户通过终端发送的、使用第二语言输入的查询信息,以第一语言为搜索所用的默认语言对该查询信息进行搜索得到包括第一语言查询结果和第二语言查询结果的查询结果,之后通过用户所属的用户群的历史搜索点击数据确定该用户为第二语言用户,然后进一步确定该用户针对上述查询信息对第二语言查询结果的第一需求级别和第二需求级别,最后根据第一需求级别和第二需求级别对查询结果中的第一语言查询结果和第二语言查询结果进行调整,并将调整后的结果推送到终端,从而实现了个性化的多语言信息推送,避免了用户手动切换语言选项的繁琐操作。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本申请可以应用于其中的示例性系统架构图;

图2是根据本申请的基于人工智能的推送信息的方法的一个实施例的流程图;

图3是根据本申请的基于人工智能的推送信息的方法的一个应用场景的示意图;

图4是根据本申请的基于人工智能的推送信息的装置的一个实施例的结构示意图;

图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的基于人工智能的推送信息的方法或基于人工智能的推送信息的装置的实施例的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如搜索类应用、网页浏览器应用、购物类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103输入的查询信息进行搜索的后台服务器。后台服务器可以对接收到的查询信息进行搜索等处理,并将搜索到的结果反馈给终端设备。

需要说明的是,本申请实施例所提供的基于人工智能的推送信息的方法一般由服务器105执行,相应地,基于人工智能的推送信息的装置一般设置于服务器105中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,示出了根据本申请的基于人工智能的推送信息的方法的一个实施例的流程200。所述的基于人工智能的推送信息的方法,包括以下步骤:

步骤201,接收用户通过终端发送的查询信息,以第一语言为搜索所用的默认语言对查询信息进行搜索得到查询结果。

在本实施例中,基于人工智能的推送信息的方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式接收用户通过终端发送的查询信息,并以第一语言为搜索所用的默认语言对该查询信息进行搜索得到查询结果,其中,上述查询信息可以是上述用户使用第二语言输入的信息,搜索得到的查询结果可以包括至少一条第一语言查询结果和至少一条第二语言查询结果。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

以第一语言为中文,第二语言为英语为例,用户可以在终端上的搜索类应用中输入英文查询信息(例如英文单词、英文短句等等),服务器接收到该英文查询信息之后,以中文为搜索时所使用的默认语言对该英文查询信息进行搜索,可以得到多条中文查询结果和多条英文查询结果。在这里,上述中文查询结果可以是与该英文查询信息相关的各种中文查询结果,例如,对该英文查询信息的中文相关报道、中文翻译等等,上述英文查询结果可以是与该英文查询信息相关的各种英文查询结果,例如,对该英文查询信息的英文相关报道。

步骤202,根据用户所属的用户群的历史搜索点击数据确定用户为第二语言用户。

在本实施例中,上述电子设备可以根据上述用户所属的用户群中的各个用户在设定时长内(例如最近6个月内)的历史搜索点击数据确定上述用户为第二语言用户。上述历史搜索点击数据可以包括但不限于设定时长内的用户群中的每个用户进行信息搜索的总搜索数量、使用第二语言进行搜索的第二语言搜索数量、第二语言搜索数量与总搜索数量的比值、点击搜索结果的总点击数量、点击第二语言搜索结果的第二语言点击数量、第二语言点击数量与总点击数量的比值等等。在这里,上述电子设备可以通过各种方式确定上述用户为对第二语言的需求较高的第二语言用户,例如,可以通过将上述用户的历史搜索点击数据与用户群的历史搜索点击数据的均值进行比较,如果高于用户群的历史搜索点击数据的均值,则可以确定上述用户对第二语言的需求高于用户群中的大多数网络用户。

在本实施例的一些可选的实现方式中,步骤202可以具体包括:首先,上述电子设备可以统计设定时长内(例如最近6个月内)上述用户的历史搜索点击数据中使用第二语言进行信息搜索的数量和所占比例,得到第一统计信息,其中,使用第二语言进行信息搜索的所占比例可以是指使用第二语言进行信息搜索的数量占总搜索数量的比例;之后,上述电子设备可以统计设定时长内上述用户的历史搜索点击数据中上述用户点击的第二语言网址的数量和所占比例,以及不同第二语言网址显现比例下的第二语言网址点击情况,得到第二统计信息,其中,上述用户点击的第二语言网址的所占比例可以是指用户点击的第二语言网址的数量占总点击数量的比例;然后,上述电子设备可以统计上述用户群中的用户分别在指定的、使用第二语言输入的查询信息的查询结果上的第二语言网址点击信息,得到第三统计信息,上述指定的、使用第二语言输入的查询信息可以是预先分析确定的、能够用于区分用户的第二语言需求级别的信息,如果一个用户对指定的、使用第二语言输入的查询信息的查询结果中的第二语言网址点击数量明显高于用户群的均值,则可以判断这个用户具有较强的第二语言需求,例如,以第一语言为中文,第二语言为英语为例,指定的、使用第二语言输入的查询信息可以是C++、neocomplete等之类的专业术语;最后,上述电子设备可以根据第一统计信息、第二统计信息和第三统计信息确定上述用户为第二语言用户。

步骤203,对用户群的历史搜索点击数据进行分析,根据分析结果确定用户针对查询信息对第二语言查询结果的第一需求级别。

在本实施例中,上述电子设备可以对上述用户群中的每个用户的历史搜索数据进行各种分析(例如统计分析),并根据分析结果确定上述用户针对查询信息对第二语言查询结果的第一需求级别,例如,当上述查询信息由多个片段组成时,可以通过统计分析上述用户群中每个用户对各个片段的搜索结果的点击情况,通过对比判断上述用户是否对各个片段的第二语言的需求高于用户群中的大多数用户,进而确定上述用户针对查询信息对第二语言查询结果的第一需求级别。在这里,上述电子设备可以将上述用户针对查询信息对第二语言查询结果的需求分为多个级别,例如,强、中、弱三个级别。

在本实施例的一些可选的实现方式中,步骤202可以具体包括:首先,上述电子设备可以将查询信息切分为至少一个片段;其次,上述电子设备可以统计设定时长内上述用户群中的用户对各个片段的查询结果中的第二语言网址的第一点击信息,其中,第一点击信息可以包括第二语言网址的点击数量、点展比、有点比等信息,在这里,有点比可以是指有点击比,例如有点击记为1,没有点击记为0,统计有点击的第二语言网址所占的比例;再次,上述电子设备可以抽取上述查询信息中的至少一个专有名词,并统计设定时长内上述用户群中的用户对各个专有名词,以及各个专有名词类别上的查绚结果中的第二语言网址的第二点击信息,第二点击信息可以包括第二语言网址的点击数量、点展比、有点比等信息,专有名词可以是指表示人、地方、事物等特有的名词,例如,人名“张三”可以是表示人的专有名词,“张三”的类别为人名;然后,上述电子设备将上述第一点击信息和上述第二点击信息进行合并,得到上述查询信息的综合点击信息;最后,将上述综合点击信息输入预先训练的语言需求预测模型,得到上述用户对上述查询信息的第一需求级别。

在一些可选的实现方式中,上述电子设备将第一点击信息和第二点击信息进行合并,得到查询信息的综合点击信息的步骤可以具体包括:上述电子设备可以采用加权平均法对上述第一点击信息和上述第二点击信息中包括的统计数据进行计算,得到上述查询信息的综合点击信息。

在一些可选的实现方式中,上述语言需求预测模型的训练步骤可以包括:首先,上述电子设备或者其他用于训练语言需求预测模型的电子设备可以根据第一历史设定时长内上述用户对通过第二语言输入的各个查询信息的查询结果中的第二语言网址的点击频次,将上述用户通过第二语言输入的查询信息划分为强第二语言需求的查询信息、中第二语言需求的查询信息和无第二语言需求的查询信息;其次,统计第二历史设定时长内上述用户群对通过第二语言输入的各个片段的查询结果中的第二语言网址的片段点击信息,在这里,上述片段点击信息可以包括对片段查询结果中的第二语言网址的点击数量、点展比、有点比、差异化等信息,其中,差异化可以是指上述用户与用户群的平均有点比之间的差值;再次,统计第二历史设定时长内上述用户群对通过第二语言输入的各个专有名词的查询结果中的第二语言网址的专名点击信息,在这里,上述专名点击信息可以包括专有名词的查询结果中的第二语言网址的点击数量、点展比、有点比、差异化等信息;然后,通过统计得到的片段点击信息和专名点击信息得到上述用户对通过第二语言输入的各个查询信息的查询结果的点击信息;最后,将得到的上述用户对通过第二语言输入的各个查询信息的查询结果的点击信息作为输入,将第一历史设定时长内对通过第二语言输入的各个查询信息的划分结果作为输出,利用机器学习方法训练语言需求预测模型,上述机器学习方法可以是各种机器学习方法,例如线性回归、支持向量机等等。

步骤204,将用户群中的用户进行分类,分析用户所属类别中的、除用户外的其他用户对查询信息的查询结果的点击信息,根据分析结果确定用户针对查询信息对第二语言查询结果的第二需求级别。

在本实施例中,上述电子设备可以首先将用户群中的包括的所有用户进行分类,例如,可以将具有大量相似点击行为的用户划分为同一类别,然后分析上述用户所属类别中的、除上述用户外的其他用户对上述查询信息的点击信息,并根据分析结果确定上述用户针对上述查询信息对第二语言查询结果的第二需求级别,即可以借助相似用户在上述查询信息的点击信息来预测上述用户对上述查询信息的第二语言查询结果的第二需求级别。

在本实施例的一些可选的实现方式中,步骤204可以具体包括:首先,上述电子设备可以统计上述用户群点击过的至少一个第二语言片段(每个片段可以包括n个词,其中,n是大于等于1的正整数),并以独热码(one-hot code)方式构建用户群中各个用户的第二语言需求向量,其中,第二语言需求向量的各个维度分别代表该用户在各个第二语言片段上的第二语言点击比例;之后,上述电子设备采用聚类算法将上述用户群中的用户进行聚类,得到至少一个分类,例如,采用K-means算法对用户群中各个用户的第二语言需求向量进行聚类,得到至少一个分类;然后,上述电子设备统计每一类别的用户在搜索过的使用第二语言输入的查询信息的查询结果上的点击信息,其中,点击信息包括以下至少一项:点展比、有点比、点击量;最后,上述电子设备查询上述用户所属类别中的、除上述用户外的其他用户对上述查询信息的查询结果的点击信息,对查询结果进行统计分析确定上述用户针对上述查询信息对第二语言查询结果的第二需求级别。

步骤205,根据第一需求级别和第二需求级别对查询结果中的第一语言查询结果和第二语言查询结果进行调整,并将调整后的结果推送到终端。

在本实施例中,上述电子设备可以根据步骤203确定的第一需求级别和步骤204确定的第二需求级别对上述查询结果中的第一语言查询结果和第二语言查询结果进行各种调整,例如,可以分别调整查询结果中第一语言查询结果和第二语言查询结果在推送内容中所占的比例,并将调整后的结果推送到上述终端。

在本实施例的一些可选的实现方式中,上述电子设备可以根据第一需求级别和第二需求级别调整查询结果中的第一语言查询结果和第二语言查询结果的展示条数和排序。例如,当第一需求级别和第二需求级别均显示上述用户针对上述查询信息对第二语言查询结果的需求较强时,可以减少第一语言查询结果的展示条数,增加第二语言查询结果的展示条数,同时将第二语言查询结果排在靠前的位置。

继续参见图3,图3是根据本实施例的基于人工智能的推送信息的方法的应用场景的一个示意图。在图3的应用场景中,第一语言为中文,第二语言为英语,用户A首先通过终端输入查询信息“science”,服务器根据终端发送的查询信息“science”搜索得到多条中文查询结果和多条英文查询结果;其次,服务器根据用户A所属的用户群的历史搜索点击数据确定用户A为英文用户;再次,服务器对用户群的历史搜索点击数据进行分析,根据分析结果确定用户A针对查询信息“science”对英文查询结果的第一需求级别为强英文需求;然后,服务器将用户群中的用户进行分类,分析用户A所属类别中的、除用户A外的其他用户对查询信息“science”的查询结果的点击信息,根据分析结果确定用户A针对查询信息“science”对第二语言查询结果的第二需求级别也为强英文需求;最后,服务器根据第一需求级别和第二需求级别对查询结果中的中文查询结果和英文查询结果进行调整,增加英文查询结果的展示条数,并将英文查询结果排在展示页面靠前的位置,并将调整后的结果推送到终端,就会如3所示。

本申请的上述实施例提供的方法通过确定用户针对查询信息对第二语言查询结果的第一需求级别和第二需求级别实现了个性化的多语言信息推送,更细致、准确的满足了用户需求,避免了用户手动切换语言选项的繁琐操作。

进一步参考图4,作为对上述图2所示方法的实现,本申请提供了一种基于人工智能的推送信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图4所示,本实施例所述的基于人工智能的推送信息的装置400包括:接收单元401、第一确定单元402、第二确定单元403、第三确定单元404和推送单元405。其中,接收单元401用于接收用户通过终端发送的查询信息,以第一语言为搜索所用的默认语言对上述查询信息进行搜索得到查询结果,其中,上述查询信息是用户使用第二语言输入的信息,上述查询结果包括至少一条第一语言查询结果和至少一条第二语言查询结果;第一确定单元402用于根据上述用户所属的用户群的历史搜索点击数据确定上述用户为第二语言用户;第二确定单元403用于对上述用户群的历史搜索点击数据进行分析,根据分析结果确定上述用户针对上述查询信息对第二语言查询结果的第一需求级别;第三确定单元404用于将上述用户群中的用户进行分类,分析上述用户所属类别中的、除上述用户外的其他用户对上述查询信息的查询结果的点击信息,根据分析结果确定上述用户针对上述查询信息对第二语言查询结果的第二需求级别;推送单元405用于根据上述第一需求级别和上述第二需求级别对上述查询结果中的第一语言查询结果和第二语言查询结果进行调整,并将调整后的结果推送到上述终端。

在本实施例中,接收单元401、第一确定单元402、第二确定单元403、第三确定单元404和推送单元405的具体处理可以参考图2对应实施例步骤201、步骤202、步骤203、步骤204和步骤205的详细描述,在此不再赘述。

在本实施例的一些可选的实现方式中,上述推送单元405进一步用于:根据上述第一需求级别和上述第二需求级别调整查询结果中的第一语言查询结果和第二语言查询结果的展示条数和排序。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述,在此不再赘述。

在本实施例的一些可选的实现方式中,上述第一确定单元402进一步用于:统计设定时长内上述用户的历史搜索点击数据中使用第二语言进行信息搜索的数量和所占比例,得到第一统计信息;统计设定时长内上述用户的历史搜索点击数据中上述用户点击的第二语言网址的数量和所占比例,以及不同第二语言网址显现比例下的第二语言网址点击情况,得到第二统计信息;统计上述用户群中的用户分别在指定的、使用第二语言输入的查询信息的查询结果上的第二语言网址点击信息,得到第三统计信息;根据上述第一统计信息、第二统计信息和第三统计信息确定上述用户为第二语言用户。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述,在此不再赘述。

在本实施例的一些可选的实现方式中,上述第二确定单元403包括:切分单元(未示出),用于将上述查询信息切分为至少一个片段;第一统计单元(未示出),用于统计设定时长内上述用户群中的用户对各个片段的查询结果中的第二语言网址的第一点击信息;第二统计单元(未示出),用于抽取上述查询信息中的至少一个专有名词,并统计设定时长内上述用户群中的用户对各个专有名词,以及各个专有名词类别上的查绚结果中的第二语言网址的第二点击信息;合并单元(未示出),用于将上述第一点击信息和上述第二点击信息进行合并,得到上述查询信息的综合点击信息;输入单元(未示出),用于将上述综合点击信息输入预先训练的语言需求预测模型,得到上述用户对上述查询信息的第一需求级别。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述,在此不再赘述。

在本实施例的一些可选的实现方式中,上述合并单元进一步用于:采用加权平均法对上述第一点击信息和上述第二点击信息中包括的统计数据进行计算,得到上述查询信息的综合点击信息。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述,在此不再赘述。

在本实施例的一些可选的实现方式中,上述语言需求预测模型的训练步骤包括:根据第一历史设定时长内上述用户对通过第二语言输入的各个查询信息的查询结果中的第二语言网址的点击频次,将上述用户通过第二语言输入的查询信息划分为强第二语言需求的查询信息、中第二语言需求的查询信息和无第二语言需求的查询信息;统计第二历史设定时长内上述用户群对通过第二语言输入的各个片段的查询结果中的第二语言网址的片段点击信息;统计第二历史设定时长内上述用户群对通过第二语言输入的各个专有名词的查询结果中的第二语言网址的专名点击信息;通过统计得到的片段点击信息和专名点击信息得到上述用户对通过第二语言输入的各个查询信息的查询结果的点击信息;将得到的上述用户对通过第二语言输入的各个查询信息的查询结果的点击信息作为输入,将第一历史设定时长内对通过第二语言输入的各个查询信息的划分结果作为输出,利用机器学习方法训练语言需求预测模型。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述,在此不再赘述。

在本实施例的一些可选的实现方式中,上述第三确定单元404进一步用于:统计上述用户群点击过的至少一个第二语言片段,并以独热码方式构建用户群中各个用户的第二语言需求向量,其中,第二语言需求向量的各个维度分别代表该用户在各个第二语言片段上的第二语言点击比例;采用聚类算法将上述用户群中的用户进行聚类,得到至少一个分类;统计每一类别的用户在搜索过的使用第二语言输入的查询信息的查询结果上的点击信息,其中,点击信息包括以下至少一项:点展比、有点比、点击量;查询上述用户所属类别中的、除上述用户外的其他用户对上述查询信息的查询结果的点击信息,对查询结果进行统计分析确定上述用户针对上述查询信息对第二语言查询结果的第二需求级别。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述,在此不再赘述。

下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。

如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元、第一确定单元、第二确定单元、第三确定单元和推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“用于接收用户通过终端发送的查询信息,以第一语言为搜索所用的默认语言对所述查询信息进行搜索得到查询结果的单元”。

作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收用户通过终端发送的查询信息,以第一语言为搜索所用的默认语言对所述查询信息进行搜索得到查询结果,其中,所述查询信息是用户使用第二语言输入的信息,所述查询结果包括至少一条第一语言查询结果和至少一条第二语言查询结果;根据所述用户所属的用户群的历史搜索点击数据确定所述用户为第二语言用户;对所述用户群的历史搜索点击数据进行分析,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第一需求级别;将所述用户群中的用户进行分类,分析所述用户所属类别中的、除所述用户外的其他用户对所述查询信息的查询结果的点击信息,根据分析结果确定所述用户针对所述查询信息对第二语言查询结果的第二需求级别;根据所述第一需求级别和所述第二需求级别对所述查询结果中的第一语言查询结果和第二语言查询结果进行调整,并将调整后的结果推送到所述终端。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1