一种获取目标标准信息的方法和系统与流程

文档序号:18642671发布日期:2019-09-11 23:43阅读:303来源:国知局
一种获取目标标准信息的方法和系统与流程

本说明书的一个或多个实施例涉及人工智能技术领域,特别涉及一种自动确定目标标准信息的方法和系统。



背景技术:

在智能客服中,机器人对客户输入的信息进行自动处理,以确定客户想要咨询的事项或意图了解的相关问题答案。客户在与机器人交互过程中通常是使用用户输入的文字信息进行匹配识别。文字信息通常包含用户单轮对话中的文本问句,以及多轮对话中的上下文信息。在大多数情况下,用户在与机器人交互过程中,可能使用简化的对话进行交互,这导致用户输入的文字信息可能是模糊的文字信息,进行匹配识别时难以精准匹配到准确信息。例如,用户可能输入“查账”,交互系统难以匹配识别用户具体需要查什么账,或查账的范围等。因此有必要提供一种更准确的问答引擎。



技术实现要素:

本说明书中的一个或多个实施例之一提供一种获取目标标准信息的方法,其特征在于,所述方法包括:获取目标用户的问题;基于所述问题和第一预设算法确定第一组标准信息;获取所述目标用户的轨迹因子,所述轨迹因子反映所述目标用户在一个或多个服务平台上的至少一个行为;基于所述轨迹因子和第二预设算法确定第一类与标准信息相关的信息;基于所述第一组标准信息和所述第一类与标准信息相关的信息确定一个或多个目标标准信息。

在一些实施例中,所述获取目标标准信息的方法还包括输出一个或多个目标标准信息。

在一些实施例中,所述获取目标标准信息的方法还包括:获取用户对所述一个或多个目标标准信息的反馈;根据用户的反馈更新所述第一预设算法和/或所述第二预设算法。

在一些实施例中,所述第一预设算法和/或所述第二预设算法包括机器学习模型,所述机器学习模型包括bert模型。

在一些实施例中,基于所述第一组标准信息和所述第一类与标准信息相关的信息确定一个或多个目标标准信息包括:基于所述第一类与标准信息相关的信息对第一组标准信息进行筛选,确定一个或多个目标标准信息;所述第一类与标注信息相关的信息包括筛选辅助信息,所述筛选辅助信息反映目标标准信息的筛选条件。

在一些实施例中,所述第一类与标准信息相关的信息包括第二组标准信息;所述第二组标准信息包括一个或多个标准信息和/或其对应的内容信息。

在一些实施例中,所述基于所述第一组标准信息和所述第一类与标注信息相关的信息确定一个或多个目标标准信息包括:确定第一组标准信息与第二组标准信息的公共标准信息;从所述公共标准信息中确定一个或多个目标标准信息。

在一些实施例中,所述第一组标准信息还包括与其各标准信息相对应的第一数值;所述第二组标准信息还包括与其各标准信息相对应的第二数值。

在一些实施例中,基于所述第一组标准信息和所述第一类与标注信息相关的信息确定一个或多个目标标准信息包括:确定第一组标准信息与第二组标准信息的公共标准信息;将公共标准信息的第一数值和第二数值进行运算;基于运算结果,从所述公共标准信息中确定一个或多个目标标准信息。

在一些实施例中,所述运算包括相乘或相加。

本说明书的实施例之一提供一种用于获取目标标准信息的系统,所述系统包括:第一获取模块,用于获取目标用户的问题;第一确定模块,基于所述问题和第一预设算法确定第一组标准信息;第二获取模块,用于获取所述目标用户的轨迹因子;所述轨迹因子反映所述目标用户在一个或多个服务平台上的至少一个行为;第二确定模块,基于所述轨迹因子和第二预设算法确定第一类与标准信息相关的信息;目标确定模块,基于所述第一组标准信息和所述第一类与标准信息相关的信息确定一个或多个目标标准信息。

在一些实施例中,所述系统还包括:目标输出模块,用于输出一个或多个目标标准信息。

在一些实施例中,所述系统还包括:第三获取模块,用于获取用户对所述一个或多个目标标准信息的反馈;算法优化模块,用于根据用户的反馈更新所述第一预设算法和/或所述第二预设算法。

在一些实施例中,所述第一预设算法和/或所述第二预设算法包括机器学习模型,所述机器学习模型包括bert模型。

在一些实施例中,所述目标确定模块还用于基于所述第一类与标准信息相关的信息对第一组标准信息进行筛选,确定一个或多个目标标准信息;所述第一类与标准信息相关的信息包括筛选辅助信息,所述筛选辅助信息反映目标标准信息的筛选条件。

在一些实施例中,所述第一类与标准信息相关的信息包括第二组标准信息;所述第二组标准信息包括一个或多个标准信息和/或其对应的内容信息。

在一些实施例中,所述目标确定模块还用于确定第一组标准信息与第二组标准信息的公共标准信息;从所述公共标准信息中确定一个或多个目标标准信息。

在一些实施例中,所述第一组标准信息还包括与其各标准信息相对应的第一数值;所述第二组标准信息还包括与其各标准信息相对应的第二数值。

在一些实施例中,所述目标确定模块还用于:确定第一组标准信息与第二组标准信息的公共标准信息;将公共标准信息的第一数值和第二数值进行运算;基于运算结果,从所述公共标准信息中确定一个或多个目标标准信息。

在一些实施例中,所述运算包括相乘或相加。

本说明书的实施例之一提供一种用于获取目标标准信息的装置,包括处理器和存储器,所述存储器用于存储计算机指令;所述处理器用于执行所述计算机指令中的至少部分指令以实现本说明书中任意一个实施例所述的操作。

附图说明

本说明书的一个或多个实施例将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:

图1是根据本说明书一些实施例所示的用于获取目标标准信息的应用场景示意图;

图2是根据本说明书一些实施例所示的示例性系统框图;

图3是根据本说明书一些实施例所示的用于获取目标标准信息的示例性流程图;

图4是根据本说明书又一些实施例所示的确定目标标准信息的子流程图示意图;

图5是根据本说明书一些实施例所示的第一预设算法相关的机器学习模型的训练流程图示意图;

图6是根据本说明书一些实施例所示的第二预设算法相关的机器学习模型的训练流程图示意图;

图7是根据本说明书一些实施例所示的获取目标用户的轨迹因子的子流程图示意图。

具体实施方式

为了更清楚地说明本说明书的一个或多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书的一个或多个实施例应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。

应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。

如本说明书的一个或多个实施例和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。

本说明书的一个或多个实施例中使用了流程图用来说明根据本说明书的一个或多个实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。

本说明书的一个或多个实施例可以应用于不同的客服问答系统或搜索引擎系统等。不同的客服问答系统包括但不限于金融、购物、出行、教育、医疗等中的一种或几种的组合。例如,网上购物客服、银行客服、支付平台客服、商场导购客服、订票客服、便民服务客服、教育咨询客服、导诊客服等应用了机器问答的客服问答系统。搜索引擎系统包括但不限于金融平台搜索引擎、购物平台搜索引擎、出行平台搜索引擎、教育平台搜索引擎、医疗平台搜索引擎、知识分享平台搜索引擎等中的一种或几种的组合。

本说明书的一个或多个实施例的不同实施例应用场景包括但不限于网页、浏览器插件、客户端app、定制系统、企业内部分析系统、人工智能机器人等中的一种或几种的组合。应当理解的是,本说明书的一个或多个实施例的系统及方法的应用场景仅仅是本说明书的一个或多个实施例的一些示例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书的一个或多个实施例应用于其它类似情景。例如,其他类似的帮助引导系统。

图1是根据本说明书的一个或多个实施例所示的目标标准信息获取及呈现系统100的应用场景示意图。目标标准信息获取及呈现系统100可以用于提供诸如银行客服问答、支付平台客服问答、商场导购客服问答、订票客服问答、便民服务客服问答、教育咨询客服问答、导诊客服问答等。目标标准信息获取及呈现系统100可以包括服务器110、存储设备120、用户终端130、网络140。

服务器110可以被配置为处理与用户输入的查询有关的信息和/或数据。例如,服务器110可以将查询变换为查询向量。又例如,服务器110可以基于预设算法从标准信息库确定一组标准信息。服务器110还可以被配置为处理与用户的行为和/或个人属性信息有关的信息和/或数据。再例如,服务器110可以响应于用户的行为和/或个人属性信息,获取轨迹因子,并基于轨迹因子和预设算法确定一组标准信息。在一些实施例中,服务器110可以是单一服务器或服务器组。该服务器组可以是集中式或分布式的(例如,服务器110可以是分布式系统)。在一些实施例中,服务器110可以是本地的,也可以是远程的。例如,服务器110可以经由网络140访问存储于用户终端130或存储设备120的信息和/或数据。又例如,服务器110可以连接用户终端130和/或存储设备120以访问存储的信息和/或数据。在一些实施例中,服务器110可以在云平台上实施。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。

存储设备120可以存储数据和/或指令。例如,存储设备120可以存储预先生成的机器学习模型。又例如,存储设备120可以存储标准信息库和/或至少两个历史用户输入-标准信息对和/或至少两个历史轨迹因子-标准信息对。又例如,存储设备120可以存储一个或多个用户在服务平台的历史行为和/或用户的个人属性。再例如,存储设备120可以存储服务器110可以执行或用于执行本说明书一个或多个实施例中描述的示例性方法的数据和/或指令。在一些实施例中,存储设备120可包括大容量储存器、可移动储存器、易失性读写内存、只读存储器(rom)等或其任意组合。示例性的大容量储存器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性易失性读写存储器可以包括随机存取内存(ram)。示例性ram可包括动态随机存取存储器(dram)、双倍数据速率同步动态随机存取存储器(ddrsdram)、静态随机存取存储器(sram)、晶闸管随机存取存储器(t-ram)和零电容随机存取存储器(z-ram)等。示例性只读存储器可以包括掩模型只读存储器(mrom)、可编程只读存储器(prom)、可擦除可编程只读存储器(perom)、电可擦除可编程只读存储器(eeprom)、光盘只读存储器(cd-rom)和数字多功能磁盘只读存储器等。在一些实施例中,所述存储设备120可在云平台上实现。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。

用户终端130可以包括目标标准信息获取及呈现系统100的应用端。用户终端130还可以用于接收客户或用户的查询数据,以及与查询数据对应的输出数据。在一些实施例中,用户的查询数据可以包括用户的提问或问题。用户的提问方式可以包括多种形式,如文本输入,语音输入,图像信息输入等中的一种或多种方式的组合。在一些实施例中,与查询数据对应的输出数据可以包括与查询数据对应的标准问题和/或与标准问题对应的内容信息。在一些实施例中,与标准问题对应的内容信息可以看作标问对应的答案。用户终端130可以包括用户使用的任何电子设备。在一些实施例中,用户终端130可以是移动设备130-1、平板计算机130-2、膝上型计算机130-3、台式计算机130-4等或其任意组合。在一些实施例中,移动装置130-1可包括可穿戴设备、智慧移动装置、虚拟实境装置、增强实境装置等或其任意组合。在一些实施例中,可穿戴设备可包括智能手镯、智能鞋袜、智能眼镜、智能头盔、智能手表、智能衣服、智能背包、智能配件等或其任意组合。在一些实施例中,智能移动设备可以包括智能电话、个人数字助理(pda)、游戏设备、导航设备、销售点(pos)等或其任意组合。在一些实施例中,虚拟现实设备和/或增强型虚拟现实设备可以包括虚拟现实头盔、虚拟现实眼镜、虚拟现实眼罩、增强现实头盔、增强现实眼镜、增强现实眼罩等或其任意组合。例如,虚拟现实设备和/或增强现实设备可以包括googleglasstm、riftcontm、fragmentstm、gearvrtm等。在一些实施例中,台式计算机130-4可以是车载计算机、车载电视等。

在一些实施例中,用户终端130可以包括至少一个网络端口。该至少一个网络端口可以被配置为经由网络140向目标标准信息获取及呈现系统100(例如,服务器110、存储设备120)中的一个或以上组件发送信息和/或从其接收信息。

网络140可以促进信息和/或数据的交换。在一些实施例中,目标标准信息获取及呈现系统100(例如,服务器110、存储设备120和用户终端130)的一个或以上组件可以经由网络140向所述目标标准信息获取及呈现系统100中的其他组件发送信息和/或数据。例如,服务器110可以经由网络140从用户终端130获得用户查询。又例如,服务器110可以向用户终端130发送至少一个推荐的标准信息,以使用户终端130呈现至少一个推荐的标准信息。在一些实施例中,网络140可以为任意形式的有线或无线网络,或其任意组合。仅作为示例,网络140可以包括缆线网络、有线网络、光纤网络、远程通信网络、内部网络、互联网、局域网络(lan)、广域网路(wan)、无线局域网络(wlan)、城域网(man)、公共开关电话网络(pstn)、蓝牙网络、紫蜂网络、近场通讯(nfc)网络等或上述举例的任意组合。在一些实施例中,网络140可以包括一个或以上网络接入点。例如,网络140可以包括有线或无线网络接入点,例如基站和/或互联网交换点,目标标准信息获取及呈现系统100的一个或以上组件可以通过网络交换点连接到网络140以交换数据和/或信息。

图2是根据本说明书的一个或多个实施例所示的示例性系统框图,在本说明书的一些实施例中,用于获取目标标准信息的系统可以包括第一获取模块202、第二获取模块204、第一确定模块206、第二确定模块208和目标确定模块210。

第一获取模块202可以用于获取目标用户的问题。

第二获取模块204可以用于获取所述目标用户的轨迹因子。在一些实施例中,所述轨迹因子反映所述目标用户在一个或多个服务平台上的至少一个行为。在一些实施例中,所述第二获取模块204还用于获取目标用户在设定时间内在一个或多个服务平台中的一个或多个行为;基于所述一个或多个行为生成一个或多个编码;拼接所述一个或多个编码,得到所述轨迹因子。

第一确定模块206可以用于基于所述问题和第一预设算法确定所述问题对应的第一组标准信息。

第二确定模块208可以用于基于所述轨迹因子和第二预设算法确定第一类与标准信息相关的信息。

目标确定模块210可以用于基于所述第一组标准信息和所述第一类与标准信息相关的信息确定一个或多个目标标准信息。在一些实施例中,所述目标确定模块210还用于至少基于所述第一类与标准信息相关的信息确定所述目标标准信息的顺序。在一些实施例中,所述目标确定模块210还用于基于所述第一类与标准信息相关的信息对第一组标准信息进行筛选,确定一个或多个目标标准信息。在一些实施例中,所述目标确定模块210还用于确定第一组标准信息与第二组标准信息的公共标准信息;从所述公共标准信息中确定一个或多个目标标准信息。在一些实施例中,所述目标确定模块210还用于:确定标准信息;将公共标准信息的第一数值和第二数值进行运算;基于运算结果,从所述公共标准信息中确定一个或多个目标标准信息。

在一些实施例中,所述系统还可以包括目标输出模块212,用于输出一个或多个目标标准信息。

在一些实施例中,所述系统还可以包括:第三获取模块和算法优化模块。所述第三获取模块用于获取用户对所述一个或多个目标标准信息的反馈;所述算法优化模块,用于根据用户的反馈更新所述第一预设算法和/或所述第二预设算法。

应当理解,图2所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的一个或多个实施例的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。

需要注意的是,以上对于候选项显示、确定系统及其模块的描述,仅为描述方便,并不能把本说明书的一个或多个实施例限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接,或者对其中的一个或多个模块进行省略。例如,图2中披露的第一获取模块202、第二获取模块204、第一确定模块206、第二确定模块208、目标确定模块210和目标输出模块212可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。在一些实施例中,目标输出模块212还可以省略。在一些实施例中,第一获取模块202、第一确定模块206可以是两个模块,也可以是一个模块同时具有获取和确定功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本说明书的一个或多个实施例的保护范围之内。

需要指出的是,本说明书中所说的“用户的问题”、“用户的提问”、“用户问题”、“用户提问”均为相同的意思。为了描述方便,本说明书一些部分将“第一类与标准信息相关的信息”简称为“第一类信息”,它们属于相同的意思。

图3是根据本说明书的一个或多个实施例所示的用于目标标准信息获取的示例性主流程图。如图3所示,一种用于获取目标标准信息的方法可以包括:

步骤302,获取目标用户的问题。在一些实施例中,步骤302可以由第一获取模块202执行。

在一些实施例中,所述目标用户的问题包括但不限于通过手动方式输入的问题、通过语音方式输入的问题、通过摄像头取词方式输入的问题等的一种或两种以上的任意组合。所述手动方式输入的问题为输入文本形式的问题,例如,目标用户可以在客服对话框中使用文本描述其想要咨询的问题;所述语音方式输入的问题可以是由语音获取模块获取语音输入,并由语音识别模块将语音形式的问题转化为文本形式的问题;所述摄像头取词方式输入的问题可以是由图像获取模块获取图像中文字形式的问题,并由文字识别模块将文字图像形式的问题转换为文本形式的问题,所述图像可以是文字截图,也可以是其他带有文字内容的图片,还可以是其他有特定指代或含义的图片。例如,带有文字或字母的logo图片等,使用摄像头对logo图片进行识别,就可以确定问题内容。又例如,对常用的非文字logo进行识别,可以识别出与logo对应的产品相关信息。所述问题内容的呈现方式可以是完整的句子,也可以是不完整的句子。完整的句子可以是疑问句、陈述句、感叹句、反问句等任意句式的形式,完整的句子也可以是病句、错句等任意不规范的句子。不完整的句子可以是缺失主要结构的句子、短语、词组、单词、字等中的任意一种或两种以上的组合。

在一些实施例中,用户的问题可以由用户终端130接收,并通过网络140发送给服务器110(例如第一获取模块202)。以支付平台客服为例,该问题可以是在用户输入完成并确认后,由用户终端130通过网络140发送给服务器110的数据;该问题也可以是在用户输入过程中,用户终端130通过网络140实时地发送给服务器110的数据。其中,用户终端130通过网络发送给服务器110的数据可以是用户问题的全部,也可以是用户问题的一部分,例如,对用户问题进行文本处理,提取其中的关键词发送给服务器。

本说明书将以“网商贷”作为示例对本说明书中的各个处理环节进行举例说明,需要指出的是,本示例仅表示本说明书的一种可能实施情况,以更清楚的说明本流程中的过程,不对本说明书任一实施例所述的方法或流程起任何限定作用。

例如,用户通过语音的方式,输入一段语音信息为“网商贷还款”,用户终端130或者第一获取模块202可以通过语音识别模块将“网商贷还款”的语音信息转换为文本内容“网商贷还款”,以便后续流程中对用户提问进行处理。在其他实施例中,用户也可以直接在文本框中输入文本“网商贷还款”以作为目标用户的问题。

步骤304,基于所述问题和第一预设算法确定第一组标准信息。在一些实施例中,步骤304可以由第一确定模块206执行。

标准信息可以包括标准问题,也可以是标准问题对应的内容信息,所述内容信息可以包括答案,还可以是与标准问题相关的信息。所述标准问题简称标问,是标准化的问句,可以缩小问句的歧义。例如,“网商贷如何还款”、“网商贷怎么还”、“网商贷还款怎么操作”等对应于标问“网商贷怎么还款”。所述标准问题对应的内容信息可以包括标问的答案。所述标问与标问的答案有确定的对应关系,所述对应方式可以是一对一的对应,也可以是多对一的对应,还可以是一对多的对应。在一些实施例中,标准信息呈现给用户的呈现方式可以包括文本的形式,图片的形式,语音的形式,视频形式,以及链接的形式等中的一种或多种的组合。具体的,呈现方式是文字形式的标准问题及其答案,用户通过阅读文字内容获得解决其问题的答案。或者,呈现方式是图片的形式,图片中可以显示操作的步骤要点,用户通过查看图片获得解决其问题的答案。又或者,呈现方式是语音形式的标准问题及其答案,用户通过听语音内容获得解决其问题的答案。又或者,呈现方式是视频的形式,视频可以完整演示解决用户问题的流程,用户通过观看视频获得解决其问题的答案。还或者,呈现方式是链接形式,用户通过点击链接访问记录有用户问题答案的页面获得解决其问题的答案。

在一些实施例中,基于所述问题和第一预设算法确定第一组标准信息可以包括基于用户问题在数据库中进行相关查询进而得到与所述问题匹配的标准信息。下面将对该方法进行更详细的介绍。

在一些实施例中,可以基于目标用户的问题进行文本处理和/或语义分析等处理,确定所述问题对应的关键词,所述关键词可以包括问题词(如为什么、怎么、是什么等等)、动作(如借、还、注册、注销等)、实体(如贷款、利息、账号、金额、额度等)以及数值(包括额度的值、时间信息等等)中的一种或多种的组合。在一些实施例中,所述第一预设算法可以是数据库查询算法。第一获取模块302获取目标用户的问题后,第一确定模块306对用户的问题进行语义分析,提取用户问题中的关键词作为第一预设算法或查询算法的输入,然后从标问数据库中查询到对应的标问和/或答案。所述查询算法可以包括等值查询(=)、范围查询(>,<,between,in)、模糊查询(like)、交集查询(and)、并集查询(or)等任意一种或多种的组合。查询算法可以通过输入信息,从标准信息数据库中检索相应的标准信息作为输出。在一些实施例中,所述标准信息库中的标准信息可以具有一个id、标题或索引。通过这种方式可以确定第一组标准信息。

例如,用户输入提问为“如何还贷”,第一获取模块302获取用户提问后,第一确定模块306对提问进行语义分析,提取提问的关键词“如何”和“还贷”,并将关键词通过查询算法在标准信息数据库中进行查询匹配,将这些标准信息确定为第一组标准信息。例如,在标准信息数据库中进行查询匹配,得到了标问“网商贷的还款流程”、“花呗还款流程”、“理财宝如何还款”等以及答案。

在一些实施例中,第一预设算法可以是通过机器学习模型实现的处理算法,对应地,基于所述问题和第一预设算法确定第一组标准信息可以包括基于用户问题和机器学习模型确定与所述问题对应的标准信息。在一些实施例中,可以把用户的问题直接作为机器学习模型的输入,得到与所述问题对应的标准信息或标准信息及对应的概率值。在一些实施例中,还可以把用户问题的语义分析结果作为机器学习模型的输入,得到与所述问题对应的标准信息或标准信息及对应的概率值。在一些实施例中,所述机器学习模型可以是自然语言处理(nlp)模型,所述nlp模型包括但不限于bert模型、dssm模型、cnn-dssm模型、lstm-dssm模型、bcnn模型、abcnn模型、hybridcnn模型等。在一些实施例中,第一确定模块206可以使用所述机器学习模型匹配用户的问题与对应的第一组标准信息。以下将介绍将用户的问题直接输入到机器学习模型中进行处理,确定第一组标准信息的实施例。

在一些实施例中,所述机器学习模型可以包括一个的模型,例如bert模型。仅作为示例,所述模型可以包括特征提取层、分类层及输出层。其中,特征提取层又可以进一步包括词嵌入层、上下文表示层或向量表达层中的一种或多种的组合。在第一获取模块302获取用户提问后,第一确定模型306将用户提问输入到模型中。模型的特征提取层可以将用户的问题通过分词处理、向量表达(如词嵌入处理)处理、上下文表示(提取分词的上下文关系)处理,获得用户问题文本中各个字/词融合了全文语义信息后的向量表示。在一些实施例中,特征提取层可以对输入的问题进行分词,并且可以将分词的结果嵌入到单个词和/或短语的向量表示中(例如,“提现”、“还款”)。之后,可以对根据至少两个向量表示中的任何两个相邻向量表示进行卷积,提取上下文信息。可以最大池化卷积信息以获得用户问题的语义信息。例如,可以选择与每个最大卷积信息对应的向量表示。然后将每个卷积进行层规范化(layernormalization),并对各向量进行转换编码(transformerencode)(例如,线性转换;又例如,将向量转换为一个int的id来代表),最后bert模型可以将输入的用户问题转换成融合了全文语义信息后的向量表示。

之后,机器学习模型中的分类层对用户问题的向量表示进行分类处理,得到一个或多个标准信息,最后输出层输出所述一个或多个标准信息。在一些实施例中,分类层也可以确定一个或多个与用户问题的向量表示匹配的标准信息及第一数值,所述第一数值反映了匹配度或者将被用户选择的概率。例如,用户输入提问为“如何还款”,第一获取模块302获取用户提问后,将问题“如何还款”输入到预先训练好的机器学习模型中,模型的特征提取层会对问题“如何还款”进行分词并将分词后的字/词转换为词向量。模型的分类层将这些向量进行处理,最后模型的输出层可以输出与用户提问相匹配的标准信息(如标问)及其概率,例如,“网商贷的还款流程(概率0.72)”“花呗还款的方式有哪些?(概率0.24)”、“如何确定网商贷的还款期限?(概率0.04)”。并将输出的信息确定为第一组标准信息。

在一些实施例中,所述机器学习模型也可以包括多个模型。仅作为示例,可以包括词向量模型(如word2vector等)以及分类模型,其中词向量模型用于将用户问句转换为向量表达,分类模型(如maskedlm等)用于对用户问题对应的向量表达进行处理,得到一个或多个标准信息。

需要说明的是,所述基于所述问题确定第一组标准信息可以包括基于用户问题确定对应的一个或多个标问,也可以包括确定的一个或多个标问对应的内容信息,还可以是一个或多个标问及其内容信息的组合。本说明书不做任何限制。

步骤306,获取所述目标用户的轨迹因子。在一些实施例中,步骤306可以由第二获取模块204执行。

在一些实施例中,所述轨迹因子反映所述目标用户在一个或多个服务平台中的至少一个行为和/或所述目标用户的个人属性信息。

在一些实施例中,轨迹因子反映目标用户在一个或多个服务平台中的操作行为,此处的服务平台可以包括目标标准信息获取及呈现系统所在的平台,也可以包括除目标标准信息获取及呈现系统所在平台以外的其他平台。例如,目标标准信息获取及呈现系统所在的平台为购物平台,所述其他平台可以是理财服务平台等。目标标准信息获取及呈现系统所在的平台与所述其他平台之间可以具有数据交互(例如,平台a可以获取用户在平台b上的全部或部分行为记录),也可以彼此隔离。在一些实施例中,所述行为可以包括浏览、点击、注册、下载、卸载、分享、转账、提现、点赞、支付等操作及其操作对象。所述操作对象可以包括访问的网页、新注册的服务内容、款项类型等。所述行为还可以包括行为的参数信息,参数信息包括但不限于时间参数、数值参数(如转账金额、提现金额等)、频次参数等。例如,用户在服务平台进行转账后,该行为包括转账的行为信息,还包括转账的时间信息、转账的金额信息等。在一些实施例中,所述用户的个人属性信息可以包括用户的基本信息,如用户的性别、年龄、学历、籍贯、职业、注册时间、偏好、性格倾向或行为习惯等。

例如,目标用户在某服务平台注册了“网商贷”账号,第二获取模块204将获取目标用户的行为“注册”,并获取目标用户的行为对象“网商贷”,并将这些信息作为用户的轨迹因子或者基于这些信息确定轨迹因子。

在一些实施例中,用户的行为轨迹和/或个人属性信息可以由用户终端130获得,并通过网络140发送给服务器110(例如第二获取模块202)。服务器110根据用户的行为轨迹和/或个人属性信息获得用户的轨迹因子。在一些实施例中,用户的行为轨迹和/或个人属性信息还可以作为历史数据存储在存储设备中,由服务器110调取。关于获取用户轨迹因子更多的描述,可以参见本说明书其他地方的相关描述,例如图7的相关描述。

步骤308,基于所述轨迹因子和第二预设算法确定第一类与标准信息相关的信息。在一些实施例中,步骤308可以由第二确定模块208执行。

第一类信息可以包括筛选辅助信息,或者可以包括第二组标准信息。对应地,在一些实施例中,基于轨迹因子和第二预设算法确定第一类信息可以包括基于轨迹因子和第二预设算法确定筛选条件;在其他实施例中,基于轨迹因子和第二预设算法确定第一类信息可以包括基于轨迹因子和第二预设算法确定第二类标准信息。下面将针对这两种实施例分别进行详细阐述。

在一些实施例中,第一类信息可以包括筛选辅助信息,所述筛选辅助信息反映目标标准信息的筛选条件。在一些实施例中,筛选辅助信息或筛选条件可以包括范围性信息、条件性信息等起限定作用的信息。

在一些实施例中,通过筛选辅助信息或筛选条件,可以对第一组标准信息进行筛选,进而得到一个或多个目标标准信息。在一些实施例中,在获取目标用户的轨迹因子之后,第二预设算法会对所述轨迹因子进行关键词提取,获取对应的实体信息,进而确定与该关键词或实体信息相关联的筛选条件。在一些实施例中,第二预设算法可以对所述轨迹因子进行分类,以确定筛选的范围性条件。

仍以“网商贷”作为示例进行说明,例如,目标用户注册了“网商贷”服务,对应目标用户的轨迹因子信息可以包括作为操作行为的“注册”,以及作为行为对象的“网商贷”服务。系统获取轨迹因子信息后,第二预设算法会对轨迹因子信息进行相关处理,提取出关键词“网商贷”,然后基于该关键词得到筛选条件“与网商贷有关的问题”。

在一些实施例中,第一类信息还可以包括与轨迹因子对应的第二组标准信息。在一些实施例中,第二组标准信息可以包括与用户轨迹因子相关的标问,也可以包括标问对应的答案信息,还可以包括标问和对应的答案信息。对应的,在一些实施例中,基于轨迹因子和第二预设算法确定第一类信息,还可以包括基于轨迹因子与第二预设算法确定第二组标准信息。关于第二组标准信息的详细描述可以参照第一组标准信息的相关描述。

在一些实施例中,第二预设算法可以包括机器学习模型,为与第一预设算法中的机器学习模型区分,下文将其称之为“因子先验模型”,但不应将其命名作为对该模型的限制。所述“因子先验模型”可以是分类模型、回归模型,也可以是与第一预设算法相关的机器学习模型类型相同的模型。对应地,在一些实施例中,机器学习模型可以包括分类模型,即可以基于轨迹因子和机器学习模型输出第二组标准信息;在另一些实施例中,机器学习模型可以包括回归模型,即可以基于轨迹因子和机器学习模型确定第二组标准信息及其对应的概率值。下面将分别介绍这两种实施例。

在一些实施例中,所述“因子先验模型”包括分类模型。所述分类模型包括但不限于决策树、最近邻分类器、朴素贝叶斯分类器、贝叶斯信念网络(bbn)、神经网络、支持向量机(svm)等。在一些实施例中,将获取到的轨迹因子作为输入数据输入到预先训练好的机器学习模型中,机器学习模型能够自动地输出与所述轨迹因子对应的第二组标准信息。关于所述机器学习模型的获取或训练过程,在下文会详细阐述。

例如,目标用户在“网商贷”平台上点击了与“提升额度”相关的链接并查看了相关信息,第二获取模块204将获取目标用户的行为“点击”、“查看”,并获取目标用户的行为对象“网商贷”平台、“提升额度”链接与信息,并将这些信息作为用户的轨迹因子。将该轨迹因子进行标注并编码,将其转换为标识id或向量表示,并对标识id或向量表示进行分类。通过分类模型将确定第二组标准信息,例如:第二组标问信息“如何提升网商贷的额度?”、“网商贷的上限是多少?”、“网商贷的还款流程”。

在一些实施例中,所述“因子先验模型”也可以包括回归模型,所述回归模型可以是线性回归模型、逻辑回归模型、多项式回归模型、逐步回归模型、岭回归模型、套索回归模型、弹性回归模型等。在一些实施例中,所述“因子先验模型”包括但不限于bert模型、dssm模型、cnn-dssm模型、lstm-dssm模型、bcnn模型、abcnn模型、hybridcnn模型等。

在一些实施例中,将获取到的轨迹因子作为输入数据输入到预先训练好的机器学习模型中,机器学习模型能够自动地输出第二组标准信息以及第二组标准信息对应的预测概率值。关于所述机器学习模型的获取或训练过程,在下文会详细阐述。

步骤310,基于所述第一组标准信息和所述第一类与标准信息相关的信息确定一个或多个目标标准信息。在一些实施例中,步骤310可以由目标确定模块210执行。

在一些实施例中,目标标准信息包括基于用户的问题和用户的轨迹因子的信息处理最终确定的较为准确的一个或多个标准信息。在一些实施例中,可以把最终确定的目标标准信息看作一个组合,所述组合在呈现给用户时会有一个呈现顺序。在一些实施例中,最终确定的目标标准信息为一个时,也可以将其看作是一种组合方式。在一些实施例中,所述呈现顺序可以包括位置上的顺序,还可以包括时间上的顺序等。在一些实施例中,所述顺序可以基于算法输出的先后顺序确定,也可以是基于各标准信息的匹配度或点击概率确定,也可以是随机确定。

在一些实施例中,可以基于第一类信息确定目标标准信息的顺序。在一些实施例中,第一类信息包括筛选条件,基于筛选条件对第一组标准信息中的各项进行排序,将按照确定顺序排列的第一组标准信息确定为目标标准信息。例如,第一类信息包括筛选条件“与网商贷有关的问题”,第一组标准信息包括“花呗还款流程”、“网商贷的还款流程”、“理财宝如何还款”等标问及其答案。因此,可以根据所述第一类信息,将满足筛选条件的标问优先显示,其余标问靠后。即,可以确定多个目标标准信息为“网商贷的还款流程”、“花呗还款流程”、“理财宝如何还款”等标问及其答案,其中,如果把上述多个目标标准信息看成是一个组合的话,该组合就会有一个对应的顺序,该实施例中“网商贷的还款流程”顺序靠前,在其他实施例中,也可以根据其他排序规则对多个目标标准信息进行想要的排序。

在一些实施例中,可以基于第一类信息对第一组标准信息进行筛选,以确定一个或多个目标标准信息。仅作为示例,第一类信息包括筛选条件“与网商贷有关的问题”,第一组标准信息包括“花呗还款流程”、“网商贷的还款流程”、“理财宝如何还款”等标问及其答案。因此,可以根据所述第一类信息,将满足筛选条件的标问选出,其余标问则被舍弃。即,可以确定一个目标标准信息为“网商贷的还款流程”。

在一些实施例中,第一类信息包括第二组标准信息,对应地,基于第一组标准信息和第一类信息确定目标标准信息还可以包括基于第一组标准信息和第二组标准信息确定公共标准信息,然后从公共标准信息中确定目标标准信息。在一些实施例中,第一类信息还包括第二组标准信息及其对应的第二数值,第一组标准信息还包括与标准信息对应的第一数值,对应地,基于第一组标准信息和第一类信息确定目标标准信息还可以包括先确定公共标准信息,然后将公共标准信息对应的第一数值与第二数值进行运算,基于运算结果确定目标标准信息。

关于基于第一组标准信息和第一类信息确定目标标准信息的更多描述可以参见文中其他地方,例如,图4的相关描述。

步骤312,输出一个或多个目标标准信息。在一些实施例中,步骤312可以由目标输出模块212执行。

在一些实施例中,所述呈现方式包括但不限于文字形式、语音形式、图像形式、视频形式等。输出就是把这些目标标准信息输出至客户端,以使用户能够直观地接收到。

在一些实施例中,所述目标标准信息可以包括标准问题;也可以包括与标准问题对应的内容信息;还可以包括标准问题及其内容信息的组合。在一些实施例中,标准问题的内容信息可以理解为标准问题对应的答案。

在一些实施例中,在输出目标标准信息的时候,还可以把一个或多个标准信息当作一个组合,把这个组合输出出来。这个组合里面包含多个标准信息时,就会有一个呈现的顺序。例如,可以向用户输出多个标问及其内容信息,所述多个标问及其内容信息可以按照一定顺序先后输出,或者按照一定顺序前后排列,所述顺序可以由各标问的概率值确定,每个标问可以指向该标问的答案文本、答案图示或者演示视频,用来向用户提供解决对应标准问题的方法或答案,用户点击任意一条标问就可查看其答案内容。

应当注意的是,上述有关流程300的描述仅仅是为了示例和说明,而不限定本说明书的一个或多个实施例的适用范围。对于本领域技术人员来说,在本说明书的一个或多个实施例的指导下可以对流程300进行各种修正和改变。然而,这些修正和改变仍在本说明书的一个或多个实施例的范围之内。例如,在一些实施例中,可以省略步骤312。又例如,在一些实施例中,可以交换步骤302、304与步骤306、308的先后顺序。步骤302、304和/或306、308可以在同一设备上执行,也可以在不同设备上执行。

图4是根据本说明书一些实施例中所示的确定目标标准信息的子流程图示意图。过程400可以由目标标准信息获取及呈现系统100执行,具体的,可以由目标确定模块210实现。以下所示过程的操作仅出于说明的目的。在一些实施例中,过程400在实施时可以添加一个或以上本说明书一个或多个实施例未描述的额外操作,和/或删减一个或以上此处所描述的操作。另外,如图4所示和下面描述的过程操作的顺序不是限制性的。

在一些实施例中,所述第一类信息包括第二组标准信息,第二组标准信息包括一个或多个标准问题和/或其对应的内容信息。在一些实施方式中,第二组标准信息与第一组标准信息有交集。此处的交集可以理解为第二组标准信息与第一组标准信息中有相同或相近的标准信息。

在一些实施例中,相近可以理解为语义距离小于设定阈值,或者具有相同的词句表达,可以基于语义距离算法或文本匹配算法确定两个或多个标准信息是否相近。在一些实施方式中,相同或相近的标准信息可以包括完全相同的标准问题;在一些实施方式中,相同或相近的标准信息可以包括相似度较高的标准问题。标准问题的相似度可以基于具体的情况提前进行设定,例如,根据标准问题中的文本重合度来设定相似度,例如有几个相同的字或词;或者整个标准问题中相同的字段所占比例是多少。在一些实施方式中,相同或相近的标准信息可以包括完全相同的答案内容;在一些实施方式中,也可以包括相似的答案内容。在一些实施方式中,相似的答案内容可以包括文本重合度较高的答案内容。步骤402,确定第一组标准信息与第二组标准信息中的公共标准信息。在一些实施例中,公共标准信息可以是第一组标准信息和第二组标准信息的交集,此处交集的理解可以参照上段。在一些实施例中,公共标准信息还可以包括分别对第一组标准信息和第二组标准信息进行筛选之后相同或相似的标准信息。筛选可以包括基于预设规则的筛选。公共标准信息可以包括标问,也可以包括与标问对应的答案,还可以包括两者的组合。在一些实施方式中,所述确定第一组标准信息与第二组标准信息中的公共标准信息可以基于等值匹配、交集查询等方式确定。例如,第一组标准信息包括“花呗还款流程”、“网商贷的还款流程”、“理财宝如何还款”等标问及其答案,第一类信息包括“如何提升网商贷的额度?”、“网商贷的上限是多少?”、“网商贷的还款流程”、“网商贷的还款时间如何确定?”等标问及其答案,可以确定其交集包括“网商贷的还款流程”、“网商贷的还款时间如何确定?”。

在一些实施例中,可以将所述交集中的选项作为所述公共标准信息,也可以从所述交集的选项中选择部分作为所述公共标准信息,其中选择条件可以是相同或相近程度。例如,上述交集中“网商贷的还款流程”比“网商贷的还款时间如何确定?”的相近程度高,因此将“网商贷的还款流程”作为所述公共标准信息。

在一些实施例中,第一组标准信息包括与其各标准信息对应的第一数值,所述第二组标准信息包括与其各标准信息对应的第二数值。在一些实施例中,第一组标准信息的第一数值可以是概率值、匹配值或权重值。所述第二组标准信息的第二数值也可以是概率值、匹配值或者权重值,这些数值可以是通过预设算法计算得出的各标准信息的概率。所述预设算法可以是第一预设算法,也可以是第二预设算法。

步骤404,将公共标准信息的第一数值和第二数值进行运算。所述运算可以是相加或相乘。例如,公共标准信息中包括“网商贷的还款流程”、“网商贷的还款时间如何确定?”两个标问,其中“网商贷的还款流程”来自第一组标准信息的第一数值为0.9,来自第二组标准信息的第二数值为0.7,将第一数值和第二数值相乘,得到公共标准信息的目标值为0.63。“网商贷的还款时间如何确定?”来自第一组标准信息的第一数值为0.6,来自第二组标准信息的第二数值为0.8,将第一数值和第二数值相乘,得到公共标准信息的目标值为0.48。

步骤406,基于运算结果,从所述公共标准信息中确定一个或多个目标标准信息。在一些实施例中,可以基于公共标准信息的目标值进行排序,并从排序结果中推荐排名前几位(如:前3位)的标准信息作为目标标准信息。例如,可以将“网商贷的还款流程”、“网商贷的还款时间如何确定?”两个标问及其答案作为所述一个或多个目标标准信息。在一些实施例中,也可以为公共标准信息的目标值设定一个阈值(如:0.5),当公共标准信息的目标值大于阈值时,则将其确定为目标标准信息。例如,仅能将“网商贷的还款流程”这一标问及其答案作为所述一个或多个目标标准信息。

图5是根据本说明书一些实施例所示的第一预设算法相关的机器学习模型的训练流程图示意图。以下所示过程的操作仅出于说明的目的。在一些实施例中,过程500在实施时可以添加一个或以上本说明书一个或多个实施例未描述的额外操作,和/或删减一个或以上此处所描述的操作。另外,如图5所示和下面描述的过程操作的顺序不是限制性的。

步骤502,获取历史用户的问题以及与之对应的标准信息。

所述历史用户可以包括历史中服务平台上的用户数据。在一些实施例中,可以基于历史用户数据确定所述历史用户的问题,历史用户的问题包括但不限于通过手动方式输入的问题、通过语音方式输入的问题、通过摄像头取词方式输入的问题等的一种或两种以上的任意组合。所述与之对应的标准信息可以包括历史用户在输入数据后点击的标准信息;也可以包括,历史用户在输入数据后点赞的标准信息;还可以包括历史用户在输入数据后浏览次数最多的标准信息;还可以包括历史用户在输入数据后分享和/或转发次数最多的标准信息。所述标准信息可以包括标问,也可以包括与标问对应的答案,还可以包括两者的组合。

步骤504,训练初始第一机器学习模型。所述机器学习模型可以是自然语言处理(nlp)模型,所述nlp模型包括但不限于bert模型、dssm模型、cnn-dssm模型、lstm-dssm模型、bcnn模型、abcnn模型、hybridcnn模型等。

在一些实施例中,所述第一机器学习模型可通过以下方式训练得到:获取第一训练样本集;所述第一训练样本集包括历史用户的输入问题,以及与所述输入问题对应的标准信息,也就是步骤502中获取的历史用户的问题以及与之对应的标准信息。在一些实施例中,与输入问题对应的标准信息可以包括历史用户输入问题后点击选择的标准问题和/或对应的答案;也可以包括历史用户在输入问题后点赞的标准问题和/或对应的答案;还可以包括历史用户在输入问题后转发的标准问题和/或对应的答案。使用所述第一训练样本集训练初始第一机器学习模型得到训练好的第一机器学习模型。

步骤506,获得训练好的第一机器学习模型。所述训练好的第一机器学习模型可以响应于用户问题,在一些实施例中,训练好的第一机器学习模型能够基于用户问题或用户问题对应的词向量输出一个或多个对应的标准信息,以确定第一组标准信息。在一些实施例中,第一获取模块202获取用户问题后,利用第一机器学习模型可以确定至少一个第一组标准信息。所述第一组标准信息至少包括标问、与标问对应的答案中的一种或其组合。关于第一机器学习模型的使用方法,可以在文中其他地方找到更详细的描述。

在一些实施例中,可以根据模型的预测输出(例如,预测的标准信息)与参考标准之间的差异反向调整模型参数,以达到训练或优化模型的目的。在一些实施例中,可以通过增加样本数据的方式来优化或更新模型。在一些实施例中,当差异满足某一预设条件时,例如,模型的预测正确率大于某一预定正确率阈值,或损失函数(lossfunction)的值小于某一预设值,训练过程将停止,即得到训练好的第一机器学习模型。

在一些实施例中,可以根据用户的反馈来判断输出值与参考值的差距,进而通过增加样本数据来进行优化算法。在一些实施例中,用户的反馈可以包括但不限于用户点击和/或点击次数、浏览和/或浏览时间、转发和/或转发次数、分享和/或分享次数、放弃查看等。

图6是根据本说明书一些实施例所示的第二预设算法相关的机器学习模型的训练流程图示意图。以下所示过程的操作仅出于说明的目的。过程600可以由目标标准信息获取及呈现系统100的第二确定模块208执行。以下所示过程的操作仅出于说明的目的。在一些实施例中,过程600在实施时可以添加一个或以上本说明书一个或多个实施例未描述的额外操作,和/或删减一个或以上此处所描述的操作。另外,如图6所示和下面描述的过程操作的顺序不是限制性的。

在一些实施方式中,步骤308基于所述轨迹因子和第二预设算法确定第一类与标准信息相关的信息可以由机器算法自动处理;在一些实施方式中,机器算法可以由机器学习模型处理,使得处理速度快,准确度高。

步骤602,获取历史用户的轨迹因子以及与之对应的第一类与标准信息相关的信息。所述轨迹因子反映所述历史用户在一个或多个服务平台中的至少一个行为,所述历史用户可以包括在服务平台上已有的用户数据。在一些实施例中,所述轨迹因子还反映所述历史用户的个人属性信息。在一些实施例中,与之对应的第一类与标准信息相关的信息或与之对应的第一类信息可以包括与历史用户的轨迹因子对应的一个或多个标准信息,还可以包括与历史用户的轨迹因子相关的其他辅助信息或筛选条件,筛选条件可以包括范围性信息、条件性信息等起限定作用的信息。

步骤604,训练初始第二机器学习模型。所述第二机器学习模型可以包括与第一机器学习模型相类似的模型。例如,第二机器学习模型包括但不限于bert模型。

在一些实施例中,所述训练初始第二机器学习模型包括:获取第二训练样本集;使用所述第二训练样本集训练初始第二机器学习模型得到训练好的第二机器学习模型。所述第二训练样本集包括步骤602中获取的历史用户的轨迹因子以及与之对应的第一类信息。

在一些实施例中,可以将样本集中的轨迹因子作为输入数据,将与轨迹因子对应的第一类信息作为输出数据或参考标准,以此来训练第二机器学习模型。

步骤606,获得训练好的第二机器学习模型。所述训练好的第二机器学习模型可以响应于目标用户的轨迹因子,在一些实施例中,训练好的第二机器学习模型能够基于目标用户的轨迹因子确定与轨迹因子对应的筛选条件或标准信息,以获得确定的第一类信息。在一些实施例中,第二获取模块204获取用户轨迹因子后,利用第二机器学习模型可以确定至少一个第一类与标准信息相关的信息。在一些实施例中,第一类与标准信息相关的信息或第一类信息至少包括标问、与标问对应的答案中的一种或其组合;在一些实施例中,第一类信息还可以包括筛选辅助信息,所述筛选辅助信息反映目标标准信息的筛选条件。在一些实施例中,所述筛选条件能够对第一组标准信息进行筛选,为确定目标标准信息服务。关于第二机器学习模型的使用方法,可以在文中其他地方找到更详细的描述。

在一些实施例中,可以根据模型的预测输出(例如,预测的标准信息)与参考标准之间的差异反向调整模型参数,以达到训练或优化模型的目的。在一些实施例中,可以通过增加样本数据的方式来优化或更新模型。在一些实施例中,当差异满足某一预设条件时,例如,模型的预测正确率大于某一预定正确率阈值,或损失函数(lossfunction)的值小于某一预设值,训练过程将停止,即得到训练好的第二机器学习模型。

在一些实施例中,也可以通过获取用户对所述一个或多个目标标准信息的反馈来调整模型参数,以达到训练或优化模型的目的。所述反馈包括但不限于用户点击和/或点击次数、浏览和/或浏览时间、转发和/或转发次数、分享和/或分享次数、放弃查看等。

在一些实施例中,还可以获取用户对所述一个或多个目标标准信息的反馈;根据用户的反馈更新所述第一预设算法和/或所述第二预设算法。用户的反馈可以包括但不限于用户点击和/或点击次数、浏览和/或浏览时间、转发和/或转发次数、分享和/或分享次数、放弃查看等。第一预设算法和/或第二预设算法会影响目标标准信息的顺序。在一些实施例中,更新第一预设算法和/第二预设算法包括采集新的训练样本,对第一预设算法和/或第二预设算法相关的机器学习模型进行再训练,提高其输出准确度。在一些实施例中,更新第一预设算法和/第二预设算法包括调整标准信息的筛选条件(例如优化筛选范围),提高筛选的准确度。在一些实施例中,更新第一预设算法和/第二预设算法包括调整与第一数值、第二数值对应的阈值,提高其输出准确度。在一些实施例中,更新第一预设算法和/或第二预设算法还包括调整对用户问题进行关键词提取的逻辑或方法,以提高关键词获取的准确性。

图7是图3中获取目标用户的轨迹因子在一些实施例中所示的子流程图示意图。过程900可以由目标标准信息获取及呈现系统100执行,具体可以由第二获取模块204实现。以下所示过程的操作仅出于说明的目的。在一些实施例中,过程700在实施时可以添加一个或以上本说明书一个或多个实施例未描述的额外操作,和/或删减一个或以上此处所描述的操作。另外,如图7所示和下面描述的过程操作的顺序不是限制性的。

在一些实施例中,用户在设定时间内在服务平台中的一个或多个行为可以是由人工采集的并输入到系统中的;也可以是通过机器获取并进行编码的。以下实施例将介绍通过机器获取用户行为并进行编码的流程。

步骤702,获取目标用户在设定时间内在服务平台中的一个或多个行为。在一些实施例中,所述服务平台可以是目标标准信息获取及呈现系统所在的平台,也可以是与目标标准信息获取及呈现系统所在平台相关联的,能够或者有权限获取相关信息的关联平台。在一些实施例中,所述行为可以是浏览、点击、注册、下载、卸载、分享、转账、提现、点赞、支付等任意用户可以对服务平台进行的操作。所述行为还可以包括行为的参数信息,参数信息包括但不限于时间参数、数值参数、频次参数等。所述设定时间可以是用户完成行为后的某一特定时间内,例如,一个星期内、三天内、一天之内、五分钟之内等等。

步骤704,基于所述一个或多个行为生成一个或多个编码。在一些实施例中,所述编码可以是对用户行为轨迹进行编码,所述编码的目的是为了进行标注化和归一化处理。所述编码的方法可以根据业务不同而采用不同的方法。例如,用户访问了一个网友链接,则将改链接编码为一个int的id来代表该链接;在一些连续数值,也做类似处理,例如将转账金额分为0~9.99,10~49.99,50~199.99,200~999.99,1000及以上五个等级,将这些等级也转换为一个int的id来代表。

步骤706,拼接所述一个或多个编码,得到所述轨迹因子。所述轨迹因子是基于上述一个或多个操作行为对应的一个或多个编码拼接获得。

在一些实施例中,在一些实施例中,所述目标用户的行为还可以包括目标用户的个人属性信息。所述个人属性信息可以包括基本信息、性格、偏好等等。对应地,在一些实施例中,还也可以是对用户个人属性信息进行编码以获取对应的轨迹因子。例如,获取用户的消费偏好后,将用户的这种偏好编码为一个int的id来代表;将用户的学历信息也编码为一个int的id来代表;将用户的收入信息(在能够获取的情况下)也编码为一个int的id来代表。

在一些实施例中,还可以对用户的行为和个人信息进行综合编码,以获取对应的轨迹因子。例如:将喜欢分期付款的用户贷款行为编码为一个int的id来代表;将年收入15~20万的用户贷款行为也转换为一个int的id来代表。

本说明书的一个或多个实施例可能带来的有益效果包括但不限于:本说明书一个或多个实施例在确定并输出目标标准信息的过程中,借助用户的行为轨迹信息,能够较大的提升识别能力,尤其是提升模糊问题识别率。不仅能够提升客服问答系统回答用户问题的准确率,还可以将原有的“不可识别”的信息转换为“可识别”的信息,极大的提高了用户问句识别的能力。需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的一个或多个实施例的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书的一个或多个实施例进行各种修改、改进和修正。该类修改、改进和修正在本说明书的一个或多个实施例中被建议,所以该类修改、改进、修正仍属于本说明书的一个或多个实施例示范实施例的精神和范围。

同时,本说明书的一个或多个实施例使用了特定词语来描述本说明书的一个或多个实施例的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书的一个或多个实施例至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外,本领域技术人员可以理解,本说明书的一个或多个实施例的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的一个或多个实施例的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的一个或多个实施例的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、rf、或类似介质,或任何上述介质的组合。

本说明书的一个或多个实施例各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如java、scala、smalltalk、eiffel、jade、emerald、c++、c#、vb.net、python等,常规程序化编程语言如c语言、visualbasic、fortran2003、perl、cobol2002、php、abap,动态编程语言如python、ruby和groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(lan)或广域网(wan),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(saas)。

此外,除非权利要求中明确说明,本说明书的一个或多个实施例所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书的一个或多个实施例流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书的一个或多个实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的处理设备或移动设备上安装所描述的系统。

同理,应当注意的是,为了简化本说明书的一个或多个实施例披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书的一个或多个实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书的一个或多个实施例对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书的一个或多个实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。

针对本说明书的一个或多个实施例引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书的一个或多个实施例作为参考。与本说明书的一个或多个实施例的内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书的一个或多个实施例中的)也除外。需要说明的是,如果本说明书的一个或多个实施例附属材料中的描述、定义、和/或术语的使用与本说明书的一个或多个实施例所述内容有不一致或冲突的地方,以本说明书的一个或多个实施例的描述、定义和/或术语的使用为准。

最后,应当理解的是,本说明书的一个或多个实施例中所述实施例仅用以说明本说明书的一个或多个实施例的原则。其他的变形也可能属于本说明书的一个或多个实施例的范围。因此,作为示例而非限制,本说明书的一个或多个实施例的替代配置可视为与本说明书的一个或多个实施例的教导一致。相应地,本说明书实施例不仅限于本说明书的一个或多个实施例明确介绍和描述的实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1