搜索引擎处的项目选项识别和搜索结果呈现的制作方法

文档序号:33012750发布日期:2023-01-20 14:13阅读:41来源:国知局
搜索引擎处的项目选项识别和搜索结果呈现的制作方法

1.本文描述的方面涉及使用深度学习识别项目选项并以精简搜索结果页面的方式呈现项目选项。


背景技术:

2.搜索引擎用于通过识别与搜索查询相关的网页来导航互联网或其他网络。响应于搜索查询来呈现搜索结果页面,并且搜索结果页面包括到相关网页的链接。一些搜索引擎是网站特定的,这意味着搜索引擎返回与网站的不同网页相对应的搜索结果。这帮助用户通过启用单词搜索来导航网站,而不是用户必须浏览网站结构以找到特定网页或输入特定url(统一资源定位符)。其他搜索引擎通过爬取互联网来识别整个互联网的搜索结果,并将找到的相关网页在搜索结果页面处呈现给用户。


技术实现要素:

3.从高层面来看,本文描述的方面涉及使用深度学习识别项目选项并以精简搜索结果页面的方式呈现项目选项。
4.项目通常具有项目的各种模型或变体。例如,手机可以具有许多型号,每个型号都具有不同的特征,即项目选项。项目选项通常是项目选项类别的部分,例如具有不同颜色和存储选项的新版本手机。
5.为了响应于搜索引擎处的搜索查询来识别针对项目选项类别的项目选项,采用了经训练的机器学习模型。可以使用多个用户的已知用户特征和用户购买历史来训练经训练的机器学习模型。当被采用时,经训练的机器学习模型使用搜索查询作为输入,并通过识别具有公共用户历史的用户组并基于用户组的公共用户历史预测项目选项来输出项目选项。即,经训练的模型识别类似于与搜索查询相关联的用户的用户,并通过确定组成员将基于组成员的用户历史选择项目选项的概率以及基于相对于针对项目选项类别的其他项目选项的概率识别项目选项来识别项目选项。
6.一旦被确定,项目选项可以作为预选呈现在显示器处。项目选项可以作为项目列表或搜索结果页面的部分进行呈现。在项目列表或搜索结果页面处,项目选项是从项目选项类别的其他项目选项中预选择的,并且针对项目选项类别的项目选项被配置为具有已经选择的所识别的项目选项的可选选项。当被提供为搜索结果页面的部分时,搜索结果页面可以排除包括相同项目选项或相同项目选项类别集合的其他项目列表。
7.本发明内容意在以简化形式介绍在本公开的具体实施方式中进一步描述的构思的选择。本发明内容不意在标识所请求保护的主题的关键特征或基本特征,也不意在帮助确定所请求保护的主题的范围。将提供本技术的附加目的、优点和新颖特征,并且在阅读本公开或通过本技术的实践学习之后将部分地对本领域技术人员变得明显。
附图说明
8.下面参考附图详细描述本技术,其中:
9.图1是根据本文描述的方面的可以采用示例推荐引擎的操作环境;
10.图2是根据本文描述的方面的被生成以提供示例项目列表的图形用户界面,该示例项目列表具有由图1的推荐引擎识别的项目选项;
11.图3是根据本文描述的方面的被生成以提供示例搜索结果页面的另一图形用户界面,该示例搜索结果页面包括具有由图1的推荐引擎识别的项目选项的项目列表;
12.图4和图5是根据本文描述的各方面的用于使用图1的推荐引擎来识别并呈现项目选项的示例方法;以及
13.图6是根据本文描述的方面的适合于实现所描述的技术的示例计算设备。
具体实施方式
14.常规搜索引擎通过爬取网页并返回与搜索查询相关的网站的网页来向用户提供搜索结果。一些搜索引擎返回与搜索查询相关的网页,该网页是特定网站的部分。由于互联网的庞大和不断变化的性质,常规搜索引擎倾向于返回大量的搜索结果,因为存在与搜索查询相关的相当大数量的网页。
15.大量的潜在搜索结果对于搜索引擎和互联网用户是有问题的。具体地,用户只能查看这么多的搜索结果,并且在用户界面处只能提供有限数量的搜索结果。例如,在提交本技术时,在常用搜索引擎中输入的“12码鞋”的搜索提供了超过850,000,000个相关网页。很难想象,一个人可以筛选这些网页中的每一个,并且没有办法在显示器上呈现哪怕是该数量的一小部分的网站。因此,由于互联网的性质,如何在搜索结果页面处提供搜索结果对于互联网的运行至关重要。否则,一个人找到上下文相关网页作为搜索结果的概率接近于零,因为仅少数搜索结果可以呈现在显示器上,而且不可能在搜索结果中逐页筛选如此大的数量,从而实际上使得无法导航互联网。
16.以另一种方式来描述该问题,存在与任何给定搜索查询紧密匹配的很多潜在搜索结果,用户识别与搜索上下文相关但不是精确匹配的网页的概率接近于零,因为这种网页将穿插在大量的搜索结果内,并可能仅首先出现在搜索结果排名的深处。例如,如果用户搜索“12码鞋”,但发现12码的红色运动鞋最相关,则用户将可能永远不会识别一双12码的红色运动鞋,因为850,000,000个结果中可能穿插的相关网页很少,而第一个相关结果可能是850,000,000个中排名靠后的几千个相关网页。因此,搜索引擎对搜索结果进行排名并显示的方式对互联网的运行至关重要,否则用户必须提供足够特定的搜索查询以区别于例如850,000,000个结果,假设这种特异性在不知道网页的确切内容或其url的情况下甚至是可能的。
17.为了克服该问题的一些方面,搜索引擎寻求以给予用户定位预期网页的能力的方式来提供搜索结果。在电子商务的上下文中,这包括为用户提供定位预期项目的能力,该预期项目存储在具有搜索引擎的电子商务网站的项目列表数据库中。为用户提供搜索结果的一些方法包括采用深度学习以更好地预测与搜索查询相关的搜索结果,该搜索结果最可能与用户的意图相关。
18.然而,该领域的一些常规机器学习技术用途有限,因为在许多情况下,没有足够的
关于特定用户的数据来针对许多可能的搜索查询准确预测用户的意图。作为补偿,已经采用了一些无监督学习技术,但结果可能仍然不够准确以将最佳搜索结果与数百万个潜在搜索结果区分开。
19.用于克服这些挑战中的一些挑战的另一方法包括搜索结果的特定呈现方法。一些现有方法提供重新排序或打乱排名靠前的搜索结果,以避免所有排名靠前的搜索结果与同一网页或项目相关。
20.本技术提供了可以用于帮助克服这些挑战的附加机制,该附加机制在技术领域中不是常规的。为了克服这些挑战中的一些挑战,本技术的一些方面采用基于类似用户组进行搜索结果预测的深度学习方法,这在与常规方法相比时允许使用关于与搜索查询相关联的用户的较少数据进行更准确的预测。通过用较少的用户数据进行更准确的预测,可以向用户呈现最好的相关搜索结果,因此使用户能够实际上识别预期搜索结果,例如网页或项目,并且该技术可以用于更多用户,包括数据有限的那些用户。
21.此外,本技术描述了以精简方式向用户提供搜索结果的呈现方法,因此允许通过排除类似的搜索结果来呈现与搜索查询具有不同上下文关系的附加搜索结果。例如,一些呈现方法提供可选择的选项,从而允许排除一些搜索结果并能够呈现其他上下文相关的搜索结果。
22.此外,如将更详细描述的,该技术提供了使用深度学习预选可选择的选项。通过使用深度学习预选选项,识别用户的最佳选项的准确性很高,因此在呈现多个选项的情况下,用户不太可能必须深入搜索结果内以找到最佳搜索结果,而是呈现最可能的选项。总之,这需要用户提供比常规系统所需的输入更少的输入来获得最终搜索结果,包括网页或项目列表。
23.总之,通过提供预选,搜索系统从用户接收较少的输入,如传统上实现类似结果所需的输入。从搜索引擎的角度来看,由于用户输入较少,搜索引擎正在处理较少的命令。这增强了采用搜索引擎的计算系统的效率,因为计算系统现在能够以与之前相同的计算处理能力来处理来自用户的更大数量的搜索请求。当被采用时,响应中处理的减少的输入和功能释放了跨其上采用计算系统的网络的带宽,因此允许网络促进系统处理更多事务。
24.影响这些益处的技术的一个示例识别项目选项,并将项目选项提供为项目列表内或搜索结果页面内的预选。如上所述,该技术的一种使用促进识别项目并将项目作为搜索结果提供给用户。在许多情况下,项目将具有多个变体。这些可能以对先前项目的项目更新、项目的新模型、或提供具有各种可选特征的项目的形式出现。电子设备尤其如此,其中不断引入新模型和模型的不同变体。通常,项目选项与项目特征相关,并且项目特征通常被分组到项目选项类别中。作为示例,可能引入具有不同存储选项、颜色选项、相机质量选项、尺寸选项、电池容量选项等的新型号手机。因此,存储、颜色、相机质量、尺寸和电池容量是项目选项类别的示例,而单独的选项或特征是与项目选项类别相关联的项目选项的示例。例如,50gb(千兆字节)、100gb和150gb将是存储容量的项目选项类别内的项目选项的示例。
25.机器学习可以用于在接收到搜索查询时针对用户识别项目选项。具体地,可以训练机器学习模型(例如,神经网络)以基于用户的搜索查询的输入将项目选项识别为输出。可以使用包括多个用户的已知用户特征和用户购买历史的训练数据集来训练神经网络。已知用户特征包括用户的任何识别方面,而用户购买历史包括用户过去购买的存储历史,包
括购买的项目和任何购买项目的项目选项。用户购买历史还可以包括网站内的交互(例如输入的搜索查询)和搜索查询之后的用户活动(例如与项目的特定搜索结果的交互)以及相关联的项目选项和项目选项类别。
26.在训练神经网络时,训练神经网络以识别类似的用户。即,在多个用户内,用户具有各种用户特征和用户购买历史。可以训练神经网络以识别聚类在向量空间中的类似用户。一个或多个类似用户的集群被称为用户组。作为训练的结果,用户组的成员包括公共用户历史。应当理解,“公共”用户历史并不意味着用户历史是相同的,而是它是可识别集群内的用户的用户历史。
27.在已经训练神经网络后,神经网络可以在运行期间通过输入用户的搜索查询来使用,还可以包括已知用户特征或项目选项类别。经训练的神经网络输出已经基于与搜索查询的用户相关联的用户组的公共用户历史确定的项目选项。即,神经网络基于用户的购买历史或具有公共历史的用户组的购买历史来预测项目选项类别的项目选项。
28.由神经网络确定的项目选项可以作为预选呈现给用户。即,项目选项类别被配置为包括针对项目选项类别中的每个项目选项的可选选项,并且由经训练的神经网络确定的项目选项可以被提供为可选选项的预选。因此,用户可以使用预选继续导航或选择另一可选选项。然而,使用机器学习,用户将使用预选继续导航的总体可能性更高,需要用户参与更少的导航步骤。此外,除了提供预选之外,还可以在搜索结果页面处提供预选,并精简搜索结果页面以显示更多相关结果。即,由于向用户呈现了预选,但可以将预选改变为另一项目选项,因此搜索结果页面可以排除具有相同项目选项或相同项目选项类别的其他搜索结果,从而有助于可能妨碍用户识别其他更相关结果的能力的重复或上下文类似的搜索结果。
29.将认识到,先前描述的方法仅是可以从下面的描述中实践的示例,并且它已经被提供以更容易地理解该技术并认识到其益处。现在参考附图描述附加示例。
30.首先参考图1,在未示出的其他组件或引擎中,示例操作环境100包括计算设备102。计算设备102被示为使用网络104与数据存储106、搜索引擎108和推荐引擎110进行通信。
31.网络104可以包括一个或多个网络(例如,公共网络或虚拟专用网络“vpn”),如网络104所示。网络104可以包括但不限于一个或多个局域网(lan)、广域网(wan)或任何其他通信网络或方法。
32.通常,计算设备102可以是对应于参考图6所描述的计算设备600的设备。在实施方式中,计算设备102可以是客户端侧或前端设备,而在其他实施方式中,计算设备102表示后端或服务器侧设备。如将要讨论的,计算设备102还可以表示一个或多个计算设备,并且因此,该技术的一些变体包括客户端侧或前端设备以及执行将进一步描述的一个或多个功能的后端或服务器侧计算设备二者。
33.操作环境100包括数据存储106。数据存储106通常存储包括数据、计算机指令(例如,软件程序指令、例程或服务)、或在所描述技术的实施例中使用的模型的信息。尽管被描绘为单个数据库组件,但数据存储106可以体现为一个或多个数据存储或者可以在云中。
34.在已经识别操作环境100的各种组件后,再次注意并强调,任何布置中的任何附加或更少的组件可以用于实现在本公开的范围内的期望功能。尽管图1的一些组件被描绘为
单个组件,但这些描绘在本质上和数量上旨在作为示例,并且不应被解释为对本公开的所有实施方式的限制。可以基于操作环境100的组件的功能和特征来进一步描述操作环境100的功能。除了所示出的那些或代替所示出的那些,可以使用其他布置和元素(例如,机器、接口、功能、命令、功能分组等),并且可以完全省略一些元素。
35.此外,关于图1描述的许多元素(例如,关于推荐引擎110描述的那些元素)是可以被实现为分立或分布式组件或与其他组件结合的功能实体,并且可以以任何合适的组合和位置来实现。本文描述的各种功能由一个或多个实体来执行并且可以由硬件、固件或软件来执行。例如,各种功能可以通过处理器执行存储器中存储的计算机可执行指令来执行。此外,关于图1描述的功能可以由计算设备102在前端、后端处或以任何组合或布置来执行。
36.搜索引擎108通常从计算设备102接收搜索查询并且作为响应提供搜索结果。搜索引擎108可以是用于计算机网络的任何类型的搜索引擎,包括从网络上的各种网站返回与搜索查询相关的网页的链接的网络爬虫、或者特定于特定网站的搜索引擎,该搜索引擎返回与特定网站相关联的相关网页。在一个特定示例中,电子商务网站可能包括识别与搜索查询相关的项目的搜索引擎,该项目由第三方使用该网站出售。在该示例中,搜索结果可能包括链接到针对该项目的项目列表的相关项目的列表。
37.推荐引擎110通常使用机器学习识别项目选项,并提供所识别的项目选项作为可选选项的预选。为此,示例推荐引擎110采用模型训练器112、项目选项确定器114和gui(图形用户界面)生成器116。
38.模型训练器112通常训练机器学习模型以识别项目选项。适合于由本技术使用的一组机器学习模型包括神经网络。适合于使用的一个特定神经网络包括多层感知器人工神经网络(ann)。
39.多层感知器的益处在于它可以逼近输入与输出目标之间的训练函数,其可以包括由用户(输入)提供的搜索查询以及与搜索查询(输出)相关联的项目的项目选项。通过其训练,多层感知器通过查找用户组或一个或多个用户的集群来学习输入与目标输出的关联,该用户组或一个或多个用户的集群是具有类似输出值的点。以这种方式,多层感知器的训练学习向量空间中一个用户与下一用户的关系以预测类似用户(包括用户组的用户成员)的项目选项,在该向量空间中,向量空间内相对较近的用户在其动作上相对更类似并被经训练的神经网络(例如,经训练的多层感知器)使用。以这种方式,可以限制关于用户的数据量,因为经训练的机器学习模型识别一个或多个用户的类似用户组,并且可以基于类似用户的用户组来预测项目选项。
40.当训练神经网络或其他类型的机器学习模型时,模型训练器112可以利用训练数据集,例如数据存储106中的训练数据118。训练数据118通常包括多个用户的已知用户特征和用户购买历史。已知用户特征通常包括用户的任何识别方面。这可以包括诸如用户识别、位置、地址、教育、服装尺寸、职业、年龄、性别等之类的方面。用户购买历史可以包括诸如购买频率、先前购买的项目、搜索查询历史、项目退货、价格等之类的方面。用户购买历史还可以包括先前购买的项目的项目选项、以及与项目选项相关联的项目选项类别。
41.使用训练数据118,模型训练器112训练机器学习模型以生成经训练的机器学习模型。因此,在所提供的特定示例中,模型训练器112训练多层感知器模型以生成经训练的多层感知器模型。经训练的机器学习模型可以作为经训练模型120存储在数据存储106内以供
操作环境100的其他组件(包括推荐引擎110)使用。
42.通常,项目选项确定器114通过采用来自模型训练器112的机器学习模型来确定项目选项。项目选项确定器114可以从搜索引擎108接收与搜索查询相关联的用户的搜索查询,或者可以接收与由搜索引擎108识别的相关项目相对应的搜索结果。当采用从数据存储106中的经训练模型120检索的经训练的机器学习模型时,项目选项确定器114可以使用所接收的搜索查询作为经训练的机器学习模型的输入。
43.基于使用训练数据集的训练,当被采用时,经训练的机器学习模型通过基于具有公共用户历史的组成员识别一个或多个用户的用户组来确定与搜索查询相关联的用户的项目选项。例如,经训练的机器学习模型识别一个或多个用户的集群,该集群在向量空间中和与搜索查询相关联的用户在空间上相关达阈值距离,其中,集群内的用户组由机器学习模型在训练期间基于与每个用户相关联的用户历史进行聚类。凭借在用户组内被识别,用户具有公共用户历史。公共用户历史可能包括由用户组的成员先前购买的项目的公共项目选项。机器学习模型使用用户组的公共用户历史来预测用户和组成员的项目选项。
44.当被项目选项确定器114采用时,经训练的机器学习模型输出项目选项。可以独立地采用经训练的机器学习模型以确定针对项目的每个项目选项类别的项目选项。如所提及的,项目可以包括项目选项类别,其具有类别内的多个项目选项。举例来说,新型号手机可能具有颜色(包括黑色和银色作为项目选项)的项目选项类别和尺寸(例如,大屏幕和小屏幕作为项目选项)的项目选项类别。
45.经训练的机器学习模型可以独立地确定针对第一项目选项类别的项目选项和针对第二项目选项类别的项目选项。在独立确定每个项目选项类别的情况下,项目选项确定器也可以使用项目选项类别作为输入。即,针对搜索查询的相关搜索结果可以被确定并且可以包括与搜索查询相关的项目。对于与相关搜索结果相关联的项目,该项目可能包括各种项目选项类别。项目选项确定器114可以向机器学习模型独立地提供项目的每个项目选项类别作为输入,以输出针对每个项目选项类别的项目选项。
46.在另一示例中,项目选项确定器114通过确定项目的单个项目模型并使用单个项目模型的特征作为项目选项来确定项目选项。例如,项目选项确定器114向经训练的机器学习模型提供搜索查询以识别与搜索查询相关的项目的项目选项。所识别的项目选项可以作为特定项目模型的部分被包括在内。基于此,项目模型被确定,并且针对项目的每个项目选项类别的项目选项基于所确定的项目模型中包括的特征来确定。在另一示例中,经训练的机器学习模型被配置为(即,由模型训练器112训练)输出与搜索查询相关的项目的模型,并且项目选项由项目选项确定器114通过基于所确定的项目模型的特征识别针对项目的每个项目选项类别的项目选项来确定。
47.在一方面,经训练的机器学习模型通过输出每个项目选项的概率值来从针对项目选项类别的多个项目选项中确定项目选项,其中概率值指示该项目由用户基于具有公共用户历史的用户组选择的概率。换句话说,概率值可以指示项目选项与用户组的公共用户历史之间的相关强度。选择具有指示相对于其他项目选项的更大概率的概率值的项目选项作为所确定的项目选项。在一些场景中,经训练的机器学习模型的输出相对于项目选项中的一些可以是不确定的,或者可以指示具有由用户基于具有相同概率值的项目选项选择的相同或类似概率的多于一个项目选项。
48.在这种情况下,项目选项确定器114可以采用汤普森采样来确定项目选项。例如,使用汤普森采样,项目选项集合中的一个被选择。例如通过将搜索结果与所选项目选项结合、购买具有与所选项目选项相对应的特征的项目、或通过将所选项目选项改变为不同的项目选项,接收与搜索查询相关联的用户是否选择所选项目选项的反馈。基于反馈,项目选项确定器114可以确定项目选项集合中的哪个项目选项具有被用户或用户组中的另一用户选择的更大概率。因此,使用与项目选项相关联的值和汤普森采样,可以响应于搜索查询来为用户确定和选择项目选项。
49.gui生成器116通常导致生成gui,其包括用于在计算设备102的显示设备处显示的项目选项。即,gui生成器116可以提供由项目选项确定器114确定的项目选项以用于显示。图2和图3示出了由gui生成器116生成的两个示例gui。应当理解,这些是示例,并且可以执行提供项目选项的其他方法。
50.在图2中,示例gui 200由gui生成器116生成,并适合于在显示设备处显示。这里,gui生成器116导致生成项目列表202。项目列表202可以是由搜索引擎108确定并提供给推荐引擎110的项目列表。如图所示,已经生成项目列表202以包括项目选项204a至204e,其分别对应于项目选项类别206a至206e,意味着项目选项204a是项目选项类别206a内的多个项目选项之一,等等。
51.如图所示,项目选项204a至204e均被呈现为预选。即,在所提供的示例中,用户被导航到项目列表202的网页,并且项目选项204a至204e中的每一个被预选。通过在搜索查询的输入之后在搜索结果页面处选择搜索结果,用户可以被导航到项目列表的网页。换句话说,项目列表202的项目选项类别206a具有与其相关联的多个项目选项。多个项目选项可以是可选选项。在这种情况下,项目选项204a从项目选项确定器114基于用户组的公共购买历史被确定为用户将与其交互的多个项目选项中最可能的项目选项。因此,具有项目列表202的gui 200最初以所确定的项目选项(例如,从多个项目选项中预选的项目选项204a)呈现给用户。用户可以将所预选的项目选项(例如,项目选项204a)改变为与项目选项类别206a相关联的多个项目选项中的任何其他项目选项。这可以通过项目选项204a至204e中的一个或多个来进行,尽管为了简洁起见仅描述一个示例。通过最初在项目列表处呈现所预选的项目选项,用户可以查看项目的特定变体或模型(如通过机器学习所确定的),以在用户界面处需要比常规方法所需的更少的用户交互和操纵的方式,因此简化通过网站的导航。
52.图3示出了可以使用gui生成器116生成的另一示例gui 300。gui 300包括搜索结果页面302,其包括针对搜索引擎(例如,搜索引擎108)处所提供的搜索查询的搜索结果304。
53.搜索结果304包括第一搜索结果306a至第三搜索结果306c,但应当理解,可以在搜索结果页面302处提供任何数量。这里,响应于搜索查询,提供具有与搜索查询相关的项目的搜索结果页面302,项目被提供为搜索结果304。以第一搜索结果306a为例,第一搜索结果306a包括各自分别对应于项目选项类别310a至310e的项目选项308a至310e。例如,项目选项类别310a具有与其相关联的多个项目选项,每个项目选项被提供为可选选项。在所提供的示例中,项目选项308a已经在与项目选项类别310a相关联的项目选项中被预选并且作为预选被提供。项目选项308a至308e中的一个或多个可以在针对搜索结果306a的搜索结果页面302处被提供为针对项目选项类别310a中的一个或多个的预选。
54.搜索结果页面302可以使用可选选项或预选来提供针对搜索查询的搜索结果的精简集。图3提供了一个示例。可以通过从搜索结果页面302中排除一些搜索结果来提供搜索结果的精简集。如先前所讨论的,一个常规问题是,相关项目的绝对数量可能意味着基于常规呈现许多上下文相关的项目将不被用户看到。然而,通过排除一些搜索结果,其他上下文相关的搜索结果可以被提供并被用户看到,例如第二搜索结果306b和第三搜索结果306c。
55.在一方面,可以排除具有相同项目选项类别集合的搜索结果。在这种情况下,搜索结果页面302可以针对包括相同项目选项类别集合的每个相关项目仅呈现一个搜索结果。如图所示,第一搜索结果306a包括项目选项类别的集合,其包括“条件”、“型号”、“存储”、“网络”和“颜色”。因此,具有相同项目选项类别集合的另一相关项目可以从搜索结果页面302中排除。然而,通过使用可选选项,用户可以在搜索结果页面302处操纵可选选项以查看其他相关搜索结果,例如,通过将项目选项308a改变为与项目选项类别310a相关联的另一项目选项,等等。因此,搜索结果页面302可以省略以不同变体提供项目的其他项目。通过这样做,用户能够查看其他上下文相关的搜索结果,例如第二搜索结果306b和第三搜索结果306c。
56.在一些方面,可以通过排除具有由项目选项确定器114针对一个或多个项目选项类别确定的相同项目选项的相关搜索结果来精简搜索结果,例如搜索结果304。例如,搜索结果306a包括所确定的项目选项306b。基于所确定的项目选项306b,gui生成器可以排除具有使用项目选项确定器114针对用户确定的项目选项的其他搜索结果。如图所示,具有针对项目选项类别“型号”的所确定项目选项“电话ix”(其被确定为项目选项308b)的其他相关项目已经从搜索结果页面302中排除。
57.关于图4和图5,提供框图以示出用于识别并提供项目选项的示例方法。该方法可以使用图1的推荐引擎110来执行。在多个方面,一种或多种计算机存储介质,其上包含有计算机可执行指令,该计算机可执行指令在由至少一个处理器执行时使至少一个处理器执行方法(例如,图4和图5的示例方法400和500)的操作。
58.现在参考图4的方法400,在框402处,接收搜索查询。可以从用户接收搜索查询,该用户从诸如计算设备102的用户计算设备在搜索引擎108处提供搜索查询。在框404处,识别对应于搜索查询的项目。搜索引擎108可以将相关项目识别为针对搜索查询的搜索结果。搜索引擎108可以通过查询具有索引的项目列表集合的项目数据库并从项目数据库识别相关项目列表来识别相关项目。在许多情况下,所识别的相关项目包括与针对项目的各种特征的多个项目列表选项相关联的项目选项类别。相关项目可能包括项目的变体,每个变体具有针对与项目相关联的项目选项类别的项目选项的不同集合。
59.在框406处,可以使用推荐引擎110的项目选项确定器114从与针对在框404处识别的项目的项目选项类别相关联(例如“在该项目选项类别内可用”)的多个项目选项确定项目选项。为此,项目选项确定器114可以采用经训练的机器学习模型来针对与搜索查询相关联的用户确定项目选项。经训练的机器学习模型可以基于具有公共用户历史的用户的用户组来确定项目选项,其中用户组在机器学习模型的训练期间被确定以将一个或多个用户的集群识别为用户组,其中集群基于用户的用户历史来确定,并且包括为集群成员是基于具有公共用户历史的用户组的一个或多个用户进行的。一类机器学习模型可以是神经网络,而被训练为经训练的机器学习模型的神经网络的一个示例是多层感知器。
60.在一些情况下,汤普森采样也可以用于确定项目选项。可以针对项目确定项目选项,或者可以针对项目确定多个项目选项。项目选项可以被独立确定,或者可以基于确定项目的特定模型或变体。当识别针对项目选项类别中的每一个的项目选项时,经训练的机器学习模型可以确定针对每个项目选项类别的每个项目选项的概率值,其中概率值指示每个项目选项与用户组的公共用户历史之间的相关的强度。针对每个项目选项类别的每个项目选项可以基于在每个项目选项类别内具有最大概率值的项目选项来确定。
61.在框408处,提供所确定的项目选项。可以将所确定的项目选项提供给从其接收搜索查询的用户计算设备。可以通过使用gui生成器116生成gui来提供项目选项。在一些情况下,所确定的项目选项在gui上被提供为针对项目选项类别的预选。预选可以被提供为搜索结果页面的部分或被提供为项目列表的部分。在一些情况下,其他搜索结果从搜索结果页面中排除,例如通过排除未提供为预选的项目变体的项目变体的其他识别的相关项目列表,例如通过排除具有相同项目列表类别集合或具有相同识别的项目列表选项的其他项目列表。
62.现在转向图5,提供方法500以示出识别并提供项目选项的另一示例。在框502处,训练机器学习模型。机器学习模型可以是神经网络,并且在一些特定情况下,是多层感知器。可以使用推荐引擎110的模型训练器112使用训练数据集来训练机器学习模型。一个示例训练数据集包括训练数据118并且包括多个用户的已知用户特征和用户购买历史。
63.在框504处,采用来自框502的经训练的机器学习模型来确定项目选项类别内的项目选项。项目选项确定器114可以使用从用户接收的搜索查询输入来采用经训练的机器学习模型,其中相关项目和针对项目的项目列表与所接收的搜索查询相关联并且是使用搜索引擎108来识别的。每个项目可以具有与其相关联的项目列表类别的集合。经训练的机器学习模型可以用于识别针对项目的项目列表类别的项目选项,这可以独立完成或通过识别单个项目模型(例如,特定项目变体)来完成。凭借训练,机器学习模型可以通过将具有公共用户历史的用户组识别为与搜索查询相关联的用户来识别项目选项中的一个或多个,并且可以通过基于用户组的公共用户历史预测项目选项来识别项目选项。汤普森采样也可以用于识别一个或多个项目选项。
64.在框506处,使图形用户界面被渲染以用于呈现在框506处确定的项目选项。gui生成器116可以用于生成包括项目选项的gui。gui可以包括具有针对相关项目的项目列表的搜索结果页面,其中项目列表提供每个确定的项目选项作为针对项目选项类别的预选,该项目选项类别具有与项目选项类别相关联的项目选项的可选选项。在一些情况下,响应于搜索查询,项目选项在项目列表处被呈现为预选。
65.已经描述了本技术的实施例的概述,下面描述可以实现本技术的实施例的示例操作环境,以便为各个方面提供一般上下文。具体地,首先参考图6,用于实现本技术的实施例的示例操作环境被示出并且通常被指定为计算设备600。计算设备600只是适当的计算环境的一个示例,并不旨在暗示对技术的功能或使用的范围的任何限制。也不应将计算设备600解释为具有与所示组件中的任何一个或组合相关的任何依赖性或要求。计算设备600适用于使用一个或多个处理器执行计算机化的方法,包括已经讨论的方法或其任何变体。
66.本公开的技术可以在由计算机或其他机器(例如,个人数据助理或其他手持设备)执行的计算机代码或机器可用指令(包括计算机可执行指令,例如程序模块)的一般上下文
中描述。通常,包括例程、程序、对象、组件、数据结构等的程序模块是指执行特定任务或实现特定抽象数据类型的代码。该技术可以在包括手持设备、消费电子产品、通用计算机、更专业的计算设备等的各种系统配置中实践。该技术也可以在分布式计算环境中实践,其中任务由通过通信网络链接的远程处理设备执行。
67.参考图6,计算设备600包括直接或间接耦合以下设备的总线610:存储器612、一个或多个处理器614、一个或多个呈现组件616、输入/输出端口618、输入/输出组件620和说明性电源622。总线610表示可以是一个或多个总线(例如,地址总线、数据总线或其组合)。尽管为了清楚起见,图6的各个框都用线条表示,但实际上,描绘各种组件并不是那么清楚,并且隐喻地,线条将更准确地是灰色和模糊的。例如,可以将诸如显示设备的呈现组件视为i/o组件。作为另一示例,处理器也可以具有存储器。这是本领域的本质,并且再次重申,图6的图仅示出了可以与本技术的一个或多个实施例结合使用的示例计算设备。诸如“工作站”、“服务器”、“膝上型计算机”、“手持设备”等的类别之间没有区别,因为所有这些类别都在图6的范围内考虑并且都指的是“计算设备”。
68.计算设备600通常包括各种计算机可读介质。计算机可读介质可以是可以由计算设备600访问的任何可用介质,并且包括易失性和非易失性介质、以及可移除和不可移除介质。作为示例而非限制,计算机可读介质可以包括计算机存储介质和通信介质。
69.计算机存储介质包括以任何方法或技术实现的易失性和非易失性、可移除和不可移除介质,用于存储信息,如计算机可读指令、数据结构、程序模块或其他数据。计算机存储介质包括但不限于:ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字通用光盘(dvd)或其他光盘存储设备、磁带盒、磁带、磁盘存储设备或其他磁存储设备、或可以用于存储期望信息并且可以由计算设备600存取的任何其他介质。计算机存储介质不包括信号本身。
70.通信介质通常以调制数据信号(如载波或其他传输机制)体现计算机可读指令、数据结构、程序模块或其他数据,并且包括任何信息传送介质。术语“调制数据信号”是指以对信号中的信息进行编码的方式设置或改变一个或多个其特征的信号。作为示例而非限制,通信介质包括诸如有线网络或直接有线连接的有线介质、以及诸如声学、rf、红外线和其他无线介质的无线介质。以上任何项的组合也应当被包括在计算机可读介质的范围内。
71.存储器612包括易失性存储器或非易失性存储器形式的计算机存储介质。存储器可以是可移除的、不可移除的或其组合。示例硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备600包括一个或多个处理器,其从诸如存储器612或i/o组件620的各种实体读取数据。呈现组件616向用户或其他设备呈现数据指示。呈现组件的示例包括显示设备、扬声器、打印组件、振动组件等。
72.i/o端口618允许计算设备600在逻辑上耦合到包括i/o组件620的其他设备,其他设备中的一些可以内置。说明性组件包括麦克风、操纵杆、游戏手柄、卫星天线、扫描仪、打印机、无线设备等。
73.上述实施例可以与一个或多个具体描述的替代方案进行组合。具体地,要求保护的实施例可以在替代方案中包含对多于一个其他实施例的参考。要求保护的实施例可以指定要求保护的主题的进一步限制。
74.本文具体描述了本技术的主题以满足法定要求。然而,描述本身并不意在限制本公开的范围。相反,发明人已经设想,要求保护或公开的主题也可以以其他方式体现,以结
合其他现有技术或未来技术包括不同的步骤或与本文档中描述的步骤类似的步骤组合。此外,尽管在本文中可以使用术语“步骤”或“框”来表示所采用的方法的不同元素,但该术语不应被解释为暗示本文公开的各个步骤之中或之间的任何特定顺序,除非并且除了明确说明各个步骤的顺序。
75.出于本公开的目的,单词“包括”或“具有”与单词“包含”具有相同的广泛含义,并且单词“防问”包括“接收”、“引用”或“检索”。此外,单词“通信”与单词“接收”或“发送”具有相同的广义含义,其由基于软件或硬件的总线、接收器或发送器使用通信介质促进。此外,单词“发起”与单词“执行”或“指示”具有相同的广义含义,其中对应的动作可以基于另一动作的发生而被执行到完成或中断。
76.此外,除非另有相反说明,否则诸如“一”、“一个”的单词包括复数以及单数。因此,例如,在存在一个或多个特征的情况下,满足“一个特征”的约束。此外,术语“或”包括连接的、分离的和二者(因此a或b包括a或b、以及a和b)。
77.出于以上详细讨论的目的,本技术的实施例参考分布式计算环境进行描述;然而,本文描述的分布式计算环境仅是示例。组件可以被配置用于执行实施例的新颖方面,其中术语“被配置用于”或“被配置为”可以指“被编程为”执行特定任务或使用代码实现特定抽象数据类型。
78.从上文可以看出,该技术非常适于实现上述所有目标和目的,包括该结构明显或固有的其他优点。应当理解,某些特征和子组合是有用的并且可以在不参考其他特征和子组合的情况下采用。这是由权利要求所设想的并且在权利要求的范围内。由于可以在不脱离本范围的情况下做出所描述技术的许多可能的实施例,因此应当理解,本文描述的或附图所示的所有内容都应被解释为说明性的而不是限制性的。
79.可以根据前述公开实践的技术的一些示例方面包括以下方面:
80.方面1:一种由一个或多个处理器执行的用于提供项目选项的计算机化的方法,所述方法包括:在搜索引擎处接收搜索查询,所述搜索查询是从用户计算设备接收的;识别对应于所述搜索查询的项目,所述项目与项目数据库内的项目列表相关联,其中,所述项目列表包括不同的项目选项;从在所述项目的项目选项类别内可用的多个项目选项中确定项目选项,所述项目选项基于具有公共用户历史的用户组来确定;以及向用户计算设备提供来自所述项目数据库的项目列表作为针对所述搜索查询的搜索结果,所述项目列表包括具有所述项目选项的所述项目。
81.方面2:根据方面1,还包括:在所述搜索引擎处将所述多个项目选项呈现为针对所述项目选项类别的可选选项集合,所述项目选项被呈现为来自所述可选选项集合的预选。
82.方面3:根据方面1至2中的任一方面,还包括:使用多个用户的已知用户特征和用户购买历史来训练神经网络,其中,所述项目选项通过以下方式确定:采用经训练的神经网络识别具有所述公共用户历史的用户组,并基于所述用户组的公共用户历史预测所述项目选项。
83.方面4:根据方面1至3中的任一方面,其中,确定所述项目选项包括:执行汤普森采样以从针对所述用户组识别的项目选项中选择所述项目选项。
84.方面5:根据方面1至4中的任一方面,其中,所述项目与多个项目选项类别相关联,每个项目选项类别包括项目选项,并且其中,所述方法还包括确定针对每个项目选项类别
的一个项目选项。
85.方面6:根据方面5,其中,确定针对每个项目选项类别的一个项目选项包括:采用经训练的神经网络来确定每个项目选项的概率值,所述概率值指示每个项目选项与所述用户组的公共用户历史之间的相关的强度,所述一个项目选项在每个项目选项类别内具有最大概率值。
86.方面7:根据方面5至6中的任一方面,其中,针对每个项目选项类别的一个项目选项是独立确定的。
87.方面8:根据方面1至7中的任一方面,其中,所述项目列表被提供为搜索结果页面的一部分,其中,所述搜索结果页面排除针对项目的具有所述项目选项的其他项目列表。
88.方面9:一种或多种计算机存储介质,存储计算机可读指令,所述计算机可读指令在由处理器执行时使所述处理器执行用于提供项目选项的操作,所述操作包括:使用包括多个用户的已知用户特征和用户购买历史的训练数据集来训练机器学习模型;采用使用搜索查询作为输入的经训练的机器学习模型来确定项目的项目选项类别内的项目选项,所述经训练的机器学习模型用于通过识别具有公共用户历史的用户组并基于所述用户组的公共用户历史预测所述项目选项来确定针对与所述搜索查询相关联的用户的项目选项;以及导致生成图形用户界面,该图形用户界面包括针对所述项目的项目列表,所述项目列表具有针对与所述项目选项相关联的项目选项类别的可选选项集合,通过采用所述经训练的机器学习模型而确定的项目选项被呈现为来自所述可选选项集合的预选。
89.方面10:根据方面9,其中,所述神经网络是多层感知器。
90.方面11:根据方面9至10中的任一方面,还包括:对所述项目选项类别的项目选项执行汤普森采样,其中,所述项目选项还基于所述汤普森采样来确定。
91.方面12:根据方面9至11中的任一方面,其中,所述项目与多个项目选项类别相关联,每个项目选项类别包括项目选项,并且其中,所述方法还包括通过采用所述经训练的机器学习模型来确定针对所述项目选项类别中的每一个项目选项类别的一个项目选项。
92.方面13:根据方面12,其中,针对所述项目选项类别中的每一个项目选项类别的一个项目选项是独立确定的。
93.方面14:根据方面12至13中的任一方面,其中,针对所述项目选项类别中的每一项目选项类别的一个项目选项是基于所述项目的单个项目模型的特征来确定的。
94.方面15:根据方面9至14中的任一方面,其中,所述项目列表被呈现为搜索结果页面的一部分,所述搜索结果页面基于所述可选选项集合排除针对项目的具有所述项目选项的其他项目列表。
95.方面16:一种用于提供项目选项的系统,所述系统包括:至少一个处理器;以及一种或多种计算机存储介质,存储计算机可读指令,所述计算机可读指令在由所述至少一个处理器执行时,使所述至少一个处理器执行方法,所述方法包括:从搜索引擎接收搜索查询;采用使用所述搜索查询作为输入的经训练的机器学习模型来确定项目的项目选项类别内的项目选项,所述经训练的机器学习模型在训练数据集上训练,所述训练数据集包括多个用户的已知用户特征和用户购买历史,其中,所述经训练的机器学习模型通过识别具有公共用户历史的用户组并基于所述用户组的公共用户历史预测所述项目选项来确定所述项目选项;以及导致生成用于通过所述搜索引擎呈现的图形用户界面,所述图形用户界面
包括针对所述项目的项目列表,所述项目列表具有针对与所述项目选项相关联的项目选项类别的可选选项集合,通过采用所述经训练的机器学习模型而确定的项目选项被呈现为来自所述可选选项集合的预选。
96.方面17:根据方面16,其中,所述机器学习模型是神经网络。
97.方面18:根据方面16至17中的任一方面,其中,所述项目与多个项目选项类别相关联,每个项目选项类别包括项目选项,并且其中,所述方法还包括通过采用所述经训练的机器学习模型来确定针对所述项目选项类别中的每一个项目选项类别的一个项目选项。
98.方面19:根据方面18,其中,针对所述项目选项类别中的每一个项目选项类别的一个项目选项是独立确定的。
99.方面20:根据方面18至19中的任一方面,其中,针对所述项目选项类别中的每一项目选项类别的一个项目选项是基于所述项目的单个项目模型的特征来确定的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1