时间期满库存的需求预测的制作方法

文档序号:13451341阅读:392来源:国知局
时间期满库存的需求预测的制作方法

相关申请的交叉引用

本申请要求于2014年11月26日提交的美国临时申请号62/085,049、于2015年2月5日提交的美国临时申请号62/112,567和于2015年5月26日提交的美国临时申请号62/166,440的权益,其全部内容通过引用并入本文。

本申请一般涉及在时间期满库存的情景中使用机器学习模型和数据分析,特别涉及将训练标签分配给与时间期满库存有关的机器学习样本数据。



背景技术:

在商品或服务的通常交易中,控制或拥有商品的管理员设定商品的价格并且等待有兴趣方同意支付所建议的价格。经常,管理员未能正确地对商品进行定价,但因为市场上的不完整信息和其它经济因素,所以有人可能最终同意支付价格。然而,因为如果库存在其期满之前没有出售,则库存就被浪费,并且管理员没有收到收益,所以对时间期满库存进行定价是个更具挑战性的工作。因此,时间期满库存的管理员很可能对其库存进行定价太高并且在期满时有失去收益的风险,或者将其库存定价太低而收到不理想的收益但利用率很高。附加地,时间期满库存的理想或期望的市场清算价格可能随库存接近其期满日期而改变。这些因素的组合使得时间期满库存的管理员难以对其库存进行最优化的定价。



技术实现要素:

在线系统使得管理员能够为时间期满库存创建列表,并且使得客户能够提交交易请求来预约、租赁或购买所列出的时间期满库存。在线系统估计时间期满库存的列表的需求。在线系统定义了特征集合,其描述了时间期满库存、相关联的列表以及时间期满库存的市场。这些描述性特征的集合是列表的特征向量。在线系统通过将该列表的特征向量输入到需求函数来估计对列表的需求。

需求函数可以包括特征向量的每个特征的特征模型,其中,特征向量中的每个特征与特征模型相关联。需求函数可以是将特征模型相加以产生需求估计的广义加法模型。在线系统可以使用训练数据来训练需求函数,其中,来自训练数据的每个样本包括二进制标签,该二进制标签描述了列表的时间期满库存是否在其期满之前从客户接收到交易请求以及描述每个采样时间的时间期满库存的列表。在线系统可以收集用于单个列表的多个样本,其中,每个样本与在时间期满库存期满之前的时间周期内的时间期满库存的列表的特征相对应。

然后,在线系统可以使用似然性模型将需求估计转换为从客户接收交易请求的似然性。然后,在线系统可以为时间期满库存的管理员创建价格提示。在线系统通过生成大于或小于时间期满库存的当前价格的测试价格集合来计算价格提示。然后,在线系统将时间期满库存的列表的修改特征向量(每个修改特征向量具有不同测试价格)输入到需求函数中。需求函数产生测试需求估计集合,在线系统使用似然性模型将其转换为测试似然性集合。

然后,在线系统可以基于该测试似然性集合来确定价格提示。在线系统可以基于数据点来拟合函数,每个数据点包括测试似然性和产生测试似然性的对应测试价格。该函数表示一系列价格以及由此产生的接收交易请求的预测似然性。在线系统可以选择使价格和函数上的点的请求似然性的乘积最大化的新价格。

附图说明

图1是按照一个实施例的使得用于预订的时间期满库存可用的包括在线系统的计算环境的框图。

图2是按照一个实施例的在线系统的逻辑部件的框图。

图3a至3b是图示了按照一个实施例的需求模块的部件和操作的图。

图4a至图4d图示了按照一个实施例的由需求模块使用的训练数据的标注逻辑。

图5图示了按照一个实施例的用于存储由需求模块使用的训练数据的示例存储装置。

图6图示了按照一个实施例的特征模型。

图7a至图7b图示了按照一个实施例的示例特征模型。

图8图示了按照一个实施例的由需求模块使用的似然性模型。

图9a至图9c图示了按照一个实施例的为列表创建定价模型的过程。

附图仅为了说明的目的而描绘了本发明的各种实施例。本领域技术人员将从以下讨论中容易地认识到,在不背离本文中所描述的本发明的原理的情况下,可以采用本文中所说明的结构和方法的备选实施例。

具体实施方式

i.系统概述

图1是按照一个实施例的包括用于提供用于购买、租借、租赁、预约等的时间期满库存的在线系统的计算环境的框图。网络109表示交易的一方(这里被称为客户102a)和交易的另一方(这里被称为管理员102b)之间的通信路径。

出于解释起见,客户包括价值的潜在购买者、租户、承租人、持有预约的客户、或提供换取以任何形式访问时间期满库存的考虑的任何其它方。出于解释起见,管理员包括时间期满库存的项目的出售方、业主、以及代表业主、出租人、管理预约库存(诸如售票员或餐厅或酒店预订人员)的那些人、或接收换取用于提供对时间期满库存的访问(以任何形式)的考虑的任何其它方来管理财产的财产物主。根据正在交易的时间期满库存的类型,时间期满库存可以是正在被出售、被租赁、被预约等。出于解释起见,这些不同类型的交易在这里被称为“预订”,以提供一个方便的项目用于对整个可能交易类型的集合。

在线系统111包括一个或多个计算设备,其通过网络109耦合与客户和管理员相关联的计算设备101,以允许客户和管理员在网络109上虚拟交互。在一个实施例中,网络是互联网。网络还可以利用不一定是因特网的一部分的专用或私有通信链路(例如,广域网(wan)、城域网(man)或局域网(lan))。网络使用标准通信技术和/或协议。

计算设备101由客户和管理员用于与在线系统113交互。计算设备101执行操作系统,例如,microsoftwindows兼容操作系统(os)、appleosx或ios、linux发行版、或google的androidos。在一些实施例中,客户设备101可以使用诸如microsoftinternetexplorer、mozillafirefox、googlechrome、applesafari和/或opera之类的网络浏览器113作为与在线系统111交互的用户友好的图形接口。在其它实施例中,计算设备101可以执行用于访问在线系统111的专用软件应用。

在线系统111为客户和管理员提供计算平台,以经由其计算设备101进行交互以交易时间期满库存。在线系统111可以支持例如餐厅用餐在线系统(或任何其它类型的在线系统,诸如飞机或火车座位在线系统、酒店在线系统或日间spa在线系统)、乘车分享(拼车)在线系统、住宿在线系统等。

在线系统111向管理员提供创建时间期满库存的列表的能力。可以为时间期满库存的每个单独的实例创建列表,诸如由航空公司在线系统提供的每个航班的每架飞机的每个座位。可替代地,可以针对特定库存创建列表,而不管时间如何,然后可以在当那些时间单位已经过去时期满的时间单位内交易该列表。在这种情况下,该列表对于时间期满库存集合是公共的,集合中的每个时间期满库存项目仅在正在交易的时间/日期范围内不同于其它项目。例如,对于房地产租借系统,列表可以针对特定公寓或共管公寓,客户和管理员可以在与该公寓或共管公寓相关联的不同时间单位(例如,日期)内交易。

通常,尽管不一定,但是每个列表将具有与列表相关联的相关联的真实世界地理位置。这可能是租赁财产的位置、或预约餐厅的位置、以及可能预约的特定桌。在线系统111还向管理员提供在线软件工具来帮助管理员管理其列表,其包括提供有关列表的实际和预测需求的信息、以及授权管理员他们可以选择使用以提高特定列表的利用率和/或收益的信息的提示。

在线系统为客户提供搜索列表、与管理员就可能的交易进行通信、正式地或非正式地请求交易发生(例如,出价)、以及实际执行交易(例如,购买、租赁、预约)的能力。在线系统111包括下面描述的附加部件和模块。

ii.在线系统

图2是按照一个实施例的在线系统111的逻辑部件的框图。在线系统111包括前端服务器201、客户模块203、管理员模块205、列表模块207、搜索模块209、交易模块211、需求模块213和数据库250。本领域技术人员应当进一步理解,在线系统111还可以包含本文中未描述的不同和其它模块。另外,传统的元件(诸如防火墙、认证系统、支付处理系统、网络管理工具、负载均衡器等)并不显示出来,因为它们没有直接涉及本文中所描述的主题。

可以使用单个计算设备或计算设备的网络(包括基于云的计算机实现方式)来实现在线系统111。优选地,计算设备是服务器级计算机,其包括一个或多个高性能计算机处理器和随机存取存储器,并且运行诸如linux之类的操作系统或其变型。如本文中所描述的在线系统111的操作可以通过硬件或通过安装在诸如固态驱动器或磁存储设备的非暂态计算机可读存储设备中并且由处理器执行以执行本文中所描述的功能的计算机程序来控制。数据库250使用非暂态计算机可读存储设备以及用于数据访问和检索的合适的数据库管理系统来实现。在线系统111包括本文中所描述的操作所需的其它硬件元件,包括网络接口和协议,用于数据录入的输入设备,以及用于显示、打印或其它数据呈现的输出设备。附加地,这里所列出的操作必须以这样的频率和通过大数据集合来执行,该大数据集合必须由计算机执行以便在商业上有用的时间量内执行,并且因此不能通过人类思维中的精神步骤在任何有用的实施例中来执行。

数据库250包括客户数据存储装置251、管理员数据存储装置252、列表数据存储装置253、查询数据存储装置254、交易数据存储装置255和训练数据存储装置256。本领域技术人员应当理解,这些数据存储装置不是通用数据库的部件,并且该数据库250可以包含这里未明确提及的其它数据存储装置。可以使用诸如mysql、postgresql、microsoftsqlserver、oracle、sap、ibmdb2等之类的任何合适的数据库管理系统来实现数据库。

前端服务器201包括客户和管理员计算设备101与在线系统111通信的程序代码,并且是用于执行此操作的一种手段。前端服务器201可以包括托管经由超文本传输协议(http)可访问的一个或多个网站的web服务器,使得可以安装在计算设备101上的诸如web浏览器软件应用之类的用户代理可以发送命令并且从在线系统接收数据。前端服务器201还可以提供应用程序编程接口(api),其允许安装在计算设备101上的软件应用程序拨打api以发送命令并且从在线系统接收数据。前端服务器201还包括用于将命令和数据路由到在线系统111的其它部件以执行本文中所描述的过程并且相应地响应于计算设备101的程序代码。

ii.a客户和管理员

客户模块203包括允许客户管理其与在线系统111的交互的程序代码,并且执行可以由在线系统111的其它部件请求的客户相关信息的处理逻辑,并且是用于执行此操作的一种手段。每个客户在在线系统111中由具有唯一客户id和客户简档的单个客户对象表示,该唯一客户id和客户简档两者都存储在客户存储装置251中。客户简档包括若干客户相关属性字段,其可以包括简档图片和/或其它标识信息、地理位置和客户日历。客户模块203向客户提供用于建立和修改其客户简档的代码。在线系统111允许每个客户与多个管理员通信。在线系统111允许客户与管理员交换通信、交易请求以及进行交易。

客户的地理位置是客户的当前位置(例如,基于由他们的计算设备101提供的信息)或其手动录入的家庭地址、附近、城市、州或居住国家。客户位置可以用于过滤与特定客户有关的时间期满库存的搜索准则或分配默认语言偏好。

管理员模块205包括程序代码,该程序代码提供允许管理员通过在线系统111来管理其交互和列表的用户接口,并且执行可以由在线系统111的其它部件请求的管理员相关信息的处理逻辑,并且是用于执行此操作的一种手段。每个管理员在在线系统111中由具有唯一管理员id和管理员简档的单个管理员对象表示,该唯一管理员id和管理员简档两者都存储在管理员存储装置252中。管理员简档与由管理员拥有或管理的一个或多个列表相关联,并且包括若干个管理员属性,该管理员属性包括交易请求和由管理员管理的每个列表的列表日历集合。管理员模块205为管理员提供用于建立和修改其管理员简档和列表的代码。在线系统111的用户既可以是管理员,也可以是客户。在这种情况下,用户将在客户存储装置251和管理员存储装置252中具有简档条目,并且由客户对象和管理员对象两者来表示。在线系统111允许管理员交换通信,对交易请求响应,以及与管理员进行交易。

任何个人标识信息被加密以用于用户的隐私和保护,该个人标识信息被包括作为客户或管理员简档的一部分或被发送以执行交易。例如,在完成交易之后,其中,管理员授予对住宿的访问并且客户支付这种访问,交易信息被加密并且作为历史交易信息存储在数据库250中。

ii.b列表

列表模块207包括管理员用于列出时间期满库存以供客户预订的程序代码,并且是用于执行此操作的一种手段。列表模块207被配置成从管理员接收描述正在被提供的库存的列表,其可用性的时间框架包括以下各项中的一项或多项:开始日期、结束日期、开始时间和结束时间、价格、地理位置、表征库存的图像和描述、以及任何其它相关信息。例如,对于住宿在线系统,列表包括住宿类型(例如,房屋、公寓、房间、睡眠空间、其它)、其大小的表示(例如,平方英尺或房间数目)、住宿可用的日期、价格(例如,每晚、每周、每月等)。列表模块207允许用户包括关于库存的附加信息,诸如视频、照片和其它媒体。

每个列表在在线系统中由列表对象表示,该列表对象包括如由管理员提供的列表信息和唯一列表id,两者都存储在列表存储装置253中。每个列表对象还与提供列表的管理员的管理员对象相关联。

具体地,关于列表的地理位置,与列表相关联的位置会标识所提供的列表的完整地址、附近、城市和/或国家。列表模块207还能够使用外部可用的地理地图信息将一种类型的位置信息(例如,邮寄地址)转换成另一类型的位置信息(例如,国家、州、城市和附近)。

具体地,关于列表的价格,价格是客户为了完成库存的交易而需要支付的金额。价格可以指定为每天、每周、每天、每月和/或每季度、或由管理员规定的其它时间间隔的金额。附加地,价格可能包括附加费用,诸如住宿库存、清洁费、宠物费、服务费和税费。

每个列表对象具有相关联的列表日历。列表日历存储如由管理员指定的或自动确定(例如,通过日历导入过程)的时间周期中的每个时间间隔(每个时间间隔可以被认为是时间期满库存的独立项目)的列表的可用性。也就是说,管理员访问列表的列表日历,并且手动指示列表可以用于客户端进行交易的哪个时间间隔,哪个时间间隔被管理员阻止为不可用,以及哪个时间间隔已经被客户端交易。另外,列表日历通过标识客户预订哪些过去的时间间隔、哪些过去的时间间隔被阻止、或哪些过去的时间间隔可用来继续存储关于列表的可用性的历史信息。进一步地,列表日历可以包括日历规则,例如,库存所允许的最小夜晚数目和最大夜晚数目。来自每个列表日历的信息被存储在列表表253中。

ii.c搜索、请求和交易

搜索模块209包括被配置成从客户接收输入搜索查询并且返回时间期满库存集合和/或与输入查询匹配的列表的程序代码,并且是用于执行该功能的一种手段。搜索查询作为由在线系统113存储在查询存储装置254中的查询对象而被保存。查询可以包含搜索位置、期望的开始时间/日期、期望的持续时间、期望的列表类型以及期望的价格范围,并且还可以包括列表的其它所期望的属性。潜在客户不需要提供上文所列出的查询的所有参数,以便从搜索模块209接收结果。搜索模块209响应于所提交的查询来提供满足所提交的查询的参数的时间期满库存集合和/或列表。在线系统111还可以允许客户浏览列表而不提交搜索查询,在这种情况下,所记录的观看数据将仅指示客户已经从所提交的搜索查询查看了特定的列表,而没有任何进一步的细节。在客户提供选择时间期满库存/列表以更仔细地审查可能的交易的输入时,搜索模块209记录指示客户查看哪些库存/列表的选择/查看数据。该信息也存储在查询数据存储装置254中。

交易模块211包括程序代码,其被配置成使得客户能够提交合同交易请求(也被称为正式请求)来交易时间期满库存,并且是用于执行该功能的一种手段。在操作中,交易模块211接收来自客户的交易请求,以交易时间期满库存的项目,诸如由特定管理员提供的列表的特定日期范围。交易请求可以是由客户发送的标准化请求表单,其可以通过对管理员的请求的响应来修改,要么接受要么拒绝接收到的请求表单,使得在管理员和客户之间达到合意条款。对所接收到的请求的修改可以包括例如改变日期、价格、或时间/日期范围(并且因此有效地,哪个时间期满库存正在被交易)。标准化表单可能需要客户记录开始时间/日期、持续时间(或结束时间)、或必须包括以便在没有进一步沟通的情况下进行约束的任何其它细节。

交易模块211从客户接收所填好的表单,并且将包括预订参数的完成的请求表单呈现给与列表相关联的管理员。管理员可以接受请求,拒绝该请求,或提供修改参数中的一个或多个参数的建议备选方案。如果管理员接受请求(或如果客户接受该建议备选方案),则交易模块211更新与请求和时间期满库存相关联的接受状态以指示该请求被接受。还更新客户日历和列表日历,以反映在特定时间间隔内已经交易了时间期满库存。然后,本文中未具体描述的其它模块允许客户完成支付,并且允许管理员接收该支付。

交易存储装置254存储由客户做出的请求,并且是用于执行该功能的一种手段。每个请求都由请求对象表示。该请求可以包括时间戳、所请求的开始时间、以及所请求的持续时间或预约结束时间。因为管理员接受预订是与客户签订的管理员将在指定时间向客户提供时间期满库存的具有合同约束力的协议,管理员需要批准此类协议的所有信息都包含在请求中。对请求的管理员响应由指示接受或拒绝的值和时间戳组成。

交易模块211还可以向管理员和客户提供交换非正式请求以进行交易的能力。非正式请求不足以对客户或管理员(如果接受)具有约束力,并且在内容方面可能从仅仅通信和关于库存可用性的一般查询变化到与在线系统111针对正式交易请求所阐述的任何特定要求相差不大的请求。由于非正式请求和正式请求均提供关于时间期满库存的需求的有用信息,所以交易模块211还可以将非正式请求存储在交易存储装置254中。

下文将参照图3对需求模块213进行了描述。

iii.需求预测

iii.a概述

图3a是图示了按照一个实施例的需求模块的部件和操作的流程图。为了预测在线系统111中的时间期满库存的需求,需求模块213使用包括多个特征模型305、需求函数300、似然性模型310和定价模型320的一系列的模型和函数。

需求模块213使用从训练存储装置256取回的训练数据集合来训练特征模型305。特征模型305用作需求函数300的一部分,以确定与列表存储装置223中的列表相关联的时间期满库存的需求估计。该需求估计实际上可以是无单位的数值,然而,似然性模型310可以使用需求估计来确定给定的时间期满库存将在期满之前接收交易请求的似然性。定价模型320可以利用由模型310生成的似然性来预测时间期满库存将以许多不同的测试价格接收交易请求的似然性,并且因此提供关于如何预期价格(或来自特征模型的任何其它特征)改变来使时间期满库存在期满之前收到交易请求的似然性进行移位的信息305。

需求模块213对来自相关联的列表的关于各个时间期满库存的数据进行操作,其中,列表在列表存储装置223中由若干个特征表示。为了预测需求,需求模块213综合地分析了许多此类库存,并且需求分析的汇总水平可能因实现方式而异。例如,需求预测可以是系统范围的,使得在线系统111上的所有列表上的所有数据被分析。可替代地,可以分别分析较小的数据分组。例如,在线住宿系统可以单独分析芝加哥大都会地区所有预约列表的预期需求,肯塔基州的所有预约列表,或国家公园附近的所有列表。然后,这些本地化需求估计被用于预测这些特定场所的需求。

当讨论特征时,m表示描述列表的特征的数目,各个特征被表示为f1,f2,f3,...,fm,并且列表的所有特征的集合由特征向量f表示。给定列表的任何给定特征的值可以是数值,诸如整数、浮点数或二进制值,或者它可以是分类的。常见特征包括列表的价格以及直到库存期满为止的剩余时间。对于关于用于训练需求模块213的各种函数和模型并且还用于使用需求模块213来获得关于时间期满库存的有用信息的样本训练数据的各个实例的结构的更多信息,请参见下文的第iii.c节。

价格特征是管理员所提供列表的价格。例如,在网上住宿系统的情况下,价格特征的值可能是客户在特定日期预订住宿的所列出的价格。列表的管理员可能会在列表的期满时间之前改变价格;因此,列表可能会在其期满之前已经具有多个价格。

直到期满特征为止的时间被定义为在时间期满库存期满之前的时间间隔或持续时间的数目。根据实现方式,这可能是几天、几小时、几分钟等。再次使用在线住宿系统的示例,各个时间期满库存的“期满”可能是寻求预订的列表的日期。例如,于12月20日预约住宿的列表将于12月20日期满,因此直到期满特征为止的时间值可能是从当前日期直到12月20日的天数。在这种情况下,因为在线住宿系统的预订通常基于每天进行,所以所使用的时间间隔是一天。然而,在网上餐厅预订系统的情况下,因为餐厅预订以更高的频率和更窄的时间窗口出现,所以可能优选的时间间隔为一小时。

时间期满库存在在线系统111中的列表可以具有附加于价格和直到期满特征为止的时间之外的任何数目个特征。这些附加特征取决于在线系统111的实现方式,并且描述了时间期满库存或列表。例如,在在线住宿系统中,列表可能具有表示所列出的住宿的平均客户评级的特征、所列出的住宿的地理位置、所列出的住宿中的床位数目、所列出的住宿是否具有无线路由器、或者所列出的住宿的任何其它相关属性。附加地,特征可以包括列表本身的质量,例如,列表已经接收的查看次数,列表中的住宿的描述的长度,预订列表的请求在接受列表之前是否被管理员审查,或在线列表的任何其它质量。

特征还可以包括与列表有关但不直接与各个列表有关的特征。例如,这些特征可以提供关于与库存的给定项目有关的列表的市场的状态的信息,同时该库存是活跃的(即,还没有期满时或在其期满的时间附近)。这些特征的示例是市场上的与在库存相同的市场上的其它库存的在线系统111上的客户执行的搜索次数。例如,在在线住宿系统的情况下,特征可能是旧金山诺埃谷附近的住宿天数的搜索次数,其与位于该附近的库存项目相关。另一可能的特征可能是二进制特征,其指示是否在时间和地理位置上与库存的足够接近出现的值得注意的事件(例如,超级碗(superbowl))。

附加地,特征可以描述多个其它特征之间的交互或者是其它特征的导数。例如,列表的平均价格可以在预订时间和列出时间之间计算出。可替代地,特征可以包括两个其它特征的值之间的相关值。

需求函数300可以是使用列表的特征值来产生需求估计的任何函数或统计模型。在一个实现方式中,需求函数是通过将特征的特征模型拟合在一起以确定该特征对需求估计的贡献而创建的广义加法模型。使用广义加法模型的需求函数300具有以下形式:d(f)=w1(f1)+w2(f2)+…+wm(fm)。其中,d(f)是需求函数300并且也是输出需求估计,并且w1,w2,...,wm是确定每个特征值f1,f2,...,fm分别对d(f)的贡献的特征模型305中的每个特征模型的权重函数。广义加法模型的拟合可以使用包括随机梯度下降、kd-树、贝叶斯或向后拟合算法之类的若干种拟合算法来完成。这些算法用于迭代地拟合特征模型305,以便减少特征模型305和先前时间期满库存的训练数据上的标签之间的部分残差的一些损失函数。

特征模型305可以是任何非参数统计模型,其将特征值与指示特征对于在期满之前接收到交易请求的时间期满库存的似然性的影响的权重相关,其与需求估计d(f)有关。根据每个特征的特点,可以基于关于该特征的可能值的训练数据来将不同的统计模型拟合到每个特征。例如,可以使用所有b样条、三次样条、线性拟合、双变量平面拟合、分段常数函数等。为了定义特征本身,有监督的机器学习技术和无监督的机器学习技术可以用于在训练广义加法模型之前一开始就确定特征。在有监督的学习技术的情况下,训练可以基于除了训练数据的标签之外的一些其它信号,因为这反而被用于训练广义加法模型。

正标签被分配给在期满之前从客户接收到交易请求的先前的时间期满库存(本文中被称为训练时间期满库存),并且负标签被分配给在没有收到交易请求的情况下期满的训练时间期满库存。分别在iii.c节和iii.d节中并且参考图4a至图7b提供了对特征模型305的训练数据结构和训练的进一步讨论。

返回到需求估计d(f),该需求估计是无单位的度量,其在没有使用训练数据进行验证的情况下是不可作用的。例如,特定特征向量fa的d(fa)的值可以是0.735。仅在不确定需求函数300的哪些值与在其期满之前从客户接收到时间期满库存的交易请求的似然性相对应的情况下,该信息单独是无用的。似然性模型310是通过将需求估计d(f)映射到给定具有特征向量f的列表的接收交易请求p(d(f))的似然性来解决该问题的统计模型。通过对用于估计需求d(f)的每个特征向量f使用相同的正训练标签和负训练标签来训练似然性模型310。参考图8在第iii.e节中对似然性模型310的进一步讨论进行描述。

定价模型320建立以列表的当前价格(或根据请求的任何其它任意选择的价格)周围的多种测试价格接收列表的交易请求的似然性的模型。需求模块213使用迭代过程来生成定价模型320,该定价模型生成围绕初始数据点的测试数据,该初始数据点表示以列表的当前价格接收交易请求的似然性。这个过程在下文的iii.b节中进行概述并且参考图9在iii.f节中进行进一步描述。

iii.b示例流程

图3a还图示了用于根据附图中的模型、函数和数据存储装置中的每个模型、函数和数据存储装置之间的箭头来训练时间期满库存的需求函数300和似然模型310的流程。需求模块213使用来自训练存储装置256的训练数据来训练330特征模型305。然后,需求模块213评价训练数据中的每个样本的每个特征向量的需求函数300,并且基于每个样本中的每个特征向量的标签来训练340似然性模型310。

图3b图示了在需求模块213已经训练了需求函数300和似然模型310之后对列表进行定价的过程。在从在线系统111接收到用于预测对主题列表的需求的指令时,需求模块213从列表表223中取回350与主题列表fs相对应的特征向量,并且将其用作需求函数300的输入。然后,需求模块213将所得到的需求估计d(fs)发送360到似然性模型310,用于在期满之前转换为接收交易请求的似然性。然后,需求模块213可以将所得到的似然性p(d(fs))传递370到定价模型320,以用于建模列表的定价改变如何更改对列表的需求。

为了生成定价模型320,需求模块213然后通过在正方向和负方向上递增产生测试价格的价格特征一价格间隔来修改380特征向量fs中价格特征的值,从而产生修改后的特征向量fs(1)和fs(-1),其包含与测试价格中的每个测试价格相等的价格特征值,在修改后的特征向量中,除价格以外的所有其它特征值均未修改,接收新特征向量p(d(fs(1)))和p(d(fs(-1)))中的每个特征向量的交易请求的似然性然后通过需求函数300和似然模型310来计算,并且与列表的原始似然性p(d(fs))分组在一起。然后,需求模块213继续递增价格特征一价格间隔,以创建特征向量fs(2)和fs(-2)的附加测试价格,并且重复该过程,直到创建足够的数据点为止。

在达到阈值数目个定价点时,需求模块213处理测试价格和接收交易请求的对应似然性,以标识满足信息的管理员或请求者的目标的价格。在一个实施例中,这是通过将测试价格和似然性与单调递减似然性函数拟合来完成的,该函数采用输入价格并且生成输出似然性。拟合函数可以用于标识如何为列表定价和/或达到预订的似然性的新提示。

更一般而言,需求模块213基于需求来生成似然估计的能力向时间期满库存的管理员提供当选择时间期满库存的价格时管理员可以考虑的信息。

iii.c训练数据标签

图4a至图4d图示了按照一个实施例的用于训练由需求模块使用的数据的标签逻辑。在图4a中,显示具有一天的时间间隔的列表日历。这意味着只有客户基于每天才能提供列表用于预订(尽管客户可能会在多个相邻日期上请求预订列表)。图4a图示了如何从历史预订数据中采样训练数据,该历史预订数据可以从交易存储装置255中取回并且分别传递到存储装置256以用作训练数据。图4a所图示的时间线表示从单个列表中获取的数据。列表具有为10月24日的期满时间(或期满日期)400、为10月2日的首次列表时间(或初始列表日期)410、以及为10月15日的请求接收和接受时间(或日期)。

列表的期满时间400是在线系统111在时间期满库存不再可用或呈现给客户的时间。在在线预订系统中,期满时间400通常是预约可能开始的时间。

初始列表时间410是首先向客户提供列表的时间和/或由管理员将列表提供给在线系统111的第一天。

请求接收和接受时间420是来自客户的交易请求已经被两者接收并且(正式地)被管理员接受从而通常使交易对双方具有合同约束力的时间。

在图4a的示例中,在初始列表日期410和请求接收和接受日期420之间的每天,训练数据的单独样本被记录430在训练存储装置256中。每个样本由在其记录的当天的列表的特征向量f组成。样本的标签没有施加,直到得知列表的最终结果为止。在图4a的示例中,因为列表的最终结果是请求并且随后在请求接收和接受日期420接受该请求,所以10月2日至10月15日期间的每天的样本被给予与接受请求相对应的正标签。

在一些实施例中,当列表已经被接受并且不再被呈现给在线系统111上的客户时,在420和期满日期400之间的日期内没有收集到样本。例如,如果时间期满库存是唯一的,则这可能发生。当时间期满库存不是唯一的(例如,航班上的多个大致相同的座位)时,系统可以允许列表持续存在,并且因此可以在直到时间期满库存已经耗尽或期满为止的时间期间收集到更多的数据。在一些实施例中,系统定义共享相同价格的多个列表,并且将每个非唯一列表视为具有若干个相同特征的唯一列表。该组列表的成员的预订被应用于该组中的列表中的一个列表,并且列表中的其余列表被允许持续存在。

在列表可用的同时,记录每个时间间隔的训练数据的样本大大地增加了可用于需求模块213的数据点的数目,以供当在总可用性周期内总体上与收集每个所接受的交易请求的仅一个数据点相比较时,进行分析。

图4b图示了用于对来自历史预订数据的训练数据的样本贴标签的第二示例结果。在图4b所图示的情况下,期满日期400和初始列表日期与图4a中相同。然而,在图4b中,即使列表从初始列表日期410到期满日期400可用,也没有接收到列表的任何交易请求。结果,在列表可用的日期内获得的所有样本440被贴有负训练标签的标签,其指示在时间期满库存期满之前没有收到列表的交易请求。

当与仅考虑到接收到交易请求的那些列表的模型相比较时,获得既接收到交易请求又没有接收到交易请求的列表的训练数据的样本、并且对它们不同地贴标签的方式,进一步增加了对于需求模块213可用的数据量。

图4c图示了用于从历史预订数据获得训练数据的样本并且对其贴标签的第三更复杂的示例结果。在图4c中,期满日期400和初始列表日期410与先前两个示例中的相同。然而,在图4c中,列表的管理员在10月15日收到交易请求,但随后拒绝该请求450。这使得列表可用于接收其它交易请求。在请求拒绝日期450和期满日期之间不会接收到其它交易请求。

在这种情况下,因为如果管理员已经接受则请求能够导致成功交易,所以正标签在接收到列表的交易请求之前的日期内施加430到样本,并且随后被拒绝450。因为在请求拒绝日期450之后,列表没有接收到其它交易请求,所以由于在该时间周期期间接收到的交易请求的缺乏与在时间上较早接收到的交易请求无关,因此在第一请求之后的日期内的样本贴有负标签440,因此在该时间周期期间的列表的特征不能生成足以吸引交易请求的需求。在一些实施例中,请求拒绝日期450可以是所拒绝的交易请求被接收的日期。在其它实施例中,请求拒绝日期450是拒绝交易请求的日期。可替代地(未示出),如果在第一请求被拒绝450之后接收到第二交易请求,则剩余样本将反而被贴有正标签的标签。

图4d图示了用于从历史预订数据获得训练数据的样本并且对其贴标签的第四示例结果。在图4d中,期满日期400和初始列表日期410再次与先前示例中相同。如图4a所示,交易请求在10月15日被接收和接受420,然而,在图4d中,请求列表的客户取消交易请求,允许在线系统111上的其它客户再次访问列表。之后被取消,该列表不会收到其它交易请求。在与图4c的类似情况下,从初始列表日期410到交易请求接受日期420的日期内的样本贴有430正标签,并且在取消日期460向客户提供列表之后,训练数据被贴有440负标签。在这种情况下,由于在该时间期间列表对于客户不可用,所以在取消日期460和交易请求接受日期420之间的日期,不会生成样本。再者(未示出),如果该列表在取消日期460之后已经收到交易请求,则在取消日期之后的样本可能反而接收到正标签。

如上文所述,在由时间周期430和440指示的每个日期获得各个训练数据样本,然而,样本470a至470d被具体地贴标签以用于参考图5的以下讨论。

图5图示了按照一个实施例的用于存储由需求模块213使用的训练数据的示例表。图5显示了训练数据表500和表510的存储样本的两个示例表。表500是指示可以被包括在特征向量中的多种特征的一般示例,而表510是来自可以在住宿系统中使用的单个列表的样本470的特定示例。

在表500中,每行表示在特定日期内记录来自历史预订数据的训练数据的单个样本。每行包含特征向量(f1至fm)中每个特征的特征值、以及与从其中记录训练样本(如参考图4a至4d所描述的)的列表的最终结果相对应的训练标签。在该实施例中,训练标签1用于表示接收列表的交易请求,并且训练标签-1用于表示在时间期满库存期满之前没有接收到交易请求的情况。

表500的列图示了若干个示例特征类型:特征1和2是定量的,特征3是分类的,特征m是二进制的。表500包含m+1列(出于说明性目的,编辑出其中一些列),其与m个特征和每个特征向量的训练标签相对应。表500包含n行,其与训练数据样本n的总数目相对应。

表510图示了从图4d所图示的示例列表时间线中选择数据样本。尽管可能从直到请求接受数据为止的初始列表日期410并且从取消日期460再次到达期满日期400的每天记录样本,但是出于讨论目的并且便于说明,仅在表中示出了样本470a至470d。

在表510中,列被贴有在线住宿系统列表的示例特征的标签,其包括价格、直到期满为止的天数、所列出的住宿的城市、以及所列出的住宿是否包括无线路由器(wifi)。因为样本470a至470d都来自同一列表,所以城市特征和wifi特征在所有样本上保持不变,而直到期满为止的日期特征和价格特征随着采样周期而改变。

在交易请求被接收和接受420之前记录样本470a,因此施加训练标签1。样本470a是在期满日期400之前的20天的10月4日记录的,因此直到期满特征为止的日期值为20。在该示例中,10月4日列表的价格为120美元,因此价格特征值为120。在样本470b中,管理员已将价格降至100美元,并且自从样本470a被记录以来已经过了一周。因此,直到期满特征和价格特征为止的日期值已经被改变以反映列表特征的改变。在样本470b和样本470c之间的日子里,100美元的价格保持不变。在请求接收和接受日期420记录了样本470c,其指示收到请求的价格为100美元。注意,这个价格与样本470a的原价120美元不同。

价格差异(和潜在的其它特征)引起因果关系问题,因为不知道降低价格是否是诱导客户提交列表的交易请求的因果关系因素。例如,如果交易请求不会以120美元的价格接收,但是当价格降到80美元时才接收到交易请求,则对于价格为120美元的日期的训练数据样本的训练标签1则指示特征值的正结果(例如,价格120美元),其如果价格在直到期满为止保持在120美元,则不会导致接收到交易请求。

根据实施例,需求模块213可以不同地处理这些类型的因果关系。在一些实施例中,如果样本与交易请求的接收日期420记录的样本基本上不同(基于样本之间的不同特征的数目、最大差异阈值或另一度量),则抛出该样本。在另一实施例中,基于样本与在请求接收日期(例如,可以给出标签0.5)记录的样本差异多少,来给予该样本较少的权重。在又一实施例中,可以将诸如“直到请求为止的天数”或“收到客户请求的价格”等之类的附加特征添加到特征向量以反映样本贡献对需求函数300的差异。在某些情况下,为了简化数据贴标签过程或者因为假设它们对需求预测模型的影响最小,这些具有不同特征的样本被赋予全部权重。在另一实施例中,初始列表日期410和请求接收日期420之间的价格分布的平均值、中值或其它度量是单独的特征。

iii.d特征模型

图6图示了按照一个实施例的特征模型w(f)。图6显示了将特征1的值与需求函数300中的权重相关的特征模型305。统计模型600拟合到训练数据点610,该训练数据点610是需求模型300输出d(f)和各个样本的对应特征值f之间的偏残差。训练过程的每次迭代改变残差,并且统计模型600被拟合到数据。诸如随机梯度下降和后向拟合算法之类的算法寻求使需求模型300中的所有特征的统计模型600之间的偏残差最小化。在迭代训练数据集合之后,统计模型600收敛到特征模型305,其输出每个给定特征值的权重。许多统计方法可以用于拟合数据,这些统计方法包括b样条、三次样条、任何类型的回归、diracdelta函数(用于分类数据和二进制数据)或这些方法的任何组合。在线系统111的管理员可以配置特征模型305以便最好地表示数据。拟合之后,对于全范围的特征值,特征模型305将具有在-1和1之间的权重值。在一些实施例中,特征值被归一化以将范围限制在0和1之间。如果特征是分类的或二进制的,则统计模型600可以简单地是从特征类别到权重值的映射,或者是基于将分类数据变换为用于确定权重的标度(scale)。

图7a至7b图示了按照一个实施例的示例特征模型305。图7a图示了价格特征的特征模型305可以与典型训练数据集合相关联的示例。在这种情况下,统计模型700通常具有价格数据的样条拟合。基于统计模型,价格对于非常便宜的列表(可能是因为客户担心被欺诈)的需求产生负面影响,价格便宜但价格水平合理,价格对列表需求有正面影响。随着价格的上涨,对需求的影响变得越来越负面,直到该价格水平的客户具有更有弹性的消费习惯的某个点为止,并且价格特征对需求的负面影响较小。

图7b图示了具有典型训练数据集合的“期满之前的天数”特征的典型特征模型305。在这种情况下使用的统计模型710指示列表在其期满日期之前被张贴的越早,该列表的需求可能就越高。这些示例特征模型305中的任一个可能与典型结果不同,并且在本文中仅用作示例来在在线系统111的情景中说明特征模型305的功能性。

iii.e似然性模型

图8图示了按照一个实施例的由需求模块213使用的似然性模型310。一旦需求模块213训练了特征模型305,需求模块213就可以使用训练数据的若干个样本的特征向量f的集合,并且使用需求函数300来输出样本中的每个样本的估计需求d(f)。为了训练似然性模型310,需求模块213将似然性函数800拟合到估计需求d(f)的贴有标签的值。似然性函数800是解决确定特征向量f具有给定d(f)的正标签的似然性(否则被表述为给定样本在时间期满库存期满之前接收到交易请求的似然性)的二进制分类问题的函数。在图8中,负标签用白色圆圈810表示,而正标签由黑色圆圈820表示。似然性函数800基于样本的估计需求来近似点为黑色的似然性。

在一些实施例中,platt缩放算法被用作似然性函数800。应用于需求函数的platt缩放算法将具有以下形式:

p(d(f))=(1+exp(αd(f)+β))-1

其中,α和β是学习常数。诸如hinge-loss函数或其它类似技术之类的损失函数用于使用最大似然性方法来训练platt缩放算法,以便最佳地解决该二进制分类问题。

一旦需求模块213训练了似然性函数800,似然性模块310就可以接收作为输入的估计的需求d(f),并且输出在期满之前时间期满库存将接收交易请求的似然性p(d(f))。

iii.f定价模型

图9a至图9c图示了按照一个实施例创建列表的定价模型320的过程。在使用训练数据的样本训练了需求模型300(包括特征模型305)和似然性模型310(包括似然性函数800)之后,需求模块213具有将任何特征向量f转换为接收交易请求的似然性p(d(f))的能力。

如上文所引入的,为了提供在测试价格范围内接收交易请求的似然性,需求模块213创建修改后的特征向量,其价格特征值等于测试价格集合(包括该列表的当前价格),其余特征的值保持不变。然后,需求模块213确定接收每个修改后的特征向量的交易请求的测试需求估计和对应的测试似然性。

然后,需求模块213处理接收交易请求的测试价格和对应的测试似然性,以标识满足信息的管理员或请求者的目标的价格。在一个实施例中,这通过将函数拟合到测试价格和似然性数据点来实现,以创建平滑单调递减的定价模型320。在图9a至图9b中图示了该过程。

在图9a中,绘制接收时间期满库存的交易请求的价格特征和似然性的值。数据点900表示以其当前价格收到交易请求的主题列表的当前似然性。然后,需求模块213通过正向和/或负向递增价格特征的值一价格区间920来创建测试数据点910。价格间隔920可以是主题列表的价格特征的原始值的金额或比例。在一些实施例中,存在不同的正价格间隔和负价格间隔。

需求模块213继续在原始价格的任一方向上将价格特征的值递增一价格间隔。根据实施例,该过程一直持续到测试价格的阈值范围被覆盖或产生阈值数目个数据点。这些测试价格可以例如高达/低至当前价格的两倍或一半、或更高/更低。如图9c所示,一旦产生了足够的测试价格,数据点就用价格函数930拟合。任何函数可以用于拟合所产生的价格与似然性数据。在一个实施例中,价格函数930是weibull分布。

在将价格函数930拟合到测试价格和所产生的似然性时,需求模块213可以向管理员呈现价格函数930以帮助设定对象列表的价格。可替代地,需求模块213可以向管理员提供价格提示。在一个实施例中,价格提示可以基于阈值似然性(产生接收交易请求的阈值似然性的最大价格)。例如,如果将阈值似然性设置为似然性940,则所得到的价格提示将为价格950。在其它实施例中,可以选择价格以使价格的值乘以似然性最大化。例如,如果价格970乘以似然性960是价格函数930的最大值,则价格970可以是用户的价格提示。在一些实施例中,学习收益函数以确定价格与接收交易请求的似然性之间的关系,其产生更好的价格提示。例如,基于学习常数a和b,价格函数930的收益函数可以是r(ps,p(d(fs)))=psa·p(d(fs))b(其中,ps是主题列表的假定价格)。在这种情况下,该收益函数的训练数据可以是先前价格预测和各种列表的那些价格预测的对应的似然性值。另外,其它度量可以用于向用户提供价格提示。

iv.附加的考虑

本说明书的一些部分依据关于信息的操作的算法和符号表示来描述本发明的实施例。这些算法描述和表示是数据处理领域的技术人员通常使用的,以便有效地将其作品的实质传达给本领域技术人员。在功能上、计算上或逻辑上描述的这些操作被理解为由计算机程序或等效电路、微代码等实现。此外,有时也在不失一般性的情况下,可以方便地将这些操作的布置作为模块。所描述的操作及其相关联的模块可以以软件、固件、硬件或其任何组合来体现。在一个实施例中,使用计算机程序产品来实现软件模块,该计算机程序产品包括包含计算机程序代码的持久计算机可读介质,该计算机程序代码可由计算机处理器执行以执行所描述的任何或全部步骤、操作或过程。

最后,本说明书中使用的语言主要是为了可读性和教学目的而选择的,并且它可能没有被选择来描绘或限定本发明的主题。因此,意图是本发明的范围不受该具体实施方式的限制,而是由在其之上的应用程序上发布的任何权利要求来限制。因此,本发明的实施例的公开内容旨在说明而非限制本发明的范围,其示例在所附权利要求中进行阐述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1