一种应用于电子商务网站的信息匹配方法和系统的制作方法

文档序号:6580256阅读:101来源:国知局
专利名称:一种应用于电子商务网站的信息匹配方法和系统的制作方法
技术领域
本申请涉及计算机数据处理技术领域,特别是指一种应用于电子商务网站的信息 匹配方法和系统。
背景技术
搜索引擎是一种寻找匹配信息的工具,其已经成为非常高效的信息发布、聚合和 展现平台,且在电子商务领域得到了广泛的应用。搜索引擎的工作原理是用户输入表明需 求的关键字,搜索引擎寻找与该关键字相匹配的信息,并将匹配的结果信息返回给该用户。 搜索引擎本身是根据关键字来识别用户需求的,而用户的需求千变万化,仅凭几个关键字 很难准确地表达出用户的真实意图。例如,用户输入“防水套”时,既可能是指“相机防水 套”,又可能是指“手机防水套”,用户既可能是想购买某种防水套,又可能只是想了解防水 套的相关信息。由于用户本身的生活方式、习惯、宗教信仰等个性化特征是各不相同的,而搜索引 擎无法识别用户的这种个性化差异,因此搜索引擎只能给不同的用户呈现千篇一律的搜索 结果;例如,同样是搜索“酒店”,预算充裕的用户可能需要了解的是豪华酒店,预算紧张的 用户可能需要了解的是经济酒店,向预算紧张的用户呈现豪华酒店的信息,只能浪费用户 过滤甄别信息的精力和时间,而且对于发布豪华酒店信息的商家而言也没有任何好处。再者,在手机等设备上,关键字的输入并不方便,而过短的关键字又不能表达清楚 用户想要的信息。例如用户搜索“审美理发”时,有那么多的连锁店,应该给用户呈现哪一 家店的信息?现在的搜索引擎只能要求用户反复精炼关键字进行调整,这样不但降低了搜 索效率,而且给用户的使用带来了极大的不便。可见,通过现有的搜索引擎实现的信息匹配,并不能保证所检索的到结果是用户
最需要的信息。竞价排名也有信息发布、信息检索等功能。竞价排名的实质是按照信息发布者为 每次点击付费多少进行排序,将排序后靠前的结果展现在访问者面前,即,信息发布者通过 付费对展现的广告进行控制。可见,竞价排名所保证的是让付费更多的发布者的信息排在前面,而该排序最靠 前的信息是否是与用户需求最匹配的信息,并不是其关注的重点。因而,竞价排名更多的关 注了信息发布者即商家的利益,而忽略了信息接收者即用户的利益。传统广告也有信息发布等功能。互联网传统广告的发展已经历经了多代,从最开 始的选择主题栏目投放(例如在新浪的汽车频道投放汽车广告),到从页面提取关键字进 行关键字投放(例如Google的AdSense)再到对用户行为进行分析,通过聚类、路径分析等 方法,定向投放(例如doubleclick、腾迅),互联网广告效果越来越明显。然而,传统广告 的本质仍是“广告”,即,信息是按照广告主的意志而不是消费者的意志投放的。可见,传统广告并不是为用户提供其所需要的匹配信息,而是寻找潜在客户,将广 告的内容强行发送给其所认定的潜在客户。因而,其实质仍然是广告,无论如何改善,它仍然是在用户需要获取其它信息的时候出现,这必然会对用户的正常活动产生干扰。同样的, 传统广告也是更多的关注了信息发布者即商家的利益,而忽略了信息接收者即用户的利益。

发明内容
本申请实施例在于提供一种应用于电子商务网站的信息匹配方法和系统,通过为 信息接收者提供其最需要的信息,使得信息发布者和信息接收者之间实现双赢。本申请实施例提供了一种应用于电子商务网站的信息匹配方法,包括搜索引擎服务器收集网络用户的每一类网络行为的特征数据,分别针对每一类网 络行为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权 重;搜索引擎服务器接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得 若干条搜索结果;搜索引擎服务器查询所述特定用户所属聚类中所有网络用户对所述每一条搜索 结果的历史点选记录;搜索引擎服务器根据所述所有网络用户的历史点选记录以及据以进行聚类的各 类特征数据的权重计算获得所述若干条搜索结果的等级值;搜索引擎服务器按照所述等级值由大到小对所述搜索结果进行排序,并将排序后 的搜索结果返回给特定用户的用户终端。其中,所述网络行为包括网络交易行为或网络点评行为;所述网络行为的特征 数据包括网络交易记录或网络点评记录。其中,所述分别针对每一类网络行为按照所述特征数据对网络用户进行聚类的方 法包括首先将没有搜集到网络行为的特征数据的网络用户聚为一类;对于剩下的网络用户,根据所述网络行为的特征数据以及已配置的聚类数目进行 聚类;将聚类结果以数据表的形式保存在数据库中。其中,所述根据所述网络行为的特征数据以及已配置的聚类数目进行聚类的步骤 包括若所述网络行为的特征数据为网络交易记录,则根据所述网络交易记录中的商品 信息是否类似进行聚类,将购买过类似商品的网络用户聚为一类;聚类数达到已配置的数目时,聚类完成。其中,所述根据所述网络行为的特征数据以及已配置的聚类数目进行聚类的步骤 包括若所述网络行为的特征数据为网络点评记录,则根据网络用户点评的商家用户所 属的类目对网络用户进行聚类;或者,统计每两个商家用户的网络点评记录中相同的网络 用户的数量,根据所述网络用户的数量与对该商家用户进行网络点评的网络用户的总数量 的比值获得重叠比例,根据重叠比例计算商家用户之间的距离;根据所述距离对商家用户 进行聚类,再反过来根据商家用户的聚类对消费者用户进行聚类;
聚类数达到已配置的数目时,聚类完成。其中,所述搜索引擎服务器收集网络用户的每一类网络行为的特征数据的方式包 括通过服务器日志分析系统收集、通过网络用户活动日志系统收集、通过地理信息系统收 集或通过第三方数据接口收集,或通过以上任意组合的方式收集。其中,所述方法还包括设置地理位置信息的权重;根据所述地理位置信息的权重和据以进行聚类的各类特征数据的权重,计算各条 检索结果的等级值,根据计算出的等级值按照从大到小的顺序对检索结果进行排序。其中,所述搜索引擎服务器接收某一特定网络用户的搜索请求,具体包括搜索引 擎服务器接收某一特定网络用户输入的搜索关键词,和/或搜索引擎服务器接收某一特定 网络用户的鼠标点击行为触发的搜索请求。本申请还提供了一种应用于电子商务网站的信息匹配系统,包括信息采集系统,收集网络用户的每一类网络行为的特征数据,分别针对每一类网 络行为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权 重;检索系统,接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干 条搜索结果,查询所述特定用户所属聚类中其他网络用户对所述每一条搜索结果的历史点 选记录,根据所述其他网络用户的历史点选记录以及据以进行聚类的各类特征数据的权重 计算获得所述若干条搜索结果的等级值,按照所述等级值由大到小对所述搜索结果进行排 序;结果页面生成系统,用于将所述排序后的检索结果显示给信息接收者。其中,所述检索系统具体包括搜索引擎,接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干 条搜索结果;排序系统,查询所述特定用户所属聚类中其他网络用户对所述每一条搜索结果的 历史点选记录,根据所述其他网络用户的历史点选记录以及据以进行聚类的各类特征数据 的权重计算获得所述若干条搜索结果的等级值,按照所述等级值由大到小对所述搜索结果 进行排序。其中,所述排序系统具体包括第一设置模块,用于设定据以进行聚类的各类特征数据的权重;查询模块,用于针对已获得的每一条检索结果,查询每一网络用户对每一条检索 结果的历史点选记录;统计模块,用于统计获得的每一个检索结果的历史点选记录,并以数据表的形式 保存于数据库中;排序模块,用于当某一特定网络用户搜索时,对于返回的检索结果,查询与所述网 络用户同一聚类的所有用户的历史点选记录,并根据所述权重,计算各条检索结果的等级 值,根据计算出的等级值按照从大到小的顺序对检索结果进行排序。其中,所述排序系统具体包括第二设置模块,用于设置地理位置信息的权重;第一设置模块,用于设定据以进行聚类的各类特征数据的权重;
查询模块,用于针对已获得的每一条检索结果,查询每一网络用户对每一条检索 结果的历史点选记录;统计模块,用于统计获得的每一个检索结果的历史点选记录,并以数据表的形式 保存于数据库中;排序模块,用于当某一特定网络用户搜索时,对于返回的检索结果,查询与所述网 络用户同一聚类的所有用户的历史点选记录,并根据所述地理位置信息的权重和据以进行 聚类的各类特征数据的权重,计算各条检索结果的等级值,根据计算出的等级值按照从大 到小的顺序对检索结果进行排序。应用本申请提供的应用于电子商务的信息匹配方法和系统,通过收集信息发布者 和信息接收者的信息,综合分析信息发布者和信息接收者的属性,根据信息接收者所表示 出来的需求,为其提供与其相匹配的信息,从而实现信息的匹配,使得在电子商务应用中信 息发布者和信息接收者之间实现双赢。


为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。图1是本申请所涉及角色之间的关系示意图;图2是本申请信息匹配方法的网络构架示意图;图3是根据本申请是实施例的在信息编辑系统中选择要发布信息分类的实例图;图4是基于图3所示分类实例选择餐饮分类后的实例图;图5是根据本申请是实施例的通过信息代理系统接入信息编辑系统的示意图;图6是根据本申请实施例的应用于电子商务网站的信息匹配方法流程图;图7是根据本申请实施例的应用于电子商务网站的信息匹配系统结构示意图。
具体实施例方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于 本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本申请保护的范围。本申请涉及三种角色信息发布者、信息接受者和本申请的信息匹配系统。信息发 布者是指提供信息一方,信息接受者是指需要信息一方,注意这二者只是概念上的区分,在 现实生活中,一个人既可以是信息发布者也可以是信息接受者,例如,一个学生在找兼职工 作时,他是一个信息发布者;同时他又需要了解招聘兼职工作的信息,这时他又变成了信息 接受者。本申请的信息匹配系统是为信息发布者和信息接受者提供信息传播的一个平台。 三者的关系如图1所示。参见图2,其是本申请信息匹配方法的网络构架示意图。其中,信息采集系统201用于收集信息,具体的,信息采集系统中的信息编辑系统2011收集信息发布者的基本属性信息以及需要发布的信息,信息采集系统中的个性化信息系统 收集信息接收者的个性化数据2012,对所述个性化数据进行聚类处理,获得所述信息接收 者的个性化属性。信息存储系统203保存信息发布者的基本属性信息,所述信息发布者需 要发布的信息,以及信息接收者的个性化属性。信息存储系统203保存信息发布者的基本 属性信息,所述信息发布者需要发布的信息,以及信息接收者的个性化属性。再有,本申请 的信息匹配网络构建还可以包括信息认证系统202,用于对所述信息采集系统所收集的信 息发布者的基本属性信息进行认证,认证通过通知信息存储系统。当信息接收者在网上活动时,需求识别系统204根据接收到的触发信息,获取所 述信息接收者的用户标识和网上活动信息;检索系统205根据所述网上活动信息生成检索 结果,所述检索结果包括与所述检索命令匹配的来自信息发布者的发布信息;结果页面生 成系统206将所述检索结果显示给信息接收者。需要说明的是,上述信息采集系统201、信息认证系统202、信息存储系统203、需 求识别系统204、检索系统205、结果页面生成系统206均为逻辑系统,其既可以全部在一台 服务器上,也可以其中的一个或多个在一台或多台服务器上。可见,本申请通过收集信息发布者和信息接收者的信息,综合分析信息发布者和 信息接收者的属性,根据信息接收者所表示出来的需求,为其提供与其相匹配的信息,从而 实现信息的匹配,使得在电子商务应用中信息发布者和信息接收者之间实现双赢。结合图2所示网络构架,下面首先从信息发布者和信息接收者两个角度分别说 明。对于信息发布者,其包括以下几个步骤第一步通过信息编辑系统,信息发布者将所需发布的信息以及其基本属性信息输入信息 存储系统。信息编辑系统是一个运行在应用程序服务器上的系统软件,它与外界的通讯通 过标准的超文本传输协议(HTTP,Hyper Text TransferProtocol)协议来完成。信息发布 者可以通过普通的浏览器访问信息编辑系统的页面,在页面上输入信息。例如,某餐饮行业的信息发布者,希望发布一条餐饮服务的信息。首先它需要在信 息编辑系统中登录后选择要发布的信息分类,选择餐饮的分类后,信息编辑系统会要求信 息发布者按照餐饮行业的情况输入相关的信息,如图3和图4所示。可以理解,如果是其他 行业,图4所示页面上需要填入的内容会有所不同。需要说明的是,图3和图4仅是针对餐 饮行业的一个实施例而已,在其他可能的实施例中页面的内容、布局、图片、颜色等都可以 发生变化。信息发布者也可以用其他方式发布信息,例如手机短信,或者通过其它终端设备 的方式,如果这些方式不是通过标准的HTTP协议,那么还需要一个信息代理系统将信息转 换为HTTP协议与信息编辑系统通信,如5图所示,手机或其他终端设备通过信息代理系统 将需要输入的信息传输至信息编辑系统。信息提交后,会保存到信息存储系统。信息存储系统是由后台数据库组成,该后台 数据库可以是分布式的,也可以是非分布式的。这里,数据库是一个泛指概念,代表各种格 式的数据库,而不局限于某种特定格式的数据,例如Oracle数据库,开放源码的小型关系 型数据库管理系统(MySQL),结构化查询语言服务器(SQL Server)等。
第二步系统管理员通过信息认证系统来审核信息发布者所提交的信息。信息认证系统也 是一个运行在系统服务器上的系统软件,它与外界的通讯通过标准的HTTP协议来完成,即 系统管理员通过浏览器即可访问。根据实际需要,系统管理员可以委托第三方认证公司、第三方信用公司或者其它 第三方机构,对信息发布者发布的信息进行审核和认证,以保证信息发布者发布的信息真 实可信。例如,在上例中,某信息发布者提供了餐饮服务的信息,其中包括商家名称、菜品 相关信息、营业执照、卫生许可证等,系统管理员将这些信息委托第三方公司进行认证,第 三方公司经过多渠道交叉认证后,认为该信息真实可信,反馈给系统管理员后,系统管理员 审核通过此信息。如果信息审核不通过,系统管理员可以拒绝该信息,或者编辑该信息使其符合要 求然后审核通过。审核通过后,信息审核系统将这条信息转入审核通过的数据库中即信息存储系统 中,供其它系统调用。需要说明的是,该步的目标是为了保证信息提供者所提供的信息真实可靠,从而 更好的维护电子商务活动中的诚信,在一些实际应用环境中该步也可以不存在。以上是面向信息发布者的流程,对于信息接受者,包括以下几个步骤第一步通过个性化信息采集系统收集用户特征数据。个性化信息采集系统是一个运行在 服务器上的系统软件,它又包含有若干子系统a)服务器日志分析系统从服务器日志中,通过分析用户的访问记录,来分析用 户特征的系统。服务器日志是指,服务器上运行的基本服务软件,所记录的软件运行的日 志,例如Apache HTTP服务器的日志。例如,从服务器的Apache日志中,可以获取用户的访问记录,某用户过去7天可能 访问过/pathl/filel/path2/file2____这些访问记录被提取作为用户特征,保存到数据存储系统。b)用户活动日志系统从用户活动的日志中分析用户特征的系统。用户活动日志 是指,网站为用户提供服务的应用程序所记录的、用户使用这些服务的日志记录。例如,网 站为用户提供的论坛程序,可能会把用户的登录IP、登录时间、发帖标题、发帖内容等信息 记录到日志中。用户活动日志系统从这些日志中提取用户的特征,保存到数据存储系统。例如,论坛程序记录的用户活动如表1所示表 权利要求
1.一种应用于电子商务网站的信息匹配方法,其特征在于,包括搜索引擎服务器收集网络用户的每一类网络行为的特征数据,分别针对每一类网络行 为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权重;搜索引擎服务器接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干 条搜索结果;搜索引擎服务器查询所述特定用户所属聚类中所有网络用户对所述每一条搜索结果 的历史点选记录;搜索引擎服务器根据所述所有网络用户的历史点选记录以及据以进行聚类的各类特 征数据的权重计算获得所述若干条搜索结果的等级值;搜索引擎服务器按照所述等级值由大到小对所述搜索结果进行排序,并将排序后的搜 索结果返回给特定用户的用户终端。
2.根据权利要求1所述的方法,其特征在于,所述网络行为包括网络交易行为或网络 点评行为;所述网络行为的特征数据包括网络交易记录或网络点评记录。
3.根据权利要求1所述的方法,其特征在于,所述分别针对每一类网络行为按照所述 特征数据对网络用户进行聚类的方法包括首先将没有搜集到网络行为的特征数据的网络用户聚为一类;对于剩下的网络用户,根据所述网络行为的特征数据以及已配置的聚类数目进行聚类;将聚类结果以数据表的形式保存在数据库中。
4.根据权利要求3所述的方法,其特征在于,所述根据所述网络行为的特征数据以及 已配置的聚类数目进行聚类的步骤包括若所述网络行为的特征数据为网络交易记录,则根据所述网络交易记录中的商品信息 是否类似进行聚类,将购买过类似商品的网络用户聚为一类;聚类数达到已配置的数目时,聚类完成。
5.根据权利要求3所述的方法,其特征在于,所述根据所述网络行为的特征数据以及 已配置的聚类数目进行聚类的步骤包括若所述网络行为的特征数据为网络点评记录,则根据网络用户点评的商家用户所属的 类目对网络用户进行聚类;或者,统计每两个商家用户的网络点评记录中相同的网络用户 的数量,根据所述网络用户的数量与对该商家用户进行网络点评的网络用户的总数量的比 值获得重叠比例,根据重叠比例计算商家用户之间的距离;根据所述距离对商家用户进行 聚类,再反过来根据商家用户的聚类对消费者用户进行聚类;聚类数达到已配置的数目时,聚类完成。
6.根据权利要求1所述的方法,其特征在于,所述搜索引擎服务器收集网络用户的每 一类网络行为的特征数据的方式包括通过服务器日志分析系统收集、通过网络用户活动 日志系统收集、通过地理信息系统收集或通过第三方数据接口收集,或通过以上任意组合 的方式收集。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括设置地理位置信息的权重;根据所述地理位置信息的权重和据以进行聚类的各类特征数据的权重,计算各条检索结果的等级值,根据计算出的等级值按照从大到小的顺序对检索结果进行排序。
8.根据权利要求1所述的方法,其特征在于,所述搜索引擎服务器接收某一特定网络 用户的搜索请求,具体包括搜索引擎服务器接收某一特定网络用户输入的搜索关键词,和 /或搜索引擎服务器接收某一特定网络用户的鼠标点击行为触发的搜索请求。
9.一种应用于电子商务网站的信息匹配系统,其特征在于,包括信息采集系统,收集网络用户的每一类网络行为的特征数据,分别针对每一类网络行 为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权重;检索系统,接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干条搜 索结果,查询所述特定用户所属聚类中其他网络用户对所述每一条搜索结果的历史点选记 录,根据所述其他网络用户的历史点选记录以及据以进行聚类的各类特征数据的权重计算 获得所述若干条搜索结果的等级值,按照所述等级值由大到小对所述搜索结果进行排序;结果页面生成系统,用于将所述排序后的检索结果显示给信息接收者。
10.根据权利要求9所述的系统,其特征在于,所述检索系统具体包括搜索引擎,接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干条搜 索结果;排序系统,查询所述特定用户所属聚类中其他网络用户对所述每一条搜索结果的历史 点选记录,根据所述其他网络用户的历史点选记录以及据以进行聚类的各类特征数据的权 重计算获得所述若干条搜索结果的等级值,按照所述等级值由大到小对所述搜索结果进行 排序。
11.根据权利要求10所述的系统,其特征在于,所述排序系统具体包括第一设置模块,用于设定据以进行聚类的各类特征数据的权重;查询模块,用于针对已获得的每一条检索结果,查询每一网络用户对每一条检索结果 的历史点选记录;统计模块,用于统计获得的每一个检索结果的历史点选记录,并以数据表的形式保存 于数据库中;排序模块,用于当某一特定网络用户搜索时,对于返回的检索结果,查询与所述网络用 户同一聚类的所有用户的历史点选记录,并根据所述权重,计算各条检索结果的等级值,根 据计算出的等级值按照从大到小的顺序对检索结果进行排序。
12.根据权利要求11所述的系统,其特征在于,所述排序系统具体包括第二设置模块,用于设置地理位置信息的权重;第一设置模块,用于设定据以进行聚类的各类特征数据的权重;查询模块,用于针对已获得的每一条检索结果,查询每一网络用户对每一条检索结果 的历史点选记录;统计模块,用于统计获得的每一个检索结果的历史点选记录,并以数据表的形式保存 于数据库中;排序模块,用于当某一特定网络用户搜索时,对于返回的检索结果,查询与所述网络用 户同一聚类的所有用户的历史点选记录,并根据所述地理位置信息的权重和据以进行聚类 的各类特征数据的权重,计算各条检索结果的等级值,根据计算出的等级值按照从大到小 的顺序对检索结果进行排序。
全文摘要
本申请公开了一种应用于电子商务网站的信息匹配方法和系统,所述方法包括搜索引擎服务器收集网络用户的每一类网络行为的特征数据,分别针对每一类网络行为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权重。接收某一特定网络用户的搜索请求,并根据所述搜索请求搜索获得若干条搜索结果。查询所述特定用户所属聚类中所有网络用户对所述每一条搜索结果的历史点选记录。根据所述所有网络用户的历史点选记录以及据以进行聚类的各类特征数据的权重计算获得所述若干条搜索结果的等级值。按照所述等级值由大到小对所述搜索结果进行排序,并将排序后的搜索结果返回给特定用户的用户终端。
文档编号G06F17/30GK101996215SQ200910171350
公开日2011年3月30日 申请日期2009年8月27日 优先权日2009年8月27日
发明者刘青焱, 叶一火, 吴鹏松, 张旭 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1