用于环境化报告和个性化推荐的概率评估的系统和方法_3

文档序号:8431402阅读:来源:国知局
[0057]又假设有一位旅行者B,他以与旅行者A类似的路线旅行。此外,旅行者B的简档特征与旅行者相似,换言之,他们年龄相同并都在遭受气喘。他们都在旅行他们所计划的路线,并且在他们造访的位置都经历了类似的事件。
[0058]在吃了某种食物并访问某些地方后,旅行者A和旅行者B规律地造访并输入指出他们的健康状况的报告。对于这种情况的一种典型方法是从这两个旅行者收集报告,然后基于对报告的计数和聚类(如每次,每个位置,每个事件等)和过滤(例如,识别并过滤出异常行为,例如在短时间内来自同一用户的对于相同位置或餐馆的多个报告),来对最相似的报告进行归类。
[0059]然而,这种分级方法很容易出现错误和偏差。在上面说明的方案中,具有不好经历的报告的简单计数可以导致一个结论,即旅行者A正在进行比旅行者B更危险的行为,因为他们不太可能由于环境的负面情况而经历正面报告。
[0060]实施本发明的示例性实施例的分类系统会考虑当地环境的特征,以向来自旅行者A的报告提供更高的等级。这样,最显著的热点(包含不同位置)的分类对努力提供优质服务的区域来说变得更加平衡,而不管旅行者A的冒险精神。
[0061]现在将论述本发明的数学模型。
[0062]如果识别出合适的因果关系模型并将其用于在考虑的具体方案,则可获得根据本发明的示例性实施例的方法的实施。为了构建这样的模型,首先需要给出概率P(Ri,Ci,Pi)的表,即在给定环境信息项Ci和用户简档项Pi的情况下报告条件Ri的概率。Ri是二进制随机变量,假设如果条件Ri被报告则该变量为1,否则该变量为O。环境信息Ci (温度、水质等等)和简档信息Pi (年龄、健康、行为等等)可以被离散化,从而使得可以通过归一频率的直接计算从报告训练集合T中获得该表。更准确地,在给出报告!■的情况下,如果我们说起无论何时报告r描述在Ci和Pi下条件Ri的发生,P(Ri,Ci, Pi)都可以被获得如下:
[0063]取决于R|、|C|和|P|,P(Ri|Ci,Pi)的计算变成一个难以计算的问题,因为这种边际概率的计算可能涉及大量元素。
[0064]为了避免这个问题并最小化计算工作量,可以使用因果关系模型,该模型可以例如经由结构方程建模(例如,在多次回归的支持下完成)而获得。这类技术通过考虑哪些变量影响其他变量来研究在两个随机变量之间是否存在关联。图3中示出了一个示例的因果关系模型。
[0065]这样的因果关系模型示出发烧330取决于天气305和温度310 (例如,环境信息),并且取决于年龄320 (例如,简档信息),并且示出其与水质315 (例如,环境信息)和病史325 (例如,简档信息)无关。换言之,概率P (发烧I年龄、疾病、天气、温度、水)等于P (发烧I年龄、天气、温度),这很容易比较。
[0066]基于这些模型就可以在一组环境信息Ci和一组简档信息Pi的情况下计算条件Ri的发生概率。因此,如果具有简档Pi的某用户到达环境Ci,用户提交报告Ri的概率可以直接通过因果关系模型计算出来(该模型可以在新情况出现和/或新证据显示某些关联不再由数据确认时被重新调整和升级)。
[0067]不同区域之间的关联可以用传统技术来评估,并且因此不使用因果关系模型。因此,预测在区域中将报告某种条件简单地包括:监控来自用户的环境信息和简档信息的演变,以及将其与关联区域中过去发生过的信息进行比较。
[0068]所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
[0069]可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0070]计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0071]计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括一但不限于一无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0072]可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言一诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0073]下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
[0074]也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
[0075]计算机程序指令也可以加载到计算机、其他可编程数据处理设备或其他装置上,以致
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1