用于生成隐私简档的方法和设备的制作方法

文档序号:7774276阅读:189来源:国知局
用于生成隐私简档的方法和设备的制作方法
【专利摘要】隐私处理系统可使用隐私规则来从网络会话数据过滤敏感个人信息。隐私处理系统可生成隐私简档或隐私元数据,其标识多久调用隐私规则、隐私规则多久成功完成行动、以及执行隐私规则所需的处理时间。隐私简档可用于检测隐私过滤处理中的可与各种隐私过滤和网络会话问题相关联的不规则性。
【专利说明】用于生成隐私简档的方法和设备
【技术领域】
[0001]本发明涉及用于生成隐私简档的方法和设备。
【背景技术】
[0002]监控和回放系统可以捕获网络会话数据,诸如从网络应用服务器发送到客户端计算机的网页、以及在客户端计算机处输入所述网页的用户接口事件。所捕获的网络会话数据可用于回放和分析在网络会话期间的用户经历。例如,所回放的网络会话可用于识别用户在网络会话期间导览网页时可能有的问题。
[0003]在网络会话期间,可能将敏感的个人信息输入到网页中。例如,网络会话可能涉及产品和/或服务的在线购买。为了完成在线交易,用户可能需要输入社会保障号、密码、信用卡号、银行账户号、健康信息、股票信息、家庭住址等或其任何组合。
[0004]政府隐私规章可以禁止保持特定个人信息或限制授权的实体保持个人信息。这些隐私规章可能需要监控和回放系统,以在将所捕获的网络会话数据存储在数据库中用于随后的回放分析之前,过滤敏感个人信息。
[0005]当前的监控和回放系统试图移除敏感个人信息。然而,可能没有从所捕获的网络会话数据成功地过滤一些个人信息。例如,网络应用可能改变之前用于触发过滤敏感个人信息的隐私规则的网页的名称或网页中字段的名称。如果没有过滤敏感个人信息,则可能需要毁灭所捕获的网络会话数据的一些或全部。

【发明内容】

[0006]根据本发明一实施例,提供了一种方法,包括:通过处理装置,生成与从网络会话数据过滤信息相关联的隐私度量;通过处理装置,从隐私度量生成隐私简档;以及通过处理装置,使用隐私简档以识别从网络会话数据过滤信息的不规则性。
[0007]根据本发明另一实施例,提供了一种设备,包括:处理装置,被配置为:对网络会话数据应用隐私规则;识别应用到网络会话数据的隐私规则的统计;以及使用所述统计来生成用于应用到网络会话数据的隐私规则的隐私简档。
[0008]根据本发明另一实施例,提供了一种设备,包括:监控系统,被配置为在网络会话期间捕获网络会话数据;以及隐私处理系统,被配置为:从网络会话数据中至少过滤一些个人信息;生成与从网络会话数据中过滤个人信息相关联的隐私度量;以及从隐私度量生成隐私简档。
【专利附图】

【附图说明】
[0009]图1示出了用于从所捕获的网络会话数据过滤信息的系统的示例。
[0010]图2示出了隐私处理系统的示例。
[0011]图3示出了通过隐私处理系统生成的隐私度量的示例。
[0012]图4示出了用于将隐私度量与隐私简档进行比较的示例处理。[0013]图5示出了用于生成隐私度量的示例处理。
[0014]图6示出了用于生成隐私简档的示例处理。
[0015]图7示出了用于检测不规则的(irregular)隐私度量的处理的示例。
[0016]图8A和SB示出了显示隐私规则的平均执行时间的示例曲线图。
[0017]图9A和9B示出了显示隐私规则的成功完成百分比的示例曲线图。
[0018]图10A-C示出了表现正确和不正确隐私过滤的回放的网络会话的示例。
[0019]图11示出了用于实现隐私处理系统的示例计算装置。
【具体实施方式】
[0020]图1示出在网络服务器102上运行的网络应用104和计算装置110之间进行的网络会话100。网络应用104可以支持任何类型的在线网络会话,诸如在线购物、在线金融或医疗服务、社交网络等。当然,这些仅是示例,并且可以使用网络应用104执行任何类型的基于电子网络的交易或活动。
[0021]计算装置110可包括个人计算机(PC)、膝上型计算机、无线个人数字助理(PDA)、蜂窝电话、智能电话、平板型计算机或任何其他访问网络应用104并与其交换信息的有线或无线装置。任何数目的计算装置110可在任何地理位置和一天中的任何时间与网络应用104进行不同的网络会话100。
[0022]计算装置110可通过网络连接108与网络应用104通信。网络连接108可包括因特网、无线网络、WiFi网络、电话网络、公共服务电话网络(PSTN)、蜂窝网络、电缆网络、广域网(WAN)、局域网(LAN)等或其任何组合上的连接的任何组合。
[0023]在一个示例中,在计算装置110上运行的网络浏览器或网络应用118可以经由网络连接108向网络应用104发送超文本传输协议(HTTP)请求。网络应用104可以响应于HTTP请求发送回一个或多个网页106,并且计算装置110可以在计算机屏幕116上经由网络浏览器或应用118显示网页。例如,网络浏览器或移动应用118可以显示包含分别用于输入用户姓名、密码和社会保障号的字段114A-114C的电子网页112。网络应用104可以响应于输入到字段114中的信息,将另外的网页106和/或响应发送到计算装置110。
[0024]网络会话监控器122可以在网络会话100期间捕获网络会话数据124。网络会话数据124可包括经由网络连接108在计算装置110和网络应用104之间传送的网络数据以及在计算装置110上生成的用户接口事件。例如,网络会话数据124可包括从计算装置110发送到网络应用104的超文本传输协议(HTTP)请求和其他数据请求、以及从网络应用104发送回计算装置110的超文本标记语言(HTML)网页106和其他响应。
[0025]一些网络会话数据124可包括用户输入到计算装置110中的用户接口事件,诸如鼠标点击、键击、字母数字数据等或其任何组合。例如,一些用户接口事件可包括输入到网页112的字段114中的数据或可包括对于网页112上的图标或链接的选择。
[0026]其他网络会话数据124可包括网络应用104与网页106 —起发送到计算装置110的进一步确定网页中的不同状态或操作的网页逻辑/代码。一些网络会话数据可以在处理装置110本地生成,而从不经由网络连接108发送。例如,网页112内的控制逻辑可以响应于用户输入改变网页112的状态,而不将任何数据发送回网络应用104。在另一示例中,可以仅将网页112中已完成信息的批量数据传送经由网络连接108传送回网络应用104。[0027]在另一示例中,一些网络会话数据124可以包括网页内的文档对象模型(DOM)事件。例如,可通过Π事件监控器122A捕获所显示的网页106的DOM中的变化,作为一些网络会话数据124。在另一示例中,网络会话数据124可包括在计算装置110和/或网络服务器102中的运行参数或任何其他日志记录的数据。例如,网络会话数据124可包括网络带宽指示符、处理器带宽指示符、网络条件指示符、计算机运行条件等或其任何组合。
[0028]在一个示例中,网络会话监控器122B可以捕获经由网络连接108在计算装置110和网络应用104之间交换的网络数据,诸如网页、请求、响应和/或逻辑。用户接口(UI)监控器122A可以捕获在计算装置110本地生成的用户接口事件。在另一示例中,Π监控器122A还可捕获经由网络连接108在计算装置110和网络应用104之间交换的网络数据的一些或全部。
[0029]在另一示例中,Π事件监控器122A和/或网络会话监控器122B可以不捕获全部网络会话数据124,并且可以仅检测一些网络会话事件的出现。在此示例中,监控器122A和122B可以发送识别特定网络会话事件的出现的唯一标识符,并且可以发送指示何时检测到网络会话事件的时间标记。
[0030]在以下文档中描述了用于捕获和/或识别(identify)网络会话数据和事件的系统的不例:2001年9月4日公布的题为“Systems and Methods for Recordingand Visually Recreating Sessions in a Client-Server Environment,,的美国专利N0.6,286,030,现在重公布为美国专利如.1?41903;2012年2月28日公布的题为“Methodand Apparatus for Monitoring and Synchronizing User Interface Events withNetwork Data”的美国专利N0.8,127,000 ;以及2012年3月13日提交的题为“Method andApparatus for Intelligent Capture of Document Object Model Events,,的美国专利申请序列号13/419,179,其全部通过引用而全文合并于此。
[0031]在网络会话100期间,用户可以将用户姓名输入字段114A,将密码输入字段114B和/或将社会保障号输入字段11`4C。由于上述的安全需求,在所捕获的网络会话数据124可以存储在数据库136中之前,可能需要过滤密码和/或社会保障号。
[0032]隐私处理系统130从所捕获的网络会话数据124中过滤敏感个人信息,诸如密码和/或社会保障号。过滤指对网络会话数据124中的数据进行移除、遮挡、替换、加密、散列等的任何组合。隐私处理系统130将经过滤的网络会话数据138存储在网络会话数据库136中。回放系统134然后可以使用所捕获的并且现在经过滤的网络会话数据138以回放原始网络会话100,而不用显示敏感个人信息。在2012年2月28日公布的题为“METHOD ANDAPPARATUS FOR MONITORING AND SYNCHRONIZING USER INTERFACE EVENTS WITH NETWORKDATA”的美国专利N0.8,127,000 (其通过引用全文合并于此)中描述了回放系统134的一个示例。
[0033]隐私处理系统130可以对所捕获的网络会话数据124应用隐私规则以移除敏感个人信息。可以对于隐私规则生成隐私简档或隐私元数据。例如,隐私简档可以识别多久调用隐私规则、隐私规则多久成功完成行动、以及执行隐私规则需要的处理时间量。隐私简档可以检测隐私过滤问题,诸如从网络会话数据不过滤个人信息或过滤错误信息的隐私规贝U,或是否特定数据模式需要异常大的隐私资源,诸如时间或CPU使用。此外,隐私资源使用中的任何大的偏离可能指示对于网站或终端用户行为的改变。[0034]过滤和/或加密所捕获的网络会话数据中的敏感个人信息可能是计算量大的。例如,特定网站每天可能服务几亿用户和几亿相关联的网络会话。隐私简档可以识别错误写入或无效并浪费处理带宽的隐私规则。可以识别所识别的隐私规则,并重写这样的隐私规贝U,从而隐私规则可以更有效地从几百万的网络会话中搜索和过滤个人信息。
[0035]隐私处理系统130可以检测可能影响网络会话100期间的用户体验的其他网络会话事件或状态。例如,隐私简档可识别不正确的用户行为、病毒攻击、源网络应用的逻辑中的错误或间隙等。因此,隐私处理系统130不仅生成定量的隐私过滤度量,而且还可以识别网络会话的其他通常的问题。
[0036]图2更详细地示出了隐私处理系统130的一个示例。隐私规则解析器148可以对从网络会话100捕获的网络会话数据124应用隐私规则150。可以对网络会话100期间捕获的不同网页和不同数据应用不同规则150。例如,第一规则150A可以搜索所捕获的网络会话数据124中可包含社会保障号的特定网页。第二规则150B可以搜索网络会话数据124中若干不同网页中的可包含信用卡号的不同字段。
[0037]规则150A和150B可以通过对诸如社会保障号或信用卡号的敏感个人信息进行替换、遮挡、散列、加密等而过滤网络会话数据。经过滤的网络会话数据138存储在数据库136中,然后可由回放系统134用于随后的回放和分析。
[0038]隐私建档器(profiler) 152可以生成对于隐私规则150的隐私简档158。例如,隐私建档器152可以跟踪当过滤网络会话数据124时调用每个规则150的次数、每个规则150成功过滤网络会话数据124中的信息的次数、和/或在过滤网络会话数据124时执行规则150所需的时间量。
[0039]隐私建档器152可通过对规则150的隐私度量进行合计而生成隐私简档158。例如,隐私建档器152可计算最近五分钟期间过滤网络会话数据124时调用规则150A的平均次数。合计的隐私度量可以被用作典型或正常隐私过滤行为的基准线或“简档(profile)”。隐私简档阈值之外的安全度量可以指示隐私过滤问题或其他网络会话问题。例如,可能存在对于每个捕获的网络会话调用特定隐私规则的平均次数的实质性的改变。在另一示例中,可能存在成功完成隐私规则的执行所需的时间量的实质性的改变。
[0040]这些隐私度量的改变可能由网络应用或网络应用使用的网页的改变而引起。如上所述,用户可以将个人信息输入到特定网页内的特定字段。当在所捕获的网络会话数据124中识别了特定网页名称或字段名称时,隐私规则解析器148可以仅调用规则150A。如果运行网络应用的企业改变了网页名称或字段名称,则隐私规则解析器148可能不再调用规则150A来过滤重命名的网页中的数据。因此,可能不再从网络会话数据124中过滤输入到重命名的网页中的社会保障号,破坏了经过滤的网络会话数据138的整体隐私和安全。
[0041]在另一示例中,成功完成隐私规则150所需的时间量的改变也可指示隐私过滤问题。例如,网络浏览器、网页和/或网页逻辑可改变或重新格式化输入到网页中的数据。经改变或重新格式化的数据可能导致隐私规则解析器148对于不包含个人信息的网页无意地调用隐私规则150,或可能导致规则150过滤错误数据。这些不正确或无意的过滤操作可能浪费处理带宽和/或移除精确回放所捕获的网络会话所需的网络会话数据。
[0042]在另一示例中,隐私度量的改变可指示异常网络会话。例如,服务攻击或其他僵尸网络攻击的拒绝可能实质上改变调用特定规则150的次数或百分比或成功完成隐私规则所需的时间量。隐私简档158可以识别隐私度量改变并隔离隐私过滤或网络会话问题。
[0043]隐私事件处理器154可以在计算装置160上显示用于隐私简档158的曲线图162。例如,曲线图162可以识别对于不同隐私规则的平均隐私度量值。曲线图162中的任何实质上的背离可指示隐私过滤问题和/或网络会话问题。用户可以指示隐私事件处理器154显示不同维度的隐私简档,诸如对于特定隐私规则、隐私规则参数、网络会话种类或网络浏览器。例如,用户可以指示隐私事件处理器154显示与不同桌面网络浏览器和移动应用相关联的隐私度量。
[0044]计算装置160可以使用回放系统134以进一步隔离隐私过滤不规则性。例如,用户可以将大的隐私度量改变之前回放的经过滤的网络会话与大的隐私度量改变之后回放的网络会话进行比较。然后可以通过在隐私规则解析器148中修改关联的规则150来校正回放期间识别的任何过滤问题。
[0045]图3更详细示出了通过隐私规则解析器使用和生成的隐私规则150和隐私度量176的示例。第一规则150A可包括查找数字、文本、值、参数等的特定集合的测试172A。例如,测试172A可测试通过空格或横杠与两个数字的第二集合隔开的三个数字的第一集合。测试172A然后可查找通过第二空格或横杠与两个数字的第二集合隔开的四个数字的第三
口 O
[0046]在检测到数字序列时,规则150A可触发行动174A。在一个示例中,规则150A的行为174A可以用“X”替换检测到的数字序列。其他行为的示例可包括仅用“X”替换所识别的序列中的一些数字,或使用散列算法来加密数字序列。在一个示例中,可以不解密加密的数字序列,而是仍用散列算法来确认数字与特定用户的关联。任何其他的行动可用于过滤信息。
[0047]可通过与隐私规则150A关联的隐私规则解析器生成隐私度量176A的集合。例如,隐私度量176可包括识别调用规则150A的特定网络会话的网络会话标识符。网页标识符可识别网络会话数据中调用规则150A的特定网页。字段标识符可识别所捕获的网络会话数据中的调用规则150A以用于过滤输入字段中的数据的特定字段。
[0048]网络浏览器标识符可识别在调用规则150A的关联的网络会话期间使用的特定网络浏览器或应用。时间标记度量可识别产生所捕获的网络会话数据的网络会话何时发生和/或可识别何时调用规则150A用于过滤所捕获的网络会话数据。“调用的#”度量可识别在过滤所捕获的网络会话数据时调用规则150A的次数、或调用规则150A用于单独的网络会话、网页等的次数。“完成行动的#”度量可识别规则150成功完成关联的过滤行动的次数。例如,行动的#可识别规则150A在行动174A中用X替代测试172A中的序列的次数。执行时间度量可识别对于网络会话、网页等完成规则150A所需的处理时间量。
[0049]第二规则150B可包括测试172B,其还解析对于数字、文本、值、参数等的特定集合的网络会话数据。在此示例中,测试172B可以测试与信用卡号相关联的数字序列。数字序列可以是由空格或横杠隔开的四个数字的四个集合。在一个示例中,测试172B的满足可以启动相关联的行动174B,其用“X”替换所检测到的十六个数字的序列的前十二个数字。可对于规则150B生成隐私度量176B的另一相似集合。
[0050]规则150A和150B仅是可以应用到网络会话数据的任何种类的测试和行动的示例。规则150可以应用到网络会话数据的任何组合。例如,可以仅对于对用户查询诸如社会保障号的敏感个人信息的特定网页调用规则150。可以调用其他规则150来过滤与其他网页上捕获的其他敏感数据相关联的数据。
[0051]图4示出了图3中的隐私建档器152从隐私度量生成的隐私简档158的示例。隐私简档158可识别与过滤网络会话数据相关联的不同统计维度。例如,第一隐私简档158A可识别在过滤网络会话数据时调用隐私规则解析器中的任何规则的平均次数。可以对于诸如时间段、网络会话、网页、网络浏览器和/或移动网络应用的不同种类得到隐私简档158A。
[0052]隐私简档158B可识别规则的平均成功完成率,其指示隐私规则成功过滤信息的次数的平均百分比。隐私简档158C可识别所有规则对于网络会话、网页、浏览器等过滤网络会话数据所需的平均时间量。
[0053]隐私简档158D可识别在过滤网络会话数据时调用特定规则#1的平均次数。隐私简档158E可识别对于规则#1的成功完成率。隐私简档158可以与任何其他隐私规则和收集的隐私维度相关联。
[0054]隐私建档器可以对于合计时段生成合计的平均隐私度量180。例如,隐私建档器可以合计调用不同规则的次数,合计规则成功完成过滤行动的次数的百分比,并合计规则完成执行所需的时间量。可以对于一些可选择的时间段(如五分钟)合计隐私度量,并且合计的值被平均以生成隐私度量180。
[0055]隐私事件处理器154可以将对于每个合计时间段的隐私度量180与隐私简档158进行比较。可以对于在隐私简档158的阈值范围以外的任何隐私度量180生成隐私度量通知182。例如,隐私建档器可以确定对于隐私简档158中的值的标准偏差。隐私事件处理器154可以对于在相关联的隐私简档158的标准偏差以外的任何隐私度量180发送通知182或在日志文件中创建条目。
[0056]例如,规则#1可以在过去的五分钟合计时段上的时间有成功完成100%。隐私简档158E中对于规则#1的平均成功完成率可以是80%,并且标准偏差可以是+/-4%。因此,隐私简档158E的阈值范围可以在76%和84%之间。因为隐私度量180中对于规则#1的成功完成率在隐私简档158E的阈值范围外,所以隐私事件处理器154可以生成通知182或在文件或表中生成条目,将对于规则#1的隐私度量180识别作为离群值(outlier)。
[0057]隐私事件处理器154还可以自动确定与不同隐私度量相关联的网络会话数据中的差别。例如,所捕获的网络会话数据可包括网页的文档对象模型(D0M)。隐私事件处理器154可以检测在隐私简档阈值之外的隐私度量。可以将具有隐私简档阈值以内的隐私度量的经过滤的网页的DOM与具有隐私简档阈值以外的隐私度量的经过滤的网页的DOM进行比较。可以识别DOM差并将其发送到操作者。例如,DOM差可识别具有可能防止规则#1正确触发的经改变的名称的网页。
[0058]图5示出用于生成隐私度量的示例处理。在操作200中,对从网络会话监控系统接收的所捕获的网络会话数据应用隐私规则。如上所述,可以连续地、周期性地或随机地监控任何数目的网络会话,并且将相关联的网络会话数据发送到隐私处理系统。
[0059]在操作202中识别在隐私过滤处理期间调用或触发的隐私规则。例如,当在网络会话数据中识别特定网页时可以调用规则,并且当在所捕获的网络会话期间所述网页从未被打开时可以不调用规则。在操作204中,对于隐私规则生成隐私度量。例如,每个网络会话和网页可以具有关联的标识符。隐私规则解析器可以识别触发规则的网络会话和/或网页。隐私规则解析器可以识别与规则相关联的任何其他隐私度量,如时间或日期、何时触发规则、触发规则的客户端侧所使用的网络浏览器的类型等。
[0060]在操作206中,隐私规则解析器可以确定规则是否成功完成。例如,可以无论何时识别特定网页都触发隐私规则。所触发的规则然后可以执行测试以识别网页中满足特定条件和/或匹配特定值、序列、位置等的任何数据。如果满足测试,则规则执行相关联的行动。例如,所述行动可以是用X替换匹配的数字组合。匹配的数字组合的替换被识别为规则的成功完成。
[0061]在操作208中,可以识别完成隐私规则所需的时间量。例如,隐私规则可能需要对与一个或多个网页相关联的所有数据应用相关联的测试。隐私规则解析器可以跟踪解析一个或多个网页所需的处理时间量。可以对诸如时间段、网络会话、网页、网页中的特定字段等的任何其他各种维度或种类跟踪时间。在操作210中,将隐私度量发送到隐私建档器。
[0062]图6示出了用于生成隐私简档的示例处理。在操作230中,隐私建档器从隐私规则解析器接收隐私度量。在操作232中,对于可选择的时间段合计隐私度量。例如,隐私建档器可以对合计时段期间触发特定规则的总次数进行计数。合计时段可以是任何可选择的时间段,如秒、分、小时、天等。可以对于不同维度触发隐私度量,所述不同维度诸如对于所有隐私规则、单独隐私规则、隐私规则调用、隐私规则完成、隐私规则执行时间、网络会话、网页等。
[0063]操作234确定合计时段何时已经结束。例如,合计时段可以是五分钟,并且隐私建档器可以对五分钟的合计时段期间触发每个隐私规则的次数进行计数。
[0064]在操作236中,可以对于特定隐私度量计算平均。例如,隐私建档器可以计算对于每个网络会话触发隐私规则的平均次数、隐私规则的平均完成率以及隐私规则的平均执行时间。操作238将合计的平均隐私度量作为隐私简档存储在数据库中。
[0065]图7示出了自动识别隐私过滤处理中的不规则性或所捕获的网络会话中的不规则性的示例处理。在操作250中,隐私事件处理器可以从隐私建档器接收新的隐私度量。例如,可以将新的隐私度量与通过隐私规则解析器过滤的最近五分钟的隐私相关联。
[0066]在操作252中,可以将新的隐私度量与之前生成的隐私简档进行比较。例如,如上所述,可以将在过去五分钟对于特定隐私规则的平均执行时间与在隐私建档器中用规则识别的平均执行时间进行比较。在操作256中,隐私事件处理器可以对于在操作254中超出隐私简档的阈值范围的任何最近的隐私度量发送通知。例如,可以将电子邮件发送到系统管理员,或者可以对日志文件添加新条目,识别特定规则、相关联的隐私度量、以及任何其他相关联的网络会话信息,如时间、网络会话、网页等。
[0067]在操作258中,可以将新的隐私度量添加到现有的隐私简档中。例如,隐私建档器可以跟踪整个几天、几周、几月、几年中规则的平均执行时间。新的隐私度量可以识别隐私简档的下一时间段。在一个示例中,新的隐私度量还可以与隐私简档中其他累积和平均的隐私度量进行累积。例如,可以累积并平均最近一小时的所有隐私度量,以生成一天、一周、或一月长的隐私简档中的一个参考点。
[0068]图8A和8B示出对于不同隐私规则显示的隐私度量的示例。选择框302可用于选择用于在电子页面300上显示的不同隐私度量或隐私维度。选择框302A可选择用于在垂直的Y轴上显示的参数或维度,并且选择框302B可选择用于沿水平的X轴显示的参数或维度。
[0069]例如,选择框302A可选择垂直的Y轴以表示隐私处理系统完成对于所捕获的网络会话数据的不同隐私规则的执行所需的平均执行时间。选择框302B可选择水平的X轴以表示用于显示诸如对于特定一天的平均执行时间的特定时间段。图8A示出Y轴上在0.0毫秒(ms)和5.0ms之间的平均执行时间的范围、以及X轴上在8:00am和3:00pm之间的时间范围。当然,在X轴和Y轴上可以显示其他隐私维度和时间范围。
[0070]选择框302C可选择用于显示相关联的隐私度量的隐私规则。例如,选择框302C可选择用于显示相关联的平均执行时间的所有规则#1、#2和#3。选择框302D可选择用于显示相关联的安全度量的网络会话种类。例如,选择框302D可选择对于捕获的网络会话、捕获的网络会话内所捕获的网页等要显示的隐私度量。
[0071]基于选择框302中的条目,隐私处理系统分别显示表示对于规则#U#2和#3在特定一天的平均执行时间的改变的三条线304、306和308。在此示例中,线304保持相对恒定在4.5ms左右,并且线306保持相对恒定在3.5ms左右。由于网络会话期间不同用户活动,在平均执行时间中可以预期正规变分(normal variation )。例如,用户可在网络会话期间导览不同网页,并且可以或可以不在这些网络会话期间完成交易。因此,对于不同的单独的网络会话可以捕获不同种类和不同量的合计数据,其可以或可以不触发特定隐私规则的执行的,并且可以改变执行隐私规则所需的时间量。
[0072]线308示出在11:00am之后的某个时间对于规则#3的平均执行时间的实质改变。直到11:00am为止,平均执行时间在2.5ms左右,并且在11:00am之后,平均执行时间下降至IJ 1.0ms左右。平均执行时间的改变可以指示规则#3的问题。例如,网络应用可能已经改变之前用于触发规则#3的网页名称或字段名称。结果,对于重命名的网页可能不再调用规则#3,并且规则#3可能不再过滤重命名的网页中的个人信息。
[0073]线308识别与规则#3相关联的潜在过滤问题。管理员可以回放11:00am以后捕获的一些网络会话,以确定规则#3是否从所捕获的网络会话数据正确地过滤个人信息。例如,管理员可确定规则#3是否正从所回放的网络会话数据中的特定网页移除社会保障号。
[0074]图SB示出隐私处理系统所显示的隐私度量的另一示例。管理员可决定更详细地调查对于规则#3平均执行时间的改变。或者经由选择框302中的条目或者通过选择线308,隐私处理系统可以显示示出与网络会话内不同网页相关联的对于规则#3的其他隐私度量的柱状图。例如,管理员可以选择选择框302C中的规则#3,并且选择选择框302D中的网页类别。
[0075]作为响应,隐私处理系统可以显示各自与可能在所捕获的网络会话期间已经显示的不同网页相关联的不同柱状图320、322和324。例如,柱状图320可以与网络会话中用户登录网络账户的登陆页面相关联,柱状图322可以与用户输入地址信息的账户网页相关联,并且柱状图324可以与用户完成购买产品或服务的交易的结账页面相关联。
[0076]第一实线柱状图可表示在11:00am对于规则#3的平均执行时间,并且第二虚线柱状图可表示在12:00pm对于规则#3的平均执行时间。柱状图320示出对于登录网页隐私规则#3的平均执行时间从11:00am和12: OOam没有显著变化,并且柱状图322示出对于账户网页对于隐私规则#3的平均执行时间从11:00am到12: OOpm没有显著变化。然而,柱状图324示出规则#3当应用到结账网页时的平均执行时间从11:00am处的2.5ms左右显著下降至Ij 12:00pm处的0.5ms左右。
[0077]管理员可以使用回放系统或可以使用其他搜索软件,然后确定规则#3是否正确过滤结账网页所捕获的个人信息。例如,通过回放12:00pm之后捕获的一些网络会话,管理员可以确定规则#3并未正从所捕获的网络会话数据中过滤信用卡号。这将对隐私的破坏
提供早期警告。
[0078]图9A和9B示出隐私处理系统如何可以显示识别隐私过滤处理中的不规则性的隐私度量的另一示例。在此示例中,选择框302A选择垂直的Y轴以表示对于不同规则的成功完成率。如上所述,百分比的完成率可以指示特定规则被调用或触发然后成功完成关联的行动(如替换或加密数字序列)的百分比次数。
[0079]图9A示出在60%和100%之间的成功完成百分比。选择框302B选择用于显示7:00am和1:00pm之间的成功完成率的时间段。选择框302C选择用于显示相关联的完成率的所有规则#1、#2和#3,并且选择框302D选择用于显示相关联的完成率的网页会话作为网络会话数据的类别。
[0080]基于选择框302中的条目,隐私处理系统显示分别示出对于规则#1、#2和#3的完成率在特定一天的变化的三条线340、342和344。在此示例中,线340示出隐私规则#1保持相对恒定在90%左右,并且线342示出隐私规则#2保持相对恒定在80%左右。
[0081]还可以由于网络会话期间的不同用户活动而预期完成率的变化。再次,用户可以在网络会话期间导览不同网页,并且可以或可以不在这些网络会话期间完成交易。例如,一些用户可以在网络会话期间将信用卡信息输入网页中,其在稍后的隐私过滤期间可触发特定隐私规则,并且允许所触发的隐私规则完成相关联的行动。其他网络会话中的用户可能从不将信用卡号输入网页中,因此防止一些隐私规则完成其相关联的行动。
[0082]线344示出在9:00am和10: OOam之间的某个时间对于隐私规则#3的完成率的显著增加。直到9:30am左右,隐私规则#3的完成率在60%左右,并且在10:00am之后,规则#3的完成率增长到超过80%。完成率的增加可以指示隐私规则#3有问题。例如,对网页的修改可以导致规则#3无意地替换所有输入网页的数据。结果,隐私规则#3可能移除用于适当回放和分析捕获的网络会话所需的网络会话数据。
[0083]因此,线344识别与隐私规则#3相关联的潜在过滤问题。管理员同样可回放在10:00am之后捕获的一些网络会话,以确定规则#3是否正从捕获的网络会话数据过滤正确信息。
[0084]图9B示出隐私处理系统所显示的其他隐私度量。管理员可以决定调查隐私规则#3的完成率的变化。或者经由选择框302中的条目或者通过选择线344,隐私处理系统可以显示示出在网络会话期间使用的不同网络浏览器的安全度量的柱状图。例如,管理员可以选择选择框302C中的隐私规则#3,并且选择选择框302D中的浏览器。
[0085]作为响应,隐私处理系统可以显示各自与在捕获的网络会话期间可能已经使用的不同网络浏览器或网络应用相关联的不同柱状图350、352和354。例如,柱状图350可以与在移动设备上使用的移动网络浏览器或移动应用相关联,柱状图352可以与在个人计算机上使用的桌面网络浏览器相关联,并且柱状图354可以与个人计算机上使用的第二类型的桌面网络浏览器相关联。
[0086]第一实线柱状图可表示在9:00am对于隐私规则#3的完成率,并且第二虚线柱状图可表示在12:00pm对于隐私规则#3的完成率。柱状图352和354示出在9:00am和10:00pm之间与两个桌面浏览器相关联的完成率没有显著变化。这可以指示用两个桌面浏览器进行的网络会话和与浏览器相关联的隐私过滤正常运行。然而,柱状图350示出对于与移动浏览器相关联的捕获的网络会话,隐私规则#3的完成率从9:00am处的60%左右显著增加至10:00am的85%左右。
[0087]管理员同样可使用回放系统或其他软件来验证隐私规则#3正过滤捕获的网络会话中的正确信息。例如,回放10:00am移动浏览器网络会话的一些可确定隐私规则#3正过滤错误数据。测试算法可对于源自移动网络浏览器的数据不同地解释规则#3,使得不同地处理数据。
[0088]图10A-10C示出回放系统如何可确认捕获的网络会话数据的适当隐私过滤的示例。图1OA示出具有显示电子网页374的屏幕的移动设备370,所述电子网页374用于输入用于完成信用卡交易的个人信息。在此示例中,用户可输入姓名到姓名字段372A中,输入街道地址到地址字段372B中,输入城镇和邮政编码到城市字段372C中,并且输入信用卡号到信用卡字段372D中。如上所述,监控系统可以捕获输入字段372中的个人信息并将其发送到隐私处理系统。
[0089]图1OB示出隐私处理系统过滤捕获的网络会话数据之后的回放的网络会话。网络会话可在计算设备160上回放,并且可以回放电子网页374。网络会话数据的捕获和过滤可能在9:00am左右发生。图1OB可以表示信用卡号的仅仅前八位被用X替换的适当过滤的网络会话。
[0090]图1OC示出隐私处理系统过滤捕获的网络会话数据之后的第二回放的网络会话。捕获的网络会话数据的过滤可能在10:00am左右发生。图1OC可表示电子网页374中捕获的全部信息被用X替换的不正确过滤的网络会话数据。因此,回放系统可用于进一步调查并识别可能最初已经通过将隐私度量与隐私简档比较而识别的隐私过滤问题。
[0091]硬件和软件
[0092]图11示出可用于运行隐私处理系统并执行上述隐私处理操作的任何组合的计算装置1000。计算装置1000可运行在服务器客户端网络环境中的服务器或客户机的地位,或作为对等(或分布式)网络环境中的对等机器。在其他示例中,计算装置1000可以是个人计算机(PC)、桌面型计算机、个人数字助理(PDA)、蜂窝电话、智能电话、网络设备、或能够执行指定机器要采取的行动的指令1006 (顺序地或其他方式地)的任何其他机器或装置。
[0093]尽管仅示出单个计算装置1000,但是计算装置1000可包括单独或联合执行一组(或多组)指令以执行上述操作的任何一个或多个的装置或电路的任何集合。计算装置1000可以是集成控制系统或系统管理器的一部分,或可以提供为便携电子装置,其配置为与联网系统本地或经由无线传输而远程地接口。
[0094]处理器1004可包括中央处理单元(CPU)、图形处理单元(GPU)、可编程逻辑装置、专用处理器系统、微控制器、或可执行上述操作的一些或全部的微处理器。处理器1004可包括但不限于模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器
坐寸ο
[0095]上述一些操作可以在软件中实现,并且其他操作可以在硬件中实现。这里描述的操作、处理或方法的一个或多个可以通过与这里参照附图描述的装置、设备或系统相似的装置、设备或系统执行。
[0096]处理器1004可执行存储器1008、1010或1020的任一中存储的指令或“代码”1006。存储器也可存储数据。指令1006和数据还可经由网络接口设备1012,利用多个已知传输协议的任一个在网络1014上发送或接收。
[0097]存储器1008、1010和1020可以与处理装置1000集成到一起,例如布置在集成电
路微处理器等中的RAM或闪存。在其他示例中,存储器可包括独立装置,如外部盘驱动、存储阵列、或在数据库系统中使用的任何其他存储装置。存储器和处理装置可以可操作地耦合在一起或彼此通过例如I/O端口、网络连接等通信,使得处理装置可读取存储器上存储的文件。
[0098]一些存储器可以借助于许可设置而通过设计为“只读”与否(ROM)。存储器的其他示例可包括但不限于W0RM、EPR0M、EEPR0M、FLASH等,其可以在固态半导体器件中实现。其他存储器可包括移动部分,如传统的旋转盘驱动。所有这些存储器可以是“机器可读的”,因为它们可以由处理装置读取。
[0099]“计算机可读存储介质”(或替代地,“机器可读存储介质”)可包括所有前述类型的存储器、以及将来可能出现的新技术,只要它们能以计算机程序或其他数据的属性以所存储的信息可以由适当处理装置“读取”的方式至少暂时地存储数字信息。术语“计算机可读”可以不限于“计算机”的历史使用以暗示完整的大型机、迷你计算机、桌面型计算机、无线装置或甚至膝上型计算机。而是,“计算机可读”可包括可由处理器、处理装置或任何计算系统读取的存储介质。这样的介质可以是可通过计算机或处理器本地和/或远程可访问的任何适当介质,并且可包括易失和非易失介质以及可移除和不可移除介质。
[0100]计算装置1000还可包括诸如液晶显示器(IXD)或阴极射线管(CRT)的视频显示器1016、以及诸如键盘、鼠标、触摸屏等的用户接口 1018。计算装置1000的全部组件可以经由总线1002和/或网络连接在一起。
[0101]为了方便,操作可以描述为各种互连或耦合的功能块或图。然而,可以存在这些功能块或图可以等效地聚合在单个逻辑装置、程序或操作中而没有明显界限的情况。
[0102]已经描述和图示了优选实施例的原理,应当显而易见的是,可以在布置和细节上修改实施例而不背离这些原理。对于落入权利要求的精神和范围内的所有修改和变型要求权益。
【权利要求】
1.一种方法,包括: 通过处理装置,生成与从网络会话数据过滤信息相关联的隐私度量; 通过处理装置,从隐私度量生成隐私简档;以及 通过处理装置,使用隐私简档以识别从网络会话数据过滤信息的不规则性。
2.如权利要求1所述的方法,其中,从网络会话数据过滤信息包括:对网络会话数据应用隐私规则。
3.如权利要求2所述的方法,其中,生成隐私度量包括:标识在过滤信息时调用隐私规则的次数。
4.如权利要求2所述的方法,其中,生成隐私度量包括:标识隐私规则从网络会话数据过滤信息的次数的百分比。
5.如权利要求2所述的方法,其中,生成隐私度量包括:标识完成隐私规则所需的处理时间。
6.如权利要求1所述的方法,其中,从网络会话数据过滤信息包括移除、替换、遮挡、或加密信息的至少一个。
7.如权利要求1所述的方法,还包括: 标识隐私简档的阈值;以及 当隐私度量超过阈值时生成通知。
8.如权利要求7所述的方法,其中,阈值包括隐私简档的标准偏差。
9.如权利要求1所述的方法,其中,生成隐私简档包括: 标识用于从网络会话数据过滤信息的规则; 标识与规则相关联的隐私度量;以及 在合计时段上将与规则相关联的隐私度量周期性地合计在一起;以及 生成在合计时段上合计在一起的隐私度量的平均值。
10.如权利要求1所述的方法,其中,所述信息包括以下至少之一: 社会保障号; 密码; 信用卡号; 医疗信息;或 银行账户信息。
11.如权利要求1所述的方法,还包括:标识与各个网络会话相关联的隐私度量。
12.如权利要求1所述的方法,还包括:标识与网络会话的各个网页相关联的隐私度量。
13.如权利要求1所述的方法,还包括:标识与生成网络会话数据的网络会话中使用的不同网络浏览器相关联的隐私度量。
14.如权利要求1所述的方法,还包括: 标识与所标识的不规则性相关联的网络会话数据中的第一文档对象模型DOM ; 标识所述过滤没有不 规则性的网络会话数据中的第二 DOM ;以及 标识第一 DOM与第二 DOM之间的差。
15.一种设备,包括:处理装置,被配置为: 对网络会话数据应用隐私规则; 标识应用到网络会话数据的隐私规则的统计;以及 使用所述统计来生成用于应用到网络会话数据的隐私规则的隐私简档。
16.如权利要求15所述的设备,其中,隐私规则被配置为从网络会话数据中移除个人信息。
17.如权利要求15所述的设备,其中: 隐私规则包括测试和行动;以及 统计标识调用测试的次数和对网络会话数据应用行动的次数。
18.如权利要求15所述的设备,其中,所述统计标识处理装置对网络会话数据应用隐私规则所需的时间量。
19.如权利要求15所述的设备,其中,处理装置还被配置为: 标识在网络会话数据中应用隐私规则的网络会话和网页;以及 生成对于网络会话和网页的统计。
20.如权利要求15 所述的设备,其中,处理装置还被配置为: 标识与网络会话数据相关联的网络浏览器;以及 生成对于网络浏览器的统计。
21.如权利要求15所述的设备,其中,处理装置还被配置为: 标识对于隐私简档的阈值; 将对于隐私简档的新统计与对于隐私简档的阈值进行比较;以及 标识超过阈值的新统计。
22.—种设备,包括: 监控系统,被配置为在网络会话期间捕获网络会话数据;以及 隐私处理系统,被配置为: 从网络会话数据中至少过滤一些个人信息; 生成与从网络会话数据中过滤个人信息相关联的隐私度量;以及 从隐私度量生成隐私简档。
23.如权利要求22所述的设备,其中,隐私处理系统包括: 隐私规则解析器模块,被配置为应用从网络会话数过滤个人信息的规则;以及 隐私建档器,被配置为合计隐私度量以生成隐私简档。
24.如权利要求22所述的设备,其中,隐私处理系统还包括隐私事件处理器,被配置为: 将应用到新网络会话数据的规则的新隐私度量与隐私简档比较;以及 标识在隐私简档的阈值以外的新的隐私度量。
25.如权利要求22所述的设备,其中,隐私处理系统被配置为: 使用隐私规则以从网络会话数据中过滤个人信息; 标识在过滤个人信息时调用隐私规则的次数; 标识隐私规则过滤个人信息的次数;以及 标识隐私处理系统执行隐私规则所需的时间量。
【文档编号】H04L12/24GK103825774SQ201310503035
【公开日】2014年5月28日 申请日期:2013年10月23日 优先权日:2012年10月23日
【发明者】T.S.鲍威尔, N.卡斯皮, R.I.韦尼格, W.赫达, G.迪特里希 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1