用于电子文档审查的系统和方法_2

文档序号:9756917阅读:来源:国知局
与法律程序有密切关系并可被用于使审查过程 合理化的有价值的元数据的损失。这是因为电子邮件格式缺乏对于被存储在本地存档系统 中的有价值的元数据所必需的字段定义,例如"消息交互类型"或"UUID"或参与者的"账 号"。因此,收集、处理和审查以电子邮件格式的聊天文字记录可削弱电子发现经验。
[0035] 此外,聊天文字记录常常包括构成不相关的"噪声"的很多消息。噪声包括例如指 示某些事件(例如,参与者进入或离开通信会话)的发生的消息帖子、诸如免责声明文本的 自动化消息帖子(例如,由聊天发消息系统输入到聊天文字记录内且一般警告提防前视声 明的低价值重复文本内容)、以及与法律程序或调查没有密切关系的实质性消息帖子。在一 些情况下,超过90%的聊天文字记录内容构成噪声。结果是,审查者可能在筛选通信数据以 识别并分析相关信息时遇到困难。这导致严重影响审查的效率和准确度的审查者的疲劳。
[0036] 本发明的系统和方法通过以促进方便、有效和可靠而没有元数据的损失的审查的 格式向审查者呈递电子通信数据来克服这些缺点。系统将以完整的结构化形式收集并包括 所有有价值的元数据的存档通信数据解析成用于每个聊天文字记录的分开的对话特定文 件。对话特定文件被呈递给审查者,并可根据诸如通信参与者的身份、通信会话持续时间或 参与者的数量的许多不同的标准来动态地被搜索和过滤。以这种方式,审查者可专注于聊 天文字记录、参与者或与需要电子发现审查的法律程序或调查最相关的其它信息。
[0037] 系统和方法还允许审查者通过在审查期间对适当的结构工作流应用元数据来使 审查过程合理化。为了说明,审查者常常在每小时费用基础上执行发现审查。可根据在会 话中的参与者的数量或按照会话持续时间来将对话特定文件分类。可将包含大部分数据 (即,大部分参与者或最长持续时间)的会话特定文件分配给具有最低的每小时费用率的 审查者。
[0038] 转到图1所示的示例性实施方式,根据本发明的一个实施方式的系统通常包括与 审查者相关的至少一个计算设备101和与电子发现提供者相关的计算机系统150。电子发 现提供者计算机系统150可包括提供者服务器106、电子文档数据库104、防火墙107和由 提供者合伙人(未示出)操作的一个或多个计算设备。
[0039] 图1所示的系统并不旨在为限制性的,且本领域中的普通技术人员将认识到,可 使用其它适当的硬件或软件配置来实现本发明的系统和方法。例如,电子发现提供者计算 机系统150可以只利用由一个或多个计算设备实现的单个服务器或单个计算设备可实现 提供者服务器106、电子文档数据库104、防火墙107和/或审查者计算设备101其中的一 个或多个。此外,单个计算设备可实现本文所述的方法的多于一个步骤;可由多于一个计算 设备实现单个步骤;或可使用对步骤的任何其它逻辑划分。在一个实施方式中,系统由使用 一个或多个合伙人或代理以进行电子发现审查的法律程序或调查方维持。使用这个实施方 式,单个计算设备可实现提供者服务器106和审查者计算设备101。
[0040] 任何适当的计算设备可被用于实现审查者计算设备101或电子发现提供者计算 机系统150的部件。审查者计算设备101、提供者服务器106和合伙人计算设备可包括经由 总线子系统与多个外围子系统通信的处理器。这些外围子系统可包括存储子系统、用户界 面输入设备、用户界面输出设备、通信系统和网络接口子系统。通过处理存储在一个或多个 存储设备上的指令,处理器可执行本方法的步骤。可使用包括光存储设备、磁存储设备或固 态存储设备的任何类型的存储设备。
[0041] 通常,审查者计算设备101访问电子发现提供者计算机系统150或在互联网120 上以正常方式-例如,通过诸如局域网("LAN")或广域网("WWAN")130的一个或多个远 程连接基于802. 11标准或通过蜂窝服务提供者提供的数据连接彼此通信。这些远程连接 只代表可对互联网120做出用于访问电子发现提供者计算机系统150或与其它审查者计算 设备101通信的多个连接。
[0042] 提供者服务器106和审查者计算设备101包括一个或多个集成软件应用,一个或 多个集成软件应用提供图形用户界面、允许与其它电子设备的通信和通常实现本文公开的 方法的步骤。在图7-12中描绘示例性用户界面显示屏。用户界面屏幕可包括用于显示信 息并接受来自用户的输入的特征,例如文本框、数据字段、超链接、下拉菜单、复选框、单选 框等。本领域中的技术人员将认识到,在附图中所示的示例性功能和用户界面显示屏并不 旨在为限制性的,且集成软件应用可包括其它显示屏和功能。
[0043] 电子发现数据被收集并存入到电子文档数据库104内。可将电子发现数据以可扩 展标记语言("XML")格式、个人存储表格("PST")格式、MME RFC 822( "EML")格式或 本领域中的普通技术人员已知的任何其它适当的格式存入数据库104内。由与发现服务提 供者服务器106集成的发现软件应用访问发现数据。发现软件应用规定用于显示在审查者 计算设备101上的电子发现数据的格式,且发现数据被传输到审查者计算设备101以审查 和分析。
[0044] 在图2中描绘如为聊天参与者显示的示例性即时发消息通信,且在图3-6中示出 的实施方式使用由标记结构构成的多层嵌套数据结构示出的以XML格式的即时消息通信 数据。标记结构以由开角括号("〈")和闭角括号(">")围住的属性组成的开始标签开 始。标记结构以由在跟随有正斜杠("〈/")的开角括号("〈")和闭角括号(">")内围 住的属性组成的结束标签结束。属性对应用于即时消息的元数据类别的标记。元数据以及 消息内容的实质由开始和结束标签作为书挡。
[0045] 参考图3所示的例子可更好地理解以XML格式的即时通信消息的结构,图3示出 当参与者发起并然后终止通信会话(即,进入和离开聊天室)时产生的数据。用唯一的会 话标识号来标记每个聊天文字记录。对话标识号在图3中被显示为PCHAT数据字段,并被 围在RoomID和ConversationID开始和结束标签内。
[0046] 当发起或终止通信会话时,即时消息软件捕获被存储为元数据的各种信息,例如, 包含:(1)在本地时间和协调世界时("UTC")中发起或终止会话时的日期和时间;(2)指示 参与者进入或退出聊天室的事件标签(即,"ParticipantEntered"和"ParticipantLeft" 属性)的时间标记;以及(3)识别信息,例如参与者的屏幕名称、名、姓、唯一用户标识号 ("UUID")、商号名称(即,用于与参与者相关的公司实体的标识号)、账号、公司名称、即时 发消息账户电子邮件地址和公司电子邮件地址。参与者信息被包含在父母用户标签和相应 的孩子子标签内:LoginName (即,用于参与者的简写屏幕名称)、FirstName、UUID等。当通 信会话终止时,终止事件连同参与者识别信息一起被记录在"ParticipantLeft"标签内,从 而使得可将终止事件链接到特定的参与者。
[0047] 在图4中以XML格式显示在两个参与者之间的示例性即时消息对话。消息内容被 围在父母"消息"标签和"内容"标签内。消息内容连同每个消息的日期和时间和发起消息 的参与者的标识信息一起被记录。在一些情况下,当发起通信会话或传输消息时,通信软件 将自动产生并显示某些信息。例如,图5示出保密免责声明的自动产生和显示。通常将这 样的免责声明附加到很多职业服务提供者和商业企业的发出的外部通信。免责声明被记录 在XML文件的消息和内容标签内。
[0048] 除了上面所述的类别以外,所公开的系统和方法还可处理描述通信的实质和环境 的各种元数据类别。示例性元数据类别在图6中被示出并包括:(l)ChatAttachmentCount ; (2)ChatAttachmentLogin ; (3)ChatAttachmentName ; (4)ChatCompany ; (5) ChatCompanyCount ; (6)ChatDomainCount ; (7)ChatDomainNames ; (8)ChatDuration ; (9) ChatEndUTC ; (10) ChatFirmCount ; (11) ChatFirmNumber ; (12) ChatMessageCount ;(13) ChatPartipantCount ; (14)ChatParticipantEmail ; (15)ChatParticipantLogins ;(16) ChatParticipantNames ; (17)ChatRoomDuration ; (18)ChatRoomEn
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1