用于电子文档审查的系统和方法_3

文档序号:9756917阅读:来源:国知局
d ; (19)ChatRoomID ; (20)ChatRoomPerspective ; (21)ChatAttachmentCount ; (22)ChatRoomType ; (23) ChatStartUTC ;以及(24)由通信软件捕获的任何其它有用的元数据类别。本领域中的普通 技术人员将认识到,这些类别并不旨在为限制性的,且系统和方法可被配置成处理涉及聊 天文字记录的内容和环境的额外的信息。
[0049] 多个聊天文字记录一般被存档在从本地发消息系统中收集的单个电子通信源文 件中。以结构化非电子邮件格式的源文件被收集并解析成用于每个聊天记录的单独的XML 文件以创建对话特定XML文件。在一个实施方式中,通过提取相应于特定的PCHAT标识值 的所有数据结构并将数据结构存储在单独的对话特定XML文件来解析结构、非电子邮件存 档电子通信源文件。在单独的XML文件中的数据结构的存储实现由电子发现审查软件根据 各种标准动态搜索和过滤。用于每个对话特定文件的元数据元素被存储到关系数据库中的 单独的数据库字段以实现在电子发现审查软件内的搜索。
[0050] 图7所示的实施方式示出以电子邮件格式显示的电子发现数据。为了以电子邮件 格式显示,存档电子通信源文件可被收集并分离成用于每个聊天文字记录的单独的对话特 定PST文件。将对话特定文件以电子邮件格式显示在审查者计算设备101上。除了消息 内容以外,PST文件还包括进一步描述在特定会话期间被传输或张贴的通信环境的元数据 (然而,当源文件是结构化、非电子邮件格式时,更少的元数据被收集)。为了说明,在图7 中所示的对话特定PST文件示出每个通信参与者的名字、相关商业实体和屏幕名称和张贴 每个消息的日期和时间。对话特定PST文件还包括与某些事件有关的元数据(例如,当参 与者发起、终止或查看通信会话)以及通常涉及通信会话的信息(例如,通信会话开始和结 束时间以及在会话中的参与者的数量)。
[0051] 与XML文件格式相比,PST文件格式支持明显少的元数据类别。在图6中示出 由PST和XML文件格式支持的元数据类别的比较。此外,PST文件是"平面的",因为消 息内容在电子邮件主体中被存储为无特征文本存储而没有任何区分的标签、密钥或字段 结构。因此,消息内容和相关元数据不能如同XML文件一样被动态地搜索和过滤。在图 8-12中示出对包含在XML文件内的通信数据的显示、搜索和过滤。技术人员将认识到,在 附图中示出的示例性实施方式并不旨在为限制性的,且创造性系统和方法可处理以任何结 构化数据格式存储并使用各种通信软件平台创建的电子文档,各种通信软件平台包括但 不限于 Microsoil Out丨〇〇k(?、Bloomberg PrQlfessi.Oiial?服务终端或 Thomson Reuters Eikon Messenger?。
[0052] 审查者可通过使用唯一的用户名和密码登录到系统内来安全地访问提供者的系 统150。审查者将对话特定XML文件载入系统内,且将文件内容显示在诸如图8所示的显示 屏的图形用户界面中。通信的内容202连同屏幕名称206和张贴每个消息的参与者的全名 204以及张贴消息的日期和时间一起被显示在阅读窗格210中。显示屏还包括提供涉及通 信会话的基础信息的头部窗格220,基础信息包括唯一会话标识号222、发起和终止会话的 日期和时间、会话的总持续时间及参与者数量2 24。
[0053] 审查者可通过从阅读窗格210过滤某些噪声元素来使审查过程合理化,噪声元素 包括显示参与者何时进入或离开会话的事件条目、历史查看条目(例如,显示参与者何时 进入会话以只查看或请求消息历史的事件条目)或保密免责声明。审查者可通过将在过滤 结果窗格230之下的滑动输入232切换到断开位置并选择应用功能234来过滤掉这些元 件。可通过选择重置功能236来将过滤器恢复到默认接通或断开设置。
[0054] 系统通过搜索用于相应的消息内容或元数据类别的对话特定文件来过滤噪 声。参考下面的简化例子可更好地理解过滤。如果审查者将显示条目和退出滑动输 入232切换到断开位置,则系统可搜索诸如图3所示文件的对话特定文件,以找出所有 ParticipantEntered和ParticipantLeft元数据标签。系统然后从阅读窗格210移除相应 的事件条目而不修改对话特定文件且不需要存储对话特定文件的预过滤版本。类似地,如 果审查者将显示全部免责声明滑动输入232切换到断开位置,则系统搜索对话特定文件的 消息内容以定位保密免责声明的所有实例。系统然后从阅读窗格210移除相应的条目。
[0055] 在一个实施方式中,系统和方法使用可被填入已知的保密免责声明或其它数据的 项目特定噪声文件。例如,如果消息张贴以文本"***DISCL"或"保密声明"开始,系统可将 整个消息张贴处理为噪声。系统使用来自项目特定噪声文件的数据来搜索、识别并过滤来 自对话特定文件的噪声,从而可将噪声从阅读窗格210移除。可在发现审查项目声明周期 期间的任何时间更新项目特定噪声文件。这具有创建"渐进学习系统"的优点,"渐进学习 系统"中在通信数据收集并最初处理初始存档的时间不需要预先知道噪声。
[0056] 在参与者窗格240之下显示的列表条目中识别通信会话的参与者,并在公司窗格 250之下的列表条目中单独地识别与参与者相关的商业实体。列表条目可以可选地显示诸 如参与者屏幕名称("登录")和由每个参与者或商业实体张贴的消息的数量("帖子计数") 的其它有用的信息。参与者通过如图7所示在阅读窗格210中紧靠参与者名字显示商业实 体名称或通过对每个参与者/商业实体对进行颜色编码来与他们的相应商业实体相关联。
[0057] 通过提供紧靠每个参与者列表条目的指示器242对参与者/商业实体对进行颜色 编码,指示器242与紧靠相应的公司列表条目的指示器252是相同的颜色。显示器还可包 括紧靠在阅读窗格210中参与者的每个张贴的颜色编码指示器208。所以,例如如果参与 者Ron Smith与实施诉讼商业实体相关联,则紧靠相应的列表条目的指示器242和252可 被渲染为橘黄色的。橘黄色的指示器208也可被显示在紧靠由Ron Smith张贴的每个消息 的阅读窗格210中。
[0058] 审查者可以可选地在聊天文字记录中只显示由特定的参与者或商业实体张贴的 那些消息。为了实现参与者过滤,审查者选择图8所示的参与者过滤功能244以显示图9 所示的所有参与者窗口。所有参与者窗口显示用于每个参与者的单独列表条目和参与者的 全名、屏幕名称("登录")、相关商业实体("公司")和由那个参与者张贴的消息的数量 ("帖子计数")。在所有参与者窗口上,审查者选择或取消选择相应于参与者的复选框310 以移除或显示在阅读窗格210中的参与者的帖子。当选择或取消选择复选框310时,系统搜 索对话特定文件以找到包含相应于该参与者的识别信息的元数据标签的所有实例(例如, Login、FirstName、LastName、UUID和FirmNumber标签)。当选择或取消选择期望的参与 者时,审查者选择应用功能312以关闭所有参与者窗口并应用过滤器。
[0059] 在图8所示的显示屏的元数据选项卡260之下显示与聊天文字记录相关的元数据 的概述。审查者可通过选择浏览全部元数据功能262以显示图9中所示的文档元数据窗口 来访问完整的元数据。审查者也可选择使用在编辑定制字段选项卡264上可得到的功能而 显示或隐藏的元数据类别。
[0060] 在头部窗格220中显示基础会话信息、对参与者/商业实体对进行颜色编码、噪声 过滤、提供对元数据类别的访问和显示消息计数信息帮助审查者快速评估对话特定文件的 潜在相关性以及潜在工作流问题。作为例子,电子发现可涉及要求按小时费用付费的多个 审查者。为了建立有效的工作流,特定的审查者可被指定基于每小时费率、审查者速度或审 查者技能连同其它标准来审查某些会话特定文件。审查者可通过选择图8所示的我的任务 280选项卡来访问所指定的文档以审查。
[0061] 可通过参考聊天持续时间和参与者计数224元数据字段根据数据量快速分类聊 天文字记录。可将具有较长的持续时间或较多的参与者的聊天文字记录分配给较快的审查 者或具有较低的每小时费率的审查者。作为另一例子,如果已知审查者特别熟悉源于特定 参与者或商业实体的通信数据,则可将包含源于该参与者或实体的最大量的消息帖子的对 话特定文件分配给具有最相关的技能的审查者。审查者可利用在过滤结果窗格230、公司窗 格250和参与者窗格240之下的过滤功能以使数据显示合理化并且只分析来自特定参与者 和商业实体的那些消息。
[0062] 方法和系统可包含促进在文
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1