基于网络的模型中动态收集信息和定向广告的系统和技术的制作方法

文档序号:7618747阅读:399来源:国知局
专利名称:基于网络的模型中动态收集信息和定向广告的系统和技术的制作方法
技术领域
本发明一般涉及基于通信媒介的因特网环境中的信息检索技术,特别涉及实时信息收集与管理的系统和方法。
因特网作为一种广义的通信媒介,其重要性从一开始就是很清楚的。由于因特网在声望上已经波浪汹涌,已经开始按照非传统的方法证明自己,其范围从来还没有被充分预料到。尤其是,随着因特网用户数目呈指数上升,基于交互式的实时网络,例如在因特网“聊天”中所看见的,已经作为一种令人惊异的流行和深入的通信方式出现。
在因特网上,术语“聊天”被用来指与同时使用因特网的其它人“谈话”的行为。典型地,“聊天”包括在因特网上占有相同空间(即,被连接到相同的服务器或者相关的服务器组)的一组用户中间,实时地进行信息广播、多点播送或者单点播送。这些用户自己可以位于不同的地理位置,并且可以使用任何数量的不同的客户程序、浏览器,或者因特网服务供应商(“ISP”)进行连接。关键的一点是,单一的因特网站点(“聊天站点”)作为所有信息的一个公共的储存库。聊天可以是正在进行的,或者是预定的,而用户可以随意进入和离开聊天站点。
通常,大多数聊天被集中在某个特殊的话题或者主题。给定的聊天站点可以是一个主机对多个聊天,每个聊天对应同时发生在不同“聊天室”的一个不同的主题,聊天室是在更广的聊天站点之内被基本上专门化的子领域。因此,在相同聊天室内的参与者一般都共享将其带到一起的某些共同兴趣或者关注的东西。
聊天由在线服务(诸如美国在线)、公告牌服务和万维网站主持。许多网站就是专门为实施聊天而存在的。大多数聊天站点使用称为“因特网中继聊天”(IRC)的一个流行的协议,用于客户-服务器握手和随后的客户-服务器和客户-客户相互作用。IRC首先在1993年5月发行的RFC1459中公开。除交换正文信息之外,聊天也可以包括使用声音和图表,只要带宽容量和适当的编程是可行的。
当前,大多数聊天活动看来似乎是非正式和消遣性的。然而,专业人员交换有价值的意见并且进行建设性对话的专门通道正在变得日益流行。
不管使用因特网的实时通信出现开始流行,用于商业广告目的的这种范例的含义在很大程度上被忽略。网络上的大多数广告由广告商预先定义和预先考虑。然而,在一些实例中,已经努力动态地改变广告,以便增加其对用户的适当性。这种情况的最值得注意的例子是搜索引擎。一旦用户输入搜索查询,许多搜索引擎将动态地改变广告标识的内容,反映以某种方式与用户的查询有关的产品。例如,搜索串“计算机部件”的用户,可能得到被显示为“康柏”或者“戴尔”的广告,因为这些公司制造计算机硬件。虽然已经采取了一些初步的措施来更好地定制在线广告,以便改进其对用户的适当性,但还没有开发出一般技术,以便在因特网上的实时用户交互的环境中动态地实现这一功能。
虽然自动的网络爬行工具被广泛地用于在一定基础上对内容进行索引和总结,这些工具的范围在很大程度上被局限于“静态”数据。还没有开发出一般的技术来处理更多的“动态”数据,这些数据实时地经常变化,例如因特网聊天会话的情况。在线聊天的声望迅速增加表明,聊天已被作为在在线社区的成员中间通信的主流形式。因为这样,希望能开发这样一种技术,使之有可能方便地监视并且归档聊天会话的内容,并且使后来的分析能够访问这种数据。而且,还希望能够以在线方式提供广告,对聊天会话的内容作出响应。
针对现有技术的这些问题和缺陷,因此,本发明的一个目的是提供一种方法和系统,从诸如因特网的计算机网络上的实时通信中收集动态的信息。
本发明的另一个目的是提供一种方法和系统,分析从诸如因特网的计算机网络上的实时通信中收集的动态信息。
本发明的进一步目的是提供一种方法和系统,对从诸如因特网的计算机网络上的实时通信中收集的动态信息,给出响应的信息。
本发明的其他目的和优点,一部分是很明显的,而另一部分可以从说明书中得出明显的结论。
上述和其它的目的和优点可以从本发明中得到,这对于熟悉这一技术的人来说是很明显的。首先,本发明针对于一种方法,对来自至少在第一和第二客户或用户之间的计算机网络上的实时通信的实时信息,自动地进行收集、总结和索引。在最佳实施例中,该方法包括连接服务器和站点,通过使用传输控制/网络(例如因特网)协议(“TCP/IP”)打开某个基于套接口(socket)的连接,发生实时通信。
在最佳实施例中,使用TCP/IP打开基于套接口的连接,包括打开到服务器的输入和输出套接口,对服务器发送第一命令要求连接,从服务器中接收一条唯一的会话识别信息,发送确认唯一的会话识别信息给服务器,把登记信息发送到服务器,该信息包括用户名称、主机名称、服务器名称、真正的名字和真正的姓,并且把第二命令发送到服务器,指定加入的聊天室。连接服务器上的聊天室站点并且监视实时通信。在最佳实施例中,至少一块通信数据从实时通信中被检索并且被处理。该处理可能包括从通信数据的块中提取至少一个参数,该参数包括正文、标题、报头、电子邮件地址或者统一资源定位器。通过用标记标明参数对数据进行总结。在最佳实施例中,产生数据的可扩展置标语言总结,可扩展的置标语言标记被用来描绘参数。
在最佳实施例中,该方法进一步包括将被总结的数据存储在数据库中。更为理想的是,该数据库被调节以适应对与通信数据块有关的至少一个关键字的查询。在最佳实施例中,根据出现的关键字询问数据库,并且,与该关键字相应的数据库记录被识别和显示。
在最佳实施例的一个方面中,在对通信数据块进行总结之后,至少一个在实时通信期间被检测的关键字被识别。对关键字的出现分析被进行总结的数据,然后把从与该关键字有关的信息数据库中选择的信息插入到可由客户检测的实时通信的网站上。信息可能包括图象标识、视频流或者音频表达,并且也可能为某个具体客户而被个性化。在最佳实施例中,一个信息可以被映射为多个关键字,而一个关键字也可能被映射为多条信息。
在另一个方面,本发明针对于一件制造品,包括具有体现在其中的计算机可读程序代码装置的计算机可利用的媒介,使得计算机能够自动地收集、总结和索引在至少第一和第二用户之间的计算机网络上的实时通信的实时信息。在这件制造品中的计算机可读程序代码装置包括计算机可读程序代码装置,使得计算机至少能够连接正在发生实时通信的一个服务器和网站,监视该实时通信,从该通信中检索通信数据块,从该通信数据中处理和提取至少一个参数,对数据进行总结并且为参数加标记。在最佳实施例中,这件制造品进一步包括计算机可读程序代码装置,使得计算机能够把被总结的通信数据块存储在数据库中,对出现的关键字查询该数据库,识别对应被总结的数据块和关键字的数据库记录,并且在客户可视的屏幕上显示该数据库记录。
在最佳实施例中,该件制造品进一步包括计算机可读程序代码装置,使得计算机能够识别在实时通信期间将被检测的关键字,并且对出现的关键字分析被总结的数据。该件制造品最好进一步包括计算机可读程序代码装置,使得计算机能够从信息数据库中选择与某个关键字相关的信息,并且把信息插入到可以由客户检测的实时通信中。
在另一个方面,本发明被指向一个计算机程序产品,该产品包括计算机音乐媒介,具有体现在该媒介中的计算机可读程序代码装置,使得计算机对来自第一和第二客户之间的计算机网络上的实时通信的实时信息进行自动收集、制作总结和索引。在最佳实施例中,该计算机程序产品具有计算机可读程序代码装置,使得计算机至少能够连接正在发生实时通信的服务器和网站,监视该实时通信并且检索通信数据块,处理该数据并且从该数据中提取至少一个参数,对该数据制作总结并且对参数加标记。该计算机程序产品最好进一步包括计算机可读程序代码装置,使得计算机能够把已制作总结的通信数据块存储在数据库中,对出现的关键字查询该数据库,识别对应该关键字的数据库记录,并且在客户可视的屏幕上显示该数据库记录。在最佳实施例中,该计算机程序产品进一步包括计算机可读程序代码装置,使得计算机能够识别在实时通信期间将被检测的关键字,对出现的关键字分析被制作总结的数据,从与该关键字相关的数据库中选择至少一个信息,并且把该信息插入回到实时通信的网站中,这样,该信息就可以被客户检测。
在更进一步的方面,本发明针对一个方法,对计算机网络上的实时通信环境中的至少一个客户指定一个信息。在最佳实施例中,该方法包括连接到网络上的实时通信的一个网站,监视出现关键字的通信,产生对应该关键字的信息,并且插入该信息到该实时通信的网站上,该信息可由该通信中的至少一个参与者检测。
虽然本发明可以在本地的内部网上使用,但更适宜针对因特网的使用。
认为是本发明的新颖和基本特性的本发明的特征,将在权利要求书中提出。这些图仅仅是为了描述目的,而不是按比例绘制的。本发明,其组织和操作方法,参考以下结合附图的详尽描述,可被最好理解

图1是本发明典型的组成部分的一个示意图。
图2是本发明典型的图表显示的图示。
图3是本发明用于定向广告时的典型组成部分的一个示意图。
图4是本发明组成部分典型结构的模块图。
在对本发明最佳实施例的描述中,这里将引用附图1-4,其中,相同的参考号指本发明相同的特征。本发明的特性在图中不一定按比例显示。
本发明提供一种方法和装置,用于对来自因特网上实时通信的实时信息,诸如因特网聊天会话,进行自动收集、制作总结、加索引,并且使得该数据便于立即分析和使用,诸如定向广告。由于本发明提供即时(live)信息选择和分析,为方便起见,本发明在这里可以被称为“LISA”。
监视、归档并且使用在线聊天会话内容的能力,对于各种个体和组织潜在地具有巨大的重要性。本发明将提供爬行、加索引和对数据制作总结的基本功能。使用本发明,感兴趣的个体和组织将能够实施详尽和定制的分析,提供新颖和有价值的洞察力。例如,本发明的若干用法被预见如下。
1.父母的监督没有时间亲自监视他们的孩子聊天对话的担心的父母,可能对搜索使用本发明归档的数据中的某些关键词感兴趣,以便理解这些谈话的主题。
2.动态广告本发明为在线广告商提供新颖和令人兴奋的机会。本发明将使广告商具有动态地监视在任何给定的聊天室中进行的谈话的能力,并且能够显示与这些谈话的主题匹配的广告标识,因此,引起用户更大的注意和兴趣。例如,诸如“小汽车”、“汽车”、“驾驶”、“敞篷车”、“小轿车”等关键词的突然发生,可能对汽车制造商发出信号现在是显示敞篷汽车的特定销售标识广告的一个机会。从聊天参与者的角度,在那个特殊的瞬间,该广告将具有更大的的相关性,并且,他们将被激发对其给予更大的关注。
3.个人电子邮件地址和URL检索本发明将使收集并且注释在线聊天者愿意公开的个人电子邮件地址和统一资源定位器(“URL”)成为一件轻而易举的事情。本发明可以被构造为,当索引和总结所收集的数据时,摘录这样的信息。
4.推断专业观点通过本发明确定由行业的专业人员频繁点击的专门聊天室,就可能监视,并且可能参考在当前的主要问题上专家的意见。
5.推断一般的公众舆论著名的公司和组织可以把本发明用于由各种用户频繁点击的一般的兴趣聊天室,以便能够看到一般公众议论他们什么(如果有的话)。例如,某个公司可能希望看到人们如何评价其对另一个公司所提供的收购。在这项应用中,本发明可以被构造来检索所有论及两个公司的名称的所有聊天信息。
上述仅仅是本发明所能实现的功能的一个小样本。无疑,随着本发明赢得声望并且被广泛地采用,许多新的和令人兴奋的用途将使之得到证明。
如图1所示,首先,本发明可能典型地包括下列的组成部分A)用户界面-10B)连接和收集管理器-12C)索引管理器-14D)总结管理器-16E)数据库管理器-18F)查询管理器-20除非有其他的注释,术语“用户”指的是本发明的操作员和操作员的计算机,而术语“客户”指的是实时在线通信中的人类参与者和参与者的计算机。
每个典型的LISA系统组成部分的功能如下A)用户界面10用户界面10是将直接与用户相互作用的系统的组成部分。在本发明和用户之间的所有相互作用都由用户界面10作为媒介。用户界面10负责从用户中得到至关紧要的配置参数,并且适当地初始化系统的其他组成部分。
用户界面10将提示用户回答服务器22的地址,感兴趣的实时通信就在该服务器上进行。通过使用传输控制协议/因特网协议(“TCP/IP”)的基于套接口的连接,用户有选择地使用超文本传输协议(“HTTP”)指定将要被访问的URL,或者可能简单地选择给出将被直接访问的因特网中继聊天(“IRC”)服务器的地址。根据用户的选择,用户界面10将自动提示用户输入建立该连接所需的所有其它有关的参数。例如,用户可能被提示输入屏幕名,由此,本发明可以用聊天服务器登记,如果服务器22要求这样一种说明,以及其它这样十分重要的信息。
用户界面10还将允许用户有选择地定制索引和总结操作,并且根据用户的爱好对这些操作进行个性化。例如,用户可以希望明确地指定应该被包含在某个总结中的属性,并且扩大或者取消这些缺省选择项。用户还可以利用该用户界面10来定制数据及查询结果的图形表示和格式。
B)连接和收集管理器12连接和收集管理器12是本发明的软件组成部分,负责实际连接所感兴趣的服务器,然后收集相关的信息。
根据用户的规格说明,连接和收集管理器12可以采用以下的两种方法之一来连接所感兴趣的服务器221)使用HTTP的基于URL的连接在这种情况下,用户将指定一个形式为http://......的串。连接和收集管理器12可以使用Java联网工具来打开对该服务器的“URL连接”。在许多情况下,这将要求用户应该已经手工地登记到了该服务器,并且已经指定了用于启动连接的用户名和口令。
连接和收集管理器12将在某种程度上仿效网络浏览器(这应该是使用HTTP连接到服务器的正常方法)。为了实现这个功能,连接和收集管理器12将拦截从服务器(认为它连接到浏览器)发送的所有“cookies”,并且将提取这些cookies的名字和值域。
“Cookies”是服务器(或者在服务器上运行的小服务程序)把信息发送到客户计算机以便存储以及服务器以后从该客户计算机中接收其数据的一种方法。小服务程序通过把字段添加到HTTP反应标题把cookies发送到客户。通过把字段添加到HTTP请求标题,期待客户(或者客户计算机)自动返回cookies。每个HTTP请求和反应标题被命名,并且具有单一的值。例如,cookie可以具有名为“chatRoom”的标题,其值为“政治”,对该调用应用表明用户想要加入称为“政治”的聊天室。对于所有对服务器的未来的HTTP请求,连接和收集管理器12将把适当的字段添加到HTTP请求标题,从而仿效浏览器应用。
为了成功地连接,连接和收集管理器12将有可能需要指定服务器已知的并且对应某个存在帐户的用户名称和口令。连接和收集管理器12然后将需要指定想要加入哪一个“聊天”室。连接和收集管理器12指定这些参数的确切方法将根据服务器的不同而变化,并且,如果希望基于URL的连接,连接和收集管理器12通常必须手工地被预先配置。这些参数将由连接和收集管理器12通过把cookie字段附加到HTTP请求标题而指定到服务器22上。因此,预先配置将通常要求用户指定这种cookies字段的名称和值,因为对于连接和收集管理器12来说,并非总是能够直接推断这些字段的名称和值。
例如,假设用户指令连接和收集管理器12打开与服务器http://www.wbs.net的基于URL的连接。此外,假设用户对使用屏幕名称“gaurav2000”和口令“ibmchat”连接被称为“talk.politics.misc”的聊天室感兴趣,在这种情况下,当连接和收集管理器12试图使用这些参数打开对http://www.wbs.net的基于URL的连接时,服务器返回多个cookie。连接和收集管理器12将细心收集这些cookie,提取其名称和值域,并且将其附加到所有未来的HTTP请求标题,最终产生的精细URL具有以下的形式http://chat9.go.com;6666/webchat3.so Room=talk,politics.misc&handle=gaurav2000&mu=142cadf11820bc29d2f7f8a90245851843fe83d885433892&chatmode=push&zipcode=95120&dd=00000000000000000000000&nofrills=l&fsection=output对该URL的连接允许连接和收集管理器12成功地听到所有在“talk.politics.misc”聊天室内所进行的谈话。对于所有其它用户,连接和收集管理器12看来似乎仅仅是另一个用户,具有屏幕名称gaurav2000.
2)使用TCP/IP的套接口连接使用HTTP的基于URL连接的限制是它不能对所有服务器一般化,并且可能要求增加用户配置。另外,在基于URL的连接模型中,聊天服务器可能坚持把小应用程序发送到连接和收集管理器12,因为在该模型中,连接和收集管理器12似乎是网络浏览器。在这样的情况下,基于URL的方法将不起作用,除非连接和收集管理器12的功能被扩展,以允许它接受并且执行与小服务程序通信的小应用程序。
使用TCP/IP的基于套接口的连接克服了基于URL方法的许多局限性,并且更为一般化。典型地,基于套接口的方法是本发明的最佳连接方法。
大多数因特网聊天服务器遵循因特网中继聊天协议。本发明的基于套接口的方法包括与服务器22的直接套接口连接,以及使用标准的IRC命令进行登记和连接。然而,用户仍然需要明确地规定所要连接到的服务器的名称、连接的端口(通常对IRC聊天服务器在范围6666-7000内)、LISA应该作为什么屏幕名称可以被见到、加入哪个聊天室,以及其它这样十分重要的参数。
在试图打开与服务器(比如说“chat.cnn.com”,在端口7000)的基于套接口的连接时,连接和收集管理器12将遵循以下的步骤序列(ⅰ)连接和收集管理器12将打开对服务器的输入和输出套接口,分别用于读写。
(ⅱ)连接和收集管理器12将试图将命令发送给服务器,表明它想要连接。例如,它可以将“NICK”信息发送给服务器。“NICK”信息被用来给客户一个绰号,或者改变以前的客户。“NICK”命令的句法是“NICK<期望的绰号>。”(ⅲ)一旦接收到“NICK”命令,服务器将变成认知连接和收集管理器12的存在。该服务器然后将唯一的会话标识符发送给连接和收集管理器12,该标识符将识别这个聊天会话的客户。具体来说,服务器将给连接和收集管理器12发送形式为“PING<唯一会话标识符>”的信息。
(ⅳ)从服务器中接收到“PING”信息之后,连接和收集管理器12必须以格式PONG<唯一会话标识符>的相应的“PONG”信息作出反应。这对该服务器确认该客户是活的,并且客户知道已经分配给它的唯一的会话标识符。
(ⅴ)紧接着在发送PONG反应之后,连接和收集管理器12必须与服务器完成“登记”,即使它知道如何识别自己(使用分配的唯一的会话标识符)。在已经从客户中接收到有效的NICK和USER命令之后,客户被认为是“已登记的”。这样,连接和收集管理器12现在将USER信息发送给服务器,以便完成登记(NICK信息已经在步骤(ⅰ)中被传送)。USER信息在连接开始时被用来指定某个新用户的用户名、主机名、服务器名和真名。因此,连接和收集管理器12将发送形式“USER<用户名><主机名><服务器名><真名><真姓>”的USER信息。
由于通过单独依赖USER信息散发其用户名对客户来说是很容易的,因此,许多聊天服务器将实际上试图使用“身份服务器”来检验客户的身份。如果用户连接的主机具有具备这种能力的服务器,用户名称被设置在“身份服务器”的回答中。在身份服务器不能验证时,某些聊天服务器将拒绝允许客户连接。其他的一些服务器将更为宽容,将简单地给客户的用户名加上前缀(“~”),或者其他这类的区分符号,说明该客户还没有被认证,并且允许该客户连接。
(ⅵ)在登记之后,连接和收集管理器12必须识别它所希望连接到哪个聊天室,通过发送一个JOIN命令给服务器。JOIN命令的语法形式“JOIN#<所需的聊天室名称>”。
假定该聊天室存在,服务器22现在将与连接和收集管理器12建立连接作为该指定聊天室中的一个聊天参加者,其中,它将以作为NICK命令一部分的指定的NICK名成为可视的。
一旦连接和收集管理器12成功地和服务器22连接,它将似乎是一个普通的客户,并且将能够听到由其它客户作为其实时通信一部分广播的所有信息。
根据用户说明,本发明可以完全被动,这种情况下它仅仅在听,实际上从不说什么。在这个事件中,这种不活动将很有可能被聊天服务器注意到。当聊天服务器发现某个客户超过一定的时间不活动时,或者“PING”(强制回应)该客户看它是否还是“活的”,或者将简单地删除该客户。这样,本发明可以被调节来或者用相应的“PONG”回答来响应“PING”请求,或者可以简单地检测它何时被注销,并且立即注册回来。这种优先选择可以由用户指定。当有一段时间(可由用户指定)听不到任何东西时,或者当从套接口或者URL读出时发生例外情况,意味着套接口或者UKL连接已不再存在,本发明可以检测它是否已经被注销。
应该注意,本发明向用户提供同时监视不同聊天室中的多个即时对话的选择。为此,用户必须为连接和收集管理器12指定多个“种子”,与主持这些聊天会话的服务器的URL或者地址相对应。其后,连接和收集管理器12将仅仅产生多条(同步化)线程,每条执行的线程对应一个唯一的对话。
连接和收集管理器12将直接把从服务器连接中接收到的所有聊天通信数据传输给索引管理器14。除聊天信息的正文之外,该数据将包括负责初始化该信息的个体的用户名称,以及由回答自动附加的任何参数。这些参数可能包括聊天者的电子邮件地址和他的“tagline”,客户可配置的文本行,给其它客户有关该客户的信息,可能包括超文本链接,或许对客户的网页,以及诸如客户照片的图表。
C)索引管理器14索引管理器14对通过连接和收集管理器12给它的数据进行索引。现有的索引技术将被用来摘录与每个信息或者聊天通信数据有关的正文、标题、标题、电子邮件地址和URL。索引操作的确切的细节可以由用户指定。索引管理器14将把被索引的数据传递到总结管理器16。
D)总结管理器16总结管理器16将对索引管理器14给出的被索引数据的产生用户定义的、人类可解释的可扩展标记语言(“XML”)摘要。这样一种摘要将包括XML标记,标记明确地描绘了电子邮件地址、URL、文本和用户所需要的出现在数据中的其他属性。总结管理器16可以将被总结的数据送给数据库管理器18。
E)数据库管理器18数据库管理器18将被总结的数据存储在某个后端数据库中。接着,数据库管理器18将向用户接口10通知已经被加到数据库26,并且用户界面10将更新其图形显示,因此,被实时总结的数据立即对用户可视。数据库管理器18负责管理所有的存储活动,并且引用被存储的数据,以便使之能被快速检索。
数据库管理器18可以具有被建立在其中的搜索引擎能力。这将使得无论何时用户启动某个搜索查询数据库管理器18都能够搜索数据库的内容,以便检索与查询管理器20的说明匹配的记录。
F)查询管理器20查询管理器20通过对一个或个多关键词发生的搜索,允许用户查询数据库的内容。当用户输入搜索查询时,查询管理器20将以关键词询问数据库管理器18。其后,数据库管理器18将返回一个列表,其单元是对数据库记录的指针(相对于物理记录本身)。查询管理器20然后将通知用户界面10,在一个单独的窗口中向用户显示这些结果,其中,在线通信的所有被总结的内容被显示。
而且,用户输入的查询将保持。这意味着随着数据库内容的变化,数据库管理器18将“记住”查询管理器20所做的最后查询,并且,如果任何新近添加数据与查询说明匹配,将通知查询管理器20。反过来,查询管理器20将通知用户界面10,动态地更新用户看见的图形的“查询结果”显示,因此实时反映了数据库的增加。
查询管理器20也可以被构造为同时处理多重查询。在用户指定超过一个查询的情况中,查询管理器20将仅仅产生多条(同步化)线程,每个执行的线程对应一个唯一的查询。在这种情况下,所有这些查询将保持。使用多条线程执行查询管理器20的精彩之处就在于这允许查询管理器20并行处理多重搜索查询,而不用中断系统其他任何部分的操作。
图2图示描述本发明可以提供给用户的典型交互式图表显示。例如,LISA被构造为监视聊天室中的实时通信。聊天室中的当前活动在屏幕100中被说明。如屏幕100中所看见的,可以由LISA监视和存储的典型参数是信息号102、时间104、用户名106、用户的电子邮件地址108、用户服务器的URL 110,以及信息正文112。在这个例子中,LISA在17∶59∶12时被开始。用户然后可以提示LISA并且为关键词“IBM”的出现查询120存储的结果。
查询120的结果在屏幕122中被显示。LISA检测和存储的包括关键词“IBM”的每个信息与指定的参数一同被显示。
在本发明的另一个方面,本发明可以被用来在因特网上的实时用户交互环境中动态地插入定制的广告。如图3中所示,本发明的这个方面将通过提取并且分析由LISA50产生的总结信息,然后以对应总结信息主题的适当信息或者广告作出响应。具体来说,根据用户的说明,本发明将寻找某个特殊的关键词或者关键词组的临时邻接出现。这样的关键词的出现将被用来推断通信或者对话的一般主题或者主题内容。一旦对话的一般主题范围已经被(概率性地)推断出来,本发明可以被用来在与谈话的主题匹配的聊天室中提供广告。这可能要比静态广告更能引起用户更多的注意和兴趣。本发明可以被构造作为一个客户加入谈话,并且可以个人的方式响应加入谈话的具体的个体。
除了本发明的LISA50组成部分之外,本发明的这个方面可以进一步包括下列的组成部分A)用户界面10B)LISA界面30C)总结分析器32D)数据库管理器34E)客户界面36每个组成部分的典型功能将在下面被讨论A)用户界面10。
除了以前被描述的用户界面10的功能之外,用户界面10也可以被构造成提示用户指定一个或者一组关键字,这些关键字是在实时通信检测中用户感兴趣的典型主题。用户界面10也可以给出候选广告的数据库,以及关键字到广告的一个映射。用户界面10可以索引所有后端数据库中的可用广告,并且将向数据库管理器34通知数据库内容和映射模式。在这个数据库60中的广告可以具有任何形式,包括图象标识、视频流,或者甚至是音频表达方式。
B)LISA界面30。
LISA界面30通常是一个软件组成部分,被用来把本发明这个方面的组成部分连接到本发明的LISA50组成部分。LISA界面30被调节来从用户界面10中获得用户指定参数,并且配置LISA的操作。LISA界面30也可以被调节来从LISA50中收集被总结的数据输出,并且把这种数据传播到总结分析器32。
C)总结分析器32。
在本发明的定向广告方面,总结分析器32为用户指定的关键字检查总结数据。根据一个或多个关键词组的一部分或者完全匹配,总结分析器32将确定被讨论问题的总结具有相关性的概率。如果推论的概率在某些用户指定的阈值之上,该总结将被“加记号”并且与被查找已匹配的关键词或关键词组一同被传递到数据库管理器34。
D)数据库管理器34。
在本发明的定向广告方面,数据库管理器34被调节为能够确定广告数据库60中的哪个广告应该被显示来响应在两个“聊天者”或者客户70之间正在实时交换的一条特殊信息。数据库管理器34也可以维护关键词和广告之间的用户指定的映射。在一个给定的关键词映射到多个广告的情况中,数据库管理器34可以在候选广告中随机选择。另外,用户可以选择在可接受的候选广告中间指定范围,或者强加特殊的条件,例如,要求采用循环调度法,以便避免重复特定的广告。
一旦数据库管理器34已选择一个可接受的广告,数据库管理器34将从数据库60中检索该广告。数据库管理器34将从数据库34中检索该广告,并且把它传递到客户界面36,与之一起被传递的还有被认为加入感兴趣的谈话或者通信的人们的“聊天绰号”的列表。另外,这些人的电子邮件地址和URL,如果能由所产生的总结提供的话,也将通过数据库管理器34传播到客户界面36。在任何给定时间,加入特殊谈话的人们通常是在“聊天室”中的人的总数的一个子集。为了能够识别这些参与者,数据库管理器34将需要实际上“跟随”某个类似的主题的延长谈话的顺序和连续性。数据库管理器34将通过记住与相同的关键词匹配的并列信息(即,按顺序发生的信息,一个在另一个的后面)的演说者的用户名称来完成这个任务。顺序的信息匹配相同的关键词的事实被用来表明这些信息相关,因而是同一谈话的一部分。
E)客户界面36。
客户界面36是本发明的定向广告方面的组成部分,可以被用来在被监视的实时通信通道和本发明之间形成链接。客户界面36负责把广告提供给在线通信通道之内的客户。根据用户的说明,客户界面36可以被构造成为,或者把该广告广播给通道中的所有参与者,多点广播给实际上相信加入兴趣对话的用户的子集(这张用户的列表通过数据库管理器34提供给客户界面36),或者把信息单点广播给某个特殊的用户。
尤其是,使用已从数据库管理器34中收到的信息,客户界面36可以用相当定制化、个性化和交互的方式提供该广告。例如,“Bob”是某个对话的参与者,在该对话中,关键字“Linux”、“窗口”、“操作系统”、“软件”和“应用”已被LISA50检测到。客户界面36现在可以为Bob提供个人信息,包含“红帽子Linux”产品的广告,并且还可以说明某些像“嗨,Bob,我感到你可能对这个感兴趣!”。此外,客户界面36还可以试图把具有关于“红帽子”产品优点的更多详尽的信息的一个个性化的电子邮件发送给Bob。
本发明包括结合上述过程步骤和指令的软件,可以在连接到因特网的不同计算机中被执行。图4是可以被用来实践本发明的一种典型的装置的示意性的表示。计算机系统80可以被连接到服务器计算机82,这样,该计算机就能够向每个计算机发送和获取信息。通过利用通信协议在诸如因特网或者使用ISDN线路这样的拨号连接的通信通道上发送,就可以使得两个计算机系统都可以使用信息。计算机80可以利用嵌入机器可读程序源代码的程序存储设备,使计算机能够执行本发明的方法步骤。本发明的程序存储设备可以利用光、磁和/或者电子设备来作为机器的一部分被设计、制造和使用,以执行本发明的方法步骤。程序存储设备包括,但不是被限制在,诸如软盘或者计算机硬盘驱动器这样的磁性媒介,它们是计算机可读和可执行的,光盘,只读存储器(ROM),软盘,和半导体芯片。计算机80通过电话或者其它常规的通信界面与万维网连接。计算机系统80和82具有执行存储程序的微处理机,并且计算机系统80可以包括在其程序存储设备上的数据存储设备,用于存储信息和数据。结合所描述的方法步骤和指令的计算机程序或者软件可以被储存在计算机和网络服务器中的其他常规的程序存储设备上。屏幕或者显示器86能够显示从计算机80访问的期望的结果。
因此,本发明提供了从因特网上例如在聊天室中的实时通信中收集并且分析动态信息的一种方法和系统,并且把根据通信主题作出的响应的信息回送给参与者。
虽然本发明是结合某个特定与具体的实施例进行特殊的描述,但根据上面的描述,许多替换、修正和变化,对那些精通于这一技术的人是很明显的。因此,权利要求书将包括任何落入本发明的真实范围和实质之内的替换、修正和变化。
权利要求
1.一种用于自动收集、总结并且索引在至少第一参与者和第二参与者之间的计算机网络上的实时通信中获得的实时信息的方法,包括以下步骤与至少一个服务器连接,所述服务器包括发生所述实时通信的至少一个网站;把所述网站连接到所述服务器上;监视所述实时通信,所述实时通信包括至少一个通信数据块;检索所述至少一个通信数据块;处理所述至少一个通信数据块,所述处理包括从所述通信数据块提取至少一个参数;并且总结所述数据,所述被总结的数据包括至少一个用于识别所述参数的标记。
2.权利要求1的方法,其中,与所述服务器的连接包括使用传输控制协议/网络协议(“TCP/IP”)打开基于套接口的连接。
3.权利要求2的方法,其中,所述使用TCP/IP打开基于套接口的连接包括步骤打开对所述服务器的输入和输出套接口;发送请求连接的第一命令给所述的服务器;从所述服务器中接收唯一的会话识别信息;发送确认唯一的会话识别信息给所述的服务器;发送登记信息给所述的服务器,所述登记信息包括用户名、主机名、服务器名、真名和真姓;发送第二命令到所述服务器,指定所要加入的聊天室,所述聊天室包括在正在发生所述实时通信的所述服务器上的所述网站。
4.权利要求1的方法,其中,所述至少一个参数是从包括正文、标题、报头、电子邮件地址和与所述通信数据块相关的统一资源定位器的组中选择的。
5.权利要求1的方法,其中,总结所述数据的所述步骤包括产生所述数据的一个可扩展的标记语言总结的步骤,所述总结包括描绘所述参数的可扩展标记语言的标识。
6.权利要求1的方法,进一步包括将所述被总结的通信数据块存储在数据库中的步骤,所述数据库被调节为对至少一个关键词查询,所述关键词与所述通信数据块相关。
7.权利要求6的方法,进一步包括步骤对所述至少一个关键词的出现查询所述数据库;识别与包括所述关键词的所述被总结数据块对应的至少一个数据库记录;显示包括所述关键词的所述至少一个数据库记录。
8.权利要求1的方法,在总结所述至少一个通信数据块的步骤之后,进一步包括步骤识别至少一个在所述的实时通信期间检测的第一关键词;对所述至少一个第一关键词的出现分析所述被总结的数据;从信息数据库中选择至少一条信息,所述信息与所述第一关键词相关;将所述至少一条信息插入回到所述实时通信的所述网站中,所述至少一条信息至少可由所述第一参与者检测。
9.权利要求8的方法,其中,所述信息是从包括图象标识、视频流和音频表达的组中选择的。
10.权利要求8的方法,其中,所述信息可由多个第一和第二个参与者检测。
11.权利要求8的方法,其中,所述信息数据库中的所述信息被映射到将要被检测的多个关键字中的至少一个。
12.权利要求8的方法,其中,所述至少一个第一关键词被映射到所述信息数据库中的多个信息。
13.权利要求8的方法,其中,所述信息为至少所述第一参与者而个性化。
14.一种制造品,包括一个计算机可利用的媒介,具有嵌入在其中的计算机可读程序代码装置,使得计算机能够自动地收集、总结和索引在至少第一和第二参与者之间的计算机网络上的实时通信中获得的实时信息,在所述的这件制造品中的计算机可读程序代码装置包括计算机可读程序代码装置,使得计算机能够连接至少一个服务器,所述服务器至少包括一个正在发生所述实时通信的网站;计算机可读程序代码装置,使得计算机能够连接所述服务器上的所述网站;计算机可读程序代码装置,使得计算机能够监视所述实时通信,所述实时通信包括至少一个通信数据块;计算机可读程序代码装置,使得计算机能够检索所述至少一个通信数据块;计算机可读程序代码装置,使得计算机能够处理所述至少一个通信数据块,所述处理包括从所述通信数据块中提取至少一个参数的步骤;以及计算机可读程序代码装置,使得计算机能够总结所述数据,所述被总结的数据包括至少一个识别所述参数的标记。
15.权利要求14的制造品,进一步包括计算机可读程序代码装置,使得计算机能够把所述被总结的通信数据块存储在数据库中;计算机可读程序代码装置,使得计算机能够对出现的所述至少一个关键字查询所述数据库;计算机可读程序代码装置,使得计算机能够识别对应包括所述关键字的被综合数据块的至少一个数据库记录;计算机可读程序代码装置,使得计算机能够在对至少所述第一参与者可视的屏幕上显示对应包括所述关键字的被综合数据块的所述至少一个数据库记录。
16.权利要求14的制造品,进一步包括计算机可读程序代码装置,使得计算机能够识别至少一个在所述实时通信期间将被检测的第一关键字;计算机可读程序代码装置,使得计算机能够对出现的所述至少一个第一关键字分析所述被综合的数据;计算机可读程序代码装置,使得计算机能够从信息数据库中选择至少一个信息,所述信息与所述第一关键字相关;计算机可读程序代码装置,使得计算机能够把所述至少一个信息插入回到所述实时通信的所述网站中,所述至少一个信息可以由至少所述的第一参与者检测。
17.一种计算机程序产品,包括一个计算机可利用的媒介,具有嵌入在所述媒介中的计算机可读程序代码装置,使得计算机能够自动地收集、总结和索引在至少第一和第二参与者之间的计算机网络上的实时通信中获得的实时信息,在所述的计算机程序产品中的计算机可读程序代码装置包括计算机可读程序代码装置,使得计算机能够连接至少一个服务器,所述服务器至少包括一个正在发生所述实时通信的网站;计算机可读程序代码装置,使得计算机能够连接所述服务器上的所述网站;计算机可读程序代码装置,使得计算机能够监视所述实时通信,所述实时通信至少包括一个通信数据块;计算机可读程序代码装置,使得计算机能够检索所述至少一个通信数据块;计算机可读程序代码装置,使得计算机能够处理所述至少一个通信数据块,所述处理包括从所述通信数据块中提取至少一个参数的步骤;计算机可读程序代码装置,使得计算机能够总结所述数据,所述被总结的数据包括至少一个识别所述参数的标记。
18.权利要求17的计算机程序产品,进一步包括计算机可读程序代码装置,使得计算机能够把所述被总结的通信数据块存储在数据库中;计算机可读程序代码装置,使得计算机能够对出现的所述至少一个关键字查询所述数据库;计算机可读程序代码装置,使得计算机能够识别对应包括所述关键字的被综合数据块的至少一个数据库记录;计算机可读程序代码装置,使得计算机能够在对至少所述第一参与者可视的屏幕上显示对应包括所述关键字的被综合数据块的所述至少一个数据库记录。
19.权利要求17的计算机程序产品,进一步包括计算机可读程序代码装置,使得计算机能够识别至少一个在所述实时通信期间将被检测的第一关键字;计算机可读程序代码装置,使得计算机能够对出现的所述至少一个第一关键字分析所述被综合的数据;计算机可读程序代码装置,使得计算机能够从信息数据库中选择至少一个信息,所述信息与所述第一关键字相关;计算机可读程序代码装置,使得计算机能够把所述至少一个信息插入回到所述实时通信的所述网站中,所述至少一个信息可以由至少所述的第一参与者检测。
20.一种为计算机网络上的实时通信环境中的至少一个参与者指定一个信息的方法,包括以下步骤连接到网络上的至少一个实时通信的至少一个网站;对至少一个关键字的出现监视所述的实时通信;产生对应所述至少一个关键字的至少一个信息;将所述至少一个信息插入到所述实时通信的所述网站上,所述信息可由所述实时通信中的所述至少一个参与者检测。
全文摘要
本发明提供一种方法和装置,用于自动地收集、总结和索引来自因特网上实时通信,诸如因特网聊天会话或者因特网上实时通信的任何其他可比较的形式的实时信息。本发明提供有效的信息选择和分析,并且提供爬行、编入索引和总结聊天室数据的基本功能,并且根据该通信的主题产生例如广告这样的信息。
文档编号H04L12/18GK1310535SQ0110490
公开日2001年8月29日 申请日期2001年2月23日 优先权日2000年2月24日
发明者丹尼尔·A.·福德, 雷纳·克拉福特, 高拉夫·特瓦利 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1