信息处理设备、信息处理系统、数据库搜索方法和程序的制作方法

文档序号:6412845阅读:111来源:国知局
专利名称:信息处理设备、信息处理系统、数据库搜索方法和程序的制作方法
技术领域
本发明涉及一种用于对数据库执行信息搜索的信息搜索系统,特别涉及用于从数据库自动搜索对用户有用的知识和信息并提供给用户的信息搜索系统。
背景技术
作为用于知识管理等等的信息搜索的基础技术,一个方法是将由每个用户(例如某一个组织的成员)所保有的信息资源(知识)向数据库登记,并且由需要预定知识和信息的用户来搜索数据库,以得到想要的知识和信息(例如参见专利文献1)。
此外,还有一种现有技术,其通过主动地从数据库方提供用户所要求的信息来减少用户的麻烦。更具体地,它是这样一种系统,其中用户阐明他或她所需要的信息,并且那些在合适类别中的信息被自动地通知给用户,在这种情况下信息在数据库上登记(例如参见非专利文献1)。根据这种现有技术,每当在数据库登记时,用户所要求的信息便会由数据库方自动提供。因此,用户不必每次都执行搜索操作,并且除此之外,用户所要求的类别的最新信息可以在任何时候提供,以使有效的信息搜索成为可能。
已公开的未审查专利申请2001-282972[非专利文献1]″CIO Online Emerging Technology,″[online],IDG Japan,[searched on Jul.26,2003],Internet<URLhttp//www.idg.co.jp/CIO/contents/emerging/emerging1.html> 如上所述,迄今为止已经提出了多种使用计算机来对数据库进行信息搜索的技术。但是,以上过去的信息搜索技术的麻烦在于,为了获得所要的知识和信息,需要通过使用户输入类别或关键字来告知数据库哪些知识和信息是要求的。
至于在非专利文献1中披露的现有技术,每次用户执行信息搜索时,不需要为搜索输入信息,例如类别或关键字。但是,这导致了同样的麻烦,因为用户需要通过用户他或她自身的主动操作预先选择这样的信息,并在数据库中进行登记。
考虑到上述现有技术中的问题,本发明的目的之一在于消除用户确定在信息搜索中所要的知识和信息时所执行的操作,以减少用户的麻烦。
本发明的另一个目的在于提供一种能够根据用户的信息活动从数据库中选择被认为对用户有用的知识和信息并主动提供给用户的信息处理系统。

发明内容
为了达到这些目的,本发明可实现成以如下方式构成的信息处理系统。更具体地,该信息处理系统包括数据库服务器和通过网络连接到数据库服务器的客户机,并且客户机在通过预定信息活动获得的文本中提取用于数据库搜索的关键字并将它发送给数据库服务器。并且数据库服务器接收客户机发送来的关键字,将关键字作为搜索条件来执行数据库搜索,并将搜索结果发送给客户机。
为了更详细地描述,被用作客户机的信息处理设备包括用于保存通过预定信息活动获得的文本的文本保存单元,用于分析信息活动的模式、根据分析结果确定提取用于数据库搜索的关键字的方法、并且利用所确定的提取方法从文本保存单元保存的文本中提取关键字的关键字提取单元。它还包括用于发送由关键字提取单元提取、作为搜索条件的关键字给网络上的数据库服务器的通信控制单元,以及用于输出利用关键字提取单元提取的关键字进行的数据库搜索的结果的输出控制单元。
关键字提取单元最好根据信息活动模式的分析结果,把被确定为通过被执行以获得预定信息的信息活动而已经获得的文本,选作关键字的提取的对象(subject)。更具体地,关键字提取单元从通过对文本保存单元保存的文本执行词法分析而获得的单词中,提取预定数量的高出现频率的单词作为关键字。
也可以是,例如,用一个与外部设备交换其中存储的电子邮件的邮箱来构成文本保存单元,并且构成关键字提取单元以分析作为信息活动模式、存储在文本保存单元中的电子邮件的发送和接收动作,并且根据分析结果选择电子邮件作为关键字提取的对象,以提取关键字。更具体地,在预定主题线索(thread)中的电子邮件发送和接收动作以单纯的接收或者发送开始,并以预定数量的发送和接收之后的发送结束的情况下,它选择该主题线索中的电子邮件以从中提取关键字。也可以分析发送和接收动作,并且针对每个主题线索确定发送和接收是否已经执行以便提供预定信息或获得预定信息,使得根据确定结果从预定电子邮件中提取关键字。
作为另一个例子,也可以用存储聊天中所交换的非定型(nontypical)消息的消息仓库(message repository),消息板(messageboard)等等来构成文本保存单元,并且构成关键字提取单元,以分析作为信息活动模式的消息的树结构,以及问题单词和问题标志是否被包括在非定型消息中,以便选择作为关键字提取对象的消息并提取关键字。
另外,该信息处理系统中的数据库服务器保存从客户机接收的关键字,并且在与关键字相关的新信息在数据库上登记的情况下,搜索新信息并将之发送给客户机。在没有来自客户机的显式搜索请求的情况下,数据库服务器按照预定定时使用所保存的关键字执行数据库搜索,并将搜索结果发送给客户机。
此外,信息处理系统还可以如此构成,使得对于关键字,客户机向数据库服务器发送信息,其中在借以获得的作为关键字提取源的文本的信息活动中,该信息指示客户机设备是信息的接收者还是提供者,并且对于从客户机发送的关键字中的预定关键字,数据库服务器将有关已发送关键字、作为信息提供者的客户机的信息,发送到发送过关键字、作为信息接收者的客户机。
除了达到这些目的之外,本发明也可作为下述的使用计算机的数据库搜索方法来实现。该搜索方法的特征在于包括步骤从通过预定信息活动所获得的文本中,通过根据信息活动模式的分析结果而确定的关键字提取方法,提取用于数据库搜索的关键字,在预定关键字存储装置中存储提取的关键字,以及使用存储在关键字存储装置中的关键字来执行数据库搜索。
另外,本发明也可以作为控制计算机来实现上述信息处理设备的功能的程序产品,或使计算机执行与数据库搜索方法的每一步相对应的过程的程序产品来实现。可以通过将这个程序存储在磁盘,光盘,半导体存储器和其他记录介质中,以及通过网络分布或发送它来提供。
根据如上构成的本发明,可以在服务器上保存客户机提取的关键字,在没有来自客户机的显式搜索请求的情况下根据这个关键字执行数据库搜索,并且向客户机提供搜索结果,以消除用户为确定所要的知识和信息而执行的操作,例如发出搜索请求和登记搜索条件,并因此显著地减少了用户的麻烦。
根据本发明,服务器在没有来自客户机的显式搜索请求和搜索条件的登记的情况下自动执行搜索,并且将搜索结果提供给客户机。因此,它具有从信息处理系统方主动提供被认为对用户有用的知识和信息的效果。


附图1是表示其中利用根据本实施方案的信息处理的信息处理系统的全面结构的图示;附图2的示意图表示适于实现本实施方案的服务器10和客户机20的计算机设备的硬件结构的例子;附图3是表示根据本实施方案的客户机20的功能性结构的图示;附图4是对关键字提取单元22的关键字提取过程进行解释的流程图;
附图5是表示在根据本实施方案的客户机是信息接收者还是提供者的基础上对电子邮件进行分类的标准(criteria)的表格。
附图6是表示根据本实施方案的服务器的功能性结构的图示;附图7是表示存储在关键字管理数据库13中数据结构的例子的图示;附图8是已经更新了与附图7的关键字管理数据库13中的电子邮件地址“”相关的关键字的表现的图示;附图9是表示本实施方案的信息处理系统的全部处理流程的流程图;附图10是在客户机信息活动是多个计算机使用协作软件进行的协作工作的情况下,表示客户机的功能性结构的图示;附图11是在客户机信息活动是多个计算机使用协作软件进行的协作工作的情况下,表示服务器的功能性结构的图示。
10,30服务器11信息知识管理DB(数据库)12搜索执行单元13关键字管理DB(数据库)14发送和接收控制单元20,40客户机21邮箱22关键字提取单元23发送和接收控制单元24输出控制单元25最优网络结构处理单元26用户简表DB(数据库)41消息仓库50网络101 CPU(中央处理器)
103 主存储器105 磁盘存储驱动器(HDD)106 网络接口具体实施方式
下面,将参考附图详细描述一个实现本发明的优选实施方案。
附图1是表示其中利用根据本实施方案的信息处理的信息处理系统的全面结构的图示。
如附图1所示,本实施方案包括包括用于存储并累积信息资源的数据库的服务器10,以及用于通过网络50连接到服务器并获得信息的客户机20。根据本实施方案的信息处理系统根据在客户机20上执行的信息活动自动提取信息搜索的搜索条件,并且根据提取的搜索条件在服务器10上执行数据库搜索,以便将搜索的信息(搜索结果)发送给客户机20。
服务器10是在计算机设备,例如工作站或者个人计算机上实现的数据库服务器。服务器10不但响应搜索请求从数据库读取满足搜索请求的搜索条件的信息并且应答搜索请求,而且具有根据预先登记的搜索条件按照预定定时执行数据库搜索,并将它发送给对应于搜索条件的客户机20的功能。
客户机20在计算机设备,如工作站、个人计算机、例如PDA(个人数字助理)的信息设备、或具有网络功能的移动电话上实现。根据本实施方案的客户机20是与服务器10有关的客户机,包括实际系统结构中由个人最终用户使用的终端设备和管理这些终端设备之间的消息交换的消息服务器。
网络50可以是公共广域网络,例如国际互联网,或本地网。更具体地,可通过以国际互联网上提供的公共数据库服务器作为服务器10的方式来构成本实施方案的系统,或者以一种封闭的形式,例如企业内部互联网来构成。
附图2的示意图表示适于实现本实施方案的服务器10和客户机20的计算机设备的硬件结构的例子。
附图2中所示的计算机设备包括作为计算装置的CPU 101(中央处理单元),通过M/B(主板)芯片组102和CPU总线连接到CPU 101的主存储器103,类似地通过主板芯片组102和AGP(加速图形接口)连接到CPU 101的视频卡104,通过PCI(外设部件互连)总线连接到主板芯片组102的硬盘驱动器(HDD)105,网络接口106,以及通过桥电路107和低速总线例如ISA(工业标准结构)总线从PCI总线连接到主板芯片组102的软盘驱动器108和键盘/鼠标109。
附图2仅仅举例说明了用于实现本实施方案的计算机设备的硬件结构,如果本实施方案适用,则可以采用其他各种结构。例如,可仅仅安装视频存储器而不是提供视频卡104,并且通过CPU 101来处理图像数据,或者通过例如ATA(AT附件)或SCSI(小型计算机系统接口)的接口提供CD-R(可记录光盘驱动器)或者DVD-RAM(数字化通用光盘随机存取存储器)驱动器作为外部存储器。
根据本实施方案,预定信息设备之间的消息交换被看作是客户机20上用来提取服务器10上的搜索条件的信息活动。至于用于消息交换的手段,可考虑各种手段,例如电子邮件,通过使用协作软件发送和接收协作工作中的消息,聊天等等。但是,考虑到现在企业运营中基本上通过电子邮件提供和接收信息,使用电子邮件的情况将被作为本实施方案的一个例子进行描述。更具体地,作为服务器10上的搜索条件的信息从客户机20发送和接收的电子邮件中提取,以便被送往服务器10。
附图3是表示根据本实施方案的客户机20的功能性结构的图示。
参照附图3,客户机20包括其中存储所发送和接收的邮件的邮箱21,用于从存储在邮箱21中的邮件中提取关键字作为服务器10上数据库搜索的搜索条件的关键字提取单元22,用于控制与服务器10的数据交换的发送和接收控制单元23,和用于输出由发送和接收控制单元23所接收的、服务器10上的数据库搜索结果的输出控制单元24。
在附图3中所示的结构中,邮箱21通过例如附图2中的计算机设备的主存储器103或磁盘存储驱动器105来实现。关键字提取单元22通过例如附图2中的计算机设备的程序控制CPU 101来实现。发送和接收控制单元23通过例如附图2中的计算机设备的程序控制CPU101和网络接口106来实现。输出控制单元24通过例如附图2中的计算机设备的程序控制CPU 101和视频卡104来实现。对于用于通过CPU 101实现关键字提取单元22,发送和接收控制单元23和输出控制单元24的功能的程序,通过将它存储在磁盘,光盘,半导体存储器和其他记录介质中,以及通过网络分布或发送来提供。
在客户机20的结构中,邮箱21积累(accumulate)在客户机20和例如其它终端设备和服务器的信息设备之间交换的电子邮件以及其通信历史。对于邮箱21,可应用迄今为止已经使用的电子邮件软件(邮件发送者(mailer))的电子邮件管理功能。
为了从存储的电子邮件中提取用于服务器10的数据库搜索的关键字,关键字提取单元22按照预定定时(例如,在系统启动时或者周期性地)搜索邮箱21。
附图4是对关键字提取单元22的关键字提取过程进行解释的流程图。
如附图4所示,关键字提取单元22首先以主题线索为单位对存储在邮箱21中的全部电子邮件进行重新配置。根据电子邮件发送和接收模式,它针对在主题线索中客户机20自身是信息提供者(销售者)还是接收者(购买者)对每个主题线索进行分类(步骤401)。
更具体地,在第一个动作是接收并且没有关于一个预定主题线索的随后动作的情况下,确定在主题线索中客户机20是信息接收者。关于这种主题线索的一个例子,存在接收信息递送服务的邮件,例如邮件杂志的情况。
在第一个动作是接收并且接收之后的动作是发送(返回邮件)再接收的情况下,可以确定客户机20在主题线索中是信息提供者。这是因为,大多数情况下,在这样的主题线索中,电子邮件在首先接收一个询问(接收),回答(发送)并接收感谢问候(接收)的过程中被交换。同样可考虑首先接收,随后若干次交换电子邮件以及以接收来结束的情况。
在第一个动作是发送并且没有随后动作的情况下,可以确定客户机20在主题线索中是信息提供者。作为这样主题线索的一个例子,存在从客户机20向其他方面发送通知的情况。
在第一个动作是发送并且随后的动作是为接收再发送(返回邮件)的情况下,可以确定客户机20在主题线索中是信息的接收者。这是因为,在这样的主题线索中,电子邮件被假设在与前面的接收再发送再接收的情况相反的过程中交换,即客户机20询问其它方面(发送),接收对其的响应(接收)并且发送感谢问候(发送)。同样考虑首先发送,随后若干次交换电子邮件以及以发送来结束的情况。
在第一个动作是发送并且随后的动作是接收再发送再接收的情况下,可以确定客户机20在主题线索中是信息提供者。这是因为,在这样的主题线索中,电子邮件被假设在从客户机20发送某通知(发送),接收关于它的询问(接收),回答(发送)并接收感谢问候(接收)的过程中交换。同样考虑首先发送,随后若干次交换电子邮件以及以接收来结束的情况。
在第一个动作是接收并且随后的动作是删除已接收的电子邮件的情况下,可以确定所接收的电子邮件是无用的电子邮件,例如垃圾邮件,并且可以确定客户机20既不是信息的提供者,也不是接收者。
附图5是概括上述电子邮件的分类的标准的表格。
接着,在步骤401中,关键字提取单元22选择其中客户机20被分类为信息接收者的主题线索,顺序地将注意力聚焦于每一个所选择的主题线索并且对包括在每一个主题线索中的电子邮件的语句执行词法分析,从而提取包括在电子邮件的语句中的名词(步骤402)。并且它计算每一个已提取名词的出现频率(步骤403)。例如,名词的出现频率可以以如下方式计算。
首先,每个主题线索的重要性是1,并且根据出现的次数,重要性被分配给出现在主题线索中的名词,它是主题线索中的出现频率(按照主题线索的出现频率)。并且它对其中客户机20位于信息接收者位置的全部主题线索中相同名词的按照主题线索的出现频率进行累计,这是名词的出现频率。
计算是通过采用具体的例子执行的。
对于其中客户机20被确定为信息接收者的预定主题线索A,假定在包括在主题线索A中的电子邮件的语句中词“知识管理”总共出现7次,词“电子学习”总共出现3次。在这个例子里,“知识管理"的出现次数为7,并且总共提取10个词(7+3)。因此,在主题线索A中其按照主题线索的出现频率如下。
7/(7+3)=0.7同样地,在主题线索A中“电子学习”的按照主题线索的出现频率如下。
0.3(=3/(7+3))对于其中客户机20同样被确定为信息接收者的另一个主题线索B,假定在包括在主题线索B中的电子邮件的语句中词“知识管理”总共出现3次,词“投资效果对比”总共出现2次。在这个例子里,用以上计算方法,主题线索B中“知识管理,,的按照主题线索的出现频率是0.6(=3/(3+2)),主题线索B中“投资效果对比”的按照主题线索的出现频率是0.4(=2/(3+2))。
在邮件交换中,在其中客户机20位于信息接收者位置的主题线索仅仅是主题线索A和主题线索B的情况下,如果累加在主题线索A和B中相同名词的按照主题线索的出现频率,则在主题线索A中“知识管理”的按照主题线索的出现频率是0.7,而在主题线索B中是0.6。因此,“知识管理”的按照主题线索的出现频率计算如下。
0.7+0.6=1.3因为“电子学习”仅仅出现在主题线索A中而“投资效果对比"仅仅出现在主题线索B中,按照线索的出现频率(对于“电子学习”是0.3,对于“投资效果对比”是0.4)就是这些名词本身的出现频率。
接着,在通过步骤402的词法分析提取的电子邮件的语句中的名词中,关键字提取单元22排除非常常用的单词(例如“会议”,“今天”,“总部”等等),并且从其余单词中选择高出现频率的单词作为关键字(步骤404)。常用单词的消除可以通过预先准备一个要排除的单词的列表(词典),并且将在步骤402中提取的名词与列表进行匹配来实现。也可根据关键字提取单元22提取的名词自动地创建这个单词列表。例如,有一种适合的方法,例如选择对于所有用户(不管是信息接收者还是信息提供者)均高频率出现的单词作为常用单词,并且将它们在单词列表中登记(更具体地,可建立一个标准,例如选择对于所有用户(包括接收者和提供者)的50%或更多,具有最高频率的若干单词作为常用单词)。按照单词出现频率的降序选择预定数量的关键字。被选择的关键字的数量是任意的和可变的。被选择的关键字由发送和接收控制单元23发送给服务器10。
上述关键字选择方法和在这里使用的单词出现频率计算方法仅仅是示例。任何其它任意的方法都可被采用,只要它是能够从邮箱21中积累的电子邮件中适当提取作为服务器10上数据库搜索的搜索条件的关键字的方法。
发送和接收控制单元23通过网络50向服务器10发送并从中接收数据,并将关键字提取单元22提取的关键字发送给服务器10,或者接收自服务器10处发送出的搜索信息(数据库搜索结果)。由发送和接收控制单元23接收自服务器10的搜索信息被送往输出控制单元24。
输出控制单元24向显示单元输出从发送和接收控制单元23接收的服务器10上的搜索信息,以在其上显示。
关键字提取单元22提取的关键字是从通过客户机20上的信息活动(电子邮件交换)获得的文本中提取的。因此,在通过发送和接收控制单元22将关键字送往服务器10时,需要向服务器10发送把关键字和客户机20关联起来的信息,使得服务器10能够识别出关键字所针对的客户机。这里,根据本实施方案,客户机20是被最终用户使用的信息设备。但是,是最终用户他或她自己而不是信息设备需要数据库搜索所获得的信息。因此,可以将用于识别使用客户机20的最终用户的信息而不是客户机20与关键字关联起来。更具体地,最终用户的电子邮件地址与关键字一起被送往服务器10。
附图6是表示根据本实施方案的服务器的功能性结构的图示。
参考附图6,服务器10包括了用于存储信息资源的信息资源管理DB(数据库)11,用于执行针对信息资源管理DB 11的数据库搜索的搜索执行单元12,用于存储用于搜索执行单元12的数据库搜索的关键字的关键字管理DB(数据库)13,和用于控制在它和客户机20之间的数据交换的发送和接收控制单元14。
在如附图6所示的结构中,信息资源管理数据库11和关键字管理数据库13通过例如附图2示出的计算机设备的主存储器103和磁盘存储驱动器105来实现。搜索执行单元12通过例如附图2示出的计算机设备的程序控制CPU 101来实现。发送和接收控制单元14通过例如附图2举出的计算机设备的程序控制CPU 101和网络接口106来实现。输出控制单元24通过例如附图2示出的计算机设备的程序控制CPU 101和视频卡104来实现。对于用CPU 101实现搜索执行单元12和发送及接收控制单元14的功能的程序,通过将它存储在磁盘,光盘,半导体存储器和其他记录介质中,以及通过网络分布或发送来提供该程序。
在服务器10的结构中,信息资源管理数据库11将信息资源存储为服务器10上的数据库搜索的对象。
搜索执行单元12使用存储在关键字管理数据库13中的关键字针对信息资源管理数据库11执行数据库搜索。搜索执行单元12对信息资源管理数据库11的搜索按照预定定时重复执行(例如,周期性地)。因此,在新登记的、灵活性于预定关键字的信息资源存在于信息资源管理数据库11中的情况下,搜索可以在任何时候进行。
关键字管理数据库13对通过使用电子邮件地址针对每一个最终用户从客户机20发送的关键字进行分类和存储。
发送和接收控制单元14通过网络50向客户机20发送并从其接收数据,并且接收从客户机20发送的关键字以将它存储在关键字管理数据库13中,或者将搜索执行单元12搜索的信息送往一个可用的电子邮件地址。
附图7是表示存储在关键字管理数据库13中的数据结构的例子的图示。
如附图7所示,关键字管理数据库存储以使其关联的方式用于识别最终用户以作为信息用户的内部(in-house)邮件ID(电子邮件地址),作为搜索条件的关键字,关键字的最后搜索日期以及有效标志。
这里,ID信息而不是电子邮件地址可被用作用于识别最终用户的信息。但是,通过使用电子邮件地址,可通过将该电子邮件地址发送给它,来通知信息资源管理数据库11的搜索结果。例如,当关键字被从客户机20送出时,电子邮件地址可以一起获得。
最后搜索日期是最后用关键字执行信息资源管理数据库11的搜索的日期,并且在最后搜索日期及以后,搜索执行单元12搜索在信息资源管理数据库11中登记的信息。因此,可避免重复搜索过去已搜索的信息和将它送往客户机20。
有效标志是用于区别在搜索执行单元12对信息资源管理数据库11执行搜索时实际使用的关键字(真),和没有用于这个搜索的关键字(假)的标志。例如,在针对每个电子邮件地址的有效关键字的数量被设置为3的情况下,与相同电子邮件地址关联的关键字中的3个的有效标志变为真(在所示例子中,在与电子邮件地址“aaa@jp.ibm.com”相关的关键字中,三个关键字“知识管理”,“注释”和“咨询”为真)。
考虑到其中与预定电子邮件地址相关的关键字被存储在服务器10的关键字管理数据库13中,并且与电子邮件地址相关的关键字还通过发送和接收控制单元14新输入的情况(如上所述,例如每次系统启动时关键字被从客户机20发送)。在这种情况下,关键字管理数据库13中与电子邮件地址相关的关键字通过新输入的关键字来更新。这里,假定例如三个关键字“知识管理”,“电子学习”和“投资效果对比”是按照某个定时从由“”识别的最终用户所使用的客户机20发送。
附图8示出了在附图7的关键字管理数据库13已更新与电子邮件地址“”相关的关键字的表现。
如果对比附图8和附图7,单词“电子学习”作为对应于电子邮件地址“”的关键字被添加(最后的搜索日期为空,因为它是一个新附加的关键字)。并且附加的这三个关键字“电子学习”,“知识管理”和“投资效果对比”的有效标志是真。关键字“注释”和“咨询”的有效标志变为假。更具体地,从客户机20发送的三个当前关键字是有效的,并且除“知识管理”外也被包括在当前关键字中的两个关键字同旧关键字一样是无效的。
在这里,旧关键字通过有效标志在有效和无效之间切换,而不是被从关键字管理数据库13中删除。这是为了防止在关键字被作为当前关键字以后从客户机20再次发送的情况下,信息资源管理数据库13被重复搜索。
作为一个具体的例子,考虑关键字“投资效果对比”,其有效标志在附图7中是假,但在附图8中是真。
在附图7中,三个关键字“知识管理”,“注释”和“咨询”是真,而且关键字“投资效果对比”与旧关键字一样是假。在这个关键字“投资效果对比”被从关键字管理数据库13中删除的情况下,关键字“投资效果对比”在如附图8所示的下一次更新中,被作为当前关键字从客户机20发送,并且因此这个关键字被重新在关键字管理数据库13中登记。然后,搜索执行单元12从在信息资源管理数据库11中新登记的信息资源中搜索隶属于新关键字“投资效果对比”的所有信息。
但是,关键字“投资效果对比”先前已经作为关键字登记过,并且隶属于这个关键字的信息那时已经被搜索过并发送给客户机20。因此,如果所有在信息资源管理数据库11中登记的信息资源在关键字“投资效果对比”再次登记时均被搜索并发送给客户机20,则先前发送给客户机20的信息将变得冗余。因此,根据本实施方案,旧关键字并不从关键字管理数据库13中删除,而是仅仅将有效标志作为假的从搜索条件中排除,以及有关通过该关键字进行搜索的最后搜索日期的信息被保存,使得当关键字下次变为真时,只有在最后搜索日期及此后存储在信息资源管理数据库11中的信息资源被搜索。对于附图8中所示的例子,关键字“投资效果对比”的最后搜索日期为2003年4月5日。因此,在此日期及此日期之后在信息资源管理数据库中登记的信息资源被搜索,以便向客户机20发送隶属于关键字“投资效果对比”的信息,如果存在的话。
根据如上构成的本实施方案的信息处理系统,对数据库的搜索请求并非从客户机20发送,而是被认为是对客户机20的最终用户有用的信息在任何时候被从服务器10送往客户机20。
附图9是表示本实施方案的信息处理系统的全部处理流程的流程图。
如附图9中所示,按照预定定时(在系统启动时或者周期性地),客户机20使存储在邮箱21中的电子邮件的主题线索被分析,并对其中客户机20被确定为信息接收者(购买者)的主题线索进行选择,以便对包括在主题线索内的电子邮件的文本执行词法分析(步骤901)。并且它被分解成单词,并且计算每一个单词(名词)的出现频率,使得关键字被选择并与客户机20的最终用户的电子邮件地址一起发送给服务器10(步骤902)。
从客户机20送往服务器10的关键字根据和关键字一起获得的电子邮件地址被分类,并且被存储在服务器10的关键字管理数据库13中。信息资源管理数据库11被搜索执行单元12使用存储在关键字管理数据库13中的关键字作为搜索条件,按照预设和预定定时(例如在每天的固定时间内)进行搜索,使所获得的作为搜索结果的信息被送往客户机20(步骤904)。客户机20输出并在其上显示从服务器10发送的信息,以便通知其最终用户(步骤905)。
根据上述操作的实施例,服务器10按照预设和预定定时执行对信息资源管理数据库11的搜索。但是,当新关键字被从客户机20发送时,也可以使用新关键字来执行数据库搜索。
另外,根据上述实施例,客户机20在接收后,将作为搜索结果的信息输出并在其上显示。但是,也可在预定存储装置中存储信息本身,并且通过显示或声音仅仅向最终用户通知信息的接收。另外,为了将作为搜索结果的信息送往与关键字相关的电子邮件地址,也可由最终用户通过使用电子邮件地址获得来自信息设备而不是他或她自己的客户机20的信息。
此外,本实施方案已经通过所举的客户机20是最终用户所使用的信息设备的例子进行描述。但是,也可使用管理电子邮件交换的邮件服务器作为客户机20。在这种情况下,作为客户机20的邮件服务器分析其所管理的电子邮件交换的主题线索,提取关键字并将之送往服务器10。并且它将服务器10送来的信息发送给一个在主题线索中处于信息接收者位置的终端的用户,其中关键字被作为邮件服务器的客户机的用户终端从该主题线索中提取。
根据该实施方案,电子邮件的交换被作为客户机20的信息活动的一个实例。但是,实质上对于本发明,从通过客户机上的信息活动获得的文本中提取关键字并发送给服务器10,使得即使客户机20的最终用户没有通过他或她的主动操作设定数据库搜索的搜索条件,搜索仍然自动地由服务器10执行,以提供被认为对最终用户有用的信息。因此,信息活动的内容不限于上述电子邮件的交换。下面,将给出对一个实施方案的描述,其中客户机20的信息活动的概念是多个计算机通过使用协作软件进行的协作工作。
附图10是在客户机信息活动是多个计算机使用协作软件进行的协作工作的情况下,表示客户机的功能性结构的图示。附图11是表示在同样情况下服务器的功能性结构的图示。
如附图10所示,与在附图3中所示的客户机20相比,根据本实施方案的客户机40包括消息仓库41,用于存储在协作软件而不是邮箱21的协作工作中交换的非定型消息。否则,其结构与附图3中所示的客户机20的结构一样。
但是,对于存储在消息仓库41的非定型消息,不可能象针对电子邮件分析直接信息活动的模式那样直接分析发送和接收模式(参见附图5),以及确定客户机40是信息的提供者还是接收者。因此,为了分析客户机40上的信息活动的模式,关键字提取单元22首先作为预处理来分析存储在消息仓库41中的每一条非定型消息的语句,以检测问题单词和问题标记,例如“是吗?”,“不是吗?”和“?”。下一步,它参照消息的树结构并计出出现在客户机40发送的消息中的问题单词和问题标记的数量。并且在问题单词和问题标记出现的数量较大的情况下(例如,在预定数量(阈值)或更多的情况下),可以确定在其一条消息交换过程中客户机40位于信息接收者的位置。
此后,对消息执行词法分析和提取关键字的操作几乎与附图4中的关键字提取单元22的处理一样。然而根据本实施方案,不仅在客户机40是信息接收者的情况下,而且在它作为信息提供者的情况下,提取关键字,并且用于识别它是接收者还是提供者的识别数据被连同关键字一起发送给服务器10。
如附图11中所示,除针对如附图6中所示的服务器10的信息资源管理数据库11,搜索执行单元12和发送及接收控制单元14以外,根据本实施方案的服务器30还包括最优网络结构处理单元31。它还包括用户简表数据库32而不是关键字管理数据库13。
最优网络结构处理单元31通过例如在附图2中例示的计算机设备的程序控制CPU 101来实现。
对于关键字,用户简表数据库32象附图6中所示的服务器10中的关键字管理数据库13那样存储并保存关键字,并且也存储用于指示已经发送关键字的客户机40是信息的接收者还是提供者的识别数据。并且搜索执行单元12仅针对从作为信息接收者的客户机40发送的关键字执行对信息资源管理数据库11的搜索。
最优网络结构处理单元31搜索用户简表数据库32,并且针对预定关键字检查是否存在通过作为信息接收者的客户机40的发送而进行的登记,和通过从作为信息提供者的客户机40的发送而进行的登记。在存在这种关键字的登记的情况下,对于关键字,最优网络结构处理单元31发送有关作为信息提供者的客户机40的信息(用于交换消息的电子邮件地址等等)给作为信息接收者的客户机40。例如,这种有关信息提供者的信息发送可在发送和关键字相关的搜索结果时一起执行。
客户机40获得和关键字相关的搜索结果,以及对于关键字,作为有关信息提供者的客户机40的信息,并且因此能够直接与作为信息提供者的客户机40交换消息,来获得所要的信息。
以上描述了本发明的实施方案。但是显然本发明的技术方案并不限于上述实施方案。例如,根据这些实施方案,客户机包括用于提取关键字的装置。但是,在信息处理系统的情况下,服务器本身也可具有关键字提取功能,其中是由服务器来管理作为客户机上信息活动的结果所获得的文本。因此,可适应适当结合硬件和软件、在没有超过本发明技术方案的范围内的各种系统结构。
权利要求
1.一种信息处理设备,包括文本保存单元,用于保存通过预定信息活动获得的文本;关键字提取单元,用于分析信息活动的模式以根据分析结果指定提取用于数据库搜索的关键字的方法,并且用于通过该指定的提取方法从保存在文本保存单元中的文本中提取关键字;和输出控制单元,用于输出通过使用关键字提取单元提取的关键字执行的数据库搜索的结果。
2.根据权利要求1的信息处理设备,其中关键字提取单元根据信息活动模式的分析结果,把被确定为通过被执行以获得预定信息的信息活动而已经获得的文本,选作关键字的提取的对象。
3.根据权利要求1的信息处理设备,其中关键字提取单元将通过对文本保存单元保存的文本执行词法分析所获得的单词提取为关键字。
4.根据权利要求3的信息处理设备,其中从根据文本获得的单词中,关键字提取单元提取具有高出现频率的预定数量的单词作为关键字。
5.根据权利要求1的信息处理设备,其中文本保存单元是在其中存储与外部设备交换的电子邮件的邮箱。
6.根据权利要求5的信息处理设备,其中关键字提取单元分析存储在文本保存单元中的电子邮件的发送和接收动作,并且选择根据分析结果而选定的电子邮件作为关键字提取对象。
7.根据权利要求5的信息处理设备,其中关键字提取单元在预定主题线索中的电子邮件发送和接收动作以单纯的接收或者发送开始,并以预定数量的发送和接收之后的发送结束的情况下,分析存储在文本保存单元中的电子邮件的发送和接收动作,并且选择该主题线索中的电子邮件作为关键字提取对象。
8.根据权利要求5的信息处理设备,其中关键字提取单元分析存储在文本保存单元中的电子邮件的发送和接收动作,并且针对每个主题线索确定发送和接收是否已经执行以便提供预定信息或获得预定信息,并且根据确定结果从预定电子邮件中提取关键字。
9.一种信息处理设备,包括文本保存单元,用于保存通过预定信息活动获得的文本;关键字提取单元,用于分析信息活动的模式以根据分析结果指定提取用于数据库搜索的关键字的方法,并且用于通过该指定的提取方法从保存在文本保存单元中的文本中提取关键字;和通信控制单元,用于发送由关键字提取单元提取的作为搜索条件的关键字到网络上的数据库服务器。
10.根据权利要求9的信息处理设备,其中关键字提取单元根据信息活动模式的分析结果,把被确定为通过被执行以获得预定信息的信息活动而已经获得的文本,选作关键字的提取的对象。
11.根据权利要求9的信息处理设备,其中关键字提取单元将通过对文本保存单元保存的文本执行词法分析所获得的单词提取为关键字。
12.一种信息处理系统,包括数据库服务器和通过网络连接到数据库服务器的客户机;其中客户机根据预定信息活动的模式指定提取用于数据库搜索的关键字的方法,通过指定的方法从通过预定信息活动获得的文本中提取关键字,并将关键字发送给数据库服务器;并且数据库服务器接收客户机发送的关键字,使用关键字作为搜索条件来执行数据库搜索,并将搜索结果发送给客户机。
13.根据权利要求12的信息处理系统,其中数据库服务器保存从客户机接收的关键字,并且在与关键字相关的新信息在数据库中登记的情况下,数据库服务器将新信息发送给客户机。
14.根据权利要求12的信息处理系统,其中数据库服务器保存从客户机接收的关键字,按照预设定时执行数据库搜索,并将搜索结果发送给客户机。
15.根据权利要求12的信息处理系统,其中客户机从与外部设备交换的电子邮件中提取关键字;并且数据库服务器根据使用客户机的最终用户的电子邮件地址对从客户机接收的关键字进行分类和保存,并且将基于关键字的数据库搜索结果发送到电子邮件地址。
16.根据权利要求12的信息处理系统,其中,对于关键字,客户机还向数据库服务器发送指示在信息活动中客户机设备曾是信息的接收者还是提供者的信息,其中曾通过所述信息活动获得作为关键字提取对象的文本;并且对于从客户机发送的关键字中的预定关键字,数据库服务器将有关作为信息提供者、发送过关键字的客户机的信息,发送到作为信息接收者、发送过关键字的客户机。
17.一种用于搜索利用计算机构成的数据库的数据库搜索方法,该方法包括以下步骤从通过预定信息活动获得并且存储在预定文本存储装置中的文本中,通过根据信息活动模式的分析结果而确定的关键字提取方法,提取用于数据库搜索的关键字;在预定关键字存储装置中存储提取的关键字;以及使用存储在关键字存储装置中的关键字来执行数据库搜索。
18.根据权利要求17的数据库搜索方法,其中提取关键字的步骤包括步骤将通过对文本执行词法分析所获得的单词提取为关键字。
19.根据权利要求17的数据库搜索方法,其中按照预设和预定定时重复用于执行数据库搜索的步骤,以便在任何时间搜索到隶属关键字的新登记信息。
20.一种程序产品,用于使计算机执行以下处理利用通过预定信息活动获得并且存储在预定存储装置中的信息,根据分析信息活动的模式的分析结果,指定提取用于数据库搜索的关键字的方法;用提取方法从通过预定信息活动获得的文本中提取关键字;以及输出所提取的作为数据库搜索的搜索条件的关键字。
21.根据权利要求20的程序产品,在指定提取关键字的方法的过程中,用于将存储在存储装置中的文本分类成被确定为通过被执行以获得预定信息的信息活动已经获得的文本,和被确定为通过其他信息活动已经获得的文本,并且选择被确定为通过被执行以获得预定信息的信息活动而获得的文本,以作为关键字提取对象。
22.根据权利要求20的程序产品,在提取关键字的过程中,用于将通过对文本保存单元保存的文本执行词法分析所获得的单词提取为关键字。
23.根据权利要求22的程序产品,在提取关键字的过程中,用于从根据文本获得的单词中,提取具有高出现频率的预定数量的单词作为关键字。
24.根据权利要求20的程序产品,在指定提取关键字的方法的过程中,用于在预定主题线索中的电子邮件发送和接收动作以单纯的接收或者发送开始,并以预定数量的发送和接收之后的发送结束的情况下,分析存储在邮件中的电子邮件的发送和接收动作,并且选择该主题线索中的电子邮件作为关键字提取对象。
25.根据权利要求20的程序产品,在指定提取关键字的方法的过程中,用于分析存储在邮件中的电子邮件的发送和接收动作,并且针对每个主题线索确定发送和接收是否已经执行以便提供预定信息或获得预定信息,并且根据确定结果选择预定电子邮件作为关键字提取对象。
全文摘要
减少由用户执行的操作,从而在信息搜索中指定所要求的资源和信息,以便减少用户的麻烦。一种信息处理系统包括具有数据库的服务器10和通过网络50连接到服务器10的客户机20。客户机20在预定信息活动模式的基础上指定一种提取用于数据库搜索关键字的方法,从预定信息活动所获得的文本中提取一个用于数据库搜索的关键字并将它发送给服务器10。并且服务器10接收并保存客户机发送来的关键字,在没有来自客户机20的搜索请求时,将关键字作为一个搜索条件,在预定时间内执行数据库搜索,并将搜索结果发送给客户机20。
文档编号G06F17/30GK1581171SQ20041005643
公开日2005年2月16日 申请日期2004年8月10日 优先权日2003年8月12日
发明者田渊敬三 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1