基于基于上下文的电子文件搜索的活动推荐的制作方法

文档序号:6505233阅读:182来源:国知局
基于基于上下文的电子文件搜索的活动推荐的制作方法
【专利摘要】本发明涉及基于基于上下文的电子文件搜索的活动推荐。一种计算机硬件实现的方法、系统和/或计算机程序产品基于电子文件中的识别的非合成事件元素产生活动推荐。执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符。包含共同合成事件的每个电子文件是相关电子文件。针对每个相关电子文件搜索至少一个非合成事件元素,其中非合成事件元素是不存在于合成事件中的事件元素。基于识别的非合成事件元素产生推荐。然后把一组二进制数据发送给客户端,该组二进制数据包括合成事件、相关电子文件、非合成事件元素和所述推荐。
【专利说明】基于基于上下文的电子文件搜索的活动推荐
【技术领域】
[0001]本公开涉及计算机的领域,具体地讲,涉及当搜索文档时的计算机的使用。更具体地讲,本公开涉及在通过使用基于上下文的搜索来搜索文档时的计算机的使用。
【背景技术】
[0002]文档(诸如,技术文章、研究论文、学术论文、网页、博客等)提供关于广泛的范围的主题的信息。信息的这种多样性使得文档对于许多不同类型的项目而言有价值。然而,当前文档搜索技术仅识别解决特定问题/主题的文档,从而能够回答特定问题和/或能够确认已知信息。

【发明内容】

[0003]一种计算机硬件实现的方法、系统和/或计算机程序产品基于电子文件中的识别的非合成事件元素产生活动推荐。执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符,并且其中在执行电子文件的数据库的基于上下文的搜索之前,共同合成事件的定义是未知的。包含共同合成事件的每个电子文件是相关电子文件。针对每个相关电子文件搜索至少一个非合成事件元素,其中非合成事件元素是不存在于合成事件中的事件元素。基于识别的非合成事件元素产生推荐。然后把一组二进制数据被发送给客户端,所述一组二进制数据包括合成事件、相关电子文件、非合成事件元素和推荐。
【专利附图】

【附图说明】
[0004]图1描述可实现本公开的示例性系统和网络;以及
[0005]图2是为了基于电子文件中的识别的非合成事件元素产生活动推荐而由处理器执行的一个或多个示例性步骤的高级流程图。
【具体实施方式】
[0006]所属【技术领域】的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
[0007]可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一但不限于一电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0008]计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括一但不限于一电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0009]计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括一但不限于一无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0010]可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言一诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0011]下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
[0012]也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)0
[0013]也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的处理,从而使得在计算机或其它可编程装置上执行的指令提供实现流程图和/或框图中的方框中规定的功能/操作的处理。
[0014]现在参照附图,并且具体地参照图1,描述可由本发明的实现方式使用并且在本发明的实现方式中使用的示例性系统和网络的方框图。要注意的是,针对计算机102以及在计算机102内显示的示例性架构(包括描述的硬件和软件)中的一些或全部可由软件部署服务器150、电子文件服务计算机152和/或客户计算机154使用。
[0015]示例性计算机102包括处理器104,处理器104耦接到系统总线106。处理器104可使用一个或多个处理器,所述一个或多个处理器中的每一个具有一个或多个处理器核。驱动/支持显示器110的视频适配器108也耦接到系统总线106。系统总线106经由总线桥112耦接到输入/输出(I/O)总线114。I/O接口 116耦接到I/O总线114。I/O接口116承担与各种I/O装置(包括键盘118、鼠标120、介质托盘122 (介质托盘122可包括诸如⑶-ROM驱动器的存储装置、多媒体接口等)、打印机124和外部USB端口 126)的通信。尽管连接到I/O接口 116的端口的格式可以是对于计算机架构领域技术人员而言已知的任何格式,但在一个实施例中,这些端口中的一些或全部是通用串行总线(USB)端口。
[0016]如上所述,计算机102能够使用网络接口 130与软件部署服务器150以及电子文件服务计算机152和客户计算机154通信。网络接口 130是硬件网络接口,诸如网络接口卡(NIC)等。网络128可以是外部网络(诸如,互联网)或内部网络(诸如,以太网或虚拟专用网络(VPN))。
[0017]硬盘驱动器接口 132也耦接到系统总线106。硬盘驱动器接口 132与硬盘驱动器134对接。在一个实施例中,硬盘驱动器134位于系统存储器136中,系统存储器136也耦接到系统总线106。系统存储器被定义为计算机102中的最低级别的易失性存储器。该易失性存储器包括另外的较高级的易失性存储器(未示出),包括但不限于,高速缓冲存储器、寄存器和缓冲器。位于系统存储器136中的数据包括计算机102的操作系统(OS) 138和应用程序144。
[0018]0S138包括用于提供对资源(诸如,应用程序144)的透明用户访问的壳(shell)140。通常,壳140是提供解释器以及用户和操作系统之间的界面的程序。更具体地讲,壳140执行被输入到命令行用户界面中的命令或者来自文件的命令。因此,壳140(也被称为命令处理器)通常是操作系统软件层级的最高级别,并用作命令解释器。壳提供系统提示,解释通过键盘、鼠标或其它用户输入介质输入的命令,并把解释的命令发送给操作系统的合适的更低级别(例如,内核142)以用于处理。要注意的是,尽管壳140是基于文本、面向行的用户界面,但本发明将会同样很好地支持其它用户界面模式,诸如图形、语音、手势等。
[0019]如上所述,0S138还包括内核142,内核142包括0S138的更低级别的功能,包括提供0S138的其它部分和应用程序144所需的必要服务,包括存储器管理、进程和任务管理、盘管理以及鼠标和键盘管理。
[0020]应用程序144包括以示例性方式显示为浏览器146的渲染器。浏览器146包括能够使万维网(WWW)客户端(例如,计算机102)使用超文本传输协议(HTTP)消息向互联网发送网络消息以及接收网络消息的程序模块和指令,由此能够实现与软件部署服务器150和其它计算机系统的通信。
[0021]计算机102的系统存储器(以及软件部署服务器150的系统存储器)中的应用程序144还包括活动推荐产生逻辑(ARGL) 148。ARGL148包括用于实现以下描述的处理(包括图2中描述的处理)的代码。在一个实施例中,计算机102能够从软件部署服务器150下载ARGL148(包括按照需求),其中直至需要执行ARGL148的代码时才下载该代码。还要注意的是,在本发明的一个实施例中,软件部署服务器150执行与本发明关联的所有功能(包括ARGL148的执行),由此使计算机102不必使用它自己的内部计算资源执行ARGL148。
[0022]要注意的是,在计算机102中描述的硬件元件不是穷举性的,而是代表性的,以突出本发明所需的必要部件。例如,计算机102可包括替代的存储器存储装置,诸如磁带、数字通用盘(DVD)、Bernoul Ii盒等。这些和其它变型应该落在本发明的精神和范围内。[0023]现在参照图2,提供为了基于电子文件中的识别的非合成事件元素产生活动推荐而由处理器执行的一个或多个示例性步骤的高级流程图。在启动块202之后,执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符(块204)。也就是说,对所有的电子文件进行上下文搜索以识别在所有的电子文件中包含的共享的(即,相同的)合成事件。这些电子文件由电子文件服务计算机(诸如,图1中描述的电子文件服务计算机152)提供。
[0024]合成事件被定义为一组上下文相关因素的不可执行描述符。例如,合成事件可以是单个文档中(即,位于同一文档内是“上下文”)的一组词A、B和C的出现(即,所有三个单词的出现是该“因素”)。
[0025]合成事件的另一例子可以是在正在针对该病人诊断(由原发病引起的)继发病(“上下文”)时的关于病人的事实的组合,诸如病人的年龄、当前折磨该病人的原发病的医疗诊断、以及该病人正在服用的药物的列表(“因素”)。
[0026]合成事件的另一例子可以是在正在研究特定疾病时正在科学实验室中检查的一组特征。也就是说,在这个例子中,“上下文”将会是导向理解特定疾病的病源(基础原因)的研究项目,并且“因素”是具有这种特定疾病的人共有的表现型(物理外观)、基因型(基因组成)和环境(例如,暴露于某些化学品等)。
[0027]术语“基于上下文的搜索”被定义为针对合成事件具有预定上下文关系的电子文件的搜索。例如,假设:在进行特定领域(例如,肿瘤学)的医学研究的同时产生合成事件,从而电子文件和合成事件位于同一上下文内。在这个例子中,活动类型(研究)定义上下文的范围,并因此定义基于上下文的搜索的范围,从而仅搜索直接与肿瘤学研究相关的文件。
[0028]如这里所使用的,电子文件被定义为任何文件或数据的集合。这种文件/数据集合的例子包括但不限于基于文本的文档、图像文件和音频文件。基于文本的文档的例子包括但不限于文本文件、博客、推特、电子邮件消息、网页、即时消息等。图像文件的例子包括但不限于用于电影的MPEG(运动图像专家组)文件、用于静止照片的JPEG(联合图像专家组)文件、用于扫描文档的TIFF(标记图像文件格式)和HF(便携式文档格式)文件、用于医学图像的DIC0M(医学数字成像与通信)文件、用于天文学图像的FITS (灵活图像传输系统)文件等。音频文件的例子包括但不限于从麦克风或其它声音捕捉装置产生的音频记录(例如,WAV文件、MP3文件、VOX文件等)。
[0029]当搜索包含特定词/短语的基于文本的文档时,对文件数据库中的每个文档(电子文件)(例如,互联网上或本地数据库中的研究论文、杂志文章等)执行简单的词搜索。然而,在执行基于文本的文档的这种词搜索之前,首先确定这个基于文本的文档是否与合成事件是上下文相关的(或替代地,与合成事件是上下文不相关的),从而电子文件的搜索是基于上下文的。例如,假设:合成事件是“城市”具有“90度”的平均高温。在确定电子文档是否包含合成事件元素“90degrees (90度)”之前,首先确定电子文档是否实际上与气象学相关。通过针对许多文章搜索列出的“关键词”能够执行这种确定。这些关键词提供描述基于文本的文档的上下文的词(诸如,“气象学”)。然而,如果不存在这种关键词列表,则必须针对文档检查上下文。
[0030]例如,如果搜索在特定电子文件中识别诸如“毕业证书”和“课程”的词,则"90degrees (90学位)”很可能在描述学院,并被略过。类似地,如果“直角”或“食物”或“病人”或“槽钢”位于特定电子文件中,则在第一实施例中这些文件也被略过(“上下文对准”),因为这种电子文件的内容不是上下文相关的。也就是说,基于上下文的搜索对于以下事物不感兴趣,并且因此忽略它们:关于提供90个不同学科的毕业证书(由学院提供的“90学位”)的学院的文章、关于直角(弧的“90度”)的数学出版物、关于食物制备(推荐将调味料保持在“90度”以上的温度)的文章、关于具有低温症的病人(描述病人的核心体温下降到“90度”)的文章或者关于结构钢的小册子(广告宣传“90度”槽钢)。
[0031]然而,如果诸如“天气”或“干旱”的术语出现在电子文件中,则该电子文件可能与合成事件(“城市具有90度的平均高温”)相关,并且由此被识别为上下文相关(“上下文对准”),因此被识别为相关电子文件。
[0032]要注意的是,在另一实施例中,在特定文档/电子文件中识别合成事件元素之后,进行搜索的基于文本的文档的上下文的确定。例如,假设:基于文本的文档很短(少于预定数量的词)并且不具有“关键词”列表。在这种情况下,在文档中针对术语“城市”和“90度”进行搜索。如果在文档中发现所述术语,则在该文档中搜索合成事件之前,上下文评估(使用上下文确定方法,诸如这里描述的上下文确定方法)确定该文档是否相关。
[0033]尽管能够如上所述执行基于文本的文档的搜索,但在视频文件中搜索合成事件需要另外的处理。首先,进行查询以确定描述合成事件的元数据以及描述正被搜索的图像的元标签是否可用。如果可用,则与文本搜索一样,简单地搜索该元数据/元标签。然而,如果这种元数据不可用(或者至少未在识别合成事件所需的具体程度上可用),则必须执行图像匹配。也就是说,构成视频文件的合成事件(视网膜具有指示视网膜中的孔的亮斑)的一部分的特定图像(例如,亮斑)被数字化为二进制值。然后,在其它数字化的电子视频文件中搜索这个二进制值以及来自合成事件的其它数字化的图像(即,描述视网膜的数字文件)。对于音频文件执行类似处理,其中,特定声音(例如,作为汽车事故的“上下文”内的“上下文相关因素”的尖叫的轮胎)被数字化为二进制值,该二进制值被用在数字化的电子音频文件的搜索中。
[0034]在一个实施例中,被选择用于搜索的电子文件基于它们的源的等级,其中所述等级基于源的公共声誉。例如,假设:特定电子文件来自于已知的、受信任的并且非常受尊敬的源(例如,享有声望的研究期刊)。源的这种描述(“已知的、受信任的、非常受尊敬的”)导致对这个特定源的重视。例如,这个源可被给予“9”的权重(按照1-10的标度)。然而,另一电子文件来自于仅被给予“2”的权重的源,因为它来自于未被同行审查的博客条目并且作者是匿名的。在这个例子中,较高等级(“9”)源的权重高于较低等级(“2”)源。在一个实施例中,在较低等级源之前搜索较高等级源,直至某一预定基线。也就是说,可预先确定最初将仅针对9-10之间等级的源搜索相关电子文件。如果时间、计算机资源和/或金钱仍然可用,则将会搜索7-8之间等级的源。该处理继续,直至I)不再有时间、计算机资源、金钱等可用;2)所有可用的电子文件已被检查(例如,本地数据库内);或3)仅高于某一预定数字的等级的可用电子文件(例如,其源的等级高于“7”的那些电子文件)已被预先确定为被授权用于检查,并且所有这种等级的电子文件已被检查。
[0035]在一个实施例中,电子文件的源的等级基于由合成事件的产生者对源的使用的历史频率。例如,假设:特定用户和/或计算机系统例行地针对特定数据库检查电子文件。在第一实施例中,频繁使用的源被视为更值得信赖,因此具有较高的权重。然而,在第二实施例中,使用频率较低的(因此,更加模糊的)源被视为更可能提供未在以前考虑过的非合成事件元素(下面描述),因此具有较高的权重。在任一实施例中,在较低等级源之前搜索较高等级源,直至某一预定基线,如上所述。
[0036]要注意的是,在块204中,在执行搜索之前,不知道合成事件。也就是说,搜索电子文件的处理识别两个或更多的电子文件中的共同合成事件。因此,该搜索并不开始于搜索已知的合成事件。
[0037]现在参照块206,随后针对每个相关电子文件(即,位于同一上下文内的那些文件)搜索非合成事件元素(即,不存在于合成事件中的事件元素)。例如,假设:合成事件是单个文档(例如,病人的文件)内的词/术语A、B和C的出现。进一步假设在块204中描述的搜索用于在同一出版物(电子文件)内具有术语A、B和C的在线出版物,并且假设一个或多个相关出版物(即,在同一文档内具有全部术语A、B和C的出版物)已被识别。一旦定位了这种相关电子文件,对该电子文件执行基于上下文的搜索,以识别该电子文件内的非合成事件元素。非合成事件元素是在合成事件中找不到的事件元素。在简单的词搜索的情况下,非合成事件元素将是词/术语D的存在,词/术语D在该合成事件(具有词/术语A、B和C)中找不到。当然,一个或两个文档将会包含其它词/术语,但这些已被预先确定为与这里描述的处理无关。
[0038]在另一例子中,假设:合成事件是城市具有90度的平均高温。进一步假设:识别的相关电子文件也包含城市的人口水平的描述,城市的人口水平与城市的天气没有关系,因此不存在于合成事件中。然而,如果很高百分比(例如,超过某预定百分比)的电子文件描述相同的人口水平,则这种相关可被视为对于改进当前研究、策略等是重要的。例如,如果很大百分比的电子文件描述城市具有90度的平均温度和超过2百万的人口,则非合成事件元素(“超过2百万的人口”)可能暗示需要创建关于对于将可能在给定的一年遭受热相关伤害的已知百分比(例如,2%)的城市居民而言将需要什么类型的卫生保健资源的策略。
[0039]现在参照块208,基于在识别的相关电子文件中发现的识别的非合成事件元素产生推荐。然而,在一个实施例中,软件逻辑(例如,图1中描述的ARGL148的一部分)基于识别的非合成事件元素产生推荐,该推荐可被发送给客户计算机(例如,图1中示出的客户计算机154)。这种推荐可用于:1)执行与导致合成事件的产生的用户活动(即,合成事件描述与用户活动相关的因素)无关的活动,或2)执行与这个原始用户活动相关的另外的步骤。
[0040]例如,假设:用户和/或计算机逻辑产生描述与用户执行的科学实验室研究相关的因素的合成事件。这个用户活动可以是来自特定的一组病人的血液样本的研究,所述特定的一组病人具有肝炎,年龄超过65岁,并且是杂食的人(统称为“合成事件A”)。使用这里描述的处理的电子文件的搜索揭示包含合成事件A并且还包含非合成事件元素(例如,对特定运动队的提及)的一个或多个电子文件。
[0041]在识别的相关电子文件中或者在任何其它电子文件中可能不存在使合成事件A与这个特定运动队的粉丝相关的任何事物,因为这二者看起来无关。然而,基于上下文的计算机逻辑能够推断这二者是相关的,并且将因此为用户产生推荐以研究它们的联系。因此,推荐能够是计算机产生的用以:1)研究与参加由这个特定运动队进行的比赛关联的健康危害。也就是说,能够随后进行推荐来研究与该特定运动队相关的主题,这可导致由基于上下文的计算机逻辑识别的自动售货机(vendor),或者它可导致以前未报告的因素(例如,这个特定运动队的体育场比赛地点的适当家政/卫生处理)。
[0042]在一个实施例中,识别出许多(超过某一预定数量/百分比)的电子文件既提及合成事件A又提及这个特定运动队的基于上下文的计算机逻辑可提示这样的推断:合成事件A和该特定运动队相关。
[0043]在另一实施例中,可由基于上下文的计算机逻辑提示合成事件A和该特定运动队相关的该推断,所述基于上下文的计算机逻辑把这个特定运动队与特定比赛地点关联(在一个电子文件中),把这个特定比赛地点与特定自动售货机关联(在另一电子文件中),并且把这个特定自动售货机与卫生法典违反引用关联(在又一电子文件中),由此导致基于上下文的计算机逻辑识别合成事件A和该特定运动队之间的可能联系。
[0044]替代地,能够进行推荐用以:2)对来自由合成事件A描述的特定的一组病人的血液样本执行另外的实验室测试。例如,假设:导致合成事件A的产生的当前科学实验室研究仅仅旨在进行血液样本的显微镜检查。基于识别的非合成事件元素,可进行推荐以执行血液样本的基因研究,以确定是否存在与合成事件A和这个特定运动队都关联的任何基因突变。这个提议可能最初看起来毫无根据。然而,基因组的完整性的检查可能提供实际支持该提议的线索/信息,或者至少提供新的研究方向的引导。
[0045]在本发明的另一实施例中,假设:合成事件描述与诊断医学病人相关的因素。也就是说,假设合成事件是:特定病人具有高血压,年龄超过65岁,并且是杂食的人(统称为“合成事件B”)。然而,卫生保健提供者不能基于这些因素和病人的慢性疲劳的抱怨诊断继发病(由原发病高血压引起的)。电子文件数据库(例如,来自互联网)的搜索揭示包括合成事件B以及非合成事件元素(诸如,对本地发电厂的提及)的一个或多个文档(相关电子文件)。基于上述分析的类型,可产生推荐用以:1)执行与导致该合成事件的产生的用户活动无关的活动,或2)执行与这个用户活动相关的另外的步骤。也就是说,I)能够进行推荐以研究在识别的本地发电厂周围的环境问题。替代地,2)能够推荐卫生保健提供者执行该特定病人的基因研究。再一次,尽管这种研究将最初看起来是不必要的,但相关电子文件提供必要信息以提示这种另外的测试。
[0046]如块210中所述,一组二进制数据然后被发送给客户计算机。这组二进制数据包括:1)共享的合成事件;2)识别的相关电子文件(或至少它的位置);3)相关电子文件内的识别的非合成事件元素的描述;以及4)推荐。也就是说,这组二进制数据(能够由处理器操纵)包括共享的合成事件自身(例如,上述合成事件A)。这组二进制数据还包括相关电子文件自身或至少该相关电子文件到提供合成事件描述的计算机的位置描述符(例如,超链接、通用资源定位符(URL)、文件路径等)。另外,这组二进制数据包括非合成事件元素的描述。因此,在以上提供的气象学例子中,合成事件将是城市具有90度的平均高温,相关电子文件将是描述多少人居住在具有90度的平均高温的同一城市(或替代地,另一城市)中的文档,并且识别的非合成事件元素的描述是居住在同一城市(或替代地,另一城市)中的人的数量。最后,这组二进制数据包括基于识别的非合成事件元素的推荐。
[0047]图2中描述的处理结束于结束块212。
[0048]附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0049]本文使用的术语仅用于描述具体实施例的目的,而非意图限制本发明。本文使用的单数形式“a”、“an”和“the”意图也包括复数形式,除非上下文清楚地另有指示。还将会理解,当在本说明书中使用时,术语“包括”和/或“包含”指定存在陈述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其它特征、整数、步骤、操作、元件、部件和/或它们的组合。
[0050]以下的权利要求中的所有装置或步骤加功能元素的对应结构、材料、动作和等同物旨在包括用于结合具体要求保护的其它要求保护的要素执行功能的任何结构、材料或动作。为了说明和描述的目的提供本发明的各种实施例的描述,但并非是穷尽的或者把本发明局限于公开的形式。在不脱离本发明的范围和精神的情况下,许多修改和变化对于本领域普通技术人员而言将会是清楚的。选择并描述实施例,以便最好地解释本发明的原理和实际应用,并且使本领域其他普通技术人员能够针对具有适合设想的具体用途的各种变化的各种实施例理解本发明。
[0051]还需要注意的是,在本公开中描述的任何方法可通过使用VHDL(VHSIC硬件描述语言)程序和VHDL芯片来实现。VHDL是用于现场可编程门阵列(FPGA)、专用集成电路(ASIC)和其它类似电子装置的示例性设计输入语言。因此,这里描述的任何软件实现的方法可由基于硬件的VHDL语言仿真,VHDL语言随后被应用于VHDL芯片,诸如FPGA。
[0052]如此已通过参照本发明的说明性实施例详细描述了本申请的本发明的实施例,将会清楚的是,在不脱离在所附权利要求中定义的本发明的范围的情况下,可以实现修改和变化是显而易见的。
【权利要求】
1.一种基于电子文件中的识别的非合成事件元素产生活动推荐的计算机硬件实现的方法,所述计算机硬件实现的方法包括:执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符,其中在执行电子文件的数据库的基于上下文的搜索之前共同合成事件的定义是未知的,并且其中均包含共同合成事件的电子文件是相关电子文件;针对每个相关电子文件搜索至少一个非合成事件元素,其中非合成事件元素不存在于合成事件中;基于识别的非合成事件元素产生推荐;以及把一组二进制数据发送给客户计算机,其中所述一组二进制数据包含合成事件、相关电子文件、所述至少一个非合成事件元素以及所述推荐。
2.如权利要求1所述的计算机硬件实现的方法,其中,所述推荐推荐执行与导致合成事件的产生的用户活动相关的另外的步骤。
3.如权利要求1所述的计算机硬件实现的方法,其中所述合成事件描述与用户活动相关的因素,其中用户活动是科学实验室研究,并且其中所述计算机硬件实现的方法还包括:产生推荐以对与识别的非合成事件元素相关的主题执行另外的科学实验室研究。
4.如权利要求1所述的计算机硬件实现的方法,其中所述合成事件描述与用户活动相关的因素,其中用户活动是诊断医学病人,并且其中所述计算机硬件实现的方法还包括:产生推荐以对医学病人执行与识别的非合成事件元素相关的另外的医学测试。`
5.如权利要求1所述的计算机硬件实现的方法,其中所述合成事件描述用户活动,并且其中所述计算机硬件实现的方法还包括:基于用户活动的活动类型确定基于上下文的搜索的上下文。
6.如权利要求1所述的计算机硬件实现的方法,还包括:对相关电子文件的源进行评级,其中所述评级基于源的公共声誉;以及基于所述评级对识别的非合成事件元素进行加权。
7.如权利要求1所述的计算机硬件实现的方法,还包括:对相关电子文件的源进行评级,其中所述评级基于由合成事件的产生者对源的使用的历史频率;以及基于所述评级对识别的非合成事件元素进行加权。
8.一种用于识别电子文件中的非合成事件元素的系统,包括:构造为执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件的设备,其中合成事件是一组上下文相关因素的不可执行描述符,其中在执行电子文件的数据库的基于上下文的搜索之前共同合成事件是未知的,并且其中均包含共同合成事件的电子文件是相关电子文件;构造为针对每个相关电子文件搜索至少一个非合成事件元素的设备,其中非合成事件元素不存在于合成事件中;构造为基于识别的非合成事件元素产生推荐的设备;以及构造为把一组二进制数据发送给客户计算机的设备,其中所述一组二进制数据包含合成事件、相关电子文件、所述至少一个非合成事件元素和所述推荐。
9.如权利要求8所述的系统,其中所述推荐推荐执行与导致合成事件的产生的用户活动相关的另外的步骤。
10.如权利要求8所述的系统,其中所述合成事件描述与用户活动相关的因素,其中用户活动是科学实验室研究,并且其中所述系统还包括:构造为产生推荐以研究与识别的非合成事件元素相关的主题的设备。
11.如权利要求8所述的系统,其中所述合成事件描述与用户活动相关的因素,其中用户活动是诊断医学病人,并且其中所述系统还包括:构造为产生推荐以对医学病人执行与识别的非合成事件元素相关的另外的医学测试的设备。
12.如权利要求8所述的系统,其中所述合成事件描述用户活动,并且其中所述系统还包括:构造为基于用户活动的活动类型确定基于上下文的搜索的上下文的设备。
13.如权利要求8所述的系统,还包括:构造为对相关电子文件的源进行评级的设备,其中所述评级基于源的公共声誉;以及构造为基于所述评级对识别 的非合成事件元素进行加权的设备。
14.如权利要求8所述的系统,还包括:构造为对相关电子文件的源进行评级的设备,其中所述评级基于由合成事件的产生者对源的使用的历史频率;以及构造为基于所述评级对识别的非合成事件元素进行加权的设备。
【文档编号】G06F17/30GK103530308SQ201310272570
【公开日】2014年1月22日 申请日期:2013年7月2日 优先权日:2012年7月2日
【发明者】R·R·弗莱德朗得, J·R·可里默, J·西罗伯尔西科 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1