使用web门户的内容采集自动化系统的制作方法

文档序号:6633865阅读:193来源:国知局
专利名称:使用web门户的内容采集自动化系统的制作方法
技术领域
下文描述的各实施例一般涉及通过广域网的数据的电子传输,尤其但不排它地涉及使用web门户的数据采集自动化系统。
背景技术
因特网是一种用于向非常多的用户,甚至在世界各地散布信息或文档的极其有效的机制。实际上,当今最复杂的软件开发者以某一方式将因特网集成到其软件产品中。实际上,许多软件开发者现今已通过因特网使用于更新或增强其软件产品的某些机制可用。这一机制的一个示例目前在模板或其它标准化文档可用于特定开发者的一套产品性软件的用户下载时使用。该产品性软件的用户可能期望不包括在所购买的产品性软件中的特定表单或模板。软件开发者可使附加模板或表单在可通过该产品性套件访问的因特网上的某一位置上可用。在一个示例中,可使补充日历模板或特殊预算表单在线可用。
产品性套件的用户理解由软件开发者变得可用的附加内容。这一类型的后继服务有助于使用户理解其在软件中的投资,由此向开发者提供了竞争性优势。在许多情况下,所提供的内容由开发者容易地生成。例如,反病毒程序的制造者可能是创建新病毒定义的最佳候选者。然而,在某些情况下,开发者不是内容的最佳来源。例如考虑提供办公室产品性解决方案的软件开发者的情况。开发者可能期望提供补充的商业模板来提高软件用户的效率。然而,产品性套件的开发者就职业而言作为一个程序员,可能不是用于生成商业模板的最佳来源。在那些情况下,开发者可与第三方提供者合伙来提供专门化的内容,该第三方提供者可以是个人,是特定主题领域的专家。这些安排通过允许每一方集中于其专长的特定领域、开发软件或创建高质量的内容,充分利用了专门化的知识。通常,这些合伙通过向不知道其服务的消费者展示内容提供者,并允许软件开发者以极少的费用或免费提供高质量的内容,创建了共生关系。
尽管通常是有益的,然而这些安排遭受至少一个问题现有技术使从若干各异的来源累积内容的过程变得尤其繁重和劳动密集型。换言之,选择与内容提供者合伙的软件开发者必须投入实际的人员来与每一潜在内容提供者处的人员接口。内容的实际交换使用用于数据交换的特别机制来处理。换言之,电子邮件通信可以是与一个内容提供者的所选择的通信手段,而另一个可选择在诸如光盘等数据介质上传送数据。必须以不同的方式处理每一关系使该过程变得低效。此外,内容的传送常规地与各方之间的许可协定相耦合。这些许可证通常频繁地改变,因此正确地确定什么条款被附加到一特定的提交有时候是困难的,这是因为正确地确定提交什么时候发生有时候是困难的。另外,该过程依赖于人员将内容的传送与许可证的执行同时耦合的勤奋,且人员经常会出错。
直到现在,本领域的技术人员仍无法理解避免手动累积用于包括在软件开发者在线分发服务中的内容的劳动密集型过程的机制。

发明内容
本发明针对实现使用web门户的内容采集自动化过程的技术和机制。简言之,该过程允许内容提供者访问广域网上的位置,并与一个或多个资源交互来上传文档。在该过程中,自动化了由人员执行的若干任务。例如,文档自动与对应于提交的任何法律条款耦合,并在提交时被归档。以此方式,避免了对于哪些条款应用于该提交的不确定性,并且在提交时自动从内容提供者收集关于该提交的描述性元数据。另外,内容自动连接到编辑上管理的内容审阅和发行系统。


参考附图描述了非限制和非穷尽实施例,贯穿附图,相同的标号指相同的部件,除非另外指定。
图1是概括地示出了用于执行自动化内容采集的系统的功能框图。
图2是更详细示出以上结合图1所介绍的web门户的功能框图。
图3是更详细示出以上结合图1所介绍的后端服务器的功能框图。
图4是示出可在开发者站点处用于向软件开发者提交文档的示例提交表单的概念图。
图5是概括地示出用于自动化内容采集的过程500的操作流程图。
图6示出了可用于实现本发明的示例计算设备。
具体实施例方式
以下描述针对一种自动化的内容采集系统。一般而言,提供了一种web门户,内容提供者可通过该web门户来向实体(例如,软件开发者)提交文档,并且提交与该提交的适用条款的当时最新的版本一起归档。现在将描述该一般概念的具体实现。
图1是概括地示出了用于执行自动化内容采集的系统100的功能框图。系统100中包括的是客户机计算系统102、在内容提供者108的控制下的计算系统、以及开发者站点150。这些元素的每一个通过诸如因特网112等广域网连接。
客户机计算系统102包括由软件开发者制造并销售的已安装软件应用程序104。在一个示例中,软件应用程序104是包括文字处理程序、电子表格程序等的产品性套件。另外,软件应用程序104被配置成从由软件开发者维护的内容服务器180检索增强的内容。增强内容的示例包括新模板或表单等等。
内容提供者108是在向软件开发者提供包括在内容服务器180中的内容的企业或个人的控制下的计算系统。贯穿本文档,术语“内容提供者”可互换地使用,来表明内容提供者计算系统108或操作内容提供者计算系统108的企业或个人。这是为了简化本讨论起见,并且该术语的互换使用不暗示或应当推断出任何重要性或相关性。
在本示例中,内容提供者108向软件开发者提供表示增强内容的文档111。内容提供者通常在某一领域中具有特定的专业知识,并且在该领域中向软件开发者提供增强的内容。在一个具体示例中,内容提供者可在法律行业中具有特定的专家知识,并可向软件开发者提供法律表单或模板。类似地,内容提供者可以在不动产行业中具有特定的专业知识,并且可向软件开发者提供不动产表单等等。在本示例中,文档111表示内容提供者108提供给软件开发者的增强内容。尽管此处被称为“文档”,然而所提供的内容可采用许多不同的形式,诸如剪贴画、文本帮助信息等。为本申请的目的,术语“文档”指包括可从网站服务的内容的任何数字文件或数据编译。
开发者站点150是可通过因特网112对其它计算系统可用的站点,以访问由软件开发者变得可用的某些信息。例如,软件开发者使软件应用程序104的增强内容可从内容服务器180上获得。如上所述,内容可以采用模板形式或其它形式,它们由软件开发者104使用,但是最初未安装在软件应用程序104中。本示例中的内容服务器180可由因特网112的一般用户,如客户机计算系统102访问。另外,客户机计算系统102上的软件应用程序104的用户可通过对软件应用程序104的普通使用来访问内容服务器180上的内容。
开发者站点150也包括web门户152,若干内容提供者,如内容提供者180可使用该web门户来向软件开发者提供要包括在内容服务器180中的文档。与内容服务器180不同,web门户152可由选择的用户可能使用认证或登录机制来访问。web门户152可用于使关于软件应用程序的开发信息对内容提供者可用。例如,软件开发者可使软件开发工具包(“SDK”)可用于从web门户152下载,并使回答许多开发相关问题的常见问题可用。另外,web门户152可提供一种允许内容提供者108将内容上传到开发者站点150的上传机制。
开发者站点150也包括后端服务器156,它是不能通过因特网112直接访问的计算系统。后端服务器156包括可用于控制采集内容的自动化过程的过程管理器158。后端服务器156使用常规的联网机制耦合至web门户152和内容服务器180。后端服务器156包括用于永久储存不是用于通过因特网112的公众访问的信息的归档存储159。
尽管在此概括地介绍,然而开发者站点150的每一组件将在下文结合图2和图3来更详细地讨论。简言之,内容提供者108访问开发者站点150上的web门户152,并将文档111上传到web门户152。在接收到文档111之后,web门户152向过程管理器158通知该提交。过程管理器158将文档111的副本连同结合文档111的提交所同意的任何合约条款一起归档到归档存储159。另外,过程管理器158自动启动用于准备文档111并将其包括到内容服务器180上的“发行过程”。该发行过程的细节在下文概括描述。
图2是更详细地示出了上文结合图1所介绍的web门户152的功能框图。web门户152包括便于内容的上传以及下载由软件开发者变得可用的某些开发信息的若干组件。例如,下载信息组件253由web门户152使用,以使某些信息对内容提供者可用。例如,软件开发者工具包(“SDK”)可在web门户152处未出,以供内容提供者用关于内容提供者可提交的任何内容的正确形式和内容的详细指令来下载。内容提供者可连接到web门户152,并使用下载信息组件253下载SDK的最新版本。下载信息组件253也可提供其它信息,如对常见问题的回答等等。
提交组件210对内容提供者可用,以将内容上传到web门户152。提交组件210可以是嵌入在web门户152上可用的标记语言页面中的一个或多个控件或其它小应用程序。激活提交组件210可向内容提供者108呈现某些合约条款214,内容提供者必须结合提交内容同意这些条款。合约条款214可用于由内容提供者结合允许内容提供者将文档111上传到web门户152或在此之前来查看。
web门户152也可向内容提供者呈现元数据表单212,用于收集关于内容提供者的提交的某些元数据的目的。例如,元数据表单212可用于提示内容提供者输入内容提供者的名称、关于文档111的各种信息、可用于文档的文字搜索的关键词等等。元数据表单212的一个特定示例在图4中示出并在下文描述。
激活提交组件210上的链接或其它按钮导致文档111、使用元数据表单212收集的信息以及合约条款214被提交给过程管理器158。作为响应,过程管理器158将文档111的副本以及至少合约条款214归档到永久归档存储159中。以此方式,关于哪些特定条款附加到文档111的提交或提交何时正式发生将没有任何将来的混淆。有利的是,合约条款214和文档111与文档111的提交同时的自动归档克服了对于人员记住收集并储存关于特定提交的当前最新条款的需求。
图3是更详细地示出上文结合图1所介绍的后端服务器156的功能框图。后端服务器156包括被配置成便于从内容提供者采集诸如文档111等增强内容的自动化过程的组件。如上所述,web门户152从内容提供者接收文档111,并将其呈现给过程管理器158,后者然后启动用于准备要包括到内容服务器180中的文档111的自动化发行过程。
更具体地,过程管理器158通过向产品管理组件320通知提交来启动发行过程。产品管理组件320负责编程上调度要结合软件应用程序的开发一起执行的特定“任务”。产品管理组件320包括工作顺序数据库325,其中是与需要执行的特定任务相等的所创建的条目。
可以理解,工作顺序数据库325内任务的创建导致生成对负责处理该类型的任务的特定个人的通知。换言之,在工作顺序数据库325中创建任务始于对要对所提交的文档111进行评估的人员的通知。产品管理组件320可使用通过自动化采集过程收集的元数据来帮助识别要分配给任务的特定个人。产品管理组件320维护描述与软件开发者相关联的个人的能力的资源信息327,以及用于将个人与所提交的文档进行匹配的其它信息。
在这一点上,人员干预330可用于对要包括在内容服务器180中的文档110进行评估。换言之,在允许内容服务器180展示文档111之前,使具有特定专业知识的人参与对文档的适合程度的评估是有益的。应当注意,这一点上(即,在发行过程中)人员干预330的使用不同于便于文档111提交本身(即,采集过程中)的人员干预的使用。例如,在这一点上,可假定所提交的文档111结合附加到其提交的任何合约条款一起归档。另外,对文档111已收集了一组标准元数据,并且该元数据可用于帮助识别最适合执行人员干预过程330的个人。人员干预330可包括诸如重新格式化文档111、对文档111的次要和主要编辑、文档111的质量的主管评估等事件。
当人员干预330完结时,文档111可被传递到内容管理器350,它负责对文档111作出任何最终的发行修改,以及将文档111发行到内容服务器180以供因特网112的用户访问。在这一点上,文档111可由一般的公众下载,尤其可由软件应用程序104的用户下载。
图4是示出了可在开发者站点150处用于向软件开发者提交文档的示例提交表单401的概念图。提交表单401可被实现为由web门户152供应的一个或多个基于标记的文档。可在接受与对软件开发者的内容提交相关联的某些合约条款之后,用提交表单401来提示内容提供者。提交表单401包括与要收集且与提交相关联的元数据相关联的数据条目字段。为此,提交表单401包括内容提供者信息部分405,其中收集了涉及内容提供者的身份的信息。例如,身份信息可包括提交文档的公司和个人的名称、联系信息(例如,电话号码、邮件和电子邮件地址等等)以及关于文档的创建者的生物测定信息。
提交表单401也包括文档信息部分407,其中收集了描述文档或提交本身的信息。例如,文档信息可标识文档所述的特定应用程序(例如,文字处理程序、电子表格程序、数据库程序、联系人管理程序等等)、该文档的语言、可用于描述该文档的内容的关键词、以及提交者希望包括在提交内或连同提交一起考虑的某些可能的杂项注释。
提供了附加文件部分409,以允许用户导航到用户的本地计算机或网络上的位置,并标识提交的文档的位置。附加文件部分409一旦在提交表单401完成之后,用户就可通过激活提交按钮411来执行提交。
图5是概括地示出了用于自动化内容采集的过程500的操作流程图。过程500可由通过广域网或局域网互连的一个或多个计算系统来实现。过程500在框501开始,其中启动与远程内容提供者的会话。例如,可在软件开发者的网络内的计算系统与由内容提供者操作的远程计算系统之间建立通信会话。会话的目的是由内容提供者向软件开发者提供文档(增强的内容)。
在框503,向内容提供者呈现应用于文档提交的合约条款。通常,可要求内容提供者在继续文档的提交之前阅读并接受许可证协定的条款等等。例如,合约条款可着眼于文档的所有权以及修改和分发文档的权限等等。
在框505,向内容提供者提示输入关于提交的元数据。元数据一般落入两个类别关于内容提供者的信息以及关于提交的信息。关于内容提供者的信息可包括内容提供者的名称、提供内容的个人的名字、内容提供者的联系信息等等。关于提交的信息可包括提交所属的软件应用程序的身份、提交的语言(如果适用)等等。
在框507,软件开发者接收提交。可以构想,软件开发者使用普通的文件或内容传输机制来提供文档。
在框509,文档结合应用于提交的合约条款来归档。如上所述,将当前最新的合约条款连同提交的副本一起自动归档不仅简化了人员必须执行的工作量,还避免了对条款的哪一特定版本适用的稍后的争论(如果条款稍后改变的话)。
在框511,执行提交的评估,并且执行对文档的任何适当修改,作为发行过程的一部分。修改可包括文档的格式化、或将提交置于适当的格式。发行过程可至少部分地由人员来执行。
在框512,将适当地格式化或修改的提交发行到内容服务器,在内容服务器上该提交可用于通过因特网下载。
尽管顺序地示出并描述了以上过程,然而在其它实施例中,各框中所描述的操作可以按不同的顺序、多次和/或并行地执行。
说明性操作环境上文描述的各实施例可以在采用为服务器或客户机的通用计算系统中实现。适用于本发明的实现的一个示例计算机环境在下文结合图6描述。
说明性计算环境图6示出了用于实现本发明的示例计算系统。参考图6,用于实现本发明的一个示例性系统包括诸如计算设备600的计算设备。在最基本的配置中,计算设备600通常包括至少一个处理单元602和系统存储器604。根据计算设备的确切配置和类型,系统存储器604可以是易失性(如RAM)、非易失性(如ROM、闪存等)或两者的某一组合。系统存储器604通常包括操作系统605、一个或多个应用程序606,并且可包括程序数据607。这一基本配置在图6中由虚线608内的组件示出。
计算设备600可具有另外的特征或功能。例如,计算设备600也可包括另外的数据存储设备(可移动和/或不可移动),如磁盘、光盘或磁带。这类另外的存储在图6中由可移动存储609和不可移动存储610示出。计算机存储介质可包括以用于储存如计算机可读指令、数据结构、程序模块或其它数据等信息的任一方法和技术实现的易失性和非易失性、可移动和不可移动介质。系统存储器604、可移动存储609和不可移动存储610都是计算机存储介质的示例。计算机存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(“DVD”)或其它光存储、磁盒、磁带、磁盘存储或其它磁存储设备、或可以用来储存期望的信息并可由计算设备600访问的任一其它介质。任一这类计算机存储介质可以是设备600的一部分。计算设备600也可具有(多个)输入设备612,如键盘、鼠标、输入笔、语音输入设备、触摸输入设备、扫描仪等等。也可包括(多个)输出设备614,如显示器、扬声器、打印机等等。这些设备在本领域中是众所周知的,因此无需在此详细讨论。
计算设备600也包含允许设备如通过网络与其它计算设备618进行通信的通信连接616。通信连接616是通信介质的一个示例。通信介质通常可以具体化为诸如载波或其它传输机制等已调制数据信号中的计算机可读指令、数据结构、程序模块或其它数据,并包括任一信息传送介质。术语“已调制数据信号”指以对信号中的信息进行编码的方式设置或改变其一个或多个特征的信号。作为示例而非局限,通信介质包括有线介质,如有线网络或直接连线连接,以及无线介质,如声学、RF、红外和其它无线介质。本发明使用的术语计算机可读介质包括存储介质和通信介质。
尽管示出并描述了示例实施例和应用,然而可以理解,本发明不限于上文所描述的精确配置和资源。可以在此处所揭示的本发明的方法和系统的安排、操作和细节上作出本领域技术人员清楚的各种修改、改变和变化,而不脱离所要求保护的本发明的范围。
权利要求
1.一种用于内容采集的计算机实现的方法,包括启动用于从内容提供者自动采集文档的内容采集事件,所述文档与软件产品相关联;向所述内容提供者提示应用于所述内容采集事件的合约条款;从所述内容提供者接收所述文档;以及将所述合约条款结合所述文档一起自动归档到永久归档存储中。
2.如权利要求1所述的计算机实现的方法,其特征在于,还包括自动启动一发行过程,用于将所述文档发行到内容服务器以使所述文档可通过广域网来获得。
3.如权利要求1所述的计算机实现的方法,其特征在于,启动所述内容采集事件包括接收启动主机web门户和远程设备之间的会话的请求,所述远程设备在所述内容提供者的控制下。
4.如权利要求3所述的计算机实现的方法,其特征在于,所述web门户使涉及软件产品的开发的信息可用于下载。
5.如权利要求4所述的计算机实现的方法,其特征在于,所述可用于下载的信息包括对关于软件产品的开发的常见问题的回答。
6.如权利要求4所述的计算机实现的方法,其特征在于,所述可用于下载的信息包括具有文档的开发者工具包以及协助软件产品的开发的其它编程工具。
7.如权利要求4所述的计算机实现的方法,其特征在于,所述软件产品包括软件应用程序的产品性的令人满意的事物。
8.如权利要求1所述的计算机实现的方法,其特征在于,所述文档包括被配置成用于软件产品的模板。
9.如权利要求1所述的计算机实现的方法,其特征在于,所述文档包括可由所述软件产品消耗来使得最初未包括在软件产品中的功能变得可用的内容。
10.一种用执行权利要求1所述的计算机实现的方法的计算机可执行指令来编码的计算机可读介质。
11.一种具有用于内容采集的计算机可执行指令的计算机可读介质,所述指令包括响应于内容提供者与web门户之间的会话的启动,向所述内容提供者提示应用于所述内容采集的合约条款;响应于所述合约条款的接受,从所述内容提供者接收内容;将所述内容与所述合约条款归档到永久归档存储中;以及启动使所述内容能够通过广域网获得的发行过程。
12.如权利要求11所述的计算机可读介质,其特征在于,所述会话包括所述内容提供者和所述web门户之间通过全球区域网的通信会话。
13.如权利要求11所述的计算机可读介质,其特征在于,所述内容包括涉及软件产品的文档。
14.如权利要求13所述的计算机可读介质,其特征在于,所述合约条款包括支配内容提供者以及软件产品的开发者的操作者的各自权利和义务的一组条款。
15.如权利要求13所述的计算机可读介质,其特征在于,所述文档包括以下的一组中所选择的一个或多个模板、表单、剪贴画图像以及文本帮助信息。
16.如权利要求11所述的计算机可读介质,其特征在于,所述发行过程包括人员干预部分,其中个人对所述内容进行评估。
17.如权利要求16所述的计算机可读介质,其特征在于,所述个人修改所述内容以将所述内容置于用于发行到内容服务器的形式。
18.如权利要求11所述的计算机可读介质,其特征在于,所述发行过程包括发行部分,其中内容被发送到内容服务器,在那里所述内容可用于通过广域网来访问。
19.一种用用于内容采集的计算机可执行组件来编码的计算机可读介质,所述组件包括web门户,包括下载区域和上传区域,所述下载区域包括涉及软件产品的开发的信息,所述上传区域被配置成从内容提供者接收文档;以及后端服务器,包括用于从web门户接收文档并同时归档文档和与内容采集相关联的当前最新合约条款的过程管理器,所述过程管理器还用于启动发行过程。
20.如权利要求19所述的计算机可读介质,其特征在于,所述文档包括被配置成用于所述软件产品的模板。
21.如权利要求19所述的计算机可读介质,其特征在于,所述文档包括可由所述软件产品消耗来使最初未包括在软件产品各种的功能变得可用的内容。
22.如权利要求19所述的计算机可读介质,其特征在于,所述可用于下载的信息包括具有文档的开发者工具包,以及协助软件产品的开发的其它编程工具。
23.如权利要求19所述的计算机可读介质,其特征在于,所述后端服务器还包括永久归档存储机制。
24.如权利要求19所述的计算机可读介质,其特征在于,所述上传区域还包括被配置成从内容提供者接收元数据的提交表单,所述元数据包括描述所述文档的信息。
25.如权利要求24所述的计算机可读介质,其特征在于,所述元数据还包括描述内容提供者的信息。
全文摘要
所描述的是实现使用web门户的内容采集自动化过程的技术和机制。该过程允许内容提供者访问广域网上的位置,并与一个或多个资源交互来上传文档。在该过程内,自动化了由人员执行的若干任务。例如,文档自动与对应于提交的法律条款相耦合,并在提交时归档。以此方式,避免了对于哪些条款应用于提交的不确定性。另外,内容自动连接到编辑上管理的内容查看和发行系统。
文档编号G06Q10/00GK1744082SQ20051008820
公开日2006年3月8日 申请日期2005年7月22日 优先权日2004年8月31日
发明者I·欧里奥丹, J·A·莱德贝特-汉尼鲍尔, M·A·阿巴尔, P·金奇, T·A·梁 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1