话音访问基于互联网的信息的系统与方法

文档序号:2822930阅读:425来源:国知局
专利名称:话音访问基于互联网的信息的系统与方法
背景技术
本发明一般涉及互联网,尤其涉及话音访问基于互联网的信息的系统与方法。
互联网已发展成一种人们利用联网的计算机能访问几乎无限信息的媒体。经互联网访问信息的能力能以不同的方式提供。有时候信息由互联网搜索引擎提供,引擎一般对关键词或短语搜索互联网,然后提供一张网址清单,里面包括网页里的搜索词或短语,如它的文本或嵌入的标识符(如metatags)。信息也可通过互联网用各个网址访问,各个网址提供各种时间苛刻的和与时间无关的两种信息和服务。
然而,虽然互联网让用户有机会访问大量信息,但是要找到有用的基于互联网的信息往往费时且麻烦。再者,很难在多个个别的网址找寻和对比同样的信息,因为同样的信息可用多种不同方式组织,以多种不同形式描述,而且在不同时间变化。除了这些互联网固有的难点以外,若没有经互联网服务提供者(ISP)与互联网连接的计算机或其它这类电子装置,就无法访问互联网上的信息。另外,要有效地访问期望的基于互联网的信息,还须学会如何通过互联网查找信息。这样,若无计算机、不与ISP连接、没有合适的软件、未经互联网应用的培训或实践的人就不能访问基于互联网的信息。这些因素构成了行家作出如下评估的理由到1999年底,只有30%的美国人访问过互联网或“网上冲浪”(据Forrester研究公司统计,1999年10月)。
因此,希望提供一种让人们能访问基于互联网的信息的系统与方法,它无须直接应用计算机,不作个人ISP连接,也不必作互联网应用的培训或实践。此外,还希望提供一种能让人们应用便利的手段获得基于互联网的信息的系统与方法,例如通过公共电话用话音访问。
迄今有许多问题致使无法实现这种系统与方法。例如,使用这类系统与方法的人想马上或至少在一定时间内获得信息,这种速度难以实现。甚至使用常规的高速计算机和快速通信连接,访问互联网所需的延迟也让许多人把它称为“全时间等待”,而不是全世界网络。对这类系统与方法的另一个挑战是话音通信识别。常规话音识别技术速度慢而且不准确。而用话音便利有效地访问基于互联网的信息,则要求简捷而精确的话音识别。对这类系统与方法的再一个挑战是如何提供免费访问基于互联网的信息而又对服务保持财政支持。互联网上的普通广告要求能见到广告信息,如“标识”,通过某种手选,如“点击”该标识,可得到做广告的产品或服务的详细信息。
因此,除了上述诸功能外,还希望提供一种能让人们迅速而准确地对免费的基于互联网的信息作话音访问的系统与方法,而且更加希望提供的系统与方法能通过拨一电话号码来访问范围广泛的基于互联网的信息。
发明简要内容本发明一实施例的一个方面是一种话音访问基于互联网的信息与服务的方法。该方法包括接收指示通信连接请求的信号,其中通信连接请求由通信设备的用户发出;建立与用户的通信设备的通信连接;接收来自用户的话音信息;和响应接收自用户的话音信息传递话音信息。响应话音信息包括基于互联网的信息。
简言之,本发明一实施例的另一个方面是单个互联网话音入口,可在互联网上访问范围广泛的现有信息与服务。该话音入口包括用户界面、至少一个数据库和更新引擎。用户界面协调与用户的话音通信。数据库与用户界面耦合,贮存了有关用户的信息和基于互联网的信息。更新引擎耦合至数据库并与互联网通信,提供更新的基于互联网的信息。
简言之,本发明一实施例的又一个方面是一种话音访问基于互联网的信息与服务的系统,包括接收指示通信连接请求的信号的装置、建立与用户通信连接的装置、用话音向用户传递信息的装置、接收用户的话音信息的装置、以及响应接收自用户的话音信息传递话音信息的装置。响应话音信息包括通过互联网从源获得的基于互联网的信息。
简言之,本发明一实施例的再一个方面是一种计算机程序制品,它包括计算机可读程序码,用于话音访问基于互联网的信息与服务。计算机程序制品里的程序码包括第一计算机可读程序码,用于接收指示通信连接请求的信号,其中通信连接请求由通信设备的用户发出;第二计算机可读程序码,用于建立与用户的通信设备的通信连接;第三计算机可读程序码,用于用话音向用户传递信息;第四计算机可读程序码,用于接收用户的话音信息;和第五计算机可读程序码,用于响应接收自用户的话音信息传递话音信息。响应话音信息包括通过互联网从源获得的基于互联网的信息。
简言之,本发明一实施例的还有一个方面是包括用户界面与数据库的话音入口,用户界面协调与用户的话音通信,而话音通信包括基于互联网的信息。
本领域技术人员通过参阅以下的附图、详细描述和所附如权利要求,将明白本发明诸实施例的其它特征与优点。
附图简介本发明以实例示明,但不限于附图的形态,图中用同样的标号表示同类元件,其中

图1一般表示接至互联网的话音入口;图2是图1中话音入口示例功能实施例的功能框图;图3是图1话音入口示例物理实施例的详细框图;图4是图1话音入口使用的示例数据结构模型的图示表示;图5是图4示例数据结构模型对用户相关信息的图示表示;图6是图4示例数据结构模型对广告相关信息的图示表示;图7是图4示例数据结构模型的示例创建过程的流程图;图8是图7示例创建过程的图示表示;图9是用非编程装置获得基于互联网的信息示例过程的流程图;图10是非编程开发与图1话音入口相关的规则的示例过程的图示表示;图11是用于非编程开发与图1话音入口相关的规则的示例图示用户界面;图12是一示例图示用户界面窗口,用于非编程开发与图1话音入口相关的规则;图13是图12图示用户界面窗口的扩展形式;图14是一示例图示用户界面搜索数据编辑窗口,用于非编程开发与图1话音入口相关的规则;图15是一示例图示用户界面窗口,用于非编程开发与图1话音入口相关的规则;
图16是图15图示用户界面窗口的扩展形式;图17是一示例图示用户界面窗口,用于非编程开发与图1话音入口相关的规则;图18是一卖主形式选项的示例图示用户界面窗口,用于非编程开发与图1话音入口相关的规则;图19是一示例图示用户界面窗口,在非编程开发与图1话音入口相关的规则时用于测试URL;图20是一示例图示用户界面窗口,在非编程开发与图1话音入口相关的规则时用于选择图案;图21是一用来识别图案的示例图示用户界面窗口,在非编程开发与图1话音入口相关的规则期间可检测多个页面上的连接;图22图示表示用于辐射形编程的分层结构;图23是一示例图示用户界面窗口,用于与图1话音入口配用的辐射形编程;图24是图23图示用户界面窗口的扩展形式;图25是把信息组合成图1话音入口的统一数据库示例过程的流程图;图26是把信息组合成图1话音入口的统一数据库第二示例过程的流程图;图27图示表示由两个在存在物(existant)建立一典型存在物以对一指定项得出更完整的信息;图28图示表示从互联网源到图1话音入口用户的数据隔离与变换示例过程的第一部分;图29图示表示图28示例过程的第二部分,其中数据从互联网源到图1话音入口用户隔离和变换;图30是图1话音入口示例操作流的流程图;图31是图30流程图中示例操作子系统的流程图;图32是图30流程图中第二示例操作子系统的流程图;图33是图30流程图中第三示例操作子系统的流程图;图34是在图1话音入口中集中用户响应以确定所需项目或服务的示例过程的流程图;图35是用图1话音入口作交易的示例过程流程图36A是用图1话音入口登广告示例过程的流程图;图36B是用图1话音入口登广告第二示例过程的流程图;图37是图1话音入口示例对话图的流程图;图38是图37示例对话图示例子系统的流程图;图39是图37示例对话图第二示例子系统的流程图;图40是图37示例对话图第三示例子系统的流程图;图41是图37示例对话图第四示例子系统的流程图;图42是图37示例对话图第五示例子系统的流程图;图43是图37示例对话图第六示例子系统的流程图。
示例实施例的详细描述描述一种话音访问基于互联网的信息的系统与方法。以下描述中,为便于说明,提出了许多特定的细节以透彻理解本发明。然而,本领域的技术人员显然无需这些细节就可实施本发明。在其它一些场合,为便于描述本发明的示例实施例,以框图形式示出了已知的结构与装置。
本发明一实施例的一个方面包括一个以下述方法实现话音访问基于互联网的信息和服务的系统接收指示通信请求的信号,该通信请求由通信设备的用户提出;与用户的通信设备建立通信连接;接收用户的话音;和响应接收自用户的话音信息而传递话音信息。响应话音信息包括基于互联网的信息。
本发明另一个方面涉及的一种系统与方法,可通过电话用话音在互联网上访问、处理和执行业务。本发明又一个方面涉及的一种系统与方法,可确定一个网站是否拥有与另一网站同样的信息。本发明再一个方面涉及的一种系统与方法,可利用互联网话音入口登广告。本发明再一个方面涉及的一种系统与方法,可以非编程开发用于变换基于互联网的信息的规则。本发明另一个方面涉及的系统与方法,用于将用户响应集中在互联网话音入口系统,以确定所需的项目。本发明另一个方面涉及的一种系统与方法,用于变换和规范系统构成的数据。
在一实施例中,使用的计算机系统有一中央处理单元(CPU),可执行存储器包含的指令序列。具体而言,执行指令序列可让CPU执行下述步骤。指令可以从只读存储器(ROM)、海量存储装置或某一其它持久存储器装入随机存取存储器(RAM),供CPU执行。在其它实施例中,可用硬线电路代替软件指令或与之结合来实施本发明。因此,这里描述的诸实施例并不限于任何特定的硬线电路与软件的结合,也不限于任何具体的计算机系统执行的指令源。
图1展示了话音入口10与网络20之间的连接。在一个示范实施例中,网络20是互联网,使用TCP/IP网络协议来促进数据发送和交换的计算机网络的一种世界性网络。在选择性实施例中,网络20是任何类型的网络,例如虚拟专用网络(VPN)。网络20较佳地提供与“超文本标签语言(HTML)”网页30和40的通信。网页30和40包括各种网络服务器上的各种数据。网络20也提供与非话音入口50的通信,该非话音入口将包括数据库58的计算机52、54和服务器56连接到网络20。服务器56是连接到网络20的任何类型的公司、内容或服务供应商。数据库58是数据存储介质,它可以是光学的、磁性的或任何其他合适的存储介质。
通常,实施话音入口10作为服务器的网络。服务器可以由软件来配置。较佳的是,服务器包括大量的读/写存储器,读/写存储器包括磁盘驱动器和其他存储器。一般而言,通过拨打开始电话与话音入口10之间的通信的电话号码(使用传统的电话服务(POTS)),用户经由电话(例如,手机12或标准电话14)访问话音入口10。或者,可以使用其他类型的电话服务,将话音或话音数据传递给入口10。可以使入口10可以经由各种线路、网络和站连接到电话12和14。有利的是,话音入口10提供与用户进行的话音通信。话音入口10允许用户访问来自网页30、40和经由网络20可获得的其他来源的信息和服务。话音入口10连续地检索、组织和存储来自各种网站和互联网服务的信息,以便迅速、有效率的方式提供这种访问。也可以为使用话音入口10而提供其他用户界面平台。例如,这种用户界面平台包括WAP(无线应用协议)和网络界面。
图2展示了由话音入口10执行的各种示范功能操作。这些功能可以用各种各样的方式来执行(包括任何数量的物理结构)。在一个示范实施例中,话音入口10包括用户界面110、广告子系统120、顾客管理子系统130、存在物子系统140、合成引擎150、更新引擎160和数据库170。
用户界面110协调话音入口10与用户之间的话音通信。用户界面110可以经由语音,经由互联网或“万维网”(WWW),经由无线应用协议(WAP)界面或任何其他的平台界面。在一个示范实施例中,用户界面是语音导向的。在这种语音导向的实施例中,用户界面110使用基于文字的自动语音识别(ASR),用于只要有可能就接受用户输入。用户界面110可以使用语音识别软件包(例如,MA的波士顿的Speech Works International所提供的Speech Works)。关于高速率的语音识别,用户界面110有利地采用集中过程,该过程将用户响应集中成一套可识别的回答。参考图34来进一步描述集中。用户界面110也使用基于拼写的ASR,用于当不可能有基于文字的ASR时接受用户输入。最后,用户界面110使用键盘输入,用于只有当有利于用户时才接受用户输入。键输入使用电话12和14上的按键(图4)。
在一个示范实施例中,用户界面110执行以下的一项或多项任务(1)利用电话号码和其他用户特殊信息来识别用户。(2)为给定平台上的给定用户开始新的通话。(3)为给定平台上的给定用户增加新的交互作用。(4)在话音入口10可得到的一套感兴趣的垂直域内更新用户的优先选择。(5)启动或禁止该感兴趣的垂直域中的用户优先选择。(6)对用户的专门技能水平进行一般的更新,或在特殊的纵向内对其进行更新。(7)更新用户的人口统计的或个人信息(以及信用卡信息)。(8)利用用户界面特殊信息来更新用户的通话状态。(9)将一张新的信用卡加入数据库。(10)利用新的信息来更新现存的信用卡。(11)利用信用卡类型和号码来识别信用卡,并检查它是否已在数据库中。(12)设置用户可获得的垂直域清单及其顺序。(13)正常结束用户的通话。(14)通知顾客管理子系统130异常终止用户的通话,进入某种被定义的状态(例如,呼叫丢失、通话超时)。(15)确定给定的某个平台的用户的最近时期的通话,致使如果异常终止通话(例如,呼叫丢失、通话超时),则可以恢复通话,并且返回被存储的通话状态。用户界面110可以执行有关识别、通话、用户和支付协议的额外功能。
广告子系统120协调与将在通信通话期间呈现给用户的广告有关的各项活动。在一个示范实施例中,广告子系统120包括各种广告(例如,受到赞助的广告、以特定用户为目标的广告,以及只在用户提出肯定的请求之后才呈现出来的基于许可的广告)。在一个示范实施例中,广告子系统120提供以下的一项或多项功能(1)根据正在被调查的用户、通话、位置、内容和项目来选择播放的广告。(2)记录曾播放的一个广告和它完成与否。(3)记录曾进行直通说话(即,如下所述,在一则广告中,用户仔细选择听取有关广告主题的更多内容)。(4)将顾客与通话信息存储在豆粒媒(bean)内,以致不需要重复调用数据库。(5)为提供广告的公司创建记录,并且能够识别一个广告。(6)创建将要被存储在数据库中的广告和广告的合同(因为一个广告可能具有用于系统上的不同的合同)。(7)出于广告销售的目的,创建一种新的销售雇员或雇主联系。(8)更新广告和/或该广告的合同。(9)更新广告公司,以改变联系信息和地址信息。(10)更新销售雇员和雇主联系。(11)将广告放置在活动清单中,将广告从活动清单中除去。(12)根据外部信息来标明将要完成或未完成的广告合同。(13)根据广告类型来显示活动广告的清单。(14)根据不活动的广告、活动的广告、未完成的广告、完成的广告或所有广告的标准,来显示与公司有关的广告清单。(15)根据以上标准来显示与广告有关的合同清单。(16)根据以上标准来显示与销售雇员有关的合同清单。(17)仅仅通过传入一个独特的标识符,来检索雇员、公司、广告或广告合同的已完成的清单。(18)在数据库中搜索雇员、公司、广告和广告合同存在物的接近字符字符串匹配。(19)已向特殊合同上的公司付款的交货情况(保持跟踪),并能够更新该公司的重要的结算差额表。(20)搜索更新记录,以确保没有数据完整性错误。(21)创建和修改存储一种特殊类型的广告所需要的播放清单。
可以使用各种不同的方法来执行这些操作中的每项操作。参考图36进一步描述广告操作。广告子系统120可以执行与识别、通话、用户和支付协议有关的额外功能。这里所揭示的广告技术也可以用于传统的个人计算机(PC)界面网络连接。
顾客管理子系统130协调信息的管理,所述信息的管理与用户和用户使用话音入口10有关。在一个示范实施例中,顾客管理子系统130获取有关用户的信息(例如,优先选择和人口统计,它们由用户界面110、广告子系统120和话音入口10的其他功能有选择地使用)。顾客管理子系统120可以执行与识别、通话、用户和支付协议有关的额外功能。虽然分开描述子系统110、120和130,但是,在不脱离本发明的原理的前提下,每个子系统的操作可以被综合在一个单一的单元中。
“用户界面(UI)”110和顾客管理子系统130交互作用,以便提供选择垂直域和访问基于互联网的信息。垂直域对、用户可以从话音入口10内选择的各种领域或区域加以分类。为了使UI 110能够有效地与用户进行通信,必须被动地或主动地确定和理解某些优先选择和用户情况。顾客管理子系统130将这类信息存入数据库170。或者,一个分开的顾客数据库可以保持这类信息。
顾客管理子系统130获取确定来自UI 110的顾客的优先选择和情况所需要的信息。UI 110将数据传入顾客管理子系统130,顾客管理子系统130对其加以处理,然后将其转发到至少一个数据库。此外,对存在物子系统140中的各种优先选择进行更新,以便进一步解析。然后,存在物子系统140将信息(例如,用户的优先选择和情况)传送回UI 110。
有利的是,顾客管理子系统130是可修改和可扩展的,而不会使响应时间有相当大的延长。这样,将新的垂直域加到话音入口110的过程快速而一致。由于可以总是增加新的垂直域,因此,永远无法完全地定义顾客情况和人口统计的类型。
顾客管理子系统130经由数据库记录与签约和未签约的用户进行的所有交易。顾客管理子系统130也记录用户在所形成的历史清单中找到的项目,并跟踪用户(在网站上和通过WAP设备)观看的收集品。
只要有可能,顾客管理子系统130尽量被动地识别签约顾客。这样,例如,较佳地经由某种识别密匙(例如,电话号码和进入系统时的ID(“PIN”))来识别顾客。这种识别会较佳地产生某些优先选择,这些优先选择与顾客和每套优先选择内的顾客的经验水平有关。此外,在根据所存储的信用卡信息而批准购物之前,该系统虑及额外等级的识别(例如,口令识别)。
顾客管理子系统130在每个垂直域内保持一套优先选择,以促进经由话音入口10的用户交互作用。例如,在一个示范实施例中,顾客管理子系统130从顾客那里收集信息,以便进一步帮助确定为顾客提供什么类型的广告和如何改善顾客的服务。顾客管理子系统130保持适合于每个被支持的领域的顾客优先选择,并动态地更新来自数据源的顾客数据。例如,在感兴趣的拍卖领域中,按用户的请求更新当前的投标状态。话音入口10有利地呈现具有适合于该领域的现时的用户数据。例如,在感兴趣的拍卖领域中,投标总是在现时的数秒内。在感兴趣的电子商务领域中,当呈现购买价格时,定价信息是现时的。
有利的是,顾客管理子系统130提供报告和分析,以便确定哪些用户正在访问哪些服务。此外,顾客管理子系统130提供有关不同人口群体的通话和交易历史的报告,例如,确定来自某个收入类别、性别或年龄组的用户访问哪些服务。顾客管理子系统130也根据实际效用来提供相关性的报告(例如,有能力报告对电影感兴趣的用户访问哪些其他的服务)。
为了连续从一个平台到另一个平台(例如,从电话到网络,或从电话到WAP)增加值和用户转换,顾客管理子系统130有利地支持个性化特点,以便用服务器改善顾客的经历。除了个性化以外,“粘性”的其他来源(顾客根据竞争来“粘住”服务)包括团体特点的支持(例如,具有共同利益的朋友或人们的网络)。这样,如果顾客管理子系统130包括个性化特点和团体特点,则顾客会趋向于更忠实于特定的服务供应商。
为了支持服务(或广告)任何适应顾客的行为,顾客管理子系统130有利地跟踪服务的使用。此外,在界面评估的领域中,对界面层级的典型的用户调查可以有助于识别问题领域或非常有用的领域,或单一通话中相关的各套次要特点。话音入口10的服务的一个重要属性的另一个例子是定时。例如,使用“闯入”(其中,在清单或提示结束之前,用户可以中断回答)可以表示更加高级的用户,顾客管理子系统130可以有利地检测到为特殊用户重复到单一子树形网络的一字符串闯入选择,并导致用于捷径的机会——或者普通的一个,或者是顾客特定的一个。
“粘性”的一个方面是服务适应顾客的优先选择。这可以包括相对简单的特点(例如,在支持不重复的“签约”或“购买”数据输入要求中的顾客信息保存),但它也可以包括对在不同的前端中的特殊子树形网络的交互作用进行导航的优先选择,以及对于服务/卖主定购或选择的优先选择。拿卖主优先选择或定购举例来说,用户可以选择一个“偏爱的卖主”,允许话音入口10已发现产品的卖主清单限制在两点最便宜的和偏爱的。
应该根据用户的行动来被动地设置垂直优先选择。也就是说,在不只一次要求一个特殊的属性之后,将设置一个被动的优先选择。或者,优先选择是动态的,根据用户的行动而变化。较佳的是,通过利用话音或网络界面设置或重新设置所有被动的优先选择,用户能够更改它们。
顾客管理子系统130可以从个性化网页(例如,MyYahoo和MyExcite)取出用户优先选择(例如,股票信息)、天气优先选择等。用户可以在先前经由传统的互联网连接来创建个性化网页。或者,个性化网页可以响应于用户话音命令而由顾客管理子系统130建立。然后,可以对这些网页进行翻译,使其可被用于话音入口10。如果不存在特殊的垂直优先选择或当前的呼叫优先选择,则可以有利地将一般的优先选择用作默认优先选择。
以下是一些示范的垂直优先选择要求的清单及它们的描述。贯穿每个界面,每个优先选择有不同的用法。在一个示范实施例中,有关天气的唯一的优先选择是顾客所要求的关于位置的天气。默认的情况是,用户的位置是其ZIP代码(邮政编码)。如果可用的话,可以由当前的呼叫位置取代“最通用的位置”。
在感兴趣的“体育”领域中,可着眼于几个不同的优先选择。首先,喜爱的体育运动是一项选择。也可以把某些体育比赛得分、时间表和比赛结果发送给用户。关于网站,可使用排他性,不发送某些体育运动的广告和信息。例如,一位用户可能不想听取有关曲棍球比赛的信息,而想要了解有关棒球的信息。其次,由于某些团队比其他团队更受青睐,所以,可以增加优先选择的粒度。在这些粒度中的每个粒度中,可以使用有限选择的最近使用(MRU)的清单来确定优先选择清单。除了体育运动和团队优先选择的类型以外,还可以使用喜爱的事件。
在感兴趣的“电影”领域中,所需的优先选择包括顾客的位置与剧院的位置、电影的类型(例如,惊险影片、恐怖影片、动作影片等......)、电影的收视率(AA、G、R等......),以及影片中有顾客喜爱的电影男演员/女演员的影片。可以把这些优先选择中的每个优先选择列在有限选择的MRU清单中。
在感兴趣的“交通”领域中,所用的主要优先选择将会是一些特殊的路线,顾客想利用这些路线达到目的地,具有是时间的属性(当前时间是默认值)。这样,有限路线的MRU清单可构成顾客的优先选择清单。
在一个示范实施例中,感兴趣的“股票”领域有两级分层级的优先选择。首先,存在市场清单的优先选择;其次,在每个市场内有一个优先选择,从中可观看股票和指数。再次,可以将市场与股票的TBD选择的MRU清单制成表格。其他感兴趣的垂直域可以包括饭店、音乐会与实况转播的事件、出租车,以及班机预定。
仍然参考图2,存在物子系统140协调用户界面110、广告子系统120、顾客管理子系统130、合成引擎150和更新引擎160对数据库170的访问。存在物子系统140管理数据库170中所包含的数据结构的创建、修改和处理。更新引擎160从各种互联网来源收集数据库170中所包含的数据。在一个示范实施例中,数据库190中所用的数据结构是根据在“存在物”或事物的一个层级及其它们关系和相互的关系的。有利的是,可以更容易地复制和修改数据库170中的信息,因为数据库170只与存在物子系统140交互作用。参考图4-10来进一步描述存在物及其创建。尤其是,虽然可以使用存在物的各种其他的结构,但是,参考图4-6来描述存在物的一个示范数据结构模型。参考图7-10来描述存在物的创建和更新。
合成引擎150确定两个存在物是否相同,如果相同,则组合这两个存在物,以形成第三个规范的存在物。这样,合成引擎150建立从一个来源收集的有关信息是还是建立与从另一个来源收集的有关信息。参考图25、26和27来进一步描述合成引擎150的各种功能。
更新引擎160从互联网中检索信息,以更新数据库170中所包含的信息和属性。在一个示范实施例中,更新引擎160使用从互联网中检索信息的“幅射形”,以便更新数据库170中的信息。参考图7和图8来进一步描述更新引擎160的各项操作。
数据库170存储话音入口10所使用的信息(例如,顾客数据、广告信息,以及产品与服务信息)。把数据库170中的信息存入存在物、存在物属性、存在物关系和存在物关联。下面进一步描述存在物是什么,它们如何形成,它们彼此的关系怎样,以及它们与话音入口10的功能性的关系如何。在选择性实施例中,对于一些特殊类型的信息(例如,顾客数据、广告信息和操作记录)多个数据库可以使用。
图3展示了话音入口10的示范物理布局。这些物理结构只是举例而已。可以结合所示结构或代替所示结构而使用其他的结构。在一个示范实施例中,话音入口10包括前端服务器210、一个从前到后的网络220、后端服务器230和一个后端网络240。用户经由电话与前端服务器210之一(通过从前到后的网络220把它连接到后端服务器230)进行通信。
在一个示范实施例中,后端服务器230包括一个代理管理器245、代理者250、豆粒媒260和一个数据库270。代理管理器245经由从前到后的网络220从前端服务器210之一接收信息的请求。代理管理器245经由后端网络240进行通信,以确定每个代理管理器245处的工作负荷等级。一旦确定合适的代理管理器245,该合适的代理管理器245从自由代理者250的一个池中取出一个自由代理者,并将该代理者分配给豆粒媒260。豆粒媒260与数据库270有关,以便检索信息、插入信息、搜索存在物或存在物关系,或执行数据库270可能有的任何其他的功能。
设计参考图3所描述的虚拟数据库结构用于及时地和非常实利地将从互联网20收集的信息传递给话音入口10的用户。人们需要和使用通过各种设置和方法的信息,有利的是,话音入口10在各种平台上支持这一点,这些平台包括(但不局限于)电话(例如,话音、WAP和两者)、网络和便携式连接计算设备(例如,Palm OS设备、WinCE设备、RIM寻呼机)。
后端服务器230包括具有各种特点的一种数据库服务支持(包括数据收集与组合)。如参考图7和图8所描述的,数据收集包括为特殊的项目类型和/或网站安排的、按规则的间隔从互联网来源收集数据。如参考图9和图10所描述的,话音入口10检测数据源网站的变化,并通知合适的网站规则管理器。同样如参考图9和图10所描述的,话音入口10也支持关于数据源的数据提取的非专家定义。
在“组合”的过程中,话音入口10识别来自不同互联网卖主的相同项目。在组合过程中,话音入口10保留有关所有信息源的元数据。元数据包括有关数据的数据。例如,元数据可以证明有关数据要素或属性(名称、尺寸、数据类型等)的数据、有关记录或数据结构(长度、字段、列等)的数据,以及有关数据(数据的位置在何处、如何关联的、所有权等)的数据。此外,在不能自动确定必然性的情况下,话音入口10支持通过非专家的组合判定或非判定的交互式澄清。话音入口10也支持增加新的数据类型和数据要素,而不改变代码。另外,话音入口10支持通过市场研究、试验和机会来加以识别的相关性的领域特殊概念。例如,在感兴趣的电子商务领域中,“较便宜的”、“较好的”、“经常被购买的”和“最受欢迎的”是重要的相关性概念。在感兴趣的电影领域中,“相关的影片与产品”、“某个种类中的最佳影片”、“最受欢迎”、“受到最佳评论的”和“演员表”是重要的相关性概念。话音入口10收集和保留提供关于项目的附加细节(例如,产品描述)所必要的相关信息。参考图25-27来进一步描述组合的操作和功能性。
图4展示了话音入口10的数据库170所使用的示范数据结构模型300,其中,“存在物”(或事物)是给定的属性、关联和关系。具有三角头的实线描绘了各个存在物之间的“继承”关系。通过具有开放头箭头的虚线描绘各存在物之间的“关联”关系。拿继承关系举例来说,在数据结构模型300中,方框310是一个“事件”。“事件”是“存在物”或事物,由指向方框320的有三角头的箭头315表示。同样,“影片放映”(方框330)是“事件”(方框310),由有三角头的箭头335表示。拿关联关系举例来说,事件与“集合地点”相关联,由指向方框340的有开放头的箭头345表示。同样,如开放头的箭头355所示,影片放映(方框330)与“影片包”(方框350)相关联。事件也可以是体育运动赛事、戏剧、音乐会、喜剧表演、烟火表演、舞蹈表演或任何其他的活动。
数据结构模型300包括图4中所示的更多存在物、关联和关系,但在这里不加以描述。此外,数据结构模型300可以包括插图说明中不包括的更多存在物、关联和关系。图4只是用于说明。
现在参考图5,所展示的示范数据结构模型400表现了用户或顾客对象与不同的垂直种类之间的与对象有关的关系。继承与关联关系的描述与参考图4所描述的数据结构模型300的描述相同。在一个示范实施例中,数据库170包含被安排在数据结构模型400中的用户信息。但是,在选择性实施例中,可以把这类用户信息包含在一个分开的顾客数据库中。
顾客是“存在物”(“顾客存在物方框402”),是层级内最高层次的后代子代或“存在物” 存在物,因此继承了其所有的属性和方法。该结构背后的原因是已经创建了那个数据库170及其方法,该结构允许代码的再使用。
顾客对象包含各种信息。一般的“优先选择”种类包含有关诸如“交通”、“天气”和“电影”等优先选择的信息。每当顾客进入一个感兴趣的、不同的新垂直域时,就创建“优先选择”对象的一个实例到垂直域的名称,具有插入的优先选择数据。如果垂直域已经存在,则用更新的信息来修改对象。
通话种类记录直接关于用户通话(通话方框404)的信息。通话可能是呼叫、搜索网站或使用WAP的呼叫。诸如一天时间和持续时间之类的数据是一般的属性,但关于用户是从陆上通讯线呼叫还是用手机呼叫的分析对于电话通话而言是特定的。这类数据可用于确定话音入口10的营销对象(出于广告的目的),并可用于改善性能与服务。顾客对象也具有与每个这些通话对象的链接,以确定那个平台上的最后的通话是什么(以防用户终止通话并想在那个特定时间重新连接)。
电话通话方框408记录与通信通话有关的信息,其中,使用电话与入口10进行通信。“电话通话”方框408所包括的信息有当前层次的交互作用、感兴趣的当前领域、界面平台的类型(例如,WWW、WAP、ASR)和以前访问过的层次等。有利的是,在用户曾停止以前的通话或被中断通话的情况下,“电话通话”方框408允许他或她再加入通话。其他存在物方框(例如,信用卡信息存在物、位置存在物或优先选择存在物)包括相关的属性,并按需要记录信息。
“专门技术”种类(“专门技术”方框406)用于保持跨越不同平台(即电话、WAP、WWW)的不同层次的可用性(一般而言,关于不同的优先选择)。顾客拥有与这些种类实例中的每个的链接。由于优先选择可以跨越平台,而用户的能力却达不到,因此,“优先选择”种类中不包括这些。
图6展示了与广告有关的信息的话音入口110的数据库170所使用的示范数据结构模型450。继承和关联关系的描述与图4中的数据结构模型300的描述相同。在一个示范实施例中,数据库170包含被安排在数据结构模型450中的广告信息。但是,在选择性实施例中,可以把这类广告信息包含在一个分开的广告数据库中。
有利的是,数据结构模型300、400和450提供了对有关存在物、关联与关系的信息进行连续的扩展布局。而且,模型300、400和500允许迅速创建感兴趣的新垂直域,而不改变以前输入的信息。例如,模型300包括与诸如电影、音乐会和商品(例如,书籍、玩具和电子设备)等事件有关的信息。可以容易地加入任何事件(例如,芭蕾舞),该存在物与“事件”有继承关系并具有合适的关联关系。同样,可以容易地加入作为存在物的任何商品(例如,车辆),该存在物与“所制造的玩具”有继承关系并具有合适的关联关系。数据结构模型300、400和450的动态性质与可扩展的能力使话音入口10具有一个优点成为范围广泛的、基于互联网的信息和服务的单元话音入口。
图7展示了存在物(例如,示范数据结构模型300(图4)、数据结构模型400(图5)和数据结构模型450(图6)中所示的存在物)的示范创建过程的流程图700。在步骤710中,发现互联网上的一张网页。在一个示范实施例中,使用辐射形来寻找与预定类别的项目有关的特殊网页。辐射形是传统上已知的一种程序,该程序通过检索文档和循环检索在“万维网”(WWW)中用作参考的一些或所有文档来自动探索“万维网”。对比而言,人类所操作的标准网络浏览器不能自动跟随联机图像和URL改址以外的链接。在执行步骤710之后,执行步骤720,其中,通过使用覆盖网页以便过滤出特殊信息的所选表格,可在所找到的网页上识别信息。在步骤720后,执行步骤730,其中,使用规则来识别来自步骤720中的表格覆盖图所检索的信息的特征信息或属性。特征信息或属性定义存在物是什么。规则定义存在物属性的组织。例如,电影存在物可以包括片名、导演、演员表、发行年份和情节摘要的属性。
在执行步骤730之后,执行步骤740,其中,把属性组织在存在物内,并把存在物存储在数据库170中。较佳的是,存在物内属性的组织和安排由预先定义的规则来建立。
图8展示了如参考图7所描述的存在物的示范创建过程。辐射形810为获取被保存在各种不同的网页上的信息而经过互联网20。根据规则820组织和安排辐射形810所检索的信息,以便将信息放置在数据结构830中。在一个示范实施例中,辐射形810从感兴趣电影的互联网20中检索信息。例如,辐射形810可以经过IMDB网站,并可以检索有关特定影片的片名、导演、演员表、发行年份和播放时间的信息。一旦把电影信息存储在数据结构830中,就把数据结构830应用于词汇表格840。词汇表格840组织数据结构830中所包含的属性,并将信息放置在三列中。在一个示范实施例中,词汇表格840的第一列包括原始数据,第二列包括采用归一化和标记格式的原始数据,第三列包括采用可搜索的和混合格式的数据。把词汇表格840和数据结构830被包含在数据库170中的存储器结构内。
举例来说,如果辐射形810为获取感兴趣影片“失去方舟的入侵者”(“Raiders of the Lost Ark”)的信息而经过互联网20,则将根据对应于电影的规则来应用从互联网20检索到的数据,并把它放置在数据结构830中。这种电影规则可以包括片名、导演、演员表和发行年份,所有这些都是电影属性。在这个例子中,片名将是“失去方舟的入侵者”,导演将是“史蒂文·斯皮尔伯格”,演员表将是“Harrison Ford和Karen Allen”,年份将是“1981年”,播放时间将是“115分钟”。这样,词汇表格840将包含采用其原始格式的片名“失去方舟的入侵者”、采用归一和标记格式的数据<名称>失去方舟的入侵者</名称>、以及采用可搜索的混合格式的数据“RaidersLostArk”(没有任何空格或识别冠词(例如,the、a、an))。
图9展示了流程图900,它描绘了使用非编程方法来收集基于互联网的信息的示范过程。在步骤910中,发现搜索网页,并使用各种式样来隔离包含感兴趣信息的网页上的区域。在执行步骤910之后,执行步骤920,其中,找到一张合适的表格,并调用特殊程序来提取实际的数据和信息。在步骤920后,执行步骤930,其中,提供一张特殊的网页,可以找到具有相关信息的多张网页。除了一些数据特殊样式以外,还有一个区域样式可以定义数据特殊样式在特殊网页中的何处进行操作。在执行步骤930之后,执行步骤940,其中,找到与多张网页上的多份产品或服务清单的链接。在一个示范实施例中,使用预测程序来计算来自代码样品的产品清单的实际样式。
一般而言,预测程序计算来自规则编写者所提供的需要输出的样式。有利的是,样式预测程序加速了生产,因为规则编写者不得不简单地从HTML代码粘贴他或她想提取的文本片段,而无需制定样式使之进行。使用当前用来编写样式的输入字段来插入该数据。
举例来说,预测程序开发了网页的“作者”数据的样式,它通过首先让规则编写者将网页上的作者名称样品拷贝入“作者”字段,来提供感兴趣书籍的数据。然后,算法使样品数据与其在网页上的位置相匹配。把接近所匹配的数据的字符或标记识别为“前缀”和“后缀”。前缀是所匹配的数据前面的字符,后缀是所匹配的数据后面的字符。使用前缀和后缀来构制样式。
把所构制的样式应用于网页,与其他数据匹配。如果所构制的样式拾取不等同于理想结果的数据,那么,增加被用于制定样式的前缀和后缀,以获得更完整、更准确的样式。重复这个程序,以改善样式。
为了进一步阐明这个例子,从提供感兴趣书籍的产品数据的网页中取出以下HTML代码<html>
<title>Programming Perl</title>
written by<b>Larry Wall</b>
</html>
<html>
<title>Learning Perl(<b>2nd edition</b>)</title>
written by<b>Randal Schwartz</b>
</html>
规则编写者将“Larry Wall”放在“作者”字段中,以指出这是要提取的关于“作者”的数据。
样式预测算法大致的运作情况如下所示n=1;repeat
$page=~m/({.}n)Larry\s+Wall({.}n)/x;$prefix=$1;$suffix=$2;$page=~m/$prefix(.*?)$suffix/x;n=n+1;until($1 eq<desired data>);从第一张网页上的n=1开始,算法匹配“>Larry Wall<”,这意味着$前缀获得值“>”和$后缀获得值“<”。接下来,样式预测算法使用它从第一个步骤中获得的$1和$2的值来建立样式“>(.*?)<”。使该样式与网页相匹配会产生“>编程Perl<”,它不等同于理想的结果“Larry Wall”。所以,使n增加到n=2,改进样式为包括前缀和后缀中的另一个字符。使网页与“({.}2)Larry\s+Wall({.}2)”相匹配会产生“b>Larry Wall</”,这意味着$前缀获得值“b>”和$后缀获得值“</”。接下来,样式预测算法使用从第一个步骤中获得的$1和$2的值来建立样式“b>(.*?)</”。使该样式与网页相匹配会产生“Larry Wall”——理想的输出。
现在,当规则编写一步步地者经过网页来应用不同网页上相同的样式时,他或她发现样式匹配关于书籍《Learning(学习)Perl》的网页上的“Zndedtion(第2版)”。然后,规则编写者通过提供理想结果的第二个例子(即,他或她将“Randal Schwartz”放在GUI输入字段)来改进算法,这引起样式预测算法进一步增加n,直到创建在<b>前面加强一个“y”的一种样式。根据数据和样式所需的网络数据样式的复杂程度,算法可以执行数次迭代。
在执行步骤940之后,执行步骤950,其中,生成卖主特殊数据提取文件。在一个示范实施例中,使用计算来自代码样品的相关URLs的一种程序。或者,可以传送计算URLs的程序作为表格。在执行步骤950之后,执行步骤960,其中,创建高速缓冲存储器。在执行步骤960之后,执行步骤970,其中,创建关于提取产品数据的样式。在一个较佳实施例中,退回测试机制支持对特殊程序进行编辑。
图10展示了与话音入口10相关联的规则的非编程制定的示范过程。在一个示范过程中,来自一组规则编写者1010的一位规则编写者访问“万维网”(“WWW”)1020,以便访问来自数据源1030、数据源1035、数据源1040或连接到WWW1020的任何其他数据源中的任何一个数据源的信息。将从数据源检索到的数据放入使用数据组织工具1025的数据结构。规则编写者1010使用数据组织工具1025来将大量可能的表格中的一张表格应用于经由WWW1020而存在的信息“网页”。这类表格提供网页上相关信息的位置指示,并标以某种特殊标记。例如,WWW1020上所提供的网页可以包括网页左上角处的一个数据输入框。此外,可以把关于部分或服务的相关信息可以被定位在HTML标记(例如,代表书名的“<title(名称)>”)后面。
应该注意,这里所用的术语“网页”包括用户界面屏幕或可以由诊断系统的用户观看的类似的布置(例如,提供数据、消息、报告等的图解或文本表现的屏幕)。而且,这类网页可以由标记语言或编程语言(例如,Java、perl、java script)或任何其他合适的语言来定义。
通过使用规则编写者1010从数据组织工具1025中选择的表格,可以将来自数据源的数据组织入数据结构1045、数据结构1050、数据结构1055或用于保持信息的任何类似的结构。可以在统一的数据结构1060的构造中比较、融合或使用数据结构1045、1050和1055。把统一的数据结构1060被存储在数据库1070中。
有利的是,图10所示的示范过程允许非专家的规则编写者1010从数据组织工具1025所提供的各种表格中进行选择,以便用于检索来自经由WWW1020而存在的特殊网站的信息。这样,利用由使用数据组织工具1025的规则编写者选择的表格,可以把来自数据源1030、1035和1040的网页上所包含的数据连续更新到数据库1070。当在准确性方面对数据结构1045、1050和1055中所包含的信息进行比较时,数据组织工具1025检测网页何时已改变其对应的网页上的数据的格式或布置。
图11-24展示了创建新规则的示范过程。此外,图11-24展示了规则编写者与数据组织工具1025之间可能的交互作用(图10)。一个示范规则基于一个现存的规则Amazon.com书籍产品。在构制这个规则的过程中所采取的步骤类似于在构制任何其他规则的过程中所采取的步骤。
图11展示了用于开始创建规则820的图形用户界面(GUI)1110(图8)。GUI1110包括卖主窗口1120、辐射形选择窗口1130、询问窗口1140、状态窗口1150、搜索框区域1160和代码窗口1197。搜索框区域1160包括滑动条1170、一套向右的箭头1180、一套向左的箭头1190和搜索窗口1195。
为了开始一个新的数据源,规则编写者进入卖主窗口1120中的数据源(例如,“Amazon Book(书籍)”)。规则编写者按“进入”并点击“新”按钮。在执行这个动作之后,示出图12中所示的图形用户界面(GUI)1200。规则编写者在确认正确地列出该数据源之后点击“完成”按钮。接下来,示出图13中所示的图形用户界面(GUI)1300。对应于所选的卖主名称来显示URL。要求规则编写者确认正确的URL。在“Amazon Book(书籍)”的例子中,URLhttp//www.AmazonBook.com出现在GUI 1300的窗口中。但是,URL链接应该读出http//www.Amazon.com。规则编写者纠正URL并点击“完成”按钮。
现在再次参考图11,规则编写者选择所需的询问类型。首先,规则编写者选择询问窗口1140,并从潜在的询问清单中进行选择。例如,“书籍包”也许是对于的书籍垂直域的可能的询问。当规则编写者点击询问窗口1140中的“SDE”(搜索数据编辑器)按钮时,开始此搜索。SDE按钮调用搜索数据编辑器,这提供了图14中所示的图形用户界面(GUI)1400。GUI1400示出可用于搜索感兴趣的特殊项目的属性清单。例如,在正在搜索书籍的情况下,示出诸如ISBN或UPC等属性。在搜索其他项目的情况下,列出对应于那个项目的属性。搜索“影片放映”会产生诸如“影片包”、时间和放映日期等被列出的属性(请见参考图4所描述的方框330)。
规则编写者将ISBN号码打入对应的数据框中并点击“完成”。GUI 1400中的按钮1430有利地允许规则编写者在不同的搜索期间保存不同的搜索标准。一旦输入搜索标准,规则编写者就点击“完成”,并且,因为没有定义关于特殊数据源(即“Amazon Book(书籍)”)的规则,因此,出现图15中所示的图形用户界面(GUI)1500。GUI 1500询问规则编写者是否想要增加新的规则或改变搜索数据。在这个例子中,规则编写者点击“增加”按钮,GUI 1500扩展成为图16中所示的图形用户界面(GUI)1600。
现在参考图16,规则编写者确认突出显示的正确类型的询问。在这个例子中,突出显示ISBN,规则编写者点击“是”按钮。出现图17中所示的图形用户界面(GUI)1700出现,以指导规则编写者将“Amazon书籍”的主页载入netscape(网络导航器)浏览器。指导规则编写者浏览与ISBN规则有关的网页。一旦搜索网页被载入互联网浏览器,规则编写者就点击“完成”按钮。
图18中所示的图形用户界面(GUI)1800示出将由规则编写者选择的一项表格选择。如果表格正确,则规则编写者点击“完成”按钮。如果所列表格没有为规则编写者提供所要求的选择,则规则编写者点击“下一步”按钮以查看网页上其他的表格。一旦发现匹配的网页,就显示图19中所示的图形用户界面(GUI)1900。
数据组织工具1025(图10)在互联网浏览器中显示产生的网页。如果网页正确,则规则编写者点击GUI 1900上的“好”。出现图20中所示的图形用户界面(GUI)2000出现,并询问如果搜索在多个项目上匹配,则如何检测网页上单个的项目。也使用GUI 2000来指出在哪里能找到URL以获得有关询问的项目的细节。如果只找到一个单个的项目,则规则编写者点击“延期”按钮,因为所呈现的信息不足以建立正规的表达式。如果找到多个项目,则将正规的表达式输入数据窗口2010。例如,作者搜索可以返回多个项目,因为一位作者可能写了几本书。在其他情况下,即使询问只与一个项目匹配,也可能需要跟随附加的URL链接,以获得信息。
接下来,出现图21中所示的图形用户界面(GUI)2100出现并被用于检测多张产品网页。如果规则编写者直接到被搜索的项目,则不需要建立正规的表达式的信息。再次参考图11,代码窗口1197中充满来自被检索的网页的HTML代码。这时,规则编写者准备好规定属性。通过将正规的表达式输入属性名称旁边的框,来规定属性。作为表达式的结果,正规的表达式必须规定其中的一个子字符串(使用括弧)。例如,正规的表达式“这个(所有)匹配”将返回作为其结果的“所有”(假设正规的表达式曾经能够匹配)。例如,要确定用于寻找书名的样式,则要求规则编写者将书名打入搜索窗口1195。可以使用各种HTML信号。要求“\s*”指出文字之间可能有的空格。被输入搜索窗口1195的搜索字符串的第一个匹配将突出显示HTML代码中所发现的第一个匹配。例如,书名的一个示范属性可能是“<title(名称)>([^<]*)</title(名称)>”。一旦输入该属性,就会发现对于该属性的所有匹配。
再次参考图14,搜索数据编辑器1400包括一个表格,可以用来把值赋予取决于类型的属性。状态窗口指出数据组织工具1025正在做什么。在一个示范实施例中,状态的状态为空闲,在互联网上提出询问并使用高速缓冲存储器。询问窗口1140允许规则编写者设置所考虑的数据源所需的询问类型,并通过使用SDE按钮来设置搜索标准。
如果进行询问搜索,则辐射形选择窗口1130允许规则编写者设置要使用的辐射形。在一个示范实施例中,可能的辐射形类型是完全的、增加的、特殊的和参考的。完全的辐射形采用与所选类型匹配的所有项目。通常使用增加的辐射形来拾取来自互联网数据源的数据的更新。通常使用特殊的辐射形来获得网站具有的特殊的事物(例如,畅销书)。通常使用参考的辐射形来确认网站仍然是上行的,规则正在起作用。
卖主窗口1120允许规则编写者设置将继续工作的数据源。搜索窗口1195允许规则编写者保存。在HTML代码中要搜索的文本。在代码窗口1197中,有一个光标指出文本输入的位置。一套向左的箭头1190包括第一个数字,它是当从高速缓冲存储器运行时将要进行搜索的地方的起点。第二个数字指出高速缓冲存储器中的网页的总数。该窗口中的这套箭头控制网页,使之从当规则编写者从高速缓冲存储器运行时开始。一套向右的箭头1180包括使所检索的网页滚动的箭头。
辐射形类似于询问,但是,当其他规则不可应用时,调用它们。辐射形负责收集有关与所规定的类型相匹配的网站中的每个对象的信息。辐射形包括几个被嵌套的回路,把每个回路设计成转向层级中更深的一个层次。现在参考图22,示出关于书籍辐射形的示范辐射形层级2200,其中,层次2210是开始网页,层次2220代表书籍类别网页,层次2230代表书籍子类别网页,而层次2240代表书籍网页。
现在参考图23,使用图形用户界面(GUI)2300来检索与辐射形规则有关的网页的URL。辐射形深度滑动规则允许规则编写者告诉数据组织工具1025需要经过多少往下的链接才能达到实际的产品网页。上限滑动规则允许规则编写者规定对于幅射形要获取多少项目的限制。一旦选择URL并选择辐射形深度和上限,规则编写者就点击“完成”按钮。示出图24中所示的图形用户界面(GUI)2400。规则编写者输入辐射形的搜索样式,以便使用与参考图11所描述的询问而输入的搜索样式相类似的方式。一旦输入样式,规则编写者就点击“建立”按钮,辐射形将开始运行。
有利的是,参考图11-24所表现和描述的图形用户界面允许非专家的规则编写者执行数据搜索并创建关于信息检索的规则的表格。一旦创建这些表格,就可以频繁地使用表格来收集被更新的信息。此外,通过使用对应于网站上的卖主所提供的信息的布置和显示的普通表格,表格有助于检索卖主的网站中可得到的大量信息。有利的是,不由专家创建的规则表格。降低了更新网站中可得到的信息的成本。此外,表格有利地使基于互联网的信息的准确检索自动化。
图25展示了组合数据库中的信息的示范过程。在图25所示的示范实施例中,流程图2500描绘了由合成引擎150(图2)执行的过分简单化的组合过程或“迅速组合”。在步骤2510中,更新引擎160从网络20接收信息并经由存在物子系统140将信息放置在数据库170中的存在物数据结构中。合成引擎150可以经由访问数据库170的存在物子系统140访问来自更新引擎160的存在物。在执行步骤2510之后,执行步骤2515,其中,合成引擎150从对应于在步骤2510中被检索的存在物的属性定义表格中收集确切的组合属性。在执行步骤2515之后,执行步骤2512,其中,合成引擎150执行来自从数据库170检索到的实体的每个组合属性的混组合,使之成为容易比较的表格。在一个示范实施例中,“混合”表格除去空格、介词和其他不必要的词。有利的是,“混合”格式提供了迅速搜索的能力。
在执行步骤2520之后,执行步骤2525,其中,合成引擎150阐明一个数据库询问,在该询问中,把数据源设置为“相同”,把状态被设置为“规范”。这个询问意在从与当前的信息相匹配的相同的数据源文件中找到一个已存在的规范的存在物。在执行步骤2525之后,执行步骤2530,其中,作出是否在数据库170中发现匹配的判定。如果因步骤2525的询问而在数据库170中发现匹配,则执行步骤2535,其中,对数据库170中所包含的存在物进行更新。
如果从步骤2525的询问中没有发现数据库170中有匹配,则执行步骤2540,其中,重新阐明步骤2525的询问,并把数据源设置为“相同”,把状态设置为“非规范”。这个询问意在从与当前的信息相匹配的相同的数据源文件中找到一个已存在的存在物。在步骤2540后,执行步骤2545,其中,作出是否从步骤2540的被重新阐明的询问中发现数据库170中有匹配的判定。如果发现匹配,则执行步骤2550,其中,对数据库170中的存在物进行更新。
如果在数据库170中没有发现匹配,则执行步骤2555,其中,重新阐明询问,把数据源设置为“任何”,并把状态设置为“规范”。这个询问意在从与当前的信息相匹配的任何数据源中找到一个已存在的规范的存在物。在步骤2555后,执行步骤2560,其中,作出是否在数据库170中发现匹配的判定。如果在数据库170中没有发现匹配,则执行步骤2565,其中,将一个存在物加入数据库170。
如果在数据库170中发现匹配,或在执行步骤2550之后,执行步骤2570,其中,作出该匹配是否是一个系统存在物的判定。如果该匹配是系统存在物,则执行步骤2575,其中,对系统存在物进行更新。如果该匹配不是系统存在物,则执行步骤2580,其中,形成一个规范的系统存在物。在执行步骤2580之后,执行步骤2585,其中,把存在物加入数据库170。在步骤2585后,执行步骤2590,其中,对组合表格进行更新。
有利的是,图25所示的组合数据库中的信息的示范过程提供了对多个网站的信息的比较。这样,可以作出一个网站是否包含与另一个网站相同的信息的判定。而且,话音入口10的数据库170中所包含的信息可以连续增加信息、关系和来自基于互联网的来源的信息的并联,这加大了从数据源检索到的信息的可用性。
图26展示了流程图2600,描绘了在组合的示范过程中所采取的步骤。在参考图26所描述的示范过程中,所示出的组合过程比参考图25所描述的流程图2500中所描绘的组合过程更加全面。在步骤2610中,合成引擎150从数据库170读取属性定义表格。在执行步骤2610之后,执行步骤2615,其中,合成引擎150读取要求高级组合的每种存在物类型的组合控制语言文件。在执行步骤2615之后,执行步骤2620,其中,合成引擎150将组合文件汇编成中间计算机代码。在执行步骤2620之后,执行步骤2625,其中,合成引擎150将以前组合的存在物存入存储器。在步骤2625后,执行步骤2630,其中,合成引擎将属性收集到同等的各个集合中。在步骤2630后,执行步骤2635,其中,作出属性是否是文本的判定。如果合成引擎150确定属性不是文本的,则执行步骤2640,其中,将各个值编入索引。如果合成引擎150判定属性是文本的,则执行步骤2645,其中,合成引擎150将属性中的子字符串事件编入索引。
在步骤2645后,执行步骤2650,其中,合成引擎150判定是否建立文本。如果判定没有建立文本,则执行步骤2670。如果判定建立文本,则合成引擎150在步骤2655中识别文本的位置和被隔离的结构段。在步骤2655后,执行步骤2660,其中,合成引擎150解析被隔离的各个部分并识别语义信息。在步骤2660后,执行步骤2665,其中,合成引擎150将语义信息编入索引。在步骤2665后,执行步骤2670,其中,合成引擎150执行有效性检查,以检验数据库170的完整性。在步骤2670后,执行步骤2675,其中,合成引擎150检索将被组合的存在物。
在步骤2675后,执行步骤2680,其中,合成引擎150激活关于对应的存在物类型的组合标准和匹配程序。组合标准和匹配程序包括使用如参考图10所描述而建立的存在物规则。在步骤2680后,执行步骤2685,其中,合成引擎150执行来自组合标准和匹配程序的第一个组合规则,并返回所有匹配。在步骤2685后,执行步骤2690,其中,作出是否已发现可接受的匹配的判定。在一个示范实施例中,可接受的匹配通常具有预定的属性百分比(例如,70%)的一个匹配。在一个选择性实施例中,可接受的匹配是所有属性具有相同的值的一个匹配。如果已发现可接受的匹配,则执行步骤2697,其中,合成引擎150将存在物组合在一起。如果没有发现可接受的匹配,则执行步骤2691,其中,执行下一个组合规则,并返回所有匹配。
在步骤2691后,执行步骤2692,其中,作出是否发现可接受的匹配的判定。如果发现可接受的匹配,则执行步骤2697,其中,合成引擎150将存在物组合在一起。存在物的组合包括创建一个新的存在物,该存在物与将被组合的存在物有关,并包含其中的所有信息。如果没有发现可接受的匹配,则执行步骤2693,其中,作出是否已测试了最后的规则的判定。如果还没有测试最后的规则,则再次执行步骤2691。如果已经测试最后的规则,则执行步骤2694,其中,合成引擎150判定是否有坚固的局部匹配。在一个示范实施例中,坚固的局部匹配是其中的匹配在某个百分比(例如,70%)内的一种匹配。如果存在坚固的局部匹配,则执行步骤2698,其中,服从人的检查。如果没有发现局部匹配,则执行步骤2695,其中,合成引擎150拒绝组合创建,并且执行步骤2699,其中,创建一个新的存在物。
有利的是,图26中所示的数据库中的组合信息的示范过程提供了对来自相同或不同的数据源的信息进行的自动比较。这样,可以连续更新数据库170中所包含的信息,并增加它与来自其他数据源的信息的相关性。此外,组合虑及编辑比互联网上单独存在的数百万个数据库更完整、更坚固的统一数据库。
图27展示了创建来自两个数据结构的一个规范的数据结构的示范过程。由独特的识别号码来识别数据文件2700,并包含第一个数据文件2710、第二个数据文件2720和一个规范的数据文件2730。在一个示范实施例中,第一个数据文件2710包含有关从IMDB(“互联网电影数据库”)网站(http//www.IMDB.com)检索到的特殊影片的信息。第二个数据文件2720包括从Reel.com网站获得的特殊影片的电影信息。在图27所展示的例子中,数据文件2710包括片名“亚利叠那州的男孩”、导演“Wiltz”、发行年份“1997年”和提要“好影片”。同样,数据文件2720包括片名“亚利桑那州的男孩”、导演“Bob Wiltz”、发行年份“1998年”和空白的情节摘要。
在创建规范的数据文件的过程中,引入了规则文件2740,这包含一种特殊类型的信息的规则。在图27所示的例子中,规则文件2740包含有关电影属性的信息。通过应用规则2740,通过从数据文件27和数据文件2720中采用最完整的片名(是来自数据文件2710的片名“亚利桑那州的男孩”),来创建规范的数据文件2730。从数据文件2720获得导演信息,因为导演信息比数据文件2710更完整(因为它包含导演的姓和名)。数据文件2710所列出的发行年份和数据文件2720所列出的发行年度相互冲突。根据原先的信息来解决该冲突,指出数据文件2720的发行年度更正确。规范的数据文件2730包括情节摘要数据文件2710,因为数据文件2720的情节摘要是空白的。
有利的是,参考图27所描述的,创建规范的数据文件的过程所创建的数据文件具有更完整、更准确的信息。此外,该过程允许对多个网站之间的信息进行比较。另外,规范的数据文件的创建过程允许增加各个数据文件中的相关性与关联关系。
图28展示了在隔离从网上获得的数据和转换该数据用于存储在数据库中的期间所执行的各项操作的功能图2800。示范过程包括将数据从网络20提取到安排和组织数据的数据结构2810中。例如,可以从互联网提取与交通报告有关的数据,以包括有关说明、主要马路、十字路口、时间、日期和激烈等级的信息。通过使用包括文本样式和说明(允许将数据安排和组织到数据结构2810中)的规则2815,来创建和组织数据结构2810。把数据结构2810被存储在数据库上的数据文件中。数据结构2810中的数据经历转换,其中,应用第一个术语替换表格来创建数据结构2820。在术语替换期间应用规则2825,来创建数据结构2820,包括转换表格的词汇条目。在交通报告例子中,把“Rd,”转换成“马路”,把“I.”转换成“州际的”,以及把“Re.”转换成“路线”。
然后,根据应用被转换数据的属性短语语法的规则2835,将数据结构2820中所包含的数据放在数据结构2830中的解析表格中。在交通报告例子中,识别“方向”(例如,东、南、西、北),并确定“公路标识符”(例如,“州际的”或“公路”)。然后,通过应用术语布置规则2845,将数据结构2830中的数据放置在数据结构2840中重新安排的表格中。由第二个术语替换表格操作数据结构2840中的数据,并通过应用来自词汇转换表格的规则2855而放置在数据结构2580中。例如,术语“St.”根据词汇转换表格中的它的位置标识符<street st(街道St.)>or(或)<City st(城市St.)>而被确定为是“街道”或是“圣”。
在执行词汇转换之后,将数据放入数据结构2860——一种未被组合的、归一化和被标记的格式。数据结构2860较佳地驻留在数据库2850中。归一化和被标记的格式是指包括统一组织以便能够容易地搜索和比较数据的一种格式,以及HTML标记。HTML标记经常提供有关数据类型、数据位置和数据长度的信息。未被组合意味着,数据没有经历参考图25和26所描述的组合过程。
有利的是,参考图28所描述的数据隔离过程从网上获取数据,并将其转换成数据库中的一种归一化和被标记的格式。准备归一化和被标记的数据,用于组织、处理和组合。有利的是,数据隔离过程是统一的,用于处理来自宽于范围的数据源的数据。这样,该过程通常包括从各种互联网来源获得数据;创建采用第一种格式的、具有所获得数据的第一个数据文件;以及,从所获得数据产生短语,其中,短语采用与特殊界面相关联的第二种格式。可以使用范围宽广的应用程序来将所获得的数据转换成第一种和第二种格式。例如,可以使用文本样式、词汇转换表格、属性短语语法和术语布置规则来将所获得的数据转换成一种统一的、可搜索的格式,把该数据保存在数据库中的数据文件中,然后,将被保存的数据转换成一种界面特殊格式。在选择性实施例中,可以使用其他的样式、表格、规则和数据操作应用程序。
图29是功能图2900,展示了经由某个用户界面平台(例如,WAP、网络、电话、ASR、TTF)将数据从数据库170转换到话音入口10的用户。通过应用具有归一化和被标记的数据的属性短语语法的规则2915,将数据结构2860中所包含的数据(也在图29中示出)放入数据结构2910中的一个解析表格中。属性短语语法采用归一化和被标记的数据来创建包括被识别的属性的切合实际的短语。然后,通过应用使用规则2920(包含词汇条目转换表格)的术语替换表格,将来自数据结构2910的数据放在数据结构2920中。在示范实施例中,规则2920的词汇条目转换表格列出对应于一个特殊界面的数据输出结构。例如,对于WAP应用程序把术语“路线(route)”转换成“Rt.”,对于使用语音的电话应用程序把它转换成“Route”。同样,对于WAP应用程序把术语“U.S.”转换成“U.S.”,对于使用语音的电话应用程序把它转换成“you ess”。
根据所用的输出设备,通过应用规则2935(其中,应用术语代替规则),将来自数据结构2920的数据放入数据结构2930中的重新安排的表格中。术语重新布置规则移动术语到最适合不同用户界面的安排。然后,通过应用包括短语生成语法的规则2945,将数据结构2930中的数据放置在其中生成句子的数据结构2940中。例如,可以生成一个句子,该句子说“我们在<主要马路>上的<交叉位置>与<交叉位置>之间发生了<严重>的交通事故”。一旦数据采用数据结构2940的格式,就可准备用于各种输出界面(例如,WAP、网络、电话和ASR)。
有利的是,参考图29所描述的数据转换过程是一个统一的过程,它为广泛的用户界面而获取和准备数据。例如,该过程虑及将从网络来源提取数据,并为经由语音界面的语音传输,用语义的方法来识别和准备数据。同时,该过程虑及为传输到WAP设备或网络应用程序而准备相同的数据。
图30-33表现了展示用户与话音入口10之间的示范交互作用的几条操作路径。如参考图32-33所描述的,用户界面110较佳地利用清楚的提示,以指导用户适当地发言。
图30是描绘一种示范系统概观的流程图3000,包括代表话音入口10的各种功能性的程序方框。在一个示范执行路径中,在方框3010处,话音入口10说“欢迎到Quack,由American Express为您提供”,以此向用户打招呼。较佳的是,话音入口10将呼叫者ID用作识别用户的方法。在一个较佳实施例中,将电话号码作为一个顾客属性存储在数据库170中。或者,将电话号码存储在顾客数据库中。话音入口10继续说“你好,Steve Woods。请说出你的PIN或在数字按键键盘上输入它。如果你不是Steve,请说出或输入你的电话号码。”然后,用户口头回答“5082”,提供他或她的PIN。一旦作出鉴定,话音入口10就进行到方框3020。在方框3020处,话音入口10指出“你在Quack通道。请说出以下清单电影、天气、交通、股票和体育中你所感兴趣的类别的名称。”用户用一个类别名称或再见来回答。如果提供类别名称,则话音入口10进行到方框3030。如果提供再见,则话音入口10为话音入口10提供得体的退出。在一个示范回答中,用户说“天气”,话音入口10进行到方框3030。在方框3030处,话音入口10说“欢迎到‘天气’,由‘天气频道’为您提供”,并进行到方框3040。在方框3040处,执行识别独特存在物子系统。
在方框3040后,执行方框3050,其中,作出是否曾在方框3040的识别独特存在物子系统中发现存在物的判定。如果没有发现存在物,则控制返回到方框3030。如果发现存在物,则执行方框3060,其中,执行所发现的存在物子系统(参考图33所描述的)。
现在参考图31,在方框3040处所执行的识别独特存在物子系统(图30)包括方框3110,其中,数据库170提供来自当前垂直域(例如,天气、交通、电影)的属性从属图表的一个属性。如果在属性从属图表中没有更多的属性,则控制传送到记录存在物搜索失败的方框3115。在方框3115后,控制传送到方框3030(图30)。在方框3110(图31)后,执行方框3120,其中,根据数据库170所提供的属性值集来建立属性词汇表。在执行方框3120之后,执行方框3130,其中,话音入口10按方法N来使用自动语音识别(ASR)技术,以获取用户对属性值提示的回应。例如,话音入口10可以要求用ZIP代码表示的用户的位置——一种示范方法N。用户可以提供他或她的ZIP代码(例如,“53045”)来回应。
在方框3140处,作出话音识别曾经成功与否的判定。如果不成功,则利用遵循撤退方法N+1的ASR技术来执行方框3130。例如,在天气垂直域中,撤退方法N+1可能会询问用户的位置所处的州和城市。在较佳实施例中,撤退方法包括从清单中选择一个属性;通过划分空间(例如,获得州,然后获得城市名称)来限制属性值集;以及,拼出属性值。如果话音识别成功,则执行方框3150,其中,话音入口10用所获取的属性来搜索数据库170。在执行方框3150之后,执行流程图3200(图32)。
现在参考图32,所示的流程图3200展示了识别独特存在物子系统的一个部分。在执行方框3150(图31)之后,执行方框3210,以确定通过搜索数据库170而获得的匹配的存在物的数目。根据在搜索产品数据库中发现的匹配数目,来采取不同的行动。如果没有发现匹配,则执行方框3220,其中,作出是否将寻找“复合的独特密匙”的判定。如果在数据库170内不包含一个或多个独特的密匙或标识符,则可能存在“复合的独特密匙”,但可以用来寻找互联网上所需的项目。
如果发现一个匹配,则执行方框3230,其中,话音入口10检验该匹配是否是正确的存在物。如果匹配的数目大于一个但小于清单的最大数目,则执行方框3240,其中,要求用户从匹配清单中识别存在物。如果所发现的匹配多于清单中可能条目的最大数目,则执行方框3250,其中,判定属性是否是“可扩展的”。换言之,作出是否可以提供有关属性的更多信息的判定。如果不能提供更多的信息,则控制返回到方框3110(图31),其中,获得来自属性从属图表的另一个属性。如果属性可扩展,则执行方框3260,其中,试图扩展属性。如果可以扩展属性,则控制传到方框3120(图31),其中,建立词汇表集,并使用ASR技术和方法来获得一个属性值。如果不能扩展属性,则控制传到方框3110(图31),其中,获得来自属性从属图表的另一个属性。如果属性的扩展会产生项目清单,则控制传到方框3240。
现在参考方框3220处所执行的询问,如果作出没有用于WWW搜索的“复合的独特密匙”的判定,则控制传到方框3110(图31)。如果作出可能存在“复合的独特密匙”,则控制传到方框3270,其中,作出是否搜索WWW的判定。如果将不搜索WWW的判定,则控制传到作为当前垂直域的最高层次的方框3030(图30)。如果要搜索WWW,则控制传到方框3280。现在参考方框3230和方框3240,如果发现正确的存在物或从清单中发现正确的存在物,则控制传到方框3280。如果在方框3230或方框3240中没有发现正确的存在物,则控制传到方框3220,用于判定是否有可以搜索以找到项目的“复合的独特密匙”。在方框3280处,执行网络查找。这时,可以向顾客呈现各种长度的目标广告。参考图36来更详细地描述广告。在方框3280期间,执行方框3060,其中,执行一种已发现的存在物子系统。
现在参考图33,所发现的存在物子系统包括方框图3310,其中,在所发现项目的顾客数据库中进行记录。在一个较佳实施例中,在数据库170中包括顾客数据库。在方框3310后,执行方框3320,其中,根据数据库170中的信息来准备适合垂直域的信息。在方框3320后,执行方框3330,其中,建立相关信息和命令语法。例如,在电影垂直域中,如果在一个特定的剧院放映一系列影片,则语法将包括片名,以便允许用户要求获得有关特殊影片的更多信息。
在方框3340处,从用户那里返回信息。在一个较佳实施例中,可能的可接受命令包括听取更详细的信息、听取来自特殊来源的信息、听取相关信息(例如,较便宜、较好)和采取适合垂直域的行动(例如,增加投标、改变位置)的各种命令。在方框3340后,执行方框3350,其中,获得下一项活动。如果需要一个新的垂直域,则控制传到方框3020(图30)。如果需要从当前的垂直域的顶部进行新的选择,则控制传到方框3030(图30)。如果需要一个新的存在物,则控制传到方框3040(图30)。
再次参考图32,在执行方框3280之后,执行方框3290,其中,通过更新数据库170来协调网络查找结果。在协调方框3290处的网络结果期间,可以在方框3295处执行智能延迟操作,其中,执行广告或其他形式的延迟处理。方框3295处的智能延迟处理使用来自顾客数据库和广告数据库的信息。在一个较佳实施例中,顾客数据库和广告数据库是数据库170的子集。在选择性实施例中,顾客数据库和广告数据库是在物理上分开的数据库。
在操作中,用于对这里所描述的基于互联网的信息进行话音访问的系统和方法可以有利地为消费者识别感兴趣的垂直域(例如,电影、购物),然后“集中”从垂直域中所有可能的事物范围到消费者想要的一个事物或一套事物的用户回应。根据集中到一个特殊项目的一套预先定义的“路径”,垂直域内的这种集中涉及针对系统地向用户提出有关产品或服务的属性的询问。按照将被确定和例示的有关产品的限制的定制,来定义路径。
图34展示了集中过程的流程图3400,该集中过程允许话音入口10集中用户响应,并实现对用户响应的高准确率的话音识别。在步骤3410中,用户调用话音入口10。在步骤3410后,使用上述不同的可能方法来执行步骤3415,其中,识别呼叫者。在步骤3415后,执行步骤3420,其中,用户选择一个感兴趣的垂直域。然后,执行步骤3425,其中,开始对所选的感兴趣垂直域的属性集中特征。在步骤3425后,执行步骤3430,其中,话音入口10判定用户在感兴趣的这个垂直域中是否有优先选择。如果有优先选择,并且用户不想推翻它们,则控制传到步骤3460,其中,根据用户优先选择,指出已发现项目或服务。
如果没有优先选择或用户推翻他或她的优先选择,则执行步骤3435,其中,建立属性词汇表集。词汇表集有利地允许话音入口10具有数量有限的可能的响应,从中用于对感兴趣的垂直域中此时的用户响应的语音识别。利用一个定义的词汇表集,话音入口10有利地实现高识别率的传统语音识别技术。例如,在用户已选择“职业体协棒球”(MLB)队和已经建立一套关于MLB队的可能要求的词汇表集之后,识别术语“Brewers”将会更容易。这种词汇表集可以包括关于相同信息的各种不同类型的用户输入。例如,在MLB队例子中,词汇表集可以包括与MLB队有关的所有城市名或州名,以及MLB队的吉祥物。这样,“密尔沃基”和“Brewers”将都是MLB队的词汇表集的一部分。
在已建立合适的词汇表集之后,执行步骤3440,其中话音入口10就属性进行询问。例如,“你想了解关于‘职业体协棒球’队的什么情况?”在步骤3440后,执行步骤3445,其中,识别属性。如果没有识别属性,则可以执行步骤3447,以便执行用于属性识别的撤退程序。在步骤3450中,话音入口10确定它是否已达到“结束状态”或已发现项目或服务的一个点。如果还没有达到“结束状态”,则执行步骤3455,其中,访问下一个属性,控制返回到步骤3430。在所提供的棒球例子中,只利用队名还没有达到结束状态。必须要求其他“范围更狭小”的属性(例如,最近的比赛结果、运动员统计数字、团队名次表或其他相关的信息)。一旦执行步骤3460,就执行步骤3465,其中,向用户报告所发现的项目或服务。
在一个示范实施例中,用户按以下方式选择项目。用户首先规定感兴趣的领域(例如,电子商务、交通信息、天气信息、电影等)。然后,用户通过规定项目的属性来选择一个项目(例如,书籍、玩具、关于交通信息的有关路线、关于感兴趣城市的天气信息等)。然后,为用户提供适合该项目领域(例如,产品、交通、天气、电影等)的、关于所识别项目的详细信息。例如,在有关评论的电子商务领域中,可得到包括定价、运输成本和可用性的卖主信息。在感兴趣的电影领域中,提供了导演、制作人和演员表。在感兴趣的拍卖领域中,突出的投标成为可得到的。
有利的是,用户可以用多种方法要求地点信息(例如,一个被识别产品的最接近的买主、放映某部影片的最接近的剧院),以便识别地点(例如,邮政编码、城镇名称、城市区域“波士顿北部、西部等”)。在一个示范实施例中,使用关于围绕ZIP代码识别位置的策略,它涉及询问郊区名称、后退到城市或(甚至)州、然后再移向目标。在一个示范实施例中,根据要求为用户提供最后更新信息的日期和时间。较佳的是,呈现给用户的所有数据是当前适合该领域的。通知用户关于“纯粹”源信息的信息来源(“由XXXXX提供”)或只来自一个来源的信息。在一个较佳实施例中,每个选择点处都可得到“帮助”或“指令”选项。
用户可以要求适合于领域的、基于项目属性的项目比较。用户可以要求适合于领域的、对“较好的”、“较便宜的”和“相关的”项目进行识别。有利的是,用户可以明确地把项目记录在许多用户定义的清单中(适合感兴趣的领域)。用户可以从他们的清单复查这些项目。用户可以要求用电话或电子邮件通知他们清单上的项目的信息变化(适合于领域的)。
图35展示了使用话音入口10来执行交易的示范过程的流程图3500。在步骤3510中,用户访问(电话或呼叫)话音入口10。在步骤3510后,执行步骤3515,其中,执行集中过程,以识别用户所需的项目或服务。这种集中过程执行流程图3400中所示的和参考图34所描述的各项操作。
在步骤3515后,执行步骤3520,其中,话音入口10要求用户规定所需的和与被识别的项目或服务有关的交易。在执行步骤3520之后,执行步骤3525,其中,话音入口10识别合适的话音入口规则,以执行所规定的交易。在步骤3525后,执行步骤3530,其中,执行规则来进行所规定的交易。交易可以包括购买项目或服务、对拍卖进行投标或可以在互联网上进行的任何其他类型的交易。在步骤3530后,执行步骤3535,其中,话音入口10记录交易结果。较佳的是,把该结果记录在数据库170中。在步骤3535后,执行步骤3540,其中,向用户报告交易。
不同的交易(例如,投标、观看、购买、跟踪)适合于不同的领域。例如,在感兴趣的电子商务领域中,用户可以从所选的卖主那里订购所识别的产品。此外,用户可以将一个项目添加到购物手推车,用于以后购买。当订购时,用户可以(从用户简介或手工)规定记帐信用卡和运输地址。用户也可以要求关于以前所订购的产品的状态信息。另一个例子是,在感兴趣的拍卖垂直域中,用户可以增加现有的投标,或用户可以对新的拍卖进行投标。
有利的是,使用话音入口10来执行交易的过程不要求用户在计算机上采取任何手工的动作。用户可以购买项目、进行投标或做任何其他的互联网交易,而无需点击鼠标、按计算机键盘上的键或采取任何其他计算机界面的手工动作(例如,鼠标点击、键盘输入)。这样,参考图35所描述的过程可以是“无点击”互联网交易过程。用户可以使用电话的触模输入板,并且仍然执行“无点击”互联网交易。
图36A展示了使用话音入口10来做广告的示范过程的流程图3600A。有利的是,广告子系统120包括确定向特殊用户播放什么广告的一种方法。通常,这种方法包括根据范围(context)(例如,用户人口统计、位置人口统计和感兴趣的当前垂直域)来设置选择限制。在设置选择限制之后,该方法根据这些限制来询问广告数据库,并检索可能的广告清单。根据每个广告的销售标准来重新定制可能的广告清单。从重新定制的清单选择一个广告,并将其呈现给用户。
参考流程图3600A,在步骤3600A中,话音入口10中的广告子系统120设置关于要呈现给用户的广告的选择限制。在一个实施例中,选择限制根据以用户为中心的信息(例如,用户人口统计、位置人口统计和感兴趣的当前所选垂直域(如果有的话))和以广告为中心的信息(例如,广告销售标准、缺少重复和其他的广告有效性因素)。在从各种不同类型的广告(例如,介绍性赞助广告、垂直的赞助广告和商业广告)中进行选择的过程中,使用这些限制或标准。在步骤3610A后,执行步骤3615A,其中,根据步骤3610A中所选的限制来向数据库170询问可能的广告清单。
在步骤3615A后,执行步骤3620A,其中,根据销售标准因素来重新定制可能的广告清单。在一个实施例中,使用销售标准来确定以下内容(1)是否正在实现这个广告的广告传递率?(2)是否已经实现这个广告的最小的目标传递量?有利的是,使用销售标准来确保每个“广告”顾客对于传递的要求将得到满足。在一个实施例中,计算比率,以便将应该首先传递的广告列入优先。
以下提供了将比率用作如何定制广告的确定因素的一个例子。广告X在其合同中需要100,000次传递。话音入口10已经传递了广告X的7,000个实例。合同的起始日期是5月10日,结束日期是6月7日。假设当前的日期是5月15日。所以,确定示范比率如下●合同开始后的天数=5。
●合同长度=27天。
●需要播放广告的天数=22。
●所播放的广告的百分比=7,000/100,000~=7%。
●已播放的天数的百分比=5/27~=18.5%。
这样,示范的最后比率是(已播放的天数的百分比-曾播放的广告的百分比)/合同中的剩余天数有利的是,这个比率说明了不久应该播放的广告(较小的分母->较高的比率),已被播放的广告的差异用较低的比率向后推。
在重新定制可能的广告清单的步骤3620A后,执行选择广告的步骤3625A。在一个实施例中,根据可能的广告清单中的最高比率来选择广告。在步骤3625A后,根据待呈现的广告的类型来采取不同的行动。在步骤3630A中,如果没有可用的广告,并且如果广告类型是介绍性赞助广告,则在步骤3635A中提出一个例外。否则,执行步骤3640A,其中,作出是否可得到广告的判定。如果可得到广告,则执行播放广告的步骤3645A。如果不可得到广告,则执行步骤3640A,其中,重新设置选择限制,控制返回到步骤3620A。
这样,每种类型的“广告”酌过程步骤有差别,有三种类型的广告介绍性赞助“广告”、垂直的赞助“广告”和商业“广告”。以下是选择介绍性赞助“广告”的示范过程1.根据介绍性赞助“广告”类型来设置选择限制(不使用纵向,因为不应用纵向)。
2.根据限制来询问数据库,把结果转换成将播放的可能的“广告”清单。
3.根据销售标准重新定制清单。
4.从具有最高比率的清单中选择广告。数据库中一定有“广告”,否则提出一个例外。
以下是选择垂直的赞助“广告”的示范过程1.根据用户人口统计、位置人口统计和垂直的赞助“广告”类型的垂直类型来设置限制。
2.根据限制来询问数据库,把结果转换成将播放的可能的“广告”清单。
3.根据销售标准重新定制清单。
4.如果可得到一个广告,则从具有最高比率的清单中选择该“广告”,并且返回到用户界面。
5.如果不可得到广告,则只根据垂直类型来重新设置选择限制,并且将垂直赞助的类型设置成只用于Quack推销。
6.根据销售标准重新定制清单。
7.如果可得到一个广告,则从具有最高比率的清单中选择该“广告”,并且返回到用户界面。
8.如果用户听取了来自清单的所有“广告”,则返回向用户播放的最后的“广告”。如果由于某种原因,清单是空的,不可得到“广告”,则提出一个例外。
以下是选择商业广告的示范过程1.根据位置人口统计、顾客人口统计和商业“广告”类型的垂直类型来设置限制。
2.根据那些限制来询问数据库,把结果转换成将播放的可能的“广告”清单。
3.根据销售标准重新定制清单。
4.如果可得到一个广告,则从具有最高比率的清单中选择该“广告”,并且返回到用户界面。
5.如果不可得到广告,则只根据垂直类型来重新设置选择限制,并且将商业广告节目的类型设置成用于Quack(即话音入口系统)商业广告节目或已付款的商业广告(不管输入的类型如何)。
6.根据销售标准重新定制清单。
7.如果可得到一个广告,则从具有最高比率的清单中选择该“广告”,并且返回到用户界面。
8.如果用户听取了来自清单的所有“广告”,则返回最后的“广告”。如果由于某种原因,清单是空的,没有“广告”,则提出一个例外。
现在参考图36B,流程图3600B展示了使用话音入口10来做广告的第二个示范过程。在步骤3610B中,用户访问(电话或呼叫)话音入口10。在步骤3610B后,执行步骤3615B,其中,执行用户查找,以识别用户。可以用各种方法来进行呼叫者识别,其中的一些方法参考图2和图30来加以描述。在步骤3615B后,在步骤3620B中,作出话音入口10是否知道用户的判定。如果不知道用户,则执行步骤3625B,其中,为用户使用默认简介。在一个示范实施例中,默认简介不包括用户限制或关于某些广告的限制。可以为已知有关呼叫的某些参数(例如,用户的区域代码、呼叫在一天中的时间、一周中的某天等)调整默认简介。如果知道用户或在执行步骤3625B之后,则执行步骤3630B,其中,广告子系统120根据界面的类型(例如,语音、WAP、WWW)来生成广告的一个集“S”(包括对于当前用户而言特定的用户限制)。
如果提供当前的操作范围(例如,特定的用户、感兴趣的垂直域),则在步骤3635B中,广告子系统120根据广告范围来生成广告集S的加权。在步骤3635B后,执行步骤3640B,以判定范围是否足以准确地知道用户最想要什么。如果范围不充分,则执行步骤3645B,其中,根据所获得的局部范围来拾取广告。如果范围充分,则执行步骤3650B,其中,播放最合适的广告。
有利的是,广告子系统120为所有呼叫者提供一个最初的普通广告或赞助消息。广告子系统120也为用户提供根据适合于领域的实用功能而选择的有目标的声频广告。在一个示范实施例中,实用功能与将做广告的产品或服务的可用性、当前项目的相关性(例如,DVD与电视机有关)、与用户的关系(例如,通过人口统计)、用户对广告客户的希求、给服务供应商的值(例如,根据成本/利润)感兴趣。有利的是,广告子系统120能够在某个时间帧内向用户传递特定数量的广告。而且,广告子系统120能够跨越不同的平台(例如,无线应用协议(WAP)、WWW和语音界面)来传递广告。
拿语音界面平台来举例,在第一分钟内,将一个赞助广告和一个有目标的广告传递给用户。在每个额外的40秒内,传递第二个有目标的广告。在一个实施例中,赞助消息将在3-5秒内进行处理,然后,有目标的广告用10-20秒。
实施这种结构的根据是这个事实当进入系统时,呈现介绍性赞助广告。每次当用户进入纵向时,都向用户提示“垂直的赞助”。一旦用户将要接收所要求的数据,就将为用户呈现完整的商业广告节目。有利的是,当估计用户在接收以前所列的时间表之前正在40秒的时间内搜索其信息时,这个模型近似该时间表。
在广告范围中,“电话说话”是在呈现广告时传递更多详细信息的要求。有利的是,电话说话不仅应用于语音界面,而且应用于WAP和WWW。关于WAP,可以考虑电话说话的语音和文本,而点击横幅以便发现有关广告的更多信息将会是WWW上的电话说话。在话音交互作用上的电话说话的一个实施例是为用户指明网站地址或电话号码。在选择性实施例中,电话说话收集电子邮件地址或定制的电话号码,提供给广告客户,以便向顾客发送更多有关的信息。利用WWW界面,电话说话可以包括使用外部来源来管理和稽核顾客信息。广告子系统120也可以为用户提供根据适合于领域(例如,WWW界面)的实用功能而选择的有目标的“横幅”广告。
根据几种因素的组合来管理广告子系统120的广告传递。在一个示范实施例中,在三个地点中的一个地点传递广告。首先,当用户正准备进入系统以开始新的通话时,可以传递广告。这个赞助消息将在用户界面110的话音中或“系统话音”中,应该在几个选择性的广告赞助者之间轮流。例如,赞助者消息可以说“由网上的当前值Visa为您提供Quack”或“由SprintPCS为您提供Quack;蜂窝服务光明的未来。”其次,在用户刚刚访问系统的某个纵向(例如,电影、交通或天气)之前,可以传递另一个赞助广告(“垂直的赞助”广告)。例如,这种广告可以说“由电影信息的世界权威IMDB为您提供”和“LCE Sony Metreon波士顿对好影片选择的‘唯一’选择”。
再次,在用户刚接收被精炼的要求之前,可以传递广告。将广告的这种类型定义为“商业广告节目”。这种广告是适时的(即,在所选的点处被传递),但只是以频繁为基础(例如,每2分钟)。有利的是,系统话音可以指出可能有帮助的、关于用户的增值情况。例如,当用户正在选择在特定剧院放映的影片时,可以建议附近的一家饭店。虽然可以有非电话说话的广告,但是,这里较佳地使用电话说话的广告。广告内容本身较佳地约为7秒钟的长度。较佳的是,电话说话的广告有可能的最高的质量(即专业制作),长度约为15~20秒。例如,如果用户将“美国丽人”选为LCE Sony Metreon处的影片,则系统话音说“我正在(清单上)查找Sony Metreon的清单......如果你想了解‘Tony的Matriciana’离Sony Metreon只有5分钟的波士顿最好的意大利食品,那么说‘Tony的!’,或继续查找你的清单。”然后,用户可以自动建立预定。也可以把其他的相关性属性也可以用于有目标的广告。有利的是,由于目前假设提出纵向特殊的要求将花费传递广告的时间,因此,在这些不同的处境中传递广告。
在处理这些事件的同时,作出用户需要传递给他们的判定哪些广告。结合在这个判定内的因素包括通话的长度、要求什么类型的垂直内容、内容和用户简介(和/或位置)(即,饭店广告应该针对当地的顾客)的组合、收入潜力、要求特殊信息的呼叫者,以及用户是否已听取广告。在一个示范实施例中,根据以下因素来交替广告。这些因素是上次播放广告是什么时候?在这次通话之前用户上次听取这个广告是什么时候?用户听取这个呼叫码?这个广告的广告传递率达到码?这个广告的最小的目标传递量?有利的是,用一种方式来传递广告,以致形式适合于特定的顾客;并根据记帐率进行跟踪。这样,收集某些基本的数据,以便管理每个广告(例如,广告已播放多少次?单独的用户已听取广告多少次?)在提供该基本数据的情况下,同时可以得到所述所有用户已听取各种被定义的分类中的广告。以下更加复杂的询问。例如,询问可以包括创建所有用户的报告的能力。这些分类如下姓名、人口统计信息、位置和相关性信息(这些用户还要求的别的什么)。询问也可以包括创建已要求电话说话的信息的所有用户的报告的能力。
当呈现广告时,可以除去在话音入口10的其他操作模式期间可能的闯入性能(即,停止播放广告)。阻止闯入的性能的重要性在于登广告者必须得到对于通过话音入口10提供的相对于广告的数据的保证已获取。在一个实施例中,由第三方听众来收集该广告数据。
广告子系统120记录服务于用户的所有广告,包括成功的传递(即,完成)和不成功(即,未完成)的传递。较佳的是,把该记录存储在数据库170中。有利的是,感兴趣的垂直域、呼叫者位置或用户、用户优先选择、或用户过去的兴趣、或者登广告者感兴趣的和用户收集信息的某种其他的组合都可以是广告的目标。
有利的是,可以使用范围敏感的信息来在狭窄的范围内使广告瞄准用户。目标对准话音入口10中的范围敏感的“广告”将商业“广告”几乎正确地与用户要接收什么信息联系起来。为了正确地执行这项功能,在将要播放“广告”之前,将合适的指会传入选择算法。在一个实施例中,垂直类型是范围指针。
在其他的实施例中,存在物是允许建立更多特殊目标的范围指针。这个范围指针使其属性标准与市场研究标准相匹配,以确定某些类别中的权重。这些类别权重与最初清单中的“广告”的销售标准结合而定义范围权重的排序,从该排序最好地选择“广告”。这份根据人口统计和垂直类型而创建的最初清单构成了范围加权的基础。引入数学符号来将这个问题纳入一个算法,其后的一个例子将进行有关的说明。
首先,定义与所涉及的参数有关的变量。让集合{e1、e2,…,em}定义变成算法的存在物的属性清单,其中,m是存在物中的属性的数目。例如,关于电影存在物,样品属性是类型、位置和放映时间。通过集合{C1、C2…Cn}定义可得到的与广告关联的类别清单,其中,n是类别的总数。系统中的一些样品类别将会是家庭、饭店、夜生活、电影和娱乐。让每个类别Ci有一个范围类别权重Wi,其中,i∈{1…n}。如以下所讨论的,拥有范围类别权重的目的是与广告的类别权重比较而确定范围的强度。
把所有存在物的市场研究标准表示为P={P1、P2,…,Pt},其中,t是数据库中所有标准的总数。每个标准pj有一个有关的权重wj,其中,j∈{1,...,t},并且,关于所有的i、j,每个属性ei将尝试满足所有的pj,其中,i∈{1,...,m},j∈{1,…,t}。这样,如果ei满足pj,并且pj属于类别Ck,那么,Wk=Wk+wj,其中,i∈{1,…,m},j∈{1,…,t},k∈{1,…,n}。使用这个迭代来定义每个类别的前述范围权重。
一旦定义了每个类别的总范围加权Wk,就必须计算其有关的强度比率Rk。使用一种类别的强度比率来判定存在物的范围是否强得足以有利于选择“广告”。例如,如果家庭类别有许多在P中的标准,那么,我们想确定对应于存在物的范围的权重处于可接受的比例。所以,Rk=Wk/Tk,其中,Tk是在有关类别k的P中的所有标准的总权重。
人口统计询问所生成的广告清单由集合A={A1、A2,…,Ar}所定义,其中,r是该清单中的广告的总数。每个广告Ai有其自己的类别权重Xk,其中,i∈{1,…,r},k∈{1,…,n},把它结合运算的对应的范围类别权重比率Rk来加以运用。
这样,一旦通过在数据库上过滤人口统计和“广告”类型来创建“广告A”的初始清单,在算法中的各个步骤将如下所示1.设置每个类别Ck的权重Wk,如下所示●初始化每个Wk=0,其中,k∈{1,…,n}●关于每个i∈{1,…,m}和每个j∈{1,…,t},根据存在物的当前属性,{e1,e2,…,lm},如果ei满足pj,以及pj与类别Ck关联,那么,Wk=Wk+wj,其中,k∈{1,…,n}2.现在,独立于存在物的属性来将类别的总权重制成表格。根据那些总权重,建立每个类别的范围比率●关于每个k∈{1,…,n}和每个j∈{1,…,t},如果pj与类别Ck关联,那么,Tk=Tk+wj。设置范围类别范围比率Rk=Wk/Tk3.关于每个类别k,使每个Rk乘以每个广告Ai的类别权重Xk,然后,使总和乘以广告的销售标准比率Si,以获得范围总数Gi●关于每个i∈{1,…,r},计算Gi,其中,Gi=Si·(R1x1+…+Rnxn)4.选择广告Ai,其中,i由max(Gi)定义,i∈{1,…,r}。
以上的算法可以用一个简单的例子来展示。考虑一个例子,其中,当在感兴趣的电影垂直域中时,用户正在使用话音入口10的服务。已经播放垂直的赞助“广告”,而用户正要接受感兴趣电影放映的信息。这样,作为范围,选择包括指向将被播放的特殊存在物的指针,它是“火星使命”(出于概要的缘故)。电影放映存在物的一些属性是收视率(例如,R)、类型(例如,惊险影片)和放映时间(例如,下午400),可以把它们表示为{e1、e2、e3}。这样,需要与包含要素P={P1、P2…Pt}的范围标准匹配的清单。可以在数据库中把标准的样品清单表示为
从这张表格中可见,可以推断各种类别为C={娱乐、家庭、夜生活、十几岁的青少年、成人},其中,k=5。所以,从步骤1中可见,W1=10,W2=0,W3=50,W4=80,W5=0。从步骤2中可见,建立R1=1,R2=0,R3=1,R4=0.4,R5=0(假设P只有8个要素,不可能会是这种情况,而会是大约200个要素或更多要素)。现在,假设“广告”清单A有三个“广告”。假设广告的五个类别的权重是
所以,从这些加权值{X1,X2,X3,X4,X5}中可见,我们可以进行计算,以获得每个广告Ai的Gi的值,其中,i∈{1,2,3},如下所示Gi=Si·(R1x1+…+Rnxn)G1=0.8·((1)(0.9)+0+(1)(0.7)+(0.4)(0.9)+0)=1.568G2=1.1·((1)(0.9)+0+(1)(0.9)+(0.4)(0.9)+0)=2.376G3=1.0·((1)(0.9)+0+(1)(0.7)+(0.4)(0.9)+0)=1.96这样,根据范围和销售比率确定,“火星使命”“广告”是最合适的。这个算法根据不同类别与正在被检索的信息的关联来表明它们的范围。也构成了一个事实记录需要为销售标准而播放的“广告”和使之因子分解成排序。这个例子只展示了在P中的简短的广告清单、各种类别和标准。该算法意在利用更多的类别和标准。
图37-43展示了用户与话音入口10之间的交互作用的示范对话图。参考图37-43所描述的该对话图只是用于说明。只在各幅图中示出了感兴趣的电影、天气、交通、股票和体育垂直域,但应该清楚,参考图4-6所描述的,特别按照因数据结构模型300、400和450而存在的可扩展的和适应的性能,在这种对话图(在话音入口10与用户的交互作用中)中可以包括感兴趣的任何垂直域。此外,表示用户与话音入口10之间不同的交互作用的特殊方框只用于说明。对于感兴趣的许多可能的垂直域中的每一个都可以有范围宽广的许多交互作用。
图37展示了对话图3700,其中,在用户打电话呼叫话音入口10之后,执行其中提供欢迎的方框3710。在方框3710后,执行方框3720,其中,跟随一个签到程序(参考图38来进一步加以描述)。在方框3720的签到程序后,用户可以选择拥有关于方框3730和3740处的话音入口10的服务的介绍或直接到通道信息,所述通道信息用于介绍方框3750处可能感兴趣的垂直域。尤其是,在方框3730处,提供有关服务供应商的介绍性信息。在方框3740处,提供有关服务如何运作的介绍性信息。在方框3750处,话音入口10要求用户从“通道”(例如,电影、天气、交通、股票、体育)选择一个感兴趣的领域。
如果用户选择感兴趣的电影领域,则执行方框3760,其中,执行电影子系统(参考图39来进一步加以描述),并且用户已经访问电影信息和交易(例如,影片清单、剧院和评论)。如果用户选择感兴趣的天气领域,则执行方框3770,其中,执行天气子系统(参考图40来进一步加以描述),并且用户已经访问天气信息(例如,今天的天气预报,或某个较佳位置或任何位置的更远的天气预报)。如果用户选择感兴趣的交通领域,则执行方框3780,其中,执行交通子系统(参考图41来进一步加以描述),并且用户已经访问交通信息(例如,城市报告、某个路线的报告或个性化的报告)。如果用户选择感兴趣的股票领域,则执行方框3790,其中,执行股票子系统(参考图42来进一步加以描述),并且用中已经访问股票信息和交易(例如,市场概要、股票报价、股票新闻,以及个性化的股票新闻或交易(例如,买进、卖出))。如果用户选择感兴趣的体育领域,则执行方框2500,其中,执行体育子系统(参考图43来进一步加以描述),并且用户已经访问体育信息和交易(例如,体育比赛得分、体育新闻、体育赛事门票信息和体育迷社团交易)。
现在参考图38,示出了一个签到子系统。在方框3810处,尝试进行呼叫者识别。话音入口10的一类用户是未被识别的用户。未被识别的用户来话呼叫(可能是第一次),通过传统的呼叫者识别技术(“呼叫者ID”)可以确定他的位置或无法确定他的位置。如果在数据库170中不存在呼叫者ID,则该呼叫者可能是一个新的呼叫者。如果隐瞒呼叫者ID,则两种情况话音入口10都无法告诉。在一个实施例中,话音入口10要求电话号码(或其他标识符)并继续联系“被识别的”呼叫者。在一个选择性实施例中,话音入口10继续运行,而无需验证。这个判定可以取决于正在要求的信息的种类。例如,在特定的垂直域中,在继续进行(例如,拍卖)之前,可能需要确定用户的身份,以便识别用户。
所识别的用户是签约用户,或未签约用户。如果所识别的用户是签约用户,则话音入口10拥有有关用户的信息(例如,信用卡和来自数据库170的优先选择)。较佳的是,用户进行签约,以致话音入口10可以开始跟踪优先选择和兴趣,来实现更高程度的消费增值,从而忠实于服务。一旦签约,用户就可以规定简介信息(包括地址和信用卡号码)。此外,收集的有关特定呼叫者的信息积聚得越多,广告就越有针对性(从而更有价值)。
如果呼叫者识别是可能的,则执行方框3820,其中,通过向用户询问口令来进行用户确认。一旦验证口令,就可以设置用户优先选择,并把控制传到方框3870,控制返回到执行介绍或通道选择的图37。如果所提供的口令无效,则控制传到方框3840。
如果呼叫者识别是不可能的或用户不知道他或她的口令,则控制传到方框3830,其中,话音入口10确定用户的帐户状态。如果用户没有帐户,则控制传到方框3850,其中,提供帐户设置提示用户应该设置帐户。如果用户有帐户,则控制传到方框3840,其中,话音入口10获得用户的帐户号码。如果用户已忘记帐户号码,则控制传到方框3850,其中,要求用户设置帐户。如果用户提供有效的帐户号码,则控制传到用于用户确认的方框3820。如果用户提供无效的帐户号码,则控制传到方框3860,其中,话音入口10通知用户该帐户无效,以访问网站或拨打支持号码求助。然后,控制传到方框3880和图37,其中,进行介绍或通道选择。
现在参考图39,执行电影子系统。在方框3910处,话音入口10播放感兴趣的电影领域方面的介绍。用户可以选择选项(例如,剧院放映的影片、影片清单和影片评论)。如果用户选择剧院放映的影片,则控制传到方框3915,其中,话音入口10确定用户所需的地理位置。可以使用各种方法来确定位置(例如,ZIP代码、州与城市,或优先选择)。如果所给定的位置附近没有剧院,则执行方框3920,其中,播放一个消息,以通知用户所给定的区域中没有剧院。在确定位置之后,执行方框3925,其中,列出该位置内的剧院名称。在方框3925后,执行方框3930,其中,列出正在该区域内的剧院放映的影片。话音入口10要求用户选择影片,控制传到方框3935。
现在回到方框3910,它曾播放感兴趣的电影领域方面的介绍。如果用户要求影片清单,则执行方框3940,其中,话音入口10向用户要求片名。在方框3940后,执行方框3945,其中,用户要求的地理位置。如上面所讨论的,可以使用各种方法来确定呼叫者的位置。如果有剧院放映所选的影片,则执行方框3950,其中,列出放映影片的剧院,并要求用户从清单中进行选择。然后,控制传到方框3935。如果没有剧院放映所选的影片,则执行方框3955,并为用户提供在最近的位置处放映影片的次数。然后,控制传到方框3935。
现在参考播放感兴趣的电影领域方面的介绍的方框3910,如果用户要求电影评论,则执行方框3960,其中,话音入口10从用户那里要求片名。在方框3960后,执行方框3965,其中,播放关于所选影片的评论。在方框3965后,执行方框3970,其中,话音入口10询问用户他或她是否想找到所选影片的放映。如果用户谢绝了,则控制返回到方框3960,以获得用于影片评论的另一个片名。如果用户接受,则控制传到方框3945。
在方框3935处,话音入口10提供关于所选影片和剧院的影片放映次数。在方框3980处,话音入口10要求执行下一个动作。用户可以要求剧院的地址,然后在方框3985处提供该地址。用户也可以要求影片评论,然后在方框3990处提供该评论。一旦用户想离开感兴趣的电影领域,控制就返回到图37中的方框3750。
现在参考图40,如图所示,执行天气子系统。在方框4010处,话音入口10播放感兴趣的天气领域方面的介绍。在方框4010处播放介绍之后,控制传到方框4020,其中,话音入口10获得在感兴趣的天气领域中使用的位置信息。如上所述,可能有多种方法可以获得位置信息(例如,从ZIP代码、城市或州及其他的位置标记中获得位置)。在方框4020后,控制传到方框4030,其中,话音入口10提供一个提示,该提示关于用户是想获得实况转播的天气信息还是想获得以后时期的天气信息。如果用户选择听取以后时期的天气信息,则控制传到方框4040,其中,话音入口10播放向用户提供天气潜伏期选项的提示。如果用户想获得当前的天气信息或在用户已选择方框4040处的潜伏期选项之后,控制传到方框4050,其中,话音入口10提供所需的天气信息。
在执行方框4050之后,控制传到方框4060,其中,话音入口10询问用户是否需要更远的天气预报。如果需要更远的天气预报,则控制传到方框4070,其中,话音入口10提供更远的天气预报。在方框4070后或如果用户不想要更远的天气预报,则控制传到方框4080,其中,话音入口10要求用户执行下一个动作。如果用户想在感兴趣的天气领域中继续,则控制传到方框4090,该方框对应于参考图37所描述的、作为方框3750的通道。
现在参考图41,执行交通子系统。在方框4110处,话音入口10播放感兴趣的交通领域方面的介绍。在方框4110后,控制传到方框4115,其中,话音入口10获得用户的位置信息或关于用户的个性化信息。在方框4115后,控制传到方框4120,其中,话音入口10获得城市交通信息。如果没有城市交通信息,则控制传到方框4135,其中,获得ZIP代码交通信息。如果话音入口10没有识别城市,则ZIP代码交通信息是撤退。如果没有发现城市数据和包含有关附近位置的数据,则控制传到方框4140,其中,话音入口10要求附近的城市。如果在方框4120处没有可报告的交通事件,则控制传到方框4125,其中,告诉用户该城市中没有可报告的交通事件。如果在方框4120处没有交通数据可得到,则控制传到方框4130,其中,为用户提供选项,来试一试另一个城市或到通道选择新的感兴趣领域。
在方框4120后,控制传到方框4145,其中,话音入口10要求特殊的交通路线或“整个城市”。在方框4145后,控制传到方框4150,其中,话音入口10获得路线方向信息。在方框4150后,如果没有报告有关路线的交通情况,则控制传到方框4155。在方框4155处,为用户提供选项来选择新的交通路线或“整个城市”,以及到通道选择新的感兴趣的领域。如果可得到路线交通信息,则在方框4150后,控制传到方框4160,其中,话音入口10列出所选路线的路线交通情况,如果在方框4145中用户已经选择“整个城市”,则控制传到方框4165,其中,话音入口10列出城市交通信息。
在方框4160和方框4165后,控制传到方框4170,其中,话音入口10为用户提供所需的交通报告。在方框4170后,控制传到方框4175,其中,话音入口10要求在感兴趣的交通领域中要执行的下一个动作。在一个示范实施例中,下一个动作可以包括重复交通报告;继续列出交通信息;以及转向通道。在用户已在方框4175处进行选择之后,控制传到一个合适的方框。例如,如果用户选择重复交通报告,则控制传到方框4170。如果用户选择继续清单选项,则控制传到方框4160或方框4165,这取决于在方框4145处是选择特殊的交通路线还是选择“整个城市”。如果用户选择转向通道,则控制传到方框4180,该方框对应于参考图37所描述的、作为方框3750的通道。
现在参考图42,执行股票子系统。在方框4210处,话音入口10播放感兴趣的股票领域方面的介绍。在方框4210后,控制传到方框4215,其中,话音入口10为用户提供对市场概要、股票报价或被称作“MyQuack”的个性化清单进行选择。如果用户选择市场概要,则控制传到方框4240,其中,为各种市场提供市场概要(例如,道琼斯工业指数、纳斯达克、S&P 500、NYSEVolume、纳斯达克Volume和30年的债券)。如果用户选择股票报价,则控制传到方框4220,其中,话音入口10从用户那里获得特殊的股票名称。在方框4220后,控制传到方框4225,其中,话音入口10获得对应于方框4220中所提供的股票名称的证券交易所。在识别证券交易所之后,控制传到方框4230,其中,话音入口10提供股票信息(例如,价值、上次交易、变化、成交量和一天中的最高价格/最低价格)。
在方框4230后,控制传到方框4235,其中,话音入口10要求在感兴趣的股票领域中要执行的下一个动作。在一个示范实施例中,用户可以选择重复股票信息/继续列出股票信息、获得新的股票、听取市场概要或转向通道。根据用户在方框4235处作出的选择,控制传到关于市场概要的方框4240、关于新的股票名称的方框4220、关于个性化的my quack股票的方框4250或关于通道的方框4275。在方框4275前,控制可以传到方框4270,其中,话音入口10向用户提供优先选择提示可以设置优先选择,以便用更加迅速的方式来获得个性化的信息。如果已经在关于优先选择的这个呼叫中提醒了用户,则控制直接传到方框4275。
如果在方框4215中用户选择“MyQuack”,如果没有识别帐户信息,则控制传到方框4245;如果识别帐户信息,则控制传到方框4250。在方框4245中,建立优先选择设置和帐户信息。可以建议用户在网上建立帐户。在方框4250处,提供个性化的股票信息(例如,价值、上次交易、变化和成交量)。在方框4250的操作期间,用户通过(例如)在播放感兴趣特定股票的信息期间说出“那个股票”,可以识别特殊的股票。如果进行这种选择,则控制传到方框4255,其中,列出关于特定股票的股票新闻选项。在用户已从方框4255中的清单中选择一种特殊的股票新闻之后,控制传到方框4260,其中,话音入口10播放所选的股票新闻。在方框4260后,控制传到方框4265,其中,话音入口10询问用户是返回以获得股票新闻清单(方框4255)还是现有股票新闻。如果用户选择现有股票新闻,则控制传到方框4235,其中,要求执行关于股票的下一个动作。一旦用户已完成感兴趣的股票领域,控制就传到方框4275,该方框对应于参考图37所描述的、作为方框3750的通道。
现在参考图43,执行体育子系统。在方框4310处,话音入口10播放感兴趣的体育领域方面的介绍。在方框4310后,控制传到方框4315,其中,话音入口10获得用户所需的体育类型,或用户可以说“MyQuack”以获得个性化的体育类型的比赛得分。如果用户选择一项特定的体育运动,则控制传到方框4320,其中,话音入口10从清单中获得所选体育运动的社团名称。例如,话音入口10可以列出“NFL、NBA、NHL和职业体协棒球”。在用户已选择社团名称之后,控制传到方框4325,其中,话音入口10获得用户感兴趣的特殊的团队。在方框4325后,控制传到其中提供体育比赛得分的方框4330。例如,话音入口10可以说“‘团队’(TEAM)参加的上场比赛是‘DATE’,最后的得分是团队1’得‘1分’,‘团队2’得‘2分’。”如果在方框4315中用户已选择“MyQuack”,则控制传到方框4340。在方框4340处,话音入口10提供关于个性化的MyQuack体育团队的体育比赛得分。在方框4340后,控制传到方框4335,其中,话音入口10提供团队特殊新闻的体育新闻。在方框4330和方框4335后,控制传到方框4345,其中,话音入口10询问用户是否想让刚刚听取的体育信息重复。如果用户的回应是肯定的,则话音入口10返回,以重复所提供的信息。如果用户不想重复信息,则控制传到方框4350,其中,话音入口10要求执行在感兴趣的体育领域中要执行的下一个动作。在方框4350后,控制传到方框4320,以选择一个社团名称,传到方框4340来提供我的quack体育比赛得分,或传到方框4355来获取通道信息。方框4355对应于参考图37进一步描述的、作为方框3750的通道。只通过举例来表现图40-43中的每个子系统。
附图中所示的和以上所描述的各个实施例在目前是较佳的,但是,不言而喻,只是通过举例的方法来提供这些实施例。其他实施例可以包括用于简化经由话音入口的互联网访问的各种数据结构。本发明不局限于某个特定的实施例,而是延伸到在所附如权利要求的范围和精神内的各种修改、组合和变更。
权利要求
1.一种提供话音访问基于互联网的信息与服务所述的方法,其特征在于该方法包括接收指示通信连接请求的信号,通信连接请求由通信设备的用户发出;与用户的通信设备建立通信连接;接收用户的话音信息;和传送对接收自用户的话音信息作出响应的话音信息,响应的话音信息包括基于互联网的信息。
2.如权利要求1所述的方法,其特征在于,传送对接收自用户的话音信息作出响应的话音信息的步骤,包括响应地提供各种与互联网关联的不同源发出的基于互联网的信息。
3.如权利要求2所述的方法,其特征在于,基于互联网的信息包括有关电影、气象、交通、股票与运动等信息。
4.如权利要求1所述的方法,其特征在于,传送对接收自用户的话音信息作出响应的话音信息的步骤,包括有选择地提供广告。
5.如权利要求4所述的方法,其特征在于,有选择地提供广告的步骤,包括以对应于用户分布图的权重识别一组广告。
6.如权利要求4所述的方法,其特征在于,还包括根据广告呈现次数给广告费用定价。
7.如权利要求4所述的方法,其特征在于,有选择地提供广告的步骤包括提供基于许可的广告,在收到用户请求后,基于许可的广告呈现更多的广告信息。
8.如权利要求4所述的方法,其特征在于,选择地提供广告的步骤包括有选择地提供电话说话广告。
9.如权利要求4所述的方法,其特征在于,还包括对有选择地提供的广告作记录。
10.如权利要求1所述的方法,其特征在于,还包括向用户提供交易信息。
11.如权利要求10所述的方法,其特征在于,还包括响应用户的话音确认与用户接洽交易。
12.如权利要求1所述的方法,其特征在于,用话音向用户传送信息的步骤包括按用户爱好选择传送的信息。
13.如权利要求12所述的方法,其特征在于,选择传送信息的步骤包括被动地确定用户爱好。
14.如权利要求12所述的方法,其特征在于,选择传送信息的步骤包括主动地询问用户的爱好。
15.如权利要求1所述的方法,其特征在于,还包括在通信连接期间记录传给用户的信息。
16.如权利要求1所述的方法,其特征在于,用话音向用户传送信息的步骤包括预期用户可能的响应而动态地安排传给用户的问题。
17.如权利要求1所述的方法,其特征在于,用话音向用户传送信息的步骤包括基于集中用户响应的属性,以确定所需的项目或服务。
18,如权利要求1所述的方法,其特征在于,还包括通过互联网获得来自诸源的信息。
19.如权利要求18所述的方法,其特征在于,还包括把来自不同数据源的同一信息合并成规范数据目标。
20.如权利要求18所述的方法,其特征在于,还包括按一严密关系提供不相同项目间的关系。
21.如权利要求18所述的方法,其特征在于,还包括把得到的信息转换成一独特键。
22.如权利要求21所述的方法,其特征在于,把得到的信息转换成独特键的步骤包括对得到的信息应用属性规则。
23.如权利要求18所述的方法,其特征在于,还包括把卖主提供的信息组合成统一的数据库。
24.如权利要求18所述的方法,其特征在于,还包括把得到的信息编成一种存在物数据结构。
25.如权利要求18所述的方法,其特征在于,还包括把得到的信息变换成可搜索的普通格式。
26.如权利要求25所述的方法,其特征在于,还包括把得到的可搜索的普通格式的信息转换成界面专用格式。
27.如权利要求26所述的方法,其特征在于,把得到的信息转换成界面专用格式的步骤包括应用属性短语语法。
28.一种访问互联网上各种信息与服务的互联网单一话音入口,其特征在于,该话音入口包括用户界面;至少一个耦接于用户界面的数据库,用户界面协调与用户的话音通信,至少一个数据库存贮着有关用户的信息和基于互联网的信息;和耦合到至少一个数据库的更新引擎,该更新引擎与互联网通信,提供更新的基于互联网的信息。
29.如权利要求28所述的话音入口,其特征在于,还包括耦合到至少一个数据库的合成引擎,该合成引擎配置成比较来自至少一个数据源的信息,并且有选择地建立一规范数据目标。
30.如权利要求28所述的话音入口,其特征在于,还包括耦合到用户界面的客户管理子系统,该客户管理子系统配置成获取确定用户爱好与真相所需的信息。
31.如权利要求28所述的话音入口,其特征在于,还包括耦合到用户界面的广告子系统,该广告子系统配置成协调呈现给用户的广告。
32.如权利要求31所述的话音入口,其特征在于,呈现给用户的广告包括主办广告、有目标广告和基于许可的广告中的任一种。
33.一种提供话音访问基于互联网的信息与服务的系统,其特征在于,该系统包括接收指示通信连接请求的信号的装置;与用户建立通信连接的装置;用话音向用户传送信息的装置;接收来自用户的话音信息的装置;和传送对接收自用户的话音信息作出响应的话音信息的装置,响应话音信息包括经互联网从各种源获得的基于互联网的信息。
34.如权利要求33所述的系统,其特征在于,传送对接收自用户的话音信息作出响应的话音信息的装置,包括响应地提供来自各种不同源的信息的装置。
35.如权利要求33所述的系统,其特征在于,传送对接收自用户的话音信息作出响应的话音信息的装置,包括有选择地提供广告的装置。
36.如权利要求35所述的系统,其特征在于,有选择地提供广告的装置包括用对应于用户分布图的权重识别一组广告的装置。
37.如权利要求34所述的系统,其特征在于,还包括按广告呈现次数对广告费用定价的装置。
38.如权利要求33所述的系统,其特征在于,还包括向用户提供交易信息的装置。
39.如权利要求38所述的系统,其特征在于,还包括对用户的话音确认响应地接洽交易的装置。
40.如权利要求33所述的系统,其特征在于,用话音向用户传送信息的装置包括按用户爱好选择所传送的信息的装置。
41.如权利要求40所述的系统,其特征在于,选择所传送信息的装置包括被动地确定用户爱好的装置。
42.如权利要求33所述的系统,其特征在于,还包括在通信连接期间记录传给用户的信息的装置。
43.如权利要求33所述的系统,其特征在于,用话音向用户传送信息的装置,包括按预期可能的用户响应动态地安排传给用户的问题的装置。
44.如权利要求33所述的系统,其特征在于,用话音向用户传送信息的装置包括按属性集中用户响应以确定所需项目或服务的装置。
45.如权利要求33所述的系统,其特征在于,还包括经互联网获取来自诸源的信息的装置。
46.如权利要求45所述的系统,其特征在于,还包括把不同数据源的同一信息合并成规范数据目标的装置。
47.如权利要求45所述的系统,其特征在于,还包括按严密关系提供不相同项目间的关联的装置。
48.如权利要求33所述的系统,其特征在于,还包括把卖主提供的信息组合成一统一数据库的装置。
49.如权利要求33所述的系统,其特征在于,还包括把得到的信息编排成存在物数据结构的装置。
50.如权利要求33所述的系统,其特征在于,还包括把得到的信息变换为可搜索的普通格式的装置。
51.一种包含计算机可读程序码可提供话音访问基于互联网的信息与服务的计算机程序制品,其特征在于,该计算机程序制品里的程序码包括第一计算机可读程序码,用于接收指示通信连接请求的信号,通信连接请求由通信设备的用户发出;第二计算机可读程序码,用于与用户的通信设备建立通信连接;第三计算机可读程序码,用于用话音向用户传送信息;第四计算机可读程序码,用于接收来自用户的话音信息;和第五计算机可读程序码,用于传送对接收自用户的话音信息作出响应的话音信息,响应话音信息包括经互联网从诸源获得的基于互联网的信息。
52.一种话音入口,其特征在于,包括用户界面;和耦合到用户界面的数据库,用户界面协调与用户的话音通信;从而话音通信包括了基于互联网的信息。
全文摘要
一种提供话音访问基于互联网的信息与服务的方法,包括接收指示通信连接请求的信号,该通信连接请求由通信设备的用户发出;与用户的通信设备建立通信连接;接收来自用户的话音信息;传送对接收自用户的话音信息作出响应的话音信息。响应的话音信息包括基于互联网的信息。
文档编号G10L19/00GK1449518SQ01806979
公开日2003年10月15日 申请日期2001年3月16日 优先权日2000年3月21日
发明者A·E·奎利西, S·G·伍兹, S·J·卡利尔 申请人:美国联机股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1