个人音频信息处理器及方法

文档序号:7580046阅读:340来源:国知局
专利名称:个人音频信息处理器及方法
技术领域
本发明一般涉及指令和音频通信装置,并且尤其涉及用于音频通信的方法和便携装置,包括话音邮件和音频内容的记录和编辑以及其应用公用电子通信媒体或数据链路在专用或公共网络如因特网上的传输和接收。
背景技术
除话音邮件之外的所有电子信息系统具有中继装置或存储媒体,借此数据更好地以高传输速率在标准通信链路上被传输并被存储在存储介质中或无人看管的装置上,以在后面被预定用户离线访问、浏览和编辑。
在传真传输情况下,图象被发送器扫描然后被传输并且最终远地打印以被预定接收者离线利用。在电子邮件的情况下,数据在计算机上产生然后被传输并且直接存储在预定用户的无人看管的计算机上或者存储在与计算机网络联接的中央主机上以在随后被预定用户取回。最普通的网络是局域网(LAN)、广域网(WAN)和公用网,如因特网,或者专用网。当预定用户访问他的计算机时,或者电子邮件已经驻留,或者他发现在图形编辑器中显示的信息指示他有邮件以及他如何把邮件取回。一旦取回了电子邮件,该电子邮件同样能在用户的计算机上被预定的用户离线阅读、浏览和处理。另一种情况是,它可以被输出到打印机,在用户方便时提供复印件给用户来浏览。
当不使用传真机时,传真可被传输到计算机或手提、无纸传真机来由接收者离线和独立地浏览,如Reflection Technology公司的FaxView个人传真阅读器。
应用程序存在于传真和电子邮件信息中,从而信息可以从主机由授权用户选择以随后传输给用户的电子邮件地址或无人看管的传真机。例如参看Duehren等人的美国专利US4,918,722。
最近,随着因特网的普遍和使用的日益增长,并且尤其随着以HTML(超文本链接标示语言)文件形式来提供出版资料的网络站点的更加普及,已经产生了允许选择这种文件来进行随后的离线访问和独立的通过传真来浏览的应用。例如参看Ibex技术公司的网上FactsLine。这种应用使得在因特网上提供的大量信息和图形可以被那些没有访问连接到因特网的计算机或者希望限制在网上花费的时间的用户所使用。
大比率的潜在用户没有访问因特网,或者即使访问了,可能在旅行,也没有访问他们的计算机,或者不希望花时间引导他们的计算机及等待网络站点图形(已经引入利用诸如Netphonic通信公司的Web-On Call Voice Browser(网上呼叫话音浏览器)的应用来允许用户响应于话音提示来访问因特网)来导航感兴趣的文件或电子邮件,也不希望按顺序标定文件及使用文本合成话音通过电话线实时读出选择的文件而且作为电子邮件的附件被传真返回或发送。
类似地,因特网的广泛使用及对那些特定的流行站点特别是在使用高峰期的通信业务拥挤已经提出了一种使用称为离线浏览器的要求,其允许因特网用户“预订”出特定网络站点以在高峰期以外的时间里再由他们的计算机从那里自动取回资料,对新的且更新的信息进行分类和组织,并且允许用户使用他选择的浏览器(例如FreeLoader公司的FreeLoader)离线浏览。
类似地,预订服务的引入允许话音邮件被发送到电子邮件地址,也允许在网络站点上提供的音频内容通过向交互式话音应答系统(例如Talet通信的“Amail”和“Dialweb”)的标准电话呼叫的方式来更新。
最近,话音处理器系统制造商已经建立由60%以上的世界话音邮件系统市场组成的工作组来开发困特网邮件话音协议子集(VPIM)的互用性标准。TCP/IP(传输控制协议/网际协议)已经被选定作为传导工具,因为它的全球可访问的接触点基本都在因特网上,并且因为它使用普遍可识别的传输协议,尤其是简化邮件传输协议(SMTP)和多用途网际函件扩展(MIME)作为VPIM的核心。(参看1996年4月29日发行的Business Wire)。一旦执行,互用标准如VPIM将允许话音邮件用户通过因特网和内联网向现在他们通过电话那样简易地发送和接收他们的话音邮件。
因特网上除话音接发和音频电子邮件之外,最新的专有客户端服务器软件系统的引入允许传统多媒体个人计算机和音频电话线路的用户浏览、选择和回放实时流(RE)中音频或基于音频的多媒体内容或者应要求(REM)下载它们。感兴趣的用户仅需要从内容提供者的网站下载软件来访问这种音频内容(如Progressive Network的RealAudio播放器和服务器)。这种系统代表了一种真正的突破,这是由于在过去由传统在线方法进行的音频传送以很低的速率来下载使得获取信息需要5倍于实际程序那么长的时间,这里需要听众在听5分钟的音频前等待25分钟。
在因特网上使用流化音频的结果,若干公司已经引入因特网电话产品,其允许拥有带专有软件的多媒体计算机的用户实时地通过因特网交谈(参看Voclatee)。当用户访问本地因特网访问入口点或现有的入口点时,使长距离的呼叫成为本地呼叫,而使这种系统在长距离时是有用的。
类似地,作为在因特网上流化音频的结果,内容提供者能从网络站点现场播放音频(如Cameron音频网络的音频网)。
最近引入了在因特网上的通信执行标准,由英特尔和微软支持,其利用了DSP Group的TrueSpeech G.273压缩技术。这里应用了尽管压缩率很高却仍能导致优良的话音质量的高级算法,可以以每秒6.3千比特(kbps)和5.3kbps分别以20∶1和24∶1的压缩比率来运行。它还包括无声压缩,其能使在28.8kbps模式速度下的有效比率降低到小于3.7kbps。这可以允许以1∶7.78的比率传输音频,或者可以在1.3分钟内传输10分钟的音频。
利用得州仪器公司的使用在28.8kbps运行的V.34调制解调器的C80 DSP芯片,在10∶1(10分钟讲话1分钟传输)的比率下音频传输速率可实现电话等级的话音质量。
从上面可以明显看到尽管数据、图形和音频信息及内容在网络上的传送已经更加普遍和方便,这种增长也具有与话音信息和音频内容的传输和输入/输出相关的突出的特定的历来的不足。当话音信息和音频内容更加实用时,缺少用于这种音频的中继装置和存储介质而产生的不足变得更明确。
对于电子邮件和传真,电话链路的使用局限在数据的传输和该数据的控制代码的传输。随着网络计算应用的增长和普及,用于电子邮件和传真的电话链路(例如RADLinx的PASSaFAX)进一步被限制在现有的本地入口点(point)的试验线路来访问网络。电子邮件和传真包含可被预定用户输出到打印机的内容,其允许用户采用复印件资料来在他方便时浏览,尽管他远离办公室或在旅行。
与此正好相反,话音信息和话音文本通常被发送者当时记录并由预定的接收者基本上实时地在线取回。最好,用户可使用他的多媒体笔记本计算机来记录和访问存储的音频文件或流化的话音文件。音频的离线访问被限制于把音频文件下载到多媒体计算机上并在装有声卡的计算机上来播放音频。但是带有屏幕、键盘和多用途处理功能的多媒体计算机不可能是传统指令装置(dictation device)或话音记录机大小。这种依赖手提电话或多媒体计算机来产生和访问音频类似于需要传真机接收器的仅在靠近传真机或具有传真功能的计算机时来浏览、编辑和准备传真件。不能实时准备、浏览和访问远离手提电话或与多媒体计算机离线的基于网络的话音邮件严重制约把话音通信和音频内容结合到网络基信息中去的愿望。这里不存在专门和便携装置来存储网络基话音信息,同样这里也不存在用来从与网络相连的主机扫描和选择个人话音信息或公共通知以进行随后的向用户后面将通过它进行离线浏览的装置进行高速传输的方法或应用程序。
允许用户离线浏览他/她的话音信息的唯一专用的装置是电话应答装置(TAD),其基本上是使用数字记录技术来取代传统带基应答机器的标准功能的家居或小办公室、家庭办公用具(SOHO)。插入电源插座和电话插孔的TAD是不便携带的,所以用户必须在TAD扬声器的听力距离内或者使用电话调入来实时在线取回他/她的信息。尽管传统上TAD已经提供非常有限的向外的信息接发容量,无论提供何种向外的信息都需要主人从TAD上麦克风的范围内或者从实时电话呼叫来记录一些向外的信息(如一般问候或特定呼叫者/邮件信箱指定信息)。
无论是网络基的或TAD基的话音接发都限制于在线和实时传输并且实际上需要访问电话装置,TAD或多媒体计算机因为话音通信本质上不需要除人类的嘴和耳朵之外的任何外部硬件或装置来产生和访问它而尤其另人遗憾。讲话是最本质和自足的通信形式。讲话是不需要用手的,也不需写入工具、键盘、屏幕、专用显示或用户的手与眼部分的合作来输入或取回。尽管如此话音邮件仍是被广泛的使用与其说是对当前技术的足够胜任投的赞成票,不如说是由于讲话的单一特性功能。类似地,已经引入的许多革新的使音频和话音可在公共和专用网络上使用的应用程序是对音频和话音内容、接发信息和发出命令的强制属性的注释,并仅把重点放在使音频和话音可更加简单地利用的需要上。直到话音接发和音频内容被制成更易于访问之时,上面提到的许多网络基音频应用程序将保持技术上的新颖性。
关于计算机电话综合体(CTI)和通用邮件信箱已经进行了很多叙述,其中网络基信息和内容源起于任何介质和选择的任何输入装置,并且同样可在任何介质和选择的任何输出装置取回。传真可作为计算机屏幕上的数据被访问,数据可作为传真或文本-语音音频文本被访问,并且当自动语音传输应用程序变得更加实用时,音频可作为电子邮件或传真中的打印文本而被访问。但是,只要除电话手机或屏幕/键盘基多媒体计算机之外只要音频没有选择的输入/输出装置,它作为选择的介质的需求同样受到严重的限制。
由于语音是用户话音的直接记录,其语气(urgency)、含义和感情色彩内容不会丧失。类似地,由于在话音中首先产生这么多数据,而且仅后面被转录为文本或数据,信息-文本应是及时用于关于会见、讲话和无线广播的数据的优选介质。理论上,在传播时、通过时域通信时并且在适时访问源于口语的信息(如会议或报告中的一小部分)时话音邮件应为通信的优选模式。话音文本(即由计算机说出的或由人类预先记录的数据或文本)应是用于信息接发信息的优选形式以在引擎技术和显示的应用不方便或受到损坏之处如当驱动、操作设备或用于闲暇行为时被访问。
目前直接使用电话访问话音信息明显地限制了话音接发信息的潜在应用。话音信息和信息-文本的实时传输使话音邮件尤其来自长距离处的话音邮件的记录和取回非常昂贵。费用和不方便包括着一个人不能以成本高效方式并按他自己的步调编纂和浏览话音邮件与信息-文本的含义。他被限制到电话是可访问的地点和位置处,并且在无线通信链路的情况下,被限制于无线传输是可能的并且是所需要的位置。
应用中继计算机来编纂和浏览话音邮件几乎不对使话音接发更方便方面产生效果,由于键盘、打印装置和屏幕的使用是不能不需要手的,而且也由于用来广泛使用并且是便携性的中继计算机的尺寸和费用。在其目前状态,话音邮件被局限于希望以更独立的方式在其他时间进行通信的个人之间的短信息(电话标志)。话音“邮件”被局限于话音的“接发”,这是由于通过电话或在多媒体计算机接听长的内容丰富的“邮件”对发送者和接收者而言成本高并且不方便。而且,通过直接的通信链路实时地而且是仅在用户访问电话(与非高峰期无人看管的记录相反)时向用户的话音处理器或TAD传输音频信号的成本使得信息文本(关于“带”的记录的指令、记录的旅行见闻、讲话笔记、文章或书)的商业应用以及其它的话音-文本的应用支持的革新的广告商/订户更加不切实可行。
最近,Charles Lamer等提出的并转让给IBM公司的美国专利No.5,444,768和Shmuel Goldberg等提出的并转让给EsproEngineering的美国专利No.5,359,698都公开了一种用于存储在一个或多个远程中央信息设备上的音频信息的可听到的处理的便携式计算机装置。Lamer等系统允许用户从中央信息设备且经过通信链路记录和回放,传送(上载)和接收(下载)话音信息到便携装置上;但是,Lamer等系统要求在便携装置与一个或多个远程中央信息设备之间建立直接的电话链路。Lamer等和Goldberg等系统使便携装置通过直接的通信链路独立地访问传统的封闭的昂贵的专有话音处理系统。Lamer等和Goldberg等系统没有提供商业上可行的不通过长距离的向中央信息设备的呼叫而用于访问话音邮件的方案。与这种长距离长途电话费联系的费用使Lamer等系统扩展的应用受到阻碍。另外,Lamer等系统需要用户接触一个或多个远程中央信息设备来取回和传输选定的音频文件。与这种轮询过程相联系的不方便使该系统所提供的方便之处失效。
类似地,Lamer等系统没有提供用户用以使音频内容可利用来浏览的方法也没有提供一种用以从菜单中选择音频文件来由便携计算机装置随后取回的方法。类似地,Lamer等系统没有提供一种应用程序从而用户不是通过把便携计算机装置直接耦合到计算机来启动专用“训练”模式或者通过探测和记录标准触摸音调电话装置局部产生的DTMF音调的方式而进行远程访问与服务器网络链接的中央服务器来下载控制代码、搜索个人用户分组或公共数据地址。由于典型的用户邮件信箱应用程序可在他的网络电子邮件服务器上被处理并在他发送和接收电子邮件的过程中被规则地改进,用于便携计算机装置的这种专用的训练部分是不实际的。类似地,由于新的音频服务器平台、应用程序和压缩模式正被规则地引入,这里需要一种动态和透明的方法用来更新控制代码和地址簿而不需要用专用的训练部分。
广义上,本发明的一个目的是提供一种因特网备好的指令和话音信息记录/浏览装置和方法,其使得用户尽管在忙于一些活动时也能够在任何地点离线地以闲暇步调在不会增加电话长途收费并且无论通信链接当前是否可访问的情况下来编纂和浏览话音邮件。
本发明的另一个目的是利用优选地与本地网络访问入口点链接的电话链路为主作为通信链路来高速传输预先记录的资料和控制代码以促进传输,从而限制用于话音信息接发的作为记录和回放装置的电话或多媒体计算机及电话线的应用。
本发明还有一个目的是提供一种协议,从而指令和话音信息记录/浏览装置与网络服务器之间产生信息前的握手信号,以使数字化的话音信号符合标准话音压缩协议和TCP/IP协议集之一以促进话音信息在网络上的高速传输。
本发明的又一个目的是提供一种便携和专用的话音可用网络(因特网)访问装置,其使用户可记录、编辑和播放通过公共或专用网络上被传输和/或接收的音频文件。
本发明的又一个目的是提供一种便携访问装置和方法,其允许特定调制解调器结构的电话应答装置(M-TAD)的主人直接从TAD的数字存储器或者以与TAD的直接电缆连接方式或者通过电话链路把压缩的话音信息文件访问和下载到便携话音信息记录/回放装置上。
提供这种便携访问装置和方法将允许TAD主人鼓励进入的呼叫者把更强大和数据丰富的音频信息留在他们的TAD上,也允许TAD主人预订以压缩数字形式被规则分送到他们的TAD并被下载到本发明上以在方便的时间地点回放和浏览的音频内容。这也将允许TAD主人尽管在远离他们的家和办公室时也能使他们的便携指令和话音信息记录/浏览装置建立与他们的TAD之间的电话链路,并经济地自动取回所有存储信息和更新所有发出的信息(例如一般的和呼叫者指定的问候),所有存储信息与向外的问候被以数字化和压缩格式传输。
本发明提供低成本便携记录和回放指令和话音信息记录/浏览装置,其允许用户记录、编辑、播放和浏览包括可被取回的并随后通过通信链路如公用交换电话系统被传输到位于公共或专用网络上的远程主机的音频-文本、文本-语音和其它音频资料的话音信息。
优选的装置包括它自己的可充电电源、集成电路和控制按钮以允许通过内置扬声器、麦克风或插入式耳机、脚踏板和可移动的存储器插件而进行音频信号的局部记录、编辑、存储、回放和传输。这种装置也包括标准RJ-11电话插孔、调制解调器片装置(或软件)或可移动的标准或无线调制解调器插件被连接到那里的PCMCIA连接器,以及DTMF音调解码器,以允许音频信号从与公共或专用网络连接的主机传输和控制及向与公共或专用网络连接的主机的传输和控制。该装置包含电路,其使它以基本上比初始被记录快的速率来传输和接收音频信号。
一种优选的装置还包含处理器,其包括必备终端仿真,以使网络用户直接从本地访问入口点如因特网服务提供商(ISP)的访问入口点和外壳帐号应用标准协议如SMTP(简化邮件传输协议)、邮政协议(POP3)和TCP/IP组中的MIME(多用途的网际函件扩充)访问网络,来浏览、选择和取回已经被发送到用户的电子邮件地址的文件(类似地可被翻译为话音的数据/文本文件)并下载和传输这种文件。
一种优选的装置还包含标准或触屏显示器和允许用户显示相似的图形编辑器以在访问他的电子邮件时编纂和阅读被显示在他的计算机屏幕上的电子邮件信息的软件,从而用户可滚动他的电子邮件信息,选择他希望下载的那些音频文件,并选择他想要的文本信息将其或通过网络服务器或在装置上转换为音频格式(文本-语音)。
一种优选的装置还包含放入装置的托架,托架具有能使其连接到电源以对装置的电池充电的端口、能使其建立通信链路的电话插孔和计算机上用于直接向计算机下载和上载文件的或用于接收“改发”文件的串行或并行端口。
一种优选的装置还包含能识别语音和用语音响应语音的语言用户接口。这种接口包括独立功能的扬声器而且也允许使个人装置调整用户的话音或发音特性从而提高准确性的扬声器匹配。这种扬声器匹配通过一种协议来实现,该协议允许系统通过在用户第一次使用该装置之前经重复的一组句子来调整用户话音(参看Lernout & Hauspie语音产品的asr1000产品系列)。语言接口包括允许用户扩充包括特殊术语和适当的名词的词库的词库建造器以供语音识别所用(参看LHSPLextoolTM);使用户能制造装置用以与用户限定的命令相联系的词的用户模板,这种词如“home”可与电子邮件地址相关联(LHSP asr产品系列);用于拼写电子邮件地址的字符识别,以及背底噪音容许和即使在汽车、飞机或公共场所中并且即使在用户没有带着头戴式耳机情况下改善语言用户接口的准确度的在一距离处的语音软件(参看LHSP)。
一种优选的装置还包含设计来通过信息数据的加密和解密及通过用保密的数字或话音特征鉴定发送者的身份来确保敏感信息的可靠和安全传输的公共密钥加密技术。
一种优选的装置还包含允许用户下载还没有被网络服务器转换为语音并且将要在该装置上被转换的数据的文本-语音应用程序。
一种优选的装置还包含允许用户扫描与打印的内容如新闻文章、地图、可使用的音频文件的菜单相关的或处于将给该装置提供它所需要的包括网络服务器地址、文件位置和文件ID在内的所有信息的旅行向导中的打印的条形码,以使与打印的内容相关的音频文件可被自动从网络如因特网取回的条形码阅读器。
一种优选的装置还包含允许用户扫描与打印的内容如新闻文章、地图、可使用的音频文件的菜单相关的或处于将给该装置提供它所需要的用来从前面取回的音频文件组(如在Goldberg等所描述的)中播放文件的所有信息的旅行向导中的打印的条形码的条形码阅读器。
一种优选的装置还包含应用标准如红外数据协会(IrDA)的红外接口,以用于音频文件和控制代码在装置和公共电话、信息站或用户计算机之间的高速局部无线传输(例如1.2Mbps和4Mbps)。
一种优选的装置还包括称为离线浏览器的软件应用程序,其编程序使装置在高峰期以外的时间从网络自动取回用户预订的音频文件,或从选择的具有新的可使用的音频资料的网站,或从用户已经设计离线浏览器的电子邮件地址来取回。
一种优选的装置还包括一种软件应用程序,其通过图形屏幕基接口或通过音频提示方式使用户浏览网络数据库如位于网上的那些用于从其接收和发送音频文件的的地址和/或站点。
一种优选的装置还包括一种软件应用程序,其为用户生成图形接口和存储器,来访问、刷新和/或下载他的包含他希望为其准备并且希望向其发送音频文件的个人和团体的电子邮件地址的电子邮件地址簿。
一种优选的装置还包括一种软件应用程序,其为用户生成图形接口和存储器,来组织他/她的电话号码、电子邮件地址、日程表、备忘录和约会,其包括通过在简单的可听到的声音警报或被设计的话音信息警报(例如“call home”)之间选择一个选项来实现时钟和警报功能。
一种优选的装置还包括一种软件应用程序,其使用户下载专有代理服务器软件系统,并升级新引入的通过公共网或专用网如因特网而使之可利用的用于低位率语音压缩的标准,以确保装置可使用最新的目前发展水平的音频压缩软件。
一种优选的装置还包括一种软件应用程序,其使用户下载专有代理服务器软件系统,并升级新引入的能使装置接收包含音频内容的高压缩和/或流化音频文件的标准,该音频内容包括但并不局限在使装置被用作便携因特网电话应用程序软件来通过应用与因特网的局部连接以进行实时双路全双工话音转换的应用程序接口(APIs)。
一种优选的装置还包括一种软件应用程序,其扩展从网浏览器运行的网络程序的功用并且在数据如音频数据在用户的PC中流动时上对数据进行操作,允许用户通过直接指向位于托架中或与串行或并行端口连接的通信端口改变音频文件的方向。可选择的另一种情况是,这可通过OLE(对象链接和嵌入)激活网络软件而达到,该软件在通过按压指定键如打印键而由用户激活,把音频文件的方向改变到直接指向装置专用特定“打印机”驱动器。这种应用程序允许在他们的计算机上浏览网罗的用户把音频文件直接下载到他们的个人音频服务器以随后访问,而不用从他们的硬盘传送。
一种优选的装置还包括一种软件应用程序,其使用户选择电子邮件地址并要求信息从文本-语音通过适当的网络上可应用的文本-语音转换软件被转换并且作为数字化和压缩音频文件仅在随后被数字化和传输。
本发明还涉及一种应用DSVD(数字同时语音/数据)和/或VoiceView协议(Radish通信系统公司)方法和软件应用程序,其使用户一旦与通信链路连接就能同时把音频文件直接传送和接收到指令和话音信息记录器装置,或者可选择的是通过用户处理,和/或从网络或向网络接收和传输其它相关或不相关的数据,或者相反的,是当用户在电话上谈话时侯。这些话音/数据协议的应用将允许指令和话音信息记录/浏览装置用户响应于以数字化流或模拟话音形式说出的话音提示要求音频文件来通过口头响应、键盘敲入或DTMF音调来响应并以高速数据模式在同一电话连接期间传输这些文件。
本发明还涉及一种方法和软件应用程序,其允许数字化的音频文件可量测以符合网络服务器要求和或用户选择。这将使服务器要求或用户要求低的压缩率或慢的传输速度以有更高的保真度用于所要求的音频文件,并且反之亦然。
本发明的一个特征是记录装置可被保留与通信链路连接并被设计来播号进入并且在高峰期以外的时间在电话使用率最低且在引入线上有多余的容量可利用时连接到局域网访问入口点。记录装置被设计来在网络搜索用户已经预订的音频文件、用户已经设计该装置来寻找的站点上的新音频文件,和搜索从选择的电子邮件地址被发送到用户的音频邮件。
本发明的一个特征是提供了接口端口,如标准RJ-11电话插孔,从而记录装置可连接在电话装置、计算机、蜂窝电话或个人数字助理与通信链路之间以使用户在应用上面的任何一种装置时选择和取回话音邮件。
本发明的另一个特征是提供了电路用于记录在指令和话音信息记录/浏览装置的存储器中的数字转换和模拟话音信号的压缩以允许数字化话音的高密度存储和高速度传输。类似地提供电路用于模拟转换和原来已经存储和接收的数字话音的自然声音的回放。
本发明的还有一个特征是提供如以类似于自动取款机方式的且位于如机场和旅游点处的公共端子,在那里用户可连接他的记录/浏览装置并选择要被记录/浏览装置直接取回和传输的话音信息和音频-文本。
附图简述本发明的前述的和其它的目的、特征及优点参考附图从下面的优选实施例的详细描述中可得到更全面的理解,其中

图1是体现本发明的优选的个人音频信息处理器的方块简图;及图2-7(图2包括图2a和2b)是表示在图1的装置中这些过程是如何进行的的流程图。
具体描述图1是体现本发明的优选的个人话音服务器(PVS)系统10的方块简图。PVS系统10广义上包括5个主要部分高集成DSP/RISC集成芯片11(DSP代表数字信号处理器且RISC代表精简指令集计算机);电信/音频编码解码器17;存储器如耦合于DSP芯片的SDRAM 12和/或闪速存储器13;外围设备如麦克风26、扬声器18、触屏/显示LCD19,红外I/O 21和条形码阅读器15。操作系统软件也提供来管理DSP以处理调制解调器例行测试如V32bis,V34等、话音识别、回声消除和语音合成;软件也经芯片11的RISC部分控制系统。尽管体现的装置10被称为话音服务器,应该清楚它对于其它类型的音频包括音乐同样是有用的。
DSP芯片优选地是Philips(菲利浦)半导体PR31100芯片,其包含带有4Kb指令高速缓冲存储器和1Kb数据高速缓冲存储器的MIPSR3000 RISC CPU芯,加上各种集成功能用于与大量系统组件和外部i/o模块进行接口。该芯片也具有硬件乘法/累加单元来执行DSP功能,如使外部调制解调器芯片装置不再需要的软件传真/调制解调器。但是,芯片还具有UART(通用异步收发报机)接口22(单独地表示),其允许装置通过传统的RS232串行连接器23被连接到外部调制解调器或其它装置(如装有电话应答装置的调制解调器)。
PR31100还包含多路的DMA(直接存储器访问)信道和高性能柔性总线接口单元(BIU)来提供在外部系统存储器、高速缓冲存储器、CPU芯和外部I/O模块之间的数据传送的有效方式。PR31100还包含系统接口模块(SIM),其提供集成功能用于与各种外部I/O模块如液晶显示(LCD)19、红外I/O模块21和编码解码器17接口。
编码解码器17优选地是Philips(菲利普)UCB1100单片集成混合信号音频和电信编码解码器,其处理系统的大部分模拟功能,包括声音和电信编码解码器(模拟/数字编码和解码)功能和触屏模数转换、ISDN/高速串行、红外和无线外围设备。高速串行接口14,尽管在图1中独立地表示出来,实际上是UCB1100的一部分。芯片具有单信道音频编码解码器,其被设计用于麦克风与扬声器之间的直接连接(如组件16和28实际上是UCB1100的一部分)。内置电信编码解码器可被直接连接到传统的RJ-11插孔20以与电话线连接。
为更全面理解图1的实施例,用于PR31100和UCB1100的数据表被附上并按参考被加入到该描述中。
用于PR31100的操作系统软件优选地是来自英国Eden GroupLimited of Cheshire的已经得到商业应用的Eden OS2.0版。这种操作系统尤其被设计用来支持PR31100(也称为DINO)和UCB1100(也称为BETTY)。用于Eden OS的数据表被附上,其描述操作系统提供的软件支持和驱动器。该数据表按参考被加入到该描述中。
存储器12,13被用于存储信息和保持暂态数据。闪速存储器根据所需的永久程序的数量来构造,包括操作系统(O/S)和应用软件,并且也存储一些记录信息。典型地,在PR31100中提供的音频压缩将导致比每秒1Kb(即1Mb存储器可提供1小时的音频)的一半还小的数据带宽。
麦克风26和扬声器18基于质量和尺寸来选择。
流程图表示于图2-7以描述在因特网上取回信息的操作和将它们传输到PVS和各种用于播号的操作选项及从PVS和各种用于播号的操作选项的传输,也描述从在因特网中给出的服务器地址接收数据、向/从PVS存储、放映、取回、传输和播放信息。这些操作包括从扬声器/麦克风和电话接线双向接收数字形式的压缩信息及模拟形式的音频信号。
图2a和2b包括表示PVS如何通过传输协议连接到因特网上的位置及PVS如何得到与其网/电子邮件位置(如HTML语言显示信息)相关的数据和接收/存储利用外围设备或实际的标准(例如以2.Skbps高度压缩的音频)被发送的信息(音频、数据等)的流程图。
在图2a和2b中描述的操作通过DSP/RISC的实时核心部分(下面参考图3进一步讨论论)被同时运行。它使多项任务可并行运行和执行。主要任务的操作在组块200开始。访问一个位置并存储或接收存储的信息与其它任务一起被同时运行。这种任务可以是本地的来操作PVS,或其它的任务如条形码阅读器、话音合成器、话音识别的操作,或者同时通过PPP来访问其它的站点。
在组块202,它进行一项测试来判定是否所需的操作通过向外的呼叫(在组块210)被连接到网络访问提供器上。如果没有,调制解调器响应于响铃应答呼叫,完成它的交接过程,并开始接收信息(组块204)。来自调制解调器的数据位通过DSP芯片11在组块220处被接收。DSP芯片在组块230处对到来的数据解码。
在组块240,它进行一项测试来判定是否所需的操作将解码HTML位置。如果没有,控制转向组块340。否则操作在组块250继续,在那里开始显示位置页面。在组块260进行一项测试来判定操作模式是交互的还是自动的。在交互模式中,PVS的用户必须浏览和选择所需的要被完成的操作。在自动模式中,取回音频和其它信息的关键词被搜索并被自动激或来得到压缩数据。如果在组块260的测试感测到是交互模式,控制被转向图2b中的组块110。如果没有,将进行自动浏览开始在组块270搜索高亮度的关键词符号。在组块280,进行一项测试来判定关键词是否构成对原来数字化的信息的要求,如果是的,被FTP协议压缩的数据被PVS在组块290接收。如果在组块280的测试导致结果“否”,控制转向组块310。
在组块310,进行一项测试来判定是否没有更多信息存在,如果是这样的,控制返回组块110。否则,在组块320产生测试来判定是否关键词构成对位置的要求以在网络服务器存储本地信息。如果是这样的,该数据,如压缩的音频信息,从PVS向网站传输(组块330)。如果不是,控制返回开始处(组块100)。过程继续进行直到在该网站处没有其它的可给PVS主人的存储信息。
在组块340,进行一项测试来判定是否该位置利用FTP协议语言。如果是这样的,信息利用FTP被取回(组块360),并被存储在组块380并且控制被转向图2b中的组块120。如果在组块340判定没有使用FTP协议,那么在组块340进行一项测试来判定是否正接收到一种可识别的访问语言。如果是这样的,在组块360利用该可识别的访问语言取回信息然后存储在组块380。控制然后转向图2b中的组块120。如果在组块350没有发现可识别的访问语言,在组块370将通知用户并且控制返回组块100。
如果在组块260判定模式是交互模式,控制被转向图2b中的组块110。在组块112,在网页中的关键词被选择并且在组块114 HTML解释被激活来把信息放置在栈中。在组块116,信息然后被发送和/或接收并且控制返回图2a中的组块100。
在组块380之后,在数据优选地以压缩形式被存储处,控制被转向图2b中的组块120。任何被存储的数据引起在平板(flat)数据库中数据的生成(组块120),数据库可被搜索以在后面的时间放置数据。在信息是音频信息的情况下,它在通过FTP协议被传输的同时被解压缩和播放。在组块122的测试判定这种行为对当前的信息是否必要,并且如果是的,解压缩和音频合成器被激活(组块124),数据库被更新来反映信息已经准备好被合成,并且控制返回组块100。如果信息没有被解压缩和播放,组块122把控制转向组块128,在那里进行一项测试来判定信息是否要被发送到网络服务器,并且如果没有,控制返回组块100。如果信息要被发送到网络服务器,它由FTP在组块30发送,并且在控制返回组块100后用户一完成传送就被通知(组块132)。
图3描述在用于本应用程序的DSP11的RISC芯CPU上运行的Eden OS的核心部分的整个操作。核心部分是多任务的,因为它能同时运行多个程序或任务,每个都有它自己的优先级并能启动其它(子任务)任务。在经组块400-420开始核心部分后,在组块480操作以闲置模式开始,那里PVS等待事件发生,并且当事件发生时它在组块430被处理。每个程序与操作系统通过使其任务在组块430被照顾(attended)这种方式相互作用。引起事件的类型是同步的或异步的。在组块440,如果同步事件被探测到,同步事件的处理经连接器5开启。否则,在组块450进行一项测试来探测异步事件,在这种情况中异步事件的处理经连接器6开启。在各种情况下,在处理被开启后,操作系统返回闲置模式来处理其它事件。另一要发生的特殊事件是在组块460的错误处理。在组块450处没有探测到异步事件的情况下,在组块460进行一项测试来探测失效事件,并且如果没有,程序返回闲置模式。在硬件失效、通信失败或软件失效的情况下,在组块460探测到错误事件并且运行时间处理器被开动(组块470)及处理该事件。控制然后返回闲置模式。在图3中判定的同步和异步事件仅是例示并可假设这里各类型中还有其它的。
图4是表示当模拟音频信息要被记录时DSP/RISC芯片11的控制器执行的例行测试的方块图。在组块710,进行一项测试来判定到来的信息是否来自内置麦克风。如果不是,控制被传送到图5的例行测试。如果是,音频信息被数字化并被压缩(组块720)及被放置在数据工作栈中(组块730)。在组块740,进行一项测试来判定在整个信息被存储之前存储器是否被存满。如果不,结束例行测试,并且控制返回闲置模式。如果是,不能进行记录(组块750)并且通过警示灯操作者被通知存储器已经充满(组块760)。控制回复闲置模式。
图5是表示执行来从电话线记录模拟音频的例行测试的方块图。在组块800,进行一项测试来判定正在被接收的音频信息是否来自通信链路(电话线)。如果不是,控制被传送到图6的例行测试。如果是的,信息作为音频通过电信/音频编码解码器17(组块810),并且在组块820进行一项测试来判定压缩是否要被DSP/RISC芯片来执行。如果是的,信息被存储在本地存储器中(组块830),记录停止,并且控制返回闲置模式。如果压缩不会由DSP/RISC芯片来执行,信息被发送到电信/音频编码解码器,其通过标准(ADPCM)算法来压缩它(组块840)。信息然后经其UART被送回DSP/RISC11(组块850),并且DSP/RISC芯片控制来引起信息被存储在闪速存储器13中(组块860)。控制然后返回闲置模式。
图6是音频/电信编码解码器控制器执行的来经内置扬声器来播放存储的音频的例行测试的方块图。在组块900,操作者从存储在装置的信息栈中选择信息。在组块910,进行一项测试来判定要被读出的存储信息是否被音频/电信编码解码器初始压缩。如果没有,控制被传送到组块920。如果是的,信息利用音频/电信编码解码器被读出和解压缩(组块930),并且解压缩的信息被应用到音频/电信编码解码器中的数模转换器(DAC)(组块940)。该信息经内置扬声器18通过D/A转换器和放大器28被播放(组块950),并且控制返回闲置模式。
如果存储信息没有被音频/电信编码解码器初始压缩,在组块920进行一项测试来判定存储信息是否被音频/电信编码解码器初始压缩。如果没有,用户被通知(组块960),并且控制返回闲置模式。如果是的,信息被控制器读出(组块970),并且然后它被发送到调制解调器来被解压缩并且然后从调制解调器经音频/电信编码解码器17的UART端口返回到存储器13(组块980)。控制被传送到组块940,并且回放以与信息初始被音频/电信编码解码器压缩相同的方式被处理。
图7是表示与其托架连接的PVS是如何被连接到PC(无论是否多媒体)和如何连接到特定结构的带内置调制解调器的TAD以允许PC或TAD用户(A)从PVS或向PVS经调制解调器而不是PVS的音频/电信编码解码器来发送或接收话音文件的简图。这将允许PC用户经PC的调制解调器发送或附接在PVS中驻留的话音文件并且同样将允许PC用户把在PC的调制解调器上接收到的话音文件直接下载到PVS。这样的结构将同样允许非多媒体PC用户(B)通过应用PVS的多媒体性能播放在非多媒体PC用户的调制解调器上接收到的音频文件来播放音频文件。这样的结构将同样允许PC用户经PVS的内置麦克风记录音频并将其作为文件或流化音频经PC的调制解调器来传输。这种结构也将允许PC用户(D)在应用标准网络浏览器程序时把音频文件的方向直接改变到指向PVS。最后类似的带有调制解调器构造的TAD的结构将允许TAD用户把音频信息向TAD和从TAD下载到PVS。
从PC向PVS的双向通信通过通信电缆(如9插脚连接器)在PC和PVS上的串行RS232端口被处理并且被控制从UART通信接口输入/输出的异步事件软件来控制。
在PC上的软件处理用于从/向PC到PVS发送/接收数据的驱动器。对于发送数据,这将类似于PC发送数据到传真或打印机,对于接收数据,这将类似于PC从扫描仪接收数据。这种驱动器设定所有PVS需要的参数如操作类型、长度及等待确认和“传输结束”。PC也处理软件来用PVS作为附件(外国设备)用于接收多媒体音频信息从而在PVS上的扬声器将操作。PC也处理软件来管理PVS的麦克风输入,以及处理软件来与标准网络浏览器(如网景导航设备)集成以与软件充分集成并因此向PVS调用命令。
PVS中的软件是多任务操作功能的一部分,用来处理在PVS的异步事件软件控制下的远程激活过程调用(RPC)。
尽管本发明的优选实施例进行了图示的公开,熟悉本领域的技术人员将理解在不脱离在后附权利要求所限定的本发明的精神和范围的条件下对其进行附加、修改和替代是可能的。
附件菲利普半导体高集成内置处理MIPS1.2版PR31100概述PR31100处理器是由MIPS R30000芯和与各种类型装置接口的系统支持逻辑电路构成的单芯片低成本集成内置处理器。
PR31100包含带有4Kb指令高速缓冲存储器和1Kb数据高速缓冲存储器的MIPS R3000 RISC CPU,加上用于与大量系统组件和外部i/o模块进行接口的集成功能。R3000 RISC CPU也增加有乘法/累加模块来执行集成DSP功能,如用于高性能标准数据和传真的软件调制解调器。PR31100还包含多路的DMA信道和高性能柔性总线接口单元(BIU)来提供在外部系统存储器、高速缓冲存储器、CPU芯和外部I/O模块之间的数据传送的有效方式。支持的外部存储器装置类型包括动态随机访问存储器(DRAM)、同步动态随机访问存储器(SDRAM)、静态随机访问存储(SRAM)、闪速存储器、只读存储器(ROM)和扩充插件(PCMCIA和/或磁卡)。PR31100还包含包括用于与各个外部I/O模块如液晶显示(LCD)、UCB1100(其处理系统大部分的模拟功能,包括声音和电信编码解码器及触屏ADC)、ISDN/高速串行接口、红外无线外围设备、Magicbus等系统接口的集成功能的系统接口模块(SIM)。最后PR31100还包含对电源管理的设施的支持,从而各个PR31100内部模块和外部子系统可被独立的(在软件控制下)供电和断电。
图1表示PR31100的外部组块图。
特性●32位R3000 RISC静态CMOS CPU●4Kb指令高速缓冲存储器●1Kb数据高速缓冲存储器●乘法/累加器●分别断电的芯片级外围设备-多通道DMA控制器-总线接口单元-用于ROM、闪速存储器、RAM、DRAM、SDRAM、SRAM、和(PCMCIA和/或磁卡的存储器控制器-电源管理模块-视频模块-实时时钟32.760KHz参引-高速串行接口-红外模块-双-UART-SPI总线●3.3V供电电压●208插脚LQFP(低轮廓四元平面分组)●40MHz操作频率
菲利普半导体MIPS高集成内置处理器PR31100
图1.PR31100组块图菲利普半导体高集成内置处理器MIPSPR31100综述各个芯片及外围设备的组成为BIU模块●系统存储器和PR31100总线接口单元(BIU)-支持直到2组物理存储器-支持自刷新DRAM和SDRAM-用于各组DRAM或SDRAM的可设计参数(排/列地址结构、刷新、脉冲模式等)●可设计的芯片选择存储器访问-4个可设计(大小、等待状态、脉冲模式控制)存储器装置和通用芯片选择可用于系统ROM、SRAM和闪存可用于外部端口扩展寄存器-4个可设计(等待状态、脉冲模式控制)磁卡或通用芯片选择可用于(将来)磁卡扩展存储器PR31100提供芯片选择和插件检测信号支持插件插入/移出超时磁卡每个端口需要最小数目的一个控制/状态信号●支持直到2个相同的全PCMCIA端口-PR31100和UCB1100提供控制信号和接收与PCMCIA版本2.01标准一致的状态信号-3.3V对5V的PCMCIA接口设施所需的适当连接器键控和移位缓冲器SIU模块●多信道32位DMA信道控制器和系统接口单元(SIU)●用于视频、Magicbus向/从UCB1100音频/电信编码解码器、高速串行接口、IR UART和通用UART的独立DMA信道●用于系统接口模块(SIM)内的子模块的地址解码CPU模块●R3000 RISC中央处理单元芯-全32位操作(寄存、指令、地址)-32通用32位寄存器;32位程序计数器-MIPS RISC指令设置结构(ISA)支持●芯片级高速缓冲存储器-4Kb直接映射指令高速缓冲存储器(I-高速缓冲存储器)物理地址标记和每高速缓冲存储器线上的有效位可设计脉冲尺寸指令流化模式支持-1Kb数据高速缓冲存储器(D-高速缓冲存储器)物理地址标记和每高速缓冲存储器线上的有效位可设计脉冲尺寸写入-支持DMA的高速缓冲存储器地址探测模式-4级深的写入缓冲器●可设计的存储器防护-把用于核心和用户空间的读出和写入防护控制分开-8个可利用的总的可防护区,每个利用断点地址、掩码、控制和状态寄存器独立的进行设计-非法读出和写入上引起地址异常●高速乘法/累加器-芯片级硬件乘法器-用64位加法器支持16×16或32×32乘法运算-现存乘法指令被加强并且新的乘法和加法指令被增加到R3000指令装置来改善DSP应用软件的性能●CPU接口
-用64处理数据总线、地址总线和CPU芯与PR31100的其余部分之间的控制接口时钟模块●PR31100支持32KHz RTC XTAL(降低成本、功率和板空间)以外的系统范围单晶结构●通常的晶体速率被分来来产生用于CPU的时钟、视频、声音、电信、UARTs等●外部系统晶体速率是依赖厂方的●在软件控制下独立启动和关闭各个时钟以进行电源管理CHI模块●高速串行集中公共通路接口(CHI)包括用于和外部全双工串行接口的逻辑电路时分多路复用(TDM)通信外围设备●支持ISDN线接口芯片和其它PCM/TDM串行接口装置●CHI接口是可设计(信道数目、帧速率、位速率等)来提供各种格式的支持●支持数据速率直到4.096Mbps●独立的DMA支持CHI接收和传输中断模块●包含用于分别启动、读出和清除所有PR31100中断源的逻辑电路●从内部PR312100模块或从外部信号插脚产生的中断IO模块●包含支持用于读出和写入7个双向通用IO插脚和32位双向多功能IO插脚●各个IO端口能产生独立的正沿和负沿中断●独立结构的IO端口允许PR31100支持柔性和宽范围的系统应用程序和结构菲利普半导体MIPS高集成内置处理器PR31100图2表示由PR31100和UCB1100组成的用于整个系统方案的典型系统图
图2系统组块图菲利普半导体高集成内置处理器 MIPSPR31100IR模块●IR用户模式-允许用户控制电子装置如立体声、TVs、VCRs等-可设计的脉冲参数-外部模拟LED电路●IRDA通信模式-允许与其他IRDA装置如传真机、复印机、打印机等通信-PR31100内UART模块支持-外部模拟接收器前置放大器和LED电路-数据速率等于1米直到15Kbps●IR FSK通信模式-PR31100内UART模块支持-外部模拟IR芯片(chips)执行频率调制以产生所需的IR通信模式协议-数据速率等于3米直到36000bps●载波检测状态机-周期地启动IR接收器来检查是否存在有效的载波Magicbus模块●同步串行接口2线(时钟和数据)半双工通信协议●支持低成本低功率外围设备●支持14.75Mbps的最大数据速率●DMA支持Magicbus接收和传输电源模块●各个内部外国组件的模块断电模式●串行接口(SPI端口)电源供电控制接口支持●电源管理状态机有四种状态RUNNING、DOZING、SLEEP和COMA串行接口总线(SIB)模块●PR31100包含固定和移位寄存器来支持UCB1100和/或其它选择的编码解码器装置的串行接口●与晶体CS4216编码解码器的从属模式3兼容的接口●同步帧基协议●PR31100总是控制时钟源和帧频率和相位;可设计的时钟频率●各个SIB帧由128个并且每个都被进一步分为2个子帧或64位的字的时钟循环组成(同时支持直到2个装置)●独立DMA支持音频接收和传输、电信接收和传输●支持8位或16位单声道电信格式●支持8位或16位单声道或立体声音频格式●独立可设计的音频和电信取样速率●CPU读出/写入寄存器用于子帧控制和状态系统外围设备接口(SPI)模块●提供SPI外围设备和装置接口●全双工同步串行数据传输(数据输入、数据输出和时钟信号)●PR31100提供专用芯片选择和中断给SPI接口串行供电●SPI接口的8位或16位数据字长●可设计的SPI波特率计数器模块●2个独立的全双工UARTs●可设计的波特率产生器●用于灰度和彩色模式的基于时间的抖动算法●支持多种屏幕尺寸●支持分离和不分离显示●可变化的尺寸和再定位的视频缓冲器●DMA支持从视频缓冲器取得图象数据高级调制解调器/音频模拟前端UCB11001.2版概述UCB1100是单芯片集成混合信号音频和电信编码解码器。该单信道音频编码解码器被设计来直接连接麦克风和扬声器。内置电信编码解码器可直接被连接到DAA并支持高速调制解调器协议。组合的10位模数转换器和触屏接口提供连接的4线耐久触屏的完全控制和读出。10个附加的通用I/O插脚给系统提供可设计的输入和/或输出。
UCB1100具有意在与系统控制器通信的串行接口总线(SIB)。编码解码器的输入和输出数据和控制寄存器数据在SIB接口被多路复用。
应用●个人智能通信(PIC)/个人数字助理(PDA)●屏幕电话●灵敏电话和灵敏传真●智能通信主要特征●48插脚LQFP(SOT313-2)小体积SMD分组和少的外部组件数导致需要小的PCB空间●带可设计的取样速率、输入和输出电压电平的12位sigmadelta音频编码解码器,能直接连接到扬声器和麦克风,包括数字控制的静音、返回和剪辑检测功能●带可设计的取样速率的14位sigma delta电信编码解码器,包括数字控制的输入电压电平静音、返回和剪辑检测功能。电信编码解码器意在直接连接到DAA(数字访问装置)并包括内置侧音抑制电路。
●完整的4线耐久触屏接口电路支持位置、电压和板电阻测量。
●带有内部轨道的10位逐步逼近ADC支持触屏读出的电路和模拟多路复用器,并监测4个外部高压(7.5V)模拟电压。
●高速4线串行接口数据总线(SIB)用于向系统控制器的通信。
●3.3V供电电压和内置电源节电模式使UCB1100最好用于便携和电池供电的装置中。内容表概述应用主要特征表的内容1.0功能组块图2.0排序信息3.0绝对最大速率4.0DC电特性5.0插脚输出5.1插脚列表6.0功能描述6.1音频编码解码器6.1.1音频输入特性6.1.2音频输出特性6.2电信编码解码器6.2.1电信输入特性6.2.2电信输出特性6.3触屏测量模式6.3.1位置测量6.3.2电压测量6.3.2板电阻测量6.4触屏接口6.4.1触屏通信6.510位ADC6.5.1特性综述6.6芯片参引电路6.6.1特性综述6.7串行接口总线6.7.1SIB数据格式6.7.2编码解码器数据格式6.7.3控制寄存器数据传输6.7.4AC电特性6.8通用I/Os6.9中断概述6.10复位电路7.0其它7.1电源路由策略8.0控制寄存器综述9.0分组纲要10.0分组纲要10.1分组纲要LQFP4811.0定义菲利普半导体高级调制解调器/音频模拟前端 UCB11001.0功能组块图
图1.UCB1100组块图
Eden OS2.0版综述EROS(Eden实时操作系统是以如下为纲要来设计的全新操作系统压缩操作系统在产品中使用以ROM和RAM形式的来源,这些来源增加产品BOM成本并且OS占据的空间必须被调整。EROS设计的很小。调制性也是支持操作系统的压缩的一个特征,在各个产品中不需要的特征可被省略或被一些子装置取代,留下更多的空间给那些增加特征并从而获得价值的可视组件。
打开打开的OS将更可能吸引第三方发展商来设计软件产品销售,从而使得以可利用的特征形式表现的价值被增加到基于OS的产品中。EROS具有公开的API和PC基SDK,其支持在已经可利用的开发的平台中的软件的开发。
模块化各个组件独立地并且在很多情况下在它们的功能不再需要或者为特定的产品而需改变时子组件可毫无困难地被省略和取代。
便携性的以ANSIC写入的指向新处理器和/或导向特定产品设计的99%是充分简化并且可预测在产品发展周期内其是完全可接受的。EROS在每个平台上提供同样的应用接口并允许应用程序在任何EROS平台上运行。EROS应用程序的发展在组合目标OS的子集的PC SDK上执行。在中试阶段,Eden将采用GNU成套工具来发展EROS自身并对所有目标都支持该成套工具。
EROS的整个结构在封闭的滑块中表示。
驱动器 ARK 服务器 应用程序
EROS的组件为高级实时核心(ARK)这是EROS的核心;基于ITRON3协议及其延伸,它支持预清空、以次序区分的多任务、信息排队、信号、会合端口、事件标记和中断处理。
虚拟存储器管理(VMM)依据在选择的平台内可利用的支持电平,它提供错误应用的保护,把虚拟存储器映射到真正存储器上并提供动态存储器处理(malloc()h free()).
Eden的可视环境(EVE)它提供对0EM和应用软件的提供者不施加“look and feel”的简单对象组的核心给构成GUI.EVE工具的取向方式的对象。EVE也支持有限数量的复杂对象(如通过把简单对象组合在一起的名字含义)。应用软件作者容易产生他们自己的复杂对象来纸芯他们设计的GUI。
高级数据库访问模块(ADAM)这是传统数据库设备,提供记录结构、插入、删除、搜索、数据完整性检查和记录锁闭。它不同于其它数据库在于被设计在内置环境中操作。
剪切板应用接口(CAIN)EROS剪切板支持拷贝、剪切和粘贴及拖动和删除。它通过允许应用程序建立能在彼此不相互熟悉的应用程序之间传送的自说明数据项而实现。
一般对象数据系统(GODS)EROS的文件系统为建成若干层,每没有认识到这种细节的应用软件中允许多种文件编排系统支持(典型地是在PC插件上DOS兼容文件编排系统和用于内置非易失性存储器取向的闪速存储器)。
PC插件服务EROS支持SRAM、闪速存储器和ATA驱动作为存储器和数据交换装置。PC插件服务支持那些在系统首先建成时还不知道的可装载的装置。EROS的装置管理器支持装置驱动器的动态添加并允许处理器任务建立与最适当的驱动器的连接。
TIP/IPEROS支持TCP/IP,SLIP和PPP。若干高级协议作为包括UDP、FTP、SMTP、POP3和HTTP的OS内的标准而被支持。其它的协议在特定的产品和设备的基础上被支持。
EROS支持的其它特征包括链接和装载内置系统典型的是作为包含操作系统和所有应用程序的单一ROM来提供。新的应用程序的添加和在ROM中提供的那些的更正是困难的。使用闪速存储器,但是升级的机制和添加通常很繁杂。EROS利用动态链接程序加载器(ELF)克服这种困难的大部分。EROS自身和内置应用程序被安装在ROM中并且它们的外部链接符号在启动期间被装载到RAM中。可安装插入码从而后面在启动序列中这些符号中的一些可被改变到指向新代码,这样避免ROM中代码的废弃区。类似地可被动态装载的应用程序被链接到这个符号表并且从而使用正确的内置和插入码。
定位OS结构提供其中构造有应用程序的框架来支持OEMs和应用程序开发商,这些应用程序易于从一种语言到另一种语言从一个国家到另一个国家的转换而应用程序很少或理论上不改变。
电源管理内置应用程序通常是电池供点并且因而电源使用是关键的。尽管特定处理器和产品提供的支持成都将变化,EROS支持API,其运输应用程序以电源敏感方式来构造并以适当的方式支持特定平台的特定属性。
应用程序接口任何应用程序与EROS通过应用程序接口(API)发生作用。在程序水平上这些函数调用。这些函数基本上以“helpers”的形式,其作为应用程序任务的一部分来执行并在返回应用程序代码之前与一个或多个EROS任务交换信息。从EROS的响应和其它输入通过信息发送提供给任务的输入队列或者,对于所谓的组块调用,通过使用“会合”的求助函数来交换。应用程序任务通常被结构为单一信息处理循环,其从信息队列中得到信息。
开发工具EROS包括一套工具来启动用于EROS平台的要被开发的应用程序。这种应用程序通常是独立的平台(处理器)和产品,服从被利用来处理接口的适当的装置。该套工具包括●在PC上的DOS中执行的并且提供大部分应用程序可被开发和测试的环境的EROS子集。这需要开发商利用Borland4.5开发系统。
●交叉编译程序、链接程序和主机目标调试程序被指定到目标平台;Eden在平台指定基础上将推荐一些,但是在中试阶段,将主要建议和支持GNU工具。
●端子/目标监测器程序,其许可要被检查的EROS的内部细节●字体和图符编辑器●全部链接指令被提供来允许OEMs来建立包括EROS和内置应用程序的ROM图象●全部结构细节被提供来允许生成插入文件●全部指令被提供来允许可装载的程序的生成。
●用于目标平台的EROS以由“helper”函数、EROS任务所用的对象代码和由OEM或代表OEM修改的起始启动序列来组成的共享库的形式被提供。
目标硬件和特定发行的产品非常大量的EROS是硬件和产品独立的,需要简单的再编译来在新的平台上运行。这样所需的把EROS导向特定处理器的产品结构的努力量相对较小。
这些通常需要在总的平台(即总处理器)基础上再工作的区域是●基本串行接口驱动和监测的制造●最低电平的核心映射●芯启动序列●映射来使用目标构造的存储器其中在总的产品基础上这种工作通常是必须的主要区域为●键盘、屏幕和数字化设备处理典型地每个产品在这些区域使用不同的硬件,EROS提供对程序的简单接口并且Eden在需要时作这种工作。
●存储器结构和启动EROS为每个目标平台提供启动序列(上述)骨架;扩展它是特定产品的任务。
●非标准装置EROS具有装置处理结构体系,其支持新装置处理器的添加。
●PC插件接口Eden通常必须对低电平的PCMCIA插件处理再加工以利用选择的特定控制器。
●PC上的EROS的发展方案需要改变来与目标产品的屏幕尺寸匹配以支持GUI开发。
权利要求
1.用于模拟和数字形式的音频信号通信并用于其存储的便携装置包括数字存储装置;与通信信道的通信连接;具有与所述通信连接耦合的通信输入与输出和数字输入与输出的电信接口;具有与所述存储装置耦合的输出的模数转换器;和与所述存储装置和所述电信接口数字输入与输出耦合的控制器并包括用来探测在所述通信连接上的信号是模拟还是数字音频信号的装置;由所述用来探测并耦合到所述电信接口、所述存储装置和所述模数转换器的装置控制的路由装置,所述探测装置一探测到数字信号,所述路由装置引起被耦合到所述存储装置的所述电信接口的数字输出,所述探测装置一探测到模拟信号,所述路由装置引起所述电信接口绕过所述连接上的信号并耦合这。
2.与用来在所述存储装置中进行随后存储的所述模数转换情况相同。
3.如权利要求1的装置,还包括通过在存储之前压缩信号的装置来产生作用的与所述存储装置的耦合。
4.如权利要求1的装置,所述控制器还包括用来把存储在所述存储装置中的数字信息组合到包含数据和控制位的分组数据流中的装置;用来耦合所述分组数据流到所述电信接口的数字输入来在所述通信信道上传输的装置。
5.如权利要求3的装置,其中所述控制器引起所述电信接口把所述分组数据流以基本上高于数字化话音的传输速率的速率来传输。
6.如权利要求1的装置还包括与数字通信信道的连接和二者之间的接口和所述控制器。
7.如权利要求1的装置,其中所述数字通信信道和相应的接口被设定来处理红外通信。
8.如权利要求1的装置还包括与所述控制器耦合的条形码阅读器。
9.如权利要求1的装置还包括与所述控制器耦合的LCD触屏。
10.用于模拟和数字形式的音频信号通信并用于其存储的装置包括数字存储装置;与通信信道的连接;具有与所述连接耦合的模拟输入与输出和数字输入与输出的电信接口;和与所述存储装置和所述电信接口耦合的控制器并包括用来把存储在所述存储装置中的数字信息组合到包含数据和控制位的分组数据流中的装置;用来耦合所述分组数据流与所述电信接口的数字输入以在所述通信信道上传输的装置。
11.如权利要求9的装置,其中所述控制器引起所述电信接口把所述分组数据流以基本上高于数字化话音的传输速率的速率来传输。
12.如权利要求9的装置,其中所述所述控制器包括用来探测信息的通信信道上HTML语言形式的接收并允许以所述语言双路通信的模块。
13.如权利要求9的装置,其中所述控制器包括用来探测信息的通信信道上FTP语言形式的接收并允许以所述语言双路通信的模块。
14.如权利要求9的装置,其中所述控制器还包括响应于在所述通信信道上文本信息的接收以产生类似于被人的话音说出的所述文本信息的可听得到的信息的语音合成器。
15.如权利要求9的装置,其中所述控制器还包括用来接收关于存储数据的信息并允许所述信息的有选择的取回的数据库管理模块。
16.用于模拟和数字形式的音频信号在通信信道上的通信并用于其存储的方法包括步骤探测在所述信道上的信号是模拟还是数字音频信号;在所述信道上一探测到数字信号,把具有与所述信道耦合的输入及数字输出的类型的电信接口的输出存储到数字存储装置中;在所述信道上一探测到模拟信号,把其从模拟转换为数字形式并将转换后的信号存储在数字存储装置中。
17.如权利要求15的方法,其中在所述任一存储步骤之前所述信号被压缩。
18.用具有与所述信道耦合的模拟输入和输出的及数字输入和输出的类型的电信接口来执行的如权利要求15的方法,还包括步骤把存储在所述存储装置中的数字信息组合到包含数据和控制位的分组数据流中;及耦合所述分组数据流到所述调制解调器的数字输入以在所述通信信道上以基本上高于数字化话音的传输速率的速率进行传输。
19.用于模拟和数字形式的音频信号在通信信道上的通信并用于其存储的方法,所述方法用具有与所述信道耦合的模拟输入和输出的及数字输入和输出的类型的电信接口来执行,并包括步骤把存储在存储装置中的数字信息组合到包含数据和控制位的分组数据流中;及耦合所述分组数据流到所述调制解调器的数字输入以在所述通信信道上以基本上高于数字化话音的传输速率的速率进行传输。
20.一种允许用户记录、编辑、播放和浏览话音信息和其它可通过通信链路从远程装置接受并随后被传输到那里的音频资料的便携装置,包括电源插座;用于使从所述电源插座供电的音频信号的本地化记录、编辑、存储和回放的集成电路;非易失性存储装置,对其的访问由所述集成电路来控制;与用所述集成电路耦合的分别用于音频的可听到回放和本地输入的内置扬声器和麦克风;用所述集成电路耦合的电信接口芯片装置;与所述调制解调器芯片装置耦合的组合式电话插孔;操作该装置从而基本上以快于初始被记录的速率来传输和接收音频信号的集成电路。
21.根据权利要求19的装置,其中所述集成电路包括操作来允许对在通信链路路上接收到的模拟和数字信号进行区分的模块,模拟信号在未被所述电信接口芯片处理的情况下被呈现给所述集成电路。
22.根据权利要求19的装置,其中所述集成电路包括允许经所述通信链路在因特网上利用那上面可使用的至少一个协议来通信的模块。
23.根据权利要求19的装置,其中所述集成电路包括作为文本识别在通信链路上接收到的信号并将该信号转换为与读出文本的人类的话音的语音相仿的信号的模块。
全文摘要
公开了一种便携装置可允许用户来记录、编辑、播放和浏览话音信息和其它可通过通信链路从远程话音处理或交互作用话音响应(IVR)主机接受并随后被传输到那里的音频资料。优选的装置包含它自己的电源、集成电路和控制按钮以经内置扬声器、麦克风和可移动的存储器插件允许使音频信号的本地化的记录、编辑、存储和回放。该装置还包含标准RJ-11电话插孔、调制解调器芯片装置和DTMF音调解码器以允许音频信号从主机或向主机的传输和控制。该装置包含电路,其允许它以基本上快于初始被记录的速率来传输和接收音频信号。
文档编号H04L12/56GK1260924SQ98805009
公开日2000年7月19日 申请日期1998年4月11日 优先权日1997年4月11日
发明者杰弗里·斯特恩, 吉尔·威克斯勒 申请人:Ent回波技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1