电子邮件辅助暨文字转语音系统的制作方法

文档序号:82641阅读:369来源:国知局
专利名称:电子邮件辅助暨文字转语音系统的制作方法
技术领域
本发明是关于一种将文字数据转换为语音信号的电子邮件辅助暨文字转语音系统,尤其是关于一种可选择性的将文字数据以虚拟播报员进行播报或者直接转换为语音输出或将其转换为声音档案的系统。
背景技术
文字为人类高度文明化过程中相当重要的媒介,借由文字的纪录,可以将各种知识、经验、感受或意思充分的纪录与表达,促进了人类文化与科技的进步。然而世界上种族繁多,加上地域的隔阂,造就了许多不同的语言,例如中文、日文、韩文、英文、法文、德文、西班牙文或俄文等。这些语言各自保存了特定文化的精髓,并作为现今社会的沟通媒介。
为数众多的语言虽然让人类世界呈现多元的文化,但却也造成沟通上的障碍,例如若欲与只懂法文的法国人沟通,便必须学习法文、使用法文。因此人们便必须学习多种语言,以因应国际化的潮流与趋势。
沟通为语言的主要功能,因此单单仅学习阅读与撰写,并未能充分达到学习语言的目的,而听说能力的训练,又有赖语文情境的建立,然而日常生活中并非可轻易成就具有学习功效的情境。虽然市面上已充斥各种外文(特别是英文)对话或朗读光盘,但其内容并非均使学习者感兴趣,尤其是对于年纪尚轻的学生或儿童,若教材的内容并无法引起其注意,其学习的成效将大打折扣。
因此,就语言学习的观点而言,需要一种更有弹性的方式或媒介,以提供语言学习者建构具有学习效率的语言情境。
此外随着计算机科技的发展,虽然有关文字转换自然语音的人工智能技术研究者众多,然受限于各国语言文法结构不同的困难度以及计算机操作系统的独占性,使得文字转换语音技术的开发不得不依附于计算机操作系统。而技术上虽已能够让使用者得以通过各种文字转语音引擎将文字数据转换为语音信号,然而目前的软件均有其局限性,无法提供全面性的功能,因而无法充分发挥文字转语音引擎的强大功效,相当令人感到遗憾。

发明内容鉴于上述问题与公知技术的缺点,本发明在此提供一种具有文字转语音功能的系统,可安装于计算机或其它具有运算能力的装置中,例如PDA、智能手机等。此系统的功能主要由数个储存于硬盘或其它储存装置内的子程序或软件模块所达成,并提供至少两种操作模式,供使用者随意切换,包含播报员模式以及直接文字转语音模式。播报员模式可借由某个虚拟人物、动物、角色、漫画或卡通造型将输入的文字以语音的方式进行播报,而直接文字转语音模式不仅可直接以语音的方式播放输入的文字,亦可将其转换为某种声音档案,例如wav/mp3档案,以供使用者于任何时刻利用任一播放装置进行播放。
本发明的目的在于提供一种储存装置,其用以储存计算机可读取的数字信息,包含一文字转换语音模块,用以将输入的文字数据转换为语音信号;一播报员模块,用以将上述语音信号通过一虚拟人物进行播报;以及一直接文字转语音模块,用以直接播放此语音信号,以及将直接文字转语音模块所产生的语音信号储存为一声音档案。
本发明的另一目的在于提供一种文字转语音系统,包含一输入单元,用以提供文字数据或操作指令;一储存装置,用以储存一电子邮件辅助暨文字转语音模块,其中此电子邮件辅助暨文字转语音模块将上述的文字数据转换为语音信号,并根据操作指令通过一虚拟人物进行播报或将语音信号直接播放、或者转换为一声音档案;以及一处理单元,耦合至输入单元与储存装置,用以执行操作指令。
图1呈现本发明较佳实施例的用以执行本发明的系统方块图。
图2呈现本发明较佳实施例的电子邮件辅助暨文字转语音系统方块图。
图3至图8呈现本发明操作状态的范例。
符号说明10 储存装置11 文字转换语音模块12 播报员模块13 声音档案产生模块14 文字输入或开启文本文件模块
15 记事提醒侦测暨处理模块16 电子邮件侦测暨处理模块17 档案快取模块18 MP3语音质量控制模块19 朗读速度音量控制模块20 使用者接口100 控制芯片102 操作系统104 邮件辅助暨文字转语音系统106 其它应用程序110 显示单元120 电源130 输入单元140 音效单元150 存储器301 虚拟人物302 文字编辑区域303-307选单308 工具列选单401 工具列选单501 工具列选单601 工具列选单701 电子邮件内容
702 记事到时提醒设定801 工具列选单具体实施方式
本发明将配合其较佳实施例与随附的图示详述于下,应理解者为本发明中所有的较佳实施例仅为例示之用,因此除文中的较佳实施例外,本发明亦可广泛地应用在其它实施例中。且本发明并不受限于任何实施例,应以随附的申请专利范围及其同等领域而定。
请参照图1,本发明的电子邮件辅助暨文字转语音系统104可以植于任何计算机设备或芯片运算处理系统中使用,包含桌上型计算机、手提式计算机、个人数字助理或是移动电话中使用。此外,本发明的电子邮件辅助暨文字转语音系统104亦可储存于可携式的光学、磁性或是电子式储存装置中。一般而言,上述终端设备包含控制芯片或处理器100、电源120、显示单元110、输入单元130、存储器150以及音效单元140(例如扬声器),各别耦合至控制芯片或处理器100,且各上述单元为熟知技术,故不赘述。计算机系统亦包含或被输入或连接储存装置或装置10,此储存装置可以为硬盘或是任何的磁性或光学储存装置,如CD-ROM等。为说明的便利性,兹采用硬盘作一说明,但本发明并不限于硬盘。换言之本系统将被储存于计算机硬盘中。一般可得知硬盘可包含操作系统102以及其它的应用程序106,本发明的电子邮件辅助暨文字转语音模块104亦储存于上述硬盘10之中。
参阅图2,其中呈现本发明所提供的计算机可读取储存装置10,其种类可包含硬盘、CD、DVD、存储器、软盘片、包含闪存的手持装置或其它可储存数字数据的装置,此计算机可读取储存装置10中包含数个功能模块11-19,可共同运作以达到本发明所预期的功能与目的,上述的功能模块11-19于本较佳实施例中可为应用程序、软件或者甚至仅为一串计算机可执行的指令。然而于另一实施例中,此功能模块乃由硬件实施,例如具特定功能的芯片或者电路,在其它实施例中,其亦可为硬件与软件的结合。
本发明包含电子邮件侦测暨处理模块16,当启动本系统后,该邮件侦测暨处理模块16将自动侦测至少一个电子邮件程序(例如OutlookTM或是NavigatorTM)的收信夹是否具有新邮件,而且无需启动上述的电子邮件程序。若是上述侦测为肯定,则将新邮件汇入本系统的使用者接口20,显示上述新邮件的相关信息以及本文。在此之前,可以启动播报员模块12告知来函信息,例如「你有新邮件」。此时,可以显现或不显现虚拟人物于使用者接口20。于汇入邮件后,本系统的文字转换语音模块11可将信件中的文字转成语音输出。当使用者点选邮件时,播报员模块12将以语音的方式播报此一邮件的内容,此播报步骤可以显现或不显现虚拟人物于使用者接口20中。文字转换语音模块11的转换语音将通过如扬声器或耳机的音效单元140以输出信号,邮件内容以及虚拟人物则通过显示单元110呈现。此外,本系统亦可自由设定邮件检查时间,在系统执行期间担任定时检查来信工作。
本发明包含的记事提醒侦测暨处理模块15,当启动本系统后,该记事提醒侦测暨处理模块15将自动取得作业环境的系统时间,并加载预先设定的提醒记事档案,侦测两者日期及时间差异,若是上述侦测为肯定,则将提醒记事档案汇入本系统的使用者接口20,显示上述记事的相关信息。于汇入记事提醒档案后,本系统的文字转换语音模块11可将记事提醒内容的文字转成语音输出。输出方式可以显现或不显现虚拟人物于使用者接口20中。文字转换语音模块11的转换语音将通过如扬声器或耳机的音效单元140以输出信号,记事提醒内容以及虚拟人物则通过显示单元110呈现。此外,本系统亦可自由设定记事提醒事项,提醒方式可为一次、每天、每周、每月或每年提醒,在系统执行期间随时侦测记事到时设定。
本发明的优点在于同时提供至少两种文字转语音的操作模式,分别为可将文字通过虚拟人物进行语音播报的播报员模式,此模式是由播报员模块12所执行,以及可直接将文字转换为语音的文字转换语音模式,此模式则不显示播报员,而是直接将转换的语音通过音效单元140输出。两者皆利用共同的核心引擎将文字数据转换为语音信号,此核心引擎即为文字转换语音(Text-to-Speech;TTS)模块11。此文字转换语音模块11可为美商微软公司(「微软」为其所注册的商标)所提供的TTS引擎,并且在本发明的较佳实施例中,文字转换语音模块11支持至少两种格式,分别为SAPI4(SoundApplication Programming Interface 4)以及SAPI5。如图3的操作范例所示,选单306与307分别代表各种SAPI4或SAPI5的不同音源,使用者可利用此两选单进行切换,而图5所示的操作范例中的工具列501亦可供使用者切换SAPI4或SAPI5的格式。
借由本发明,使用者可通过文字输入或开启文本文件模块14以将选定的文字输入或汇入,例如利用图1的系统中的输入单元130输入一段文字或者将某个文字文件汇入,上述文本文件的格式可包含doc、pdf、txt、xls、html、eml或者msg等,如图3所示,使用者可利用键盘于编辑区域302内输入欲转换为语音信号的文字,或者将某个档案或网页上的文字剪贴至编辑区域302内。于输入完成后文字转换语音模块11便将其转换为语音信号,若使用者选用播报员模块12所提供的模式,此语音信号便可由一虚拟人物进行播报,在本发明的较佳实施例中,将提供数个虚拟人物供使用者选择,并且各个虚拟人物均具有独特的音质、语调、快慢、腔调、性别、场景或支持的语言。除了内建的虚拟人物(播报员)之外,使用者亦可额外安装其它的虚拟人物,以扩充本发明的多样性。如图3所示,虚拟人物301正在「朗诵」文字编辑区域302内的文字,并可借由选单303至305切换虚拟人物以及调整其播报方式。此外,亦可如图4所示,利用工具列选单401切换执行播报的虚拟人物,将其改变为图5所示的虚拟人物502。
播报员模式能够提供较为生动活泼的播放方式,因此对于语言学习而言,将更能够吸引学童或一般学习者的注意力,进而提高学习的效果,有别于传统的语言学习光盘或录像带。此外,本发明的虚拟人物所播报的内容,全然由使用者自由且弹性的设定,因此可任意选择学习者感兴趣的题材,以增进学习的动机。目前因特网甚为普及,外文内容的文字数据俯拾即是,例如若欲学习日文,可连结至一日文新闻网站,任意撷取一段日文新闻,利用文字输入或开启文本文件模块14将其提供予转换模块11以进行转换,最后由播报员模块12以使用者选定的虚拟人物进行播报,如此便可轻易达到训练日文听力与学习日文发音的效果。
然而,仅能够实时将文字以语音的方式进行播报,已无法充分满足使用者的需求,因此需要提供更为弹性的方式来聆听转换完成的语音信号。数字音乐播放装置已逐渐成为基本且普遍的设备,例如具有MP3音乐播放功能的随身碟、PDA、手机或汽车音响等,均可随时提供使用者播放音乐的功能,因此本发明除上述播报员模式外,亦同时拥有另一种声音档案产生模块13所提供的模式,使用者于操作时可借由输入单元来选择以随时进行模式的切换,使本发明可充分因应各种需求。
声音档案产生模块13具备将文字转换语音模块11所转换完成的语音信号转存成音效格式档案,例如MP3、wav格式的档案,供使用者事后随时利用任一播放装置收听。例如,使用者可将欲聆听的文字数据转换并储存为MP3档案,并将其传输至具有MP3播放功能的PDA上,之后始利用空闲的时间聆听。如此一来便可超越时间、空间的限制,随时进行语言学习,充分利用各种琐碎的时间,增进生活的效率。图6呈现将文字转换为语音档案的操作状态,工具列选单601提供使用者将文字转换为wav档案或者MP3档案的选项,可将文字编辑区域302内的文字转换并储存为声音档案。应可理解者为本发明所得转换的声音档案格式并非以wav或MP3为限,任何可能且适合的声音档案格式均可包含于本发明的范围中。再者,本系统亦可包含MP3语音质量控制模块18用以控制MP3的质量,以及朗读速度音量控制模块用以控制朗读速度。上述MP3语音质量控制模块18与声音档案产生模块13相关。
本发明通过上述两模块11及12所提供的双模式切换,以充分满足使用者或语言学习者的各种需求,乃为公知技术所未能预期,此外由于使用者可随时进行模式间的切换,因此亦增进操作上的弹性。
此外,于本发明的一个实施例中,计算机可读取储存装置10更可包含一记事提醒侦测暨处理模块15,可供使用者设定各种记事提醒以及代办事项,并由播报员模块12以语音的方式进行提醒,于图7所呈现的操作范例中选单702可用以设定上述的记事内容。再者,于另一实施例中,计算机可读取储存装置10更可包含一电子邮件侦测暨处理模块16,用以接收与传送电子邮件。当侦测以及收到电子邮件时,将由播报员模块12或直接文字转换语音模块11以语音的方式告知,其操作状态图请参见图7。图7所呈现的实施例是以虚拟人物301通知使用者系统已收到两封新邮件,但使用者亦可不通过虚拟人物301直接以语音告知收到新邮件。
再者,本发明可将电子邮件的文字内容(邮件内容701)转换为语音信号,此语音信号便可借由上述的方式播放、播报或转档。例如,对于极为忙碌的人士而言,可于开车或搭车时聆听电子邮件的内容,而不受限于办公室的计算机即可「读取」信件。
于本发明的一个实施例中,计算机可读取储存装置更可包含一档案快取模块17,用以筛选特定格式的档案,例如WORD文件(doc)、EXCEL文件(xls)、PowerPoint文件(ppt)、PDF文件或者纯文字文件(txt)。其可滤除指定档案格式以外的档案,使用者因此可快速且简便地寻找出欲得的档案,其操作范例请参照图8,工具列选单801提供五种档案格式供使用者选定,然而应可理解者为本发明可供筛选的档案格式并非仅以此五种为限,任何档案格式均可做为本发明筛选的依据。
于图式与说明书中,虽然以个别的功能模块呈现本发明的各个实施例,但应可理解者为亦可将两个以上的模块整并为单一的多功能模块,甚至各个模块间的功能亦可能产生重复。说明书与图式将其以单一功能的模块进行呈现,乃仅为清楚解释本发明的精神与范围,而非用以限缩本发明。
图1呈现包含本系统的计算机系统,其主要由处理单元(控制芯片100以及存储器150)、储存装置10以及输入单元130等所构成,此外于本发明的另一实施例,此系统更可包含显示单元110以及音效单元(例如扬声器)140,所有的装置均能够通过总线(bus)互相耦合,并交换数据。于本实施例中,此系统即为一个人计算机,可执行安装于储存装置10内的电子邮件辅助暨文字转语音系统104,其中此储存装置10可为硬盘机、闪存储存装置(flash drive)、CD、DVD或者软盘片。应可理解者为图1所呈现的电子邮件辅助暨文字转语音系统104乃为图2中功能模块11-19的组合,使用者可视其需求选择性地安装至少一个功能模块,因此功能模块11-19所得以共同或个别达成的功效,均可由电子邮件辅助暨文字转语音系统104执行。
显示单元110的种类可包含电视、液晶屏幕(LCD)或者阴极射线管屏幕(CRT monitor),其中的虚拟人物与操作接口即可呈现于显示单元110之中。图2中所呈现的输入单元130的种类可包含键盘、鼠标、轨迹球、触控板、手写板、扫瞄器或者麦克风。再者音效单元140的通常为扬声器或者耳机,供系统将转换完成的语音信号输出。
由于图1所呈现的系统,主要是用以执行图2中各个模块的功能,因此类似的叙述将在此省略,以避免重复累赘。
本发明所得以支持的语言主要是根据SAPI4与SAPI5所得以提供的语音来源而定,目前世界上绝大部分主要的语言文字均可由本发明进行转换为语音信号或档案,至少包含英文、德文、日文、法文、荷文、意大利文、韩文、葡萄牙文、西班牙文、俄文或简体中文等。
对熟悉此领域技艺者,本发明虽以较佳实例阐明如上,然其并非用以限定本发明的精神。在不脱离本发明的精神与范围内所作的修改与类似的配置,均应包含在申请专利范围内,此范围应覆盖所有类似修改与类似结构,且应做最宽广的诠释。
权利要求
1.一种储存装置,其用以储存计算机可读取的数字信息,其特征包含一文字转换语音模块,用以将输入的文字数据转换为语音信号;一播报员模块,用以将该语音信号通过一虚拟人物进行播报;以及一声音档案产生模块,用以将该文字转换语音模块所产生的该语音信号储存为一声音档案。
2.如权利要求
1所述的计算机可读取储存装置,其特征在于,还包含一文字输入模块,用以供使用者输入或汇入该文字数据。
3.如权利要求
1所述的计算机可读取储存装置,其特征在于,还包含一记事提醒侦测暨处理模块,用以供使用者编排行事历,并借由该转换模块将使用者设定的文字形式的提醒内容转换为语音信号,以通过该播报员模块进行播报,或通过该声音档案产生模块直接播放。
4.如权利要求
1所述的计算机可读取储存装置,其特征在于,还包含一电子邮件侦测暨处理模块,用以侦测电子邮件,其中可借由该文字转换语音模块将该电子邮件侦测暨处理模块所接收的电子邮件转换为该语音信号。
5.如权利要求
1所述的计算机可读取储存装置,其中所述的文字转换语音模块包含SAPI4的TTS引擎及SAPI5的TTS引擎。
6.一种文字转语音系统,其特征在于,包含一输入单元,用以提供文字数据或操作指令;一储存装置,用以储存一电子邮件辅助暨文字转语音系统,将该文字数据转换为语音信号,并根据该操作指令将该语音信号直接播放、通过一虚拟人物进行播报或者转换为一声音档案;以及一处理单元,耦合至该输入单元与该储存装置,用以执行该操作指令。
7.如权利要求
6所述的文字转语音系统,其特征在于,还包含一音效单元,耦合至该处理器,其中该音效单元包含一扬声器或者一耳机。
8.如权利要求
6所述的文字转语音系统,其中所述的电子邮件辅助暨文字转语音系统可将该文字数据转换为各种声音型态的语音信号,其中每一种该声音型态均具有音质、语调、快慢、腔调、性别、场景或支持的语言。
9.如权利要求
6所述的文字转语音系统,其中所述的电子邮件辅助暨文字转语音系统包含SAPI4的TTS引擎及SAPI5的TTS引擎。
10.如权利要求
6所述的文字转语音系统,其特征在于,还包含一MP3语音质量控制模块用以控制MP3的质量。
专利摘要
本发明提供一种至少具有两种操作模式的电子邮件辅助暨文字转语音系统,分别为播报员模式以及直接文字转换语音模式,使用者可视其需要随意进行切换。当所选择者为播报员模式时,可将输入的文字通过某一虚拟人物进行朗诵,另一方面,若所选择者为直接文字转换语音模式,则便可将输入的文字转换为语音,并直接由音效单元输出,使用者亦可储存为wav/MP3格式的声音档案于日后聆听。本发明的系统主要包含控制芯片、具有至少一个功能模块的储存装置以及输入单元。
文档编号G06Q10/00GK1991817SQ200510135943
公开日2007年7月4日 申请日期2005年12月29日
发明者罗兆鑫 申请人:罗兆鑫导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1