便携式码识别语音输出装置的制作方法

文档序号：2829277阅读：286来源：国知局

专利名称：便携式码识别语音输出装置的制作方法
技术领域：
本发明涉及用于语音合成输出设备的技术，特别是便携式码识别语音合成输出设备，其能够读取特定压缩码的印刷输出并能通过语音输出读出。
技术背景随着信息通信技术的发展，全国范围内的个人和社会成员之间相互共享信息，但是社会弱势群体，例如残疾人、老年人和文盲等难以获取和使用这些信息通信，使得他们不能享受到随之而来的便利。大多数发达国家努力向用户提供考虑残疾人和老年人可获取性的信息通信产品和服务。而且，这些发达国家需要信息通信设备的制造商和业务提供商允许残疾人获取和使用他们的信息通信设备和业务。随着这样的国际化趋势，韩国关注于这样的问题，但是开发产品的制造商和业务提供商态度不积极，因为这样的职责不符合他们的公司利益。特别是，视力受损害的人获取现代信息社会的各种信息或者从现代信息社会各种信息截取信息时受到限制。文盲在获取这些信息时最困难。视力受损害的人能够使用布莱叶盲文读书或者可以读取声音书籍。但是，为了制造布莱叶盲文书籍，需要花费时间输入内容并进行校正。布莱叶盲文书籍缺点在于布莱叶盲文的阅读速度比印刷的文字慢，它的体积相对较大使它占了很大空间。此外，音频书籍缺点在于它们的制造周期相对较长，但不能保存相对长的时间。因此，需读取这些语音记录书籍的人相比于非残疾人很难收集信息社会的信息。盲人可以通过读书获得各种间接经验。为了克服读和写的限制，残疾人通过阅读充分受到教育，通过这种方式，盲人能够扩展他们的经验，有机会获取信息。由于这些情况，需要开发能够帮助盲人和老年人不需其他人帮助就能获取
各种信息媒介的装置。根据这样的需要，已经开发出并市场上已经开始出售了一种码识别语音合成装置，其根据特定的码压缩文字并进行记录。因此，盲人和老年人可以^艮容易地自己读书。本发明涉及语音合成输出设备，能够识别压缩码并通过语音输出识别的结果。通常，包含码类型的输出材料的示例例子是条形码，它指示使用平行条码和空格的阵列提供信息的符号。也就是，这样的条形码是根据作为条形码语言的符号表示法定义的规则编码成视觉上易于读取信息的符号。条码和空格根据它们的宽度解码成一个二进制比特或者多个二进制比特，条码和空格的组合表示ASCII字符。此处，表达的字符根据条形码的种类表示图形和字母。由于这样的条形码很容易编码数据，且在数据编码时具有相对'j、的错误率，它可以在数据处理系统中进行配置并在各种材料中印刷。因此，条形码可以广泛地使用在各种领域中，包括指示国家代码、制造商、产品码、生产日期等的货物标识功能。但是，条形码缺点在于，符号只能不可避免地包括有限数量的信息，例如国家代码、制造商、产品码信息，不能表达各种信息，而且符号损坏时难以重新获取信息。因此，由于很难使用条形码编码大量文件，例如书籍，已经研究了各种符号以通过这样的符号表达大量信息。近来，已经研究和使用了各种类型的数码图像。发明内容因此，本发明的一方面是提供一种便携式的码识别语音合成输出设备，能够识别特定压缩码格式的数码图像，通过语音合成识别的结果，并输出合成结果。本发明的其他方面和/或优点部分将在以下的描述中阐明，部分将在描述中显而易见，或者可以通过实施本发明认识到。根据本发明的一方面，以上的和其他的目标可以通过提供一种便携式码识
别语音合成输出设备来实现，其包括作为扫描仪的读取器，用于识别压缩数码图像；播放器，用于处理读取器读取的码图像，合成处理结果并通过语音输出合成结果，其中读取器和播放器彼此分离。根据本发明的另一方面，提供了一种便携式码识别语音合成输出设备，能够考虑主要用户，例如盲人、文盲和老年人等，向用户提供各种功能使得用户可以容易地使用该装置，其中各种功能包括文本文件的语音输出功能、MP3 播放功能、录音功能、FM收音功能、时钟功能等，对全部菜单和操作状态都提供了语音向导功能。如同从以上各方面理解的，当根据每一页印刷相应书籍、文件等的内容时，由于只有包含内容的数码图像可以印刷，本发明的设备可以将相应的图像转换为语音，使用户可以听到该语音。因此，盲人以及文盲和老年人可以很容易地获取信息。还有，由于读取器和播放器通过USB通信彼此连接，它们可以按照情况需要相互分离，用户可以将播放器放在口袋中或者特定的位置上，而只操作读取器，以进行抓取从而执行抓取播放模式。另外，由于用户4建接口相对简单，用户容易操作，全部菜单和操作状态都通过语音通知用户，盲人和老年人可以容易地使用该设备。

本发明的这些和/或其他方面及优点将结合附图从以下实施例的描述中变得更清楚或更容易理解，附图中图1是根据本发明的便携式码识别语音合成输出设备的透视图；图2是根据本发明的读取器和播放器的示意框图；图3是根据本发明的数码图像的显示印刷输出；图4是描述根据本发明的播放模式执行处理的流程图；图5是描述根据本发明的抓取播放模式执行处理的流程图。
具体实施方式
根据本发明的便携式码识别语音合成输出设备包括读取器，用于读取压缩格式的数码图像；播放器，用于解码读取器读取的信息并以特定的语音输出解码的结果，其中播放器通过有线/无线网络接口装置连接到读取器。
读取器包括图像扫描装置，用于抓取压缩数码图像；和有线/无线网络接口装置，用于向播放器发送抓取的数据。播放器包括网络接口装置，用于向读取器或计算机发送数据以及^v读取器或计算机接收数据；语音合成处理控制装置，用于才艮据程序存储器装置中存储的程序处理解码根据操作模式通过读取器输入的数据，且用于根据程序存储器装置中存储的语音合成值执行已解码的数据的语音合成处理以生成语音合成数据，或者根据程序存储器装置中存储的语音合成值执行用于数据存储的存储器装置中存储的文本文件的语音合成处理以生成语音合成数据；程序存储器装置，包括设置了处理的程序，其中一个处理解码通过读取器输入的数据并根据每个存储数据的语音值合成语音，另一处理执行操作模式转换和操作状态语音向导；数据存储存储器装置，用于存储已解码的数据(文本文件)；语音输出装置，用于以语音格式输出语音合成数字信息，其中通过语音合成处理装置生成语音合成数字信息；用户键输入装置，用户通过该装置调节音量和模式转换从而操作播放器；显示装置，用于显示读取器和播放器的操作状态以及显示播放器的文件搜索屏幕；电能控制装置，用于向播放器提供驱动电能；和数据转换装置，用于将输入到语音合成处理控制装置的数据转换成数字数据，以及将语音合成处理控制装置输出的语音数据转换成模拟数据。现在详细描述本发明的实施例，在所附附图中示出示例。图1是根据本发明的便携式码识别语音合成输出设备的透视图。图2是根据本发明的读取器和播放器的示意框图。便携式码识别语音合成输出设备包括读取器100,用于读取特定压缩格式的数码图像；和播放器200,用于解码读取器IOO读取的信息并以特定的语音输出解码的结果，其中播放器200通过有线/无线网络接口单元连接到读取器 100。读取器100包括摄像机IOI，用于抓取压缩数码图像；USB通信接口单元102，用于通过USB通信端口 103从摄像机101向播放器200发送抓取的信息。播》文器200包括USB通信接口单元202，用于通过USB通信端口 201 从读取器100接收数据，其中USB通信接口单元202包括连接到USB通信端
口 103的USB通信端口 201; A/D转换单元203,用于将抓取的数据转:换成数字数据以执行数据的语音合成处理；语音合成处理控制器(DSP) 204,用于才艮据是否向其中输入了用户键或是否与读取器100相连的状态来确定操作模式(例如，抓取播放模式，和播放模式)，用于根据程序存储器205中存储的程序处理解码数据(其中根据操作模式通过读取器IOO抓取数据)，用于根据程序存储器中存储的语音合成值执行已解码的数据的语音合成处理以生成语音合成数据，以及用于根据程序存储器205中存储的语音合成值执行数据存储存储器206中存储的文本文件的语音合成处理以生成语音合成数据；程序存储器205，包括设置了处理的程序，其中该处理解码语音合成处理控制器204的压缩数字图像并对已解码的数据进行语音合成，该处理还用于以语音通知才喿作模式转换和操作状态；数据存储存储器206,用于存储解码的数据文件和传送给计算机(PC)的文件；D/A转换单元207，用于将合成处理控制器204中输出的语音合成信息转换成模拟数据用于语音输出；语音输出单元208,用于以语音向外界输出语音合成处理控制器204中转换成模拟数据的语音合成信息；用户键输入单元209,用户通过该单元调节音量和模式转换等，从而可以^燥作播放器；计算机通信接口单元210,用于管理播放器200的数据和从计算机(PC) 输入文本信息，其中计算机通信接口单元210连接到计算机(PC); LCD显示单元211,用于显示读取器100和播放器200的操作状态，并显示播放器的文件搜索屏幕；电能控制器212,用于向播放器200提供驱动电能。语音合成处理控制器(DSP) 204包括字符转换单元204A,用于根据程序存储器205中存储的解码信息解码通过读取器IOO抓取的数码图像，并将解码结果转换为字符(文本)；语音合成单元204B,用于根据程序存储器205中设置的语音合成信息将转换的字符信息转换为语音信息；模式设定单元204C，用于根据用户的选择设置播放器200的操作模式。程序存储器205包括程序存储单元205A,用于存储关于解码压缩数字图像的解码信息和已解码的数据的语音合成处理程序，以及用于存储关于模式转换和操作状态的程序输出向导消息；和DB存储单元205B，用于存储执行解码字符数据(文本)向语音转换(TTS)的数据。DB存储单元205B配置为进一步包括用户定义数据存储单元205B-1,其
中存储了用户设置的用于符号、图形、字符等的语音转换数据。DB存储单元205B配置为可以进一步包括标签信息存储单元205B-2,其中标签信息指示包含数码图像的语音输出时的音色、语速、语调等。而且，DB存储单元205B还配置为进一步包括语音向导存储单元205B-3，用于将通知语音消息信息通知用户。语音输出单元208配置为放大通过D/A转换单元207转换的语音^T出数据，并输出给扬声器208A或者耳^/L插孔208B。这样，本发明将配置为包括读取器100和播放器200。读取器100和播放器200分别包括USB通信接口 102和202作为数据通信接口装置，>^人而它们可以通过USB通信交换数据，而且还包括USB通信端口 103和201用于彼此通信。此处，尽管本发明的实施例实施了读取器100和播放器200，使得它们可以根据USB通信形成网络，但是也可以修改为采用进行蓝牙通信、串行通信等的各种有线/无线通信装置。考虑到盲人或老年人作为主要用户，读取器100和播放器200可以制造为较小的尺寸。而且，读取器100和播放器200可以配置为它们基于USB通信相互连接，即使用户只#:作读取器100也可以筒单地进行i爪取才喿作。此外，播放器200包括计算机通信接口单元210，其与计算机形成网络，其中计算机通信接口单元210可以实施执行USB通信。另一方面，播放器200 可以配置为通过USB接口单元102和USB通信端口 103与计算机进行数据通信，而不需要额外的计算机通信接口单元209及其通信端口 209a与播;改器200 通信。此处，计算机和播放器之间的网络可以以各种通信连接装置实现。播放器200包括程序存储器205,提供用于执行语音合成处理控制器204 抓取的数字图像的语音合成处理，其中程序存储器205包括程序存储单元205A 和DB存储单元205B。程序存储单元205A存储了一系列处理，用于执行抓取的数码图像的语音合成处理，且DB存储单元205B存储对应已解码数码图像的语音信息值。这样，DB存储单元205B输入执行已解码数码图像的语音合成的信息，并配置为包括用户定义数据存储单元205B-1，由此用户可以指定特定对应字符的输出值。用户定义数据用于提供用户定义功能，从而可以:換照用户所需读取特定字符串(包括图形、符号、外国语言等)。用户通过用户键输入单元209向用户定义数据存储单元205-1输入用户定义功能需要的信息。此外，DB存储单元205B包括标签信息存储单元205B-2。数码图像可以包括指定音色、语速、音调等的标签。因此，必须记录执行这些标签的标签信息定义。数据存储存储器206存储数据为文本文件，其中凄t据转换成文本用于语音合成输出。存储的文件可以根据条件需要通过语音播放。此处，由于数据存储存储器206具有数据存储容量限制，可以配置为进一步包括数据存储器，从而可以应用扩展的数据存储器。此外，DB存储单元205B根据通过用户键输入单元209选择的语音输出模式存储语音合成信息。因此，可以根据语音输出模式输出各种阅读文章的语音，例如女声、男声、提神语音和娱乐语音等。播放器200包括LCD显示单元211用于显示文件搜索状态以及读取器100 和播放器200的操作状态。此外，播放器200配置为可以输出指定文件夹和文件的语音向导信息和依照每个模式的转换操作状态的语音向导信息，从而盲人或者文盲可以识别播放器200的操作状态。用户键输入单元209安装在播放器200外壳的外侧，从而文盲或者老年人可以容易地输入键。因此，每种模式的转换，和控制音量等的切换操作可以根据键的选择顺序容易地进行。另一方面，键可以实施为在上面刻上布莱叶盲文点，从而用户可以容易地识别键上的内容。基于上述的配置，以下将详细描述本发明的操作语音-目艮(voice-eye)码)，以及通过语音合成抓取的4言息，从而使用户听到它们。根据本发明的设备可以工作在必须印刷在文件或出版书籍上的存储压缩文本内容的语音眼码的状态。冯图像(此处称为
此处，语音眼码印刷在书籍的上或下端部，从而盲人可以容易地获取它们的位置。图3是根据本发明的数码图像的显示印刷输出。如图3所示，抓取了印刷的语音眼码以允许用户通过语音听到它的文本信息。首先，以下是上述过程的操作的示意描述。在读取器100和播放器200互相连接的情况下执行抓取播放模式。当使用读取器100抓取文本时，在读取器100和播放器200互相连接的情况下操作读取器100时抓取语音眼码。也就是，读取器100的摄像机101读取语音眼码，通过播放器100的USB通信端口 103和播放器200的USB通信通信端口 201向播放器200发送读取信息。播放器200的A/D转换单元203将接收的抓取模拟图像转换为数字数据，以将数字数据发送到语音合成处理控制器204。语音合成处理控制器204识别输入的数字图像数据，将其转换为特定字符，然后通过语音合成转换的字符信息，以生成待输出的语音信息。语音合成处理控制器204操作使得输入的语音眼码信息通过字符转换单元204A根据存储在DB存储单元205B中的语音眼码解码信息转换成字符。转换成字符后，语音合成单元204B使用对应存储在DB存储单元205B 中的字符的语音合成值进行相应转换字符的语音合成，然后生成待输出的语音信息。此处，当出现与用户定义数据存储单元205B-1中定义的用户定义值相对应的字符时，通过定义的用户值确定语音合成值。此外，当转换字符中出现标签时，在标签信息存储单元205B-2中识别相应的标签值，以根据标签指定的命令生成语音信息。生成的语音信息通过D/A转换单元207转换成模拟语音数据用于语音输出，然后通过语音输出单元208进行放大，将语音通过安装在播放器外壳外侧的扩音器208A或者耳机插孔208B输出到外界。另一方面，语音合成处理控制器204根据模式设置单元204C中设置的用户设置模式向数据存储存储器206存储解码的语音信息为文本文件，从而用户可以播放并重听解码的语音信息。用户可以通过用户键输入单元209设置自动存储和自动存储模式，用于根据情况需要进行存储，或者可以设置选择存储。以下是根据本发明的设备基于它们模式的操作的描述。播放器200的操作模式通过读取器是否与其连接的状态和通过用户键输入单元209的用户选择来执行。根据100是否连接了读取器的确定来确定操作模式。当连接了读取器100 时，其在抓取播放模式操作，当读取器100没有连接时，其在播放模式进行操作，以播放数据存储存储器206中存储的文件。然而，当通过用户键输入单元209的模式转换键尝试模式转换时，不管是否连接了读取器IOO的状态，而播放器200在基于用户选择的相应操作模式下工作，该模式给与了优先权。当选择用户键输入单元209的模式转换键指定抓取播放模式时，进行是否连接了读取器IOO的确定。当连接了读取器100时，读取语音向导信息存储单元205B-3中的向导信息，然后利用语音输出使用户听到相应的语音。例如，发送语音向导信息"读取器未连接"。之后，当读取器100连接到播放器200时，通过语音向用户输出"读取器已连接"的信息，通知他们执行抓取播放模式。这样，当读取器100和播放器200在设置了抓取播放模式的情况下彼此连接时，自动执行抓取播放模式。这种情况下，不需要任何额外的指示抓取的操作。也就是，不需要抓取命令键。当操作读取器IOO读取语音眼码时，将其通过字符转换单元204A转换成字符，然后在緩存器中存储为文本文件。之后，在语音合成单元204B中通过语音合成，然后以语音实时输出。完成全部的抓取播放过程后，在用户选择了停止键时，抓取播放模式结束。之后，当向用户通知是否存储直到该时间输出的语音输出信息的语音信息时，
用户可以确定是否存储信息。当用户选择存储键时，转换的字符文件-文本文件存储在数据存储存储器206中。另一方面，当用户不选择存储键时，删除存储器緩存的内容。此处，可以在播放时存储语音合成信息。因此，当用户选4奪保存4建时，在输出嘟嘟声时向数据存储存储器206中存储临时存储在存储器緩存中的文本文件。当存储了语音合成输出文件时，继续语音合成输出直到用户执行停止键。此外，当用户设置了自动存储模式时，不需要确定是否存储而自动进行存储。以下将主要描述这样的存储方法。当解码书籍时，在语音眼书中自动生成文件夹，作为语音眼码报头中定义的书籍标题，文件夹中存储了 "书籍页数.txt"格式的文件。此处，根据文件名分类LCD显示单元上显示的文件。此处，指定的书籍文件夹中的文件设置为计算机(PC)不能对其访问以保护版权。也就是，在预压缩和编码当书籍的内容时，包括了头中的通知书籍编码的数据。因此，由于解码并存储内容时包括了信息，可以保护版权。对于通常的文本、而非书籍，根据设置名称的确定方法在另一个文件夹(语音眼)中存储名称+页数.txt格式的文件。此处，用户进行管理，从而用户可以通过计算机(PC)创建子文件夹。解码的文件根据它们的类型命名，并根据特定规则存储。关于选择播放模式当用户选择了播放模式时，LCD显示器上显示搜索屏幕，从而用户可以通过搜索屏幕选择他/她需要的文件，并进行语音播放以听到语音。由于播放模式关联于不管是否连接了读取器100而对存储在数据存储存储器206中的文本文件的语音输出，所以不确定是否连接了读取器IOO的状态。此处，由于在用户指定要搜索的文件夹和文件时以语音向用户通知了文件夹和文件，当用户听到向导语音时，用户可以播放存储在数据存储存储器206 中和之前抓取并转换成语音信息的信息，然后可以听到播放的信息的语音。
当不进行额外的用户播放模式转换时，抓取播放模式变成基本的操作模式。此处，抓取播放模式用作执行语音眼码的语音合成(其中抓取了读取器 100和播放器200之间的连接状态)，然后实时输出语音。当播放模式变为基本操作时，其中播放;漠式在读取器100和播放器200没有互相连接的状态下播放，在连接了读取器100的状态下用户选择播放模式转换时，播放器200将基本在第一开机状态(复位状态)的播》丈模式下工作。在这种情况下，继续处理搜索播放文件的播放模式使得可以从数据存储存储器206中存储的文本文件的最近已播放的文本文件中指定、显示和搜索。另一方面，在上述描述的抓取播放模式中存储在数据存储存储器206内的文本文件由计算机访问或者从计算机(PC)接收文本文件，从而执行文本文件的语音合成时，可以执行文本文件的语音播放。播放器200连接到计算机以向计算机发送或从计算机接收数据。也就是，播放器200可以通过USB通信连接到计算机从而可以管理播放器200中的文亏牛夹和文4牛。此外，计算机(PC)中的文本文件可以发送到播;改器200，从而可以使用播放器200支持的语音合成输出功能执行文本文件的语音合成功能，向外界输出"i吾"^"。图4是描述根据本发明的播放模式执行处理的流程图。图5是描述根据本发明的抓取播放模式执行处理的流程图执行处理包括抓取播放模式执行处理和播放模式执行处理。首先，抓取播放模式执行处理包括以下的处理当选择了抓取播放模式时，执行读取器连接确定处理，从而以语音输出向导消息，通知选择了抓取播放模式，然后执行是否连接了读取器的确定。当根据读取器连接确定处理的结果读取器未连接时，执行读取器状态向导消息输出处理，从而输出通知读取器连接状态的向导消息，使得允许读取器连接到播放器。当连接了读取器时，执行字符转换处理从而接收抓取的图像并将接收的图〃象解码为文本。执行语音信息生成处理，从而使用设置的语音合成值由根据用户设定的语
音输出模式所转换的字符生成待输出的语音信息。
语音输出处理用于以语音向外界输出生成的语音信息。其次，播放模式执行模式包括以下的处理当选择了播放模式时，执行播放选择处理，从而以语音输出向导消息，通知选择了播放模式，显示搜索屏幕从而可以搜索存储的文件，并以语音输出用户指定的文件夹和文件的向导消息。
执行语音信息生成处理，从而使用用户选择的用于l番放文件的用于文件的语音合成值，生成待输出的语音信息。语音输出处理用于以语音向外界输出生成的语音信息。
另一方面，抓取播放模式处理还包括复位确定处理，用于确定第一电源是否开启；以及播放模式执行处理，该执行使得根据复位确定处理的结果，不管第一电源开启时是否连接了读取器的状态如何都执行通知执行播放模式的向导消息。此外，抓取播放模式还可以包括以下处理，其中根据是否连接了读取器的状态执行抓取播放模式，并可以通过用户模式转换键输入时用户转换的相应模式执行抓取播放模式。
另外，当用户停止键输入从而完成抓取播放时，抓取播放模式可以进一步包括确定是否是自动存储模式的状态，并完成处理的步骤，在该处理中在播放器处于自动存储模式时在数据存储存储器中存储解码的文本文件，在不是自动存储模式时执行用户是否存储解码的文本文件的状态确认，并根据用户的选择存储解码的文本文件。
另一方面，本发明包括各种功能，向盲人、文盲和老年人提供使用便利。首先，根据本发明的播放器还进一步包括MP3文件的解码装置，以提供 MP3文件插-放功能。根据本发明的播放器可以包括收音调谐器，作为接收无线电信号的接收装置，使用户可以收听FM无线电广播。此外，根据本发明的设备还可以包括编码器，可以将语音输出装置输入的模拟语音数据转换成数字数据，存储成特定的压缩文件(MP3)。此处，用户的i吾音可以记录成文4牛。
然后，在用户希望收听无线电广播时，可以根据情况需要，使用解码器以MP3记录无线电ilr出语音。此夕卜，语音合成处理控制器可以使用上述的编码器以压缩文件格式(MP3)存储输出的语音信息，另一方面，可以以压缩文件格式而不是文本格式存储语音信息。根据本发明的设备可以配置成进一步包括相应的编码器，以选择地转换文件格式，或者进一步包括相应的文件格式转换装置以转换文件格式，从而可以将语音合成信息转换成用户的指定输出^"式(PCM、 WAV、 ASF、 MP3等)，并将它们存储在数据存储存储器中或者将它们发送到计算才几(PC )。此外，由于本发明提供了全部菜单和操作状态的语音向导功能，其配置为包括时钟系统。时钟系统在LCD显示单元上显示时间，允许每隔预定周期以语音通知时间，本发明可以向用户提供使用便利。尽管示出和描述本发明很少的实施例，但是本领域技术人员应当理解在不脱离本发明的原理和精神范围内可以对这些实施例进行各种变化，本发明的范围由权利要求及其等价范围限定。
权利要求
1.一种便携式码识别语音合成输出设备，包括读取器，用于读取压缩格式的数码图像；播放器，用于解码读取器读取的信息并以特定的语音输出解码的结果，其中播放器通过有线/无线网络接口装置连接到读取器，其中读取器包括图像扫描装置，用于抓取压缩数码图像；和有线/无线网络接口装置，用于向播放器发送抓取的数据，其中播放器包括网络接口装置，用于向读取器或计算机发送数据以及从读取器或计算机接收数据；语音合成处理控制装置，用于根据程序存储器装置中存储的程序处理来解码根据操作模式通过读取器输入的数据，且用于根据程序存储器装置中存储的语音合成值执行已解码的数据的语音合成处理以生成语音合成数据，或者根据程序存储器装置中存储的语音合成值执行用于数据存储的存储器装置中存储的文本文件的语音合成处理以生成语音合成数据；程序存储器装置，包括设置了处理的程序，其中，一个处理解码通过读取器输入的数据并根据每个存储数据的语音值合成语音，另一处理执行操作模式转换和操作状态语音向导；数据存储存储器装置，用于存储已解码的数据(文本文件)；语音输出装置，用于以语音格式输出语音合成数字信息，其中通过语音合成处理装置生成语音合成数字信息；用户键输入装置，用户通过该装置调节音量和模式转换从而操作播放器；显示装置，用于显示读取器和播放器的操作状态以及显示播放器的文件搜索屏幕；电能控制装置，用于向播放器提供驱动电能；和数据转换装置，用于将输入到语音合成处理控制装置的数据转换成数字数据，以及将语音合成处理控制装置输出的语音数据转换成模拟数据。
2. 根据权利要求1所述的设备，还包括计算机网络接口装置，用于通过网络连接计算机以管理播放器中的数据和从计算机接收特定的文本信息。
3. 根据权利要求1所述的设备，其中语音合成处理控制装置包括字符转换单元，用于根据程序存储器中存储的解码信息解码通过读取器抓取的数码图像，并将解码结果转换为字符(文本)；语音合成单元，用于根据程序存储器中设置的语音合成信息将转换的字符信息转换为语音信息；模式设定单元，用于根据用户的选择设置播放器的操作模式，其中程序存储器包括程序存储单元，用于存储关于解码压缩数字图像的解码信息和已解码的数据的语音合成处理程序，以及存储关于模式转换和操作状态的程序输出向导消息。DB存储单元，用于存储执行从已解码的字符数据(文本)向语音转换 (TTS)的数据。
4. 根据权利要求3所述的设备，其中DB存储单元配置为进一步包括用户定义数据存储单元，其中存储用户设置的符号、图形、字符的语音转换翁:据。
5. 根据权利要求3所述的设备，其中DB存储单元配置为可以进一步包括标签信息存储单元，其中标签信息指示输出包含数码图像的语音时的音色、语速、语调。
6. 根据权利要求3所述的设备，其中语音输出单元包括用于放大语音输出数据的装置；和扬声器(208A)或者耳机插孔(208B )，向外界输出放大的语音输出数据。
7. 根据权利要求1所述的设备，其中网络接口装置用于执行USB通信接口。
8. 根据权利要求1所述的设备，还包括扩展存储器槽单元，使得根据情况需要使用扩展的数据存储器。
9. 根据权利要求1至5中任一项所述的装置，其中语音合成处理控制装置根据用户通过用户键输入装置选择执行的模式转换或者是否连接了读取器的确定来确定其^t喿作模式。
10. 根据权利要求9所述的设备，其中语音合成处理控制装置根据给予优先权的用户通过用户键输入装置的选择确定其操作模式。
11. 根据权利要求1所述的设备，其中语音合成处理控制装置从解码信息读取净艮头信息，从读取的结果识别关于版权的文件信息，在数据存储存储器的特定指定区域(文件夹)中存储识别结果，以及设置使得连接了计算机时计算才几不能访问该区i或。
12. 根据权利要求1所述的设备，其中语音合成处理控制装置执行包括抓取播放模式执行处理和播放模式执行处理的语音合成处理控制，其中抓取播放模式执行处理包括确定处理，其中确定是否输入了用户模式转换键的状态；当根据确定结果选择了抓取播放模式时的读取器连接确定处理，其中以语音输出通知选择了抓取播放模式的向导消息，然后执行是否连接了读取器的确定；当根据读取器连接确定处理的确定结果确定未连接读取器时的读取器状态向导消息输出处理，其中输出通知读取器的连接状态的向导消息；当连接了读取器时的字符转换处理，其中接收抓取的图像并将接收的图像解码为文本；语音信息生成处理，其中使用设置的语音合成值由根据用户设定的语音输出模式所转换的字符生成待输出的语音信息；语音输出处理，用于以语音向外界输出生成的语音信息，其中播放模式执行模式包括当选择了播放模式时的播放选择处理，其中以语音输出向导消息，通知选择了播放模式，显示搜索屏幕从而可以搜索存储的文件，并以语音输出用于用户指定的文件夹和文件的向导消息；语音信息生成处理，其中使用用户选择的用于播放文件的用于文件的语音合成值生成辨，输出的语音信息；语音输出处理，用于以语音向外界输出生成的语音信息。
13. 根据权利要求12所述的设备，其中语音合成处理控制装置的处理还包括复位确定处理，用于确定是否第一电源为开启；播放模式执行处理，执行使得根据复位确定处理的结果，在第一电源开启时不管是否连接了读取器的状态都进行通知执行了播放模式的向导消息。
14. 根据权利要求12所述的设备，其中抓取播放模式包括以下处理，其中根据读取器是否连接了的状态自动执行抓取播放模式，并可执行在输入用户模式转换键时执行用户指定的对应模式的操作模式转换。
15. 根据权利要求12所述的设备，其中在通过用户停止键输入完成抓取播放时抓取播放模式进一步包括步骤确定是否是自动存储模式的状态；完成处理，其中在处于自动处理模式时在数据存储存储器中存储已解码的文本文件，在不是自动存储模式时执行用户是否存储了已解码的文本文件的状态确认，并根据用户的选择存储已解码的文本文件。
16. 根据权利要求1所述的设备，其中播放器还进一步包括MP3文件的解码装置，以提供MP3文件播放功能。
17. 根据权利要求1所述的设备，其中播放器进一步包括无线电接收装置和无线电调谐器。
18. 根据权利要求1所述的设备，还包括编码器，用于将语音输入装置输入的模拟语音数据转换成数字数据以存储特定的压缩文件(MP3)。
全文摘要
本发明涉及码识别语音输出设备，其中识别预定压缩类型的数码图像，并将识别的图像转换成向外界输出的语音。该装置包括作为扫描仪单元的读取器，用于识别压缩数码图像；播放器，用于处理读取器读取的数码图像，并将处理的数码图像转换成向外界输出的语音，其中读取器和播放器配置成能够彼此分离。本发明还提供了一种码识别语音输出设备，支持各种功能并对全部菜单和操作状态提供语音向导功能，支持用于视力残疾人、文盲、老年人等的功能，从而提高用户便利性。
文档编号G10L13/04GK101128863SQ200580048684
公开日2008年2月20日申请日期2005年3月10日优先权日2005年2月25日
发明者朴敏哲申请人:Ad情报通信株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朴敏哲
技术所有人：维视雅株式会社
我是此专利的发明人

上一篇：用于媒体信号的压缩域编码设备和方法
上一篇：防翻倒用片材的制作方法