字幕提取装置的制作方法

文档序号：7909142阅读：179来源：国知局

专利名称：字幕提取装置的制作方法
技术领域：
本发明涉及一种从电视、录像等的视频信号中提取字幕信息并将此字幕信息输出的字幕提取装置。
另一方面，作为视频一部分所嵌入的叠印字幕是制作者能够容易插入信息的装置，其在很多的播放节目和视频媒体中普及。从而，利用作为视频一部分所嵌入的字幕信息在当前非常重要。
字幕上一般包含概括视频内容的信息，所以对弱视者等的轻度视力障碍者以及听力障碍者是重要的信息来源。因此，发明了在文字播放中，将字幕中的文字数据(字幕数据)提取出来，再通过其他终端将该字幕内容放大显示的装置(例如，日本专利公开第2001-024964号披露的装置)。另一方面，正在以叠印字幕为基础，探讨研究视频的检索及分类的方法。例如，在日本专利公开第1995-192003号公报或日本专利公开第1998-308921号公报中批露了将存储的视频中所包含的字幕作为视频的索引来检索视频的技术。另外，日本专利公开第1998-092052号公报中公开了特定节目识别装置的技术，该技术可以保持广告及节目时间变更等的文字及图像的模式，提取图像中包含的广告的标题和节目时间变更等的文字模式，并与上述保持的模式进行比较，从而识别广告(特定节目)，所以能够录制视频内容而删除该广告，能够观看那些内容而跳过该广告。
不过，虽然人们都期待能够将字幕中所含的信息灵活运用，但是，现阶段仍未提出有效的方法和装置，可以将实际播放或重播的视频中所嵌入的叠印字幕进行实时文字识别，并将识别的字幕信息本身多样有效地利用。
以往，为了检索图像或删除广告等，字幕信息的利用方法被特定化，没能得到普遍的利用。另外，观众虽然可以利用叠印字幕中的信息进行各种活动(例如，电话购物时可以拨打画面中显示的电话号码等)，但是，现实生活中，尤其对于视力、听力障碍者来说就无法参与这样的活动了。
根据本发明的字幕提取装置是一种从视频信号中提取字幕信息的字幕提取装置，其特征在于包括字幕提取单元，其从实际播放或者重播的视频信号中提取叠印字幕；文字识别单元，其将提取的含在叠印字幕中的字符串进行实时识别，并输出包含与识别字符串相对应的字符代码列的文字信息；以及显示单元，其按照该文字信息显示该字符串。
据此可以将嵌入在图像中的字幕信息本身实时提供给使用者。
在根据本发明的字幕提取装置中，该各单元可以全部内装在一个机箱里。
这样，全部功能内装于一个机箱中，使用者使用非常方便。
在根据本发明的字幕提取装置中，还可包括输入输出单元，其可与外部设备与/或外部通信环境连接。
据此可充分利用外部设备与/或外部通信环境。
在根据本发明的字幕提取装置中，还可包括文字处理单元，其将用于对该识别的文字进行扩大、变形、上色等处理的附加信息添加在该文字信息上。
据此，该显示单元将经过该文字处理单元的附加功能扩大、变形、上色处理过的文字信息中的字符串显示出来，为使用者提供容易识别的字幕信息。
根据本发明的字幕提取装置，与显示基于该视频信号的视频的电视接收机等的显示装置是分体的。
因为根据本发明的字幕提取装置与电视接收机等显示装置是分体设置的，本发明的字幕提取装置可配置在使用者的身边，这样既能在使用者身边输出字幕信息，由能为轻度视力障碍者等提供方便。
此外，在根据本发明的字幕提取装置中，还可包括声音合成单元，其将由该文字识别单元识别的字符代码进行声音合成，并输出合成的声音信号。
这样通过配备该声音合成单元，即使使用者是重度的视力障碍者，也可利用声音为其提供字幕信息。
此外，在根据本发明的字幕提取装置中，还包括颜色信息提取单元，其获取叠印字幕中的颜色信息；该声音合成单元是根据由该颜色信息提取单元取得的叠印字幕的颜色信息，或者根据由该文字识别单元识别的、预先插入叠印字幕中的文字·记号，区分男女、成人、孩子、老人等，进行声音合成。
这样，合成后的声音就不是单纯的没有质感的声音。而且用叠印字幕颜色的不同或特定的文字·记号区分男女、成人、孩子、老人等，视频制作者一插入含有这些颜色或文字·记号的叠印字幕，本发明的字幕提取装置可用合成的声音表现出男女、成人、孩子、老人的不同，为收看收听字幕信息的使用者提供帮助。
在根据本发明的字幕提取装置中，该声音合成单元可以以显示叠印字幕时输出的声音特征类似的特征进行声音合成。
这样，不仅合成后的声音不是单纯的无质感的声音，而且由于与演出者的声音特征类似，可以给使用者提供自然的收听感受。
在根据本发明的字幕提取装置中，其将该文字信息提供到盲文输出单元上，输出盲文。
通过盲文输出可为重度视力障碍者提供帮助。
在根据本发明的字幕提取装置中，该盲文输出单元具有盲文键盘。
这样就可以为重度视力障碍者提供帮助。
在根据本发明的字幕提取装置中，该盲文输出单元可具有盲文打印机。
由此为重度视力障碍者提供帮助。
在根据本发明的字幕提取装置中，还可包括判断单元，其通过检索由该文字信息指定的关键词，自动判断出现该关键词的画面。
据此可以自动查出出现想查找的关键词的画面。
在根据本发明的字幕提取装置中，还可包括控制单元，其将含有由所述判断单元查出的所述关键词的画面的出现时刻记录在记录单元上。
据此可提供这样的帮助，根据查出的画面出现的时刻确定该查出的画面。
在根据本发明的字幕提取装置中，还可包括控制单元，其将含有由所述判断单元查出的所述关键词的画面录制在录像单元上。
据此，当出现含有被指定(登记)的关键词的视频内容时，因为可自动录像，所以使用者非常关心的信息即使没有看到或看的不完全，也可以重新观看，对使用者来说是很大的帮助。
在根据本发明的字幕提取装置中，还可包括控制单元，其根据查出的预先设定的字符串，控制用于输出文字信息的单元。
这样，对用于输出文字信息的单元，根据查出的字符串可进行各种控制。
在根据本发明的字幕提取装置中，若该预先设定的字符串是节目开始字符串及节目结束字符串，该控制单元响应该字符串对录像单元下达预先设定节目录像或者节目录像的指令。
据此，只要电台将上述字符串作为字幕信息插入，使用者只要利用该字幕信息无需对任何录像单元进行操作设定，就可进行节目录像(或预先设定录像)。
在根据本发明的字幕提取装置中，若该预先设定的字符串是地址或邮政编码，该控制单元将该地址或邮政编码通过打印单元进行打印。
当字幕中显示的地址或邮政编码对使用者有用时，通过这样的控制方式，自动将显示出的地址或邮政编码并通过打印单元打印出来。
在根据本发明的字幕提取装置中，若该预先设定的字符串是邮政编码，当查出该邮政编码时，该控制单元从与邮政编码相对应的地址数据库中检索并获得与该邮政编码对应的地址，并将获得的地址通过打印单元进行打印。
这样仅通过检索出的邮政编码即可自动打印出对应的地址，非常方便使用者使用。
在根据本发明的字幕提取装置中，在可与网络连接的同时，若该预先设定的字符串是URL，当查出该URL时，该控制单元存取与该URL(Uniform Resource Locator)对应的网页，将该网页的内容显示在该显示单元上。
这样即可自动参考互联网上的相关信息。
在根据本发明的字幕提取装置中，在可与电话连接的同时，如该预先设定的字符串是电话号码，当查出该电话号码时，该控制单元呼叫该电话号码的电话机。
字幕中显示的电话号码如对使用者有用(例如电话购物等)，则可利用这种控制方式自动接通所显示的电话号码的对方。
图2是同一实施例的字幕提取装置与其他设备相连接的实例示意图。
图3是同一实施例的字幕提取装置的配置实例示意图。
图4是为了说明利用同一实施例的字幕提取装置进行录像的实例示意图。

图1是根据本发明的一个实施例的字幕提取装置1的构成方框图。图2是同一字幕提取装置与其他设备相连接的实例示意图。
如图2所示，本实施例的字幕提取装置1与电视接收机2等的显示装置是分体的，该字幕提取装置1既与各种外部设备连接，又与互联网、电话网等的通信网络连接。
如图1所示，符号1a表示调谐部分，其接收播放接收信号/视频重播信号，对选择的节目频道(或输入信号)的视频和音频信号进行分离·输出。
符号1b表示字幕提取部分，从调谐部分1a输出的视频信号中提取出字幕部分(叠印字幕)。叠印字幕通常叠印显示在图像的下半部分，在具体实施例中，将提取这部分。然后，将提取出的字幕信息数字化，再输送至下面的文字识别部分1c及颜色信息提取部分1k。此外，输送至文字识别部分1c的数据对叠印字幕的亮度信号以特定的阈值为基准转换成二进制。
符号1c表示文字识别部分，其将由字幕提取装置提取出的字幕部分所包含的字符串进行实时文字识别，并输出含有与识别的字符串相对应的字符代码列的文字信息。此外，记号也作为文字进行识别。文字识别部分1c将经字幕提取部分1b提取的字幕叠印部分中超过规定水平亮度的部分等同于文字进行文字识别。而且，也可从整个画面中进行文字识别。
符号1d表示文字识别部分1c进行文字识别时所使用的识别字典DB。此外，文字识别部分1c是利用以往公知的文字识别技术设计完成的。
符号1e表示用于与外部设备和外部通信环境连接的输入输出部分。该输入输出部分1e具有用于与外部设备连接所需的接口功能，可符合连接的外部设备所要求的规格。此外，还具有用于与电话网15连接的电话机的功能。并且具有依照与互联网14连接的TCP/IP标准的通信机能。此外，输入输出部分1e也可对内置于字幕提取装置1中的显示部分1f进行显示控制。这里所说的外部设备是指盲文键盘10、盲文打印机11、录像机12、打印机13等，所说的通信环境(通信网络)是指互联网14及电话网15。此外，显示部分1f为液晶显示装置等的显示装置，还具有触摸板等的输入装置，可实现后面提到的输入设定关键词等功能。
符号1g表示文字处理部分，对经文字识别部分1c识别出的字符串中所含的文字进行扩大、变形、上色等处理时，将用于此的附加信息(特定代码)添加在从文字识别部分1c中输出的文字信息上。在此被处理的文字由显示部分1f将扩大、变形、上色后的状态显示出来。此外，当一个画面无法显示所有字符串时，将依次滚屏显示。
符号1h表示声音合成部分，将文字识别出的字幕中所含字符串合成声音从扬声器1i中输出。此外，在叠印字幕中插入文字识别部分1c识别出的预先设定的文字·记号(这也是后面提到的关键词的一种)时，根据该关键词可以合成区分男女、成人、孩子、老人等的男女差别以及年龄差别的声音。实现此功能时，从下面的关键词判断部分1l发出该关键词，基于该关键词合成上述声音，但该关键词本身不会被合成声音。而且，在下述的从颜色信息提取部分1k接收了颜色信息的情况下，则可以用与预先设定的颜色信息相对应的音质(例如，红色用于女性的音质，黑色用于男性的音质等)合成同样效果的声音。
此外，还可以使用与显示叠印字幕时输出的声音特征相类似的特征音质，进行声音合成。此时，通过分析输入的声音信号的音质特征(频率成分等)，从下列的声音DB·1j中选择出与该音质最接近的音质合成声音。在这种情况下，在外国电影中，显示日语字幕输出的声音是女演员的声音时，可从该声音的特征出发合成女性音质的声音。也就是说可以将外国电影自动配音复制成日语。这样连视力障碍者都能欣赏外国影片，健全人也不必一个一个读字幕了。
利用以上的变化音质功能，即使合成一些容易产生无质感效果的声音，也多少会使其具有个性特点(单一音质或无质感的声音会使听众感到乏味)。此外，节目制作者可以根据自己的意图选择·使用叠印字幕中字符串的颜色和特定的文字·记号。即节目制作者可明确设定字幕提取装置1输出的音质。例如，播放依据新闻、解说的字幕合成的声音时可以按照自己的意图区分使用不同的音质。具体来说，儿童节目选用年轻女性的音质、政治节目选用男性音质，作到节目不同使用的音质不同。而且，根据显示叠印字幕是输出的声音特征选择音质时，节目制作者无须在叠印字幕中插入用于决定音质的上述文字·记号。
此外，声音合成部分1h可以使用以往公知的声音合成技术实现。
符号1j表示声音DB(数据库)存储用于合成声音的下列数据。利用该声音DB·1j可以事先存储各种区分男女、年龄不同的典型的音质数据(组成声音的频率成分的数据等)，合成符合上述各条件的声音时可选用不同的音质。此外，还可选择与显示叠印字幕时输出的声音特征类似的音质。而且，该声音DB·1j上也存储有与上述各条件(关键词、声音特征)和音质数据相对应的表，可依据条件选择对应的音质数据。
符号1k表示颜色信息提取部分，将由字幕提取部分1b提取的叠印字幕一部分的字符串的颜色信息提供到声音合成部分1h上，这里的颜色信息是表示3原色亮度分布的信息。
符号1l表示关键词判断部分，先判断利用文字识别部分1c识别出的字符串中是否有关键词DB·1m里存储的关键词，再自动判断出现该关键词的画面。然后根据关键词向声音合成部分1h或控制部分1n下达找到该关键词及相应画面的指令。接着关键词DB·1m对应于各关键词，对下述的控制部分1n依据各关键词(包含地址、邮政编码、URL、电话号码等)应实施控制处理的内容，进行存储。
符号1n表示控制部分，当由关键词判断部分1l查出特定的关键词后并接收到来自关键词判断部分1l的关键词等(包含地址、邮政编码、URL、电话号码等)的指令时，根据该关键词参照关键词DB·1m，实施下列相应的控制措施。
具体来说，控制部分1n，将查出关键词的画面出现时刻(开始时刻)记录在记录部分1o中。此外，当关键词判断部分1l查出预先登记的关键词时，从查出该关键词的画面开始在规定时间内由录像机12对视频、音频进行录像。而且，可以对从查出关键词的画面开始到识别出与查出的关键词不同的字符串时刻为止的信息进行录像。图4表示一录像实例。在这个实例中关键词是“TARO”(太郎)，当叠印字幕中显示“TARO”这个关键词时，立即就会查出，从查出这个关键词时起(TARO出场时)，在规定时间内对出场以后的画面进行录像。
此外，如是以节目开始及节目结束的字符串，进行录像或预先设定录像开始·结束的字符串作为关键词出来时，可根据该字符串向录像机12发出预先设定节目录像或开始节目录像的指令。该节目开始的字符串可以使用如节目名称及“开始”等字符串，节目结束的字符串可使用如节目名称及“剧终”等字符串。
而且，当查出地址或邮政编码的关键词时，控制部分1n可控制打印机13将该地址及邮政编码打印出来。如关键词仅是邮政编码，则可依据此邮政编码通过符号1p表示的地址DB检索取得对应的地址，通过打印机13将该地址打印出来。地址DB·1p是由邮政编码及与该邮政编码对应的地址构成的数据库。如查出的关键词是URL(Uniform Resource Locator)则由字符代码的列(文字信息)中提取出该URL对应的字符串，指示输入输出部分1e存储此URL对应的网页，并通过显示部分1f将该网页内容显示出来。
如查出的关键词是电话号码，同样亦可提取出该电话号码对应的字符串，指示输入输出部分1e呼叫该号码的电话机。此外，依据地址或邮政编码是否由正规使用的字符串构成，判断该字符串是地址亦或是邮政编码。依据是否是以[http//]开始的固定格式判断字符串是否是URL。依据构成字符串的字符是否是数字，是否含有划分局号的连字符，是否使用正规的局号等标准判断字符串是否是电话号码。
这里，识别字典部分DB·1d、声音DB·1j、关键词DB·1m、记录部分1o、地址DB·1p都是由EPROM(可擦可编程只读存储器)、硬盘等的非易失性的记录装置构成的。
此外，利用由文字识别部分1c、文字处理部分1g、声音合成部分1h、颜色信息提取部分1k、关键词判断部分1l、控制部分1n、存储器及CPU(中央处理装置)等构成的处理部分(无图示)，通过在存储器中加载实现各部分功能的程序来实现上述各种功能。
如此构成的字幕提取装置1与所述的电视接收机2是分体的。因此，可将该字幕提取装置安装在使用者身边。也就是说，利用本实施例的字幕提取装置1可以在使用者身边输出(显示或输出声音)显示叠印字幕中的字幕信息(参照图3)。这样，字幕提取装置1实现上述各种自动控制，方便使用者(尤其是残障者)使用。
下面，就本实施例的字幕提取装置1的工作流程概括地说明如下。
字幕提取装置1也可输入与电视接收机2一样，通过天线3接收的播放接收信号(或放像机(未图示)的视频重播信号)。经调谐部分1a分离·输出从接收信号中选择出的频道(或输入信号)的视频和音频信号。视频信号输送至字幕提取部分1b，音频信号输送至声音合成部分1h。
字幕提取部分1b接收视频信号后，提取出视频内容中插入的叠印字幕部分，将其数字化，再将该数据输送至文字识别部分1c及颜色信息提取部分1k。
文字识别部分1c，接收字幕提取部分1b输送的字幕数据后，识别出叠印字幕的字符串，将该字符代码输送至文字处理部分1g、声音合成部分1h和关键词判断部分1l。
文字处理部分1g，依据预先设定将用于文字处理(扩大、变形、上色等)的附加信息添加在由字符代码构成的文字信息上。然后经由输入输出部分1e通过显示部分1f将处理后的字符串显示出来。
一方面，关键词判断部分1l接收文字识别部分1c输送的文字方式后，查出已登记的关键词，可自动判断(确定)含有该关键词的画面。然后，依照该关键词向声音合成部分1h或控制部分1n下达显示该关键词及相应画面的指令。
另一方面，声音合成部分1h，依据所接收的文字识别部分1c传来的字符代码合成声音，并经扬声器li输出，还可依据由关键词判断部分1l传来的预先设定的关键词，或字幕中包含的文字颜色(该颜色信息经由颜色信息提取部分1k提供的)，改变音质后输出。
此外，控制部分1n接收关键词判断部分1l传来的关键词(规定的字符串)等，依照该关键词可实现上述各种预先设定的控制功能。
以上就字幕提取部分1的工作流程进行了简单说明。
此外，将可实现图1中的文字识别部分1c、文字处理部分1g、声音合成部分1h、颜色信息提取部分1k、关键词判断部分1l、控制部分1n的各种功能的程序，记录在计算机可读记录介质当中，通过计算机系统读取运行该记录介质中记录的程序，从而可实现字幕提取装置1的各项处理工作。这里所说的“计算机系统”是指OS和外部设备等硬件。
这里所说的“计算机可读记录介质”包括软盘、光盘、ROM、CD-ROM等可移动介质、计算机系统内置的硬盘等的存储装置。进一步说，所说的“计算机可读记录介质”也包括通过互联网等的网络和电话线路等的通信线路，作为服务商和客户发送程序时的计算机系统内部的易失性存储器(RAM)，其可保持恒定时间的程序。
此外，上述程序可由将该程序存储至记录装置的计算机系统，通过传输介质或经传输介质的发射波传送至其他计算机系统。这里所谓传输程序的“传输介质”是指互联网等网络(通信网络)、电话线路等通信线路(通信线)，具有传输信息功能的介质。
上述程序也可以只实现所述功能的一部分。而且，也可是与上述计算机系统中已有记录的程序组合在一起实现所述功能，即勘误文件(勘误程序)。
以上依照附图对本发明的实施例进行了详细说明，实际的构造并不限于本实施例，也包含不偏离本发明主题的其他构造。
正如以上的详细说明，利用本发明从实际播放或重播的视频信号提取叠印字幕，再将叠印字幕中包含的字符串进行实时识别，输出包含与该字符串对应的字符代码的文字信息，可以广泛应用于识别字幕中的文字信息。
此外，利用本发明亦可方便容易地利用外部设备及外部通信环境。
利用本发明对该文字信息依据附加功能将识别出的文字进行扩大、变形、上色等等处理。因此，可以为视觉障碍者提供符合其要求的字幕信息的视觉效果。
此外，因本发明与电视机接收机等的显示装置是分体的，可将本发明安装在使用者身边，使用者在身边即可完成所有操作。
利用本发明可以将字幕信息合成声音，而且可依据条件改变音质后进行输出，不仅可以提供具有视觉效果的字幕信息，还可提供具有声音效果的字幕信息。为健康者以及残障者提供高质量的服务。
此外，利用本发明可实现依据关键词或规定的字符串，进行录像、存储互联网上的网页和自动接通电话等功能，尤其对视觉、听觉障碍者，能帮助他们完成这些活动。
尽管本发明已经参照附图和优选实施例进行了说明，但是，对于本领域的技术人员来说，本发明可以有各种更改和变化。本发明的各种更改、变化和等同物由权利要求书的内容涵盖。
附图标记说明1 字幕提取装置2 电视接收机3 天线1a 调谐部分1b 字幕提取部分(字幕提取单元)
1c 文字识别部分(文字识别单元)1d 识别字典DB1e 输入输出部分(输入输出单元)1f 显示部分(显示单元)1g 文字处理部分(文字处理单元)1h 声音合成部分(声音合成单元)1i 扬声器1j 声音DB1k 颜色信息提取部分(颜色信息提取单元)1l 关键词判断部分(关键词判断单元)1m 关键词DB1n 控制部分(控制单元)1o 记录部分(记录单元)1p 地址DB10 盲文键盘(盲文输出单元)11 盲文打印机(盲文输出单元)12 录像机(录像单元)
13 打印机(打印单元)14 互联网15 电话网
权利要求
1.一种从视频信号中提取字幕信息的字幕提取装置，其特征在于包括字幕提取单元，其从实际播放或者重播的视频信号中提取叠印字幕；文字识别单元，其将提取的含在叠印字幕中的字符串进行实时识别，并输出包含与识别字符串相对应的字符代码列的文字信息；以及显示单元，其按照所述文字信息显示所述字符串。
2.根据权利要求1所述的字幕提取装置，其特征在于，所述各单元全部内装在一个机箱里。
3.根据权利要求1所述的字幕提取装置，其特征在于，还包括输入输出装置，其可与外部设备与/或外部通信环境连接。
4.根据权利要求1所述的字幕提取装置，其特征在于，还包括文字处理单元，其将用于对所述识别的文字进行扩大、变形、上色等处理的附加信息添加在所述文字信息上。
5.根据权利要求4所述的字幕提取装置，其特征在于，与显示基于所述视频信号的视频内容的电视接收机等的显示装置是分体的。
6.根据权利要求1所述的字幕提取装置，其特征在于，还包括声音合成单元，其将由所述文字识别单元识别的字符代码进行声音合成，并输出合成的声音信号。
7.根据权利要求6所述的字幕提取装置，其特征在于，还包括颜色信息提取单元，其获取叠印字幕中的颜色信息，其中，所述声音合成单元是根据由所述颜色信息提取单元取得的叠印字幕的颜色信息，或者根据由所述文字识别单元识别的、预先插入叠印字幕中的文字·记号，区分男女、成人、孩子、老人等，进行声音合成。
8.根据权利要求6所述的字幕提取装置，其特征在于，所述声音合成单元可以以显示叠印字幕时输出的声音特征类似的特征进行声音合成。
9.根据权利要求3所述的字幕提取装置，其特征在于，其将所述文字信息提供到盲文输出单元上以输出盲文。
10.根据权利要求9所述的字幕提取装置，其特征在于，所述盲文输出单元具有盲文键盘。
11.根据权利要求9所述的字幕提取装置，其特征在于，所述盲文输出单元具有盲文打印机。
12.根据权利要求3所述的字幕提取装置，其特征在于，还包括判断单元，其通过检索由所述文字信息指定的关键词，自动确定出现该关键词的画面。
13.根据权利要求12所述的字幕提取装置，其特征在于，还包括控制单元，其将含有由所述判断单元查出的所述关键词的画面的出现时刻记录在记录单元上。
14.根据权利要求1 2所述的字幕提取装置，其特征在于，还包括控制单元，其将含有由所述判断单元查出的所述关键词的画面录制在录像单元上。
15.根据权利要求3所述的字幕提取装置，其特征在于，还包括控制单元，其响应查出的预先设定的字符串，控制用于输出文字信息的单元。
16.根据权利要求15所述的字幕提取装置，其特征在于，若所述预先设定的字符串是节目开始字符串及节目结束字符串，所述控制单元依据该字符串对录像单元下达预先设定节目录像或者节目录像的指令。
17.根据权利要求15所述的字幕提取装置，其特征在于，若所述预先设定的字符串是地址或邮政编码，所述控制单元将所述地址或邮政编码通过打印单元进行打印。
18.根据权利要求17所述的字幕提取装置，其特征在于，若所述预先设定的字符串是邮政编码，当查出所述邮政编码时，所述控制单元从与邮政编码相对应的地址数据库中检索并获得与该邮政编码对应的地址，并将获得的地址通过打印单元进行打印。
19.根据权利要求15所述的字幕提取装置，其特征在于，在可与网络连接的同时，若所述预先设定的字符串是URL(UniformResource Locator)，当查出所述URL时，所述控制单元存取与所述URL对应的网页，将所述网页的内容显示在所述显示单元上。
20.根据权利要求15所述的字幕提取装置，其特征在于，在可与电话连接的同时，如所述预先设定的字符串是电话号码，当查出所述电话号码时，所述控制单元呼叫所述电话号码的电话机。
全文摘要
本发明提供了一种从视频信号中提取字幕信息的字幕提取装置，其不仅可提供包含在视频内容中的字幕信息本身，还能利用该字幕信息帮助残障者。该字幕提取装置包括字幕提取单元(1b)，其从实际播放或重播的视频信号中提取叠印字幕；文字识别单元(1c)，其实时识别提取的叠印字幕中包含的字符串，并输出含有与识别的字符串对应的字符代码的文字信息；以及显示单元(1f)，其基于文字信息将叠印字幕包含的字符串显示出来。
文档编号H04N5/445GK1461146SQ0312347
公开日2003年12月10日申请日期2003年5月14日优先权日2002年5月16日
发明者长石道博, 山田光穗, 坂井忠裕, 清水俊宏, 河合直树申请人:精工爱普生株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：长石道博;山田光穗;坂井忠裕;清水俊宏;河合直树
技术所有人：精工爱普生株式会社
我是此专利的发明人

上一篇：支持亚洲语言的双语主叫识别的制作方法
上一篇：简易型车用导航方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。