浏览多媒体文件的系统及方法_2

文档序号:8258584阅读:来源:国知局
多媒体教学文件的影像时间信息,并记录影像文字信息对应的影像时间信息。影像文字转换模块140所取得的每一个影像文字信息都会具有至少一个相对应的影像时间信息,其中,影像时间信息可以包含从多媒体教学文件中转换出相对应的影像文字信息的画面开始被播放的时间,这个时间在本发明中被称为「起始播放时间」,影像时间信息也可以包含在多媒体教学文件播放时持续显示与被转换出的影像文字信息对应的画面的时间,这个时间在本发明中被称为「持续播放时间」,实际上,影像时间信息也可以同时包含起始播放时间与持续播放时间,本发明并没有特别的限制。
[0038]语音文字转换模块150负责对文件加载模块110所加载的多媒体教学文件中的声音信号进行语音文字转换,藉以在语音文字转换后取得一个或多个数据,在本发明中,语音文字转换模块150在转换后所取得的数据被称为「声音文字信息」。
[0039]一般而言,语音文字转换模块150可以使用如语音转文字(Speech-to-Text,STT)等语音辨识技术由文件加载模块110所加载的多媒体教学文件中辨识出声音文字信息,也就是说,语音文字转换模块150所转换出的声音文字信息为由文字或符号所组成的信息。但语音文字转换模块150转换产生声音文字信息的方式并不此为限。
[0040]语音文字转换模块150也负责判断进行语音转换后所取得的声音文字信息对应到文件加载模块110所加载的多媒体教学文件的声音时间信息,并记录所判断出的与声音文字信息对应的声音时间信息。与影像文字转换模块140相似的,语音文字转换模块150所取得的每一个声音文字信息都会具有至少一个相对应的声音时间信息,其中,声音时间信息可以包含相对应的声音文字信息在多媒体教学文件中开始被播放的时间,这个时间在本发明中同样被称为「起始播放时间」,声音时间信息也可以包含在多媒体教学文件播放时持续发出与被产生的声音文字信息对应的声音所经过的时间,这个时间在本发明中也同样被称为「持续播放时间」,声音时间信息也可以同时包含起始播放时间与持续播放时间,本发明并没有特别的限制。
[0041]索引文件产生模块160负责产生索引文件。索引文件产生模块160所产生的索引文件可以是纯文字的数据、也可以是数据库中的数据表的数据,本发明没有特别的限制,凡数据格式可以被用来对文件的内容进行查找的文件都可以作为本发明所提的索引文件。
[0042]索引文件产生模块160所产生的索引文件包含播放文字信息以及与播放文字信息对应的起始播放时间信息。其中,播放文字信息是由影像文字转换模块140转换产生的所有影像文字信息以及语音文字转换模块150转换产生的所有声音文字信息组成,起始播放时间信息则是由与影像文字转换模块140转换产生的影像文字信息对应的影像时间信息以及与语音文字转换模块150转换产生的声音文字信息相对应的声音时间信息组成。一般而言,索引文件产生模块160会将播放文字信息以及相对应的起始播放时间信息作为一笔数据写入所产生的索引文件中。
[0043]输入模块170负责输入关键字词。
[0044]播放数据读取模块180负责比对输入模块170所输入的关键字词以及索引文件产生模块160所产生的索引文件,并依据索引文件中与关键字词对应的影像文字信息,由索引文件中读取与播放文字信息对应的影像时间信息,以及依据索引文件中与关键字词对应的声音文字信息,由索引文件中读取与声音文字信息对应的声音时间信息。其中,与关键字词对应的影像文字信息表示影像文字信息包含关键字词、或影像文字信息与关键字词完全相同或部分单字相同,但本发明并不以此为限。
[0045]在部分的实施例中,播放数据读取模块180可以在索引文件产生模块160所产生的索引文件中搜寻与输入模块170所提供输入的关键字词对应的影像文字信息以及声音文字信息(在本发明中,也使用「播放文字信息」表示影像文字信息以及声音文字信息),例如,比对关键字词与索引文件中所记录的影像文字信息以及声音文字信息,藉以搜寻包含关键字词的播放文字信息或与关键字词相同的播放文字信息,播放数据读取模块180也可以在搜寻到与关键字词对应的播放文字信息后,读取与关键字词对应的播放文字信息对应的影像时间信息以及声音时间信息(在本发明中,也使用「播放时间信息」表示影像时间信息以及声音时间信息)。
[0046]文件播放模块190负责依据播放数据读取模块180所读取出的播放时间信息播放文件加载模块110所加载的多媒体教学文件。
[0047]在部分的实施例中,文件播放模块190可以由播放数据读取模块180所读取出的播放时间信息中的起始播放时间开始播放多媒体教学文件,例如,起始播放时间为2分8秒,文件播放模块190便会由多媒体教学文件的2分8秒处开始播放多媒体教学文件,文件播放模块190也可以较起始播放时间更早的时间开始播放多媒体教学文件,例如,文件播放模块190可以向前7秒,也就是从多媒体教学文件的2分I秒处开始播放多媒体教学文件。
[0048]在部分的实施例中,文件播放模块190也可以依据播放数据读取模块180所读取出的播放时间信息中的持续播放时间播放多媒体教学文件,例如,当持续播放时间为4分13秒,则当多媒体教学文件由2分I秒处开始播放时,当文件播放模块190播放到多媒体教学文件的6分14秒处便会停止播放多媒体教学文件。
[0049]接着以一个实施例来解说本发明的运作系统与方法,并请参照「图2」本发明所提的浏览多媒体文件的方法流程图。
[0050]首先,文件加载模块110可以加载多媒体教学文件(步骤202)。在本发明中,假设多媒体教学文件被储存于执行本发明的装置中,则文件加载模块110会由执行本发明的装置的储存媒体101中加载多媒体教学文件。
[0051]在文件加载模块110加载多媒体教学文件(步骤202)后,辨识区域设定模块120可以设定文字辨识区域(步骤210)。在本实施例中,假设如「图3A」与「图3B」所示,辨识区域设定模块120提供使用者在显示多媒体教学文件的显示区域300中设定文字辨识区域330,使用者可以操作鼠标控制光标320在显示多媒体教学文件的显示区域300中框选出包含文字的黑板310的范围,如此,辨识区域设定模块120便会将使用者在显示区域300中所框选出的范围设定为文字辨识区域330。
[0052]在辨识区域设定模块120设定文字辨识区域(步骤210)后,影像文字转换模块140可以将多媒体教学文件被播放时在文字辨识区域330中显示的影像信息转换为影像文字信息,并记录影像文字信息对应多媒体教学文件的影像时间信息(步骤220)。在本实施例中,假设影像文字转换模块140会对文字辨识区域330中显示的影像信息进行文字辨识,并记录进行文字辨识的时间为起始播放时间,若所辨识出的影像文字信息其中之一为「电阻」,且影像文字信息「电阻」在多媒体教学文件中的起始播放时间为13分4秒,同时,影像文字转换模块140会也会记录持续辨识出「电阻」的时间为播放时间,例如为14分3秒。
[0053]同样在文件加载模块110加载多媒体教学文件(步骤202)后,语音文字转换模块150可以将多媒体教学文件中的声音信号转换为声音文字信息,并记录声音文字信息对应多媒体教学文件的声音时间信息(步骤230)。在本实施例中,语音文字转换模块150会对多媒体教学文件进行语音辨识,并记录辨识出声音文字信息的时间为起始播放时间,例如,所辨识出的声音文字信息其中之一为「电路」,且声音文字信息「电路」在多媒体教学文件中的起始播放时间为8分2秒。
[0054]在影像文字转换模块140由多媒体教学文件中转换产生影像文字信息,并记录影像文字信息对应多媒体教学文件的影像时间信息(步骤220),且语音文字转换模块150由多媒体教学文件中转换产生声音文字信息,并记录声音文字信息对应多媒体教学文件的声音时间信息(步骤230)后,索引文件产生模块160可以产生索引文件(步骤250)。在本实施例中,索引文件产生模块160所产生的索引文件包含影像文字信息「电阻」以及相对应的影像时间信息,也就是起始播放时间「13分4秒」与持续播放时间「14分3秒」,也包含声音文字信息「电路」以及相对应的声音时间信息,也就是起始播放时间8分2秒等两笔数据。
[0055]在索引文件
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1