一种多媒体互动方法及装置的制造方法

文档序号：10511718阅读：333来源：国知局

一种多媒体互动方法及装置的制造方法
【专利摘要】本公开是关于一种多媒体互动方法及装置，该方法包括：在多媒体文件播放过程中，从服务器获取与当前播放时刻对应的弹幕内容，所述弹幕内容至少包括：语音信息和与所述语音信息相对应的文本信息；在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息；检测是否接收到对所述语音播放控件进行操作的触控操作；当接收到对所述语音播放控件进行操作的触控操作时，播放与所述语音信息对应的声音。相比于文本信息而言，由于该方法展示的弹幕内容中的语音信息中可以包含语气或语调等信息，因此，可以使得弹幕内容包含的信息更加丰富，方便用户在观看多媒体文件时，可以更好地互动。
【专利说明】
_种多媒体互动方法及装置
技术领域
[0001 ]本公开涉及互联网技术领域，尤其涉及一种多媒体互动方法及装置。
【背景技术】
[0002]随着网络技术的飞速发展，互联网得到了广泛的应用，已经成为了人们工作、生活中最重要的工具之一。人们不仅可以在互联网中浏览网络视频，而且还可以在观看网络视频时发表评论。
[0003]在网络视频播放的过程中，终端可以动态的显示用户发表的评论信息，这些动态显示的评论信息可以称作弹幕信息。这些弹幕信息通常为用户在观看视频过程中，输入的一些文本或表情符号，以表达用户对此刻情节的分析以及心情等。
[0004]但这种显示文本或符号的弹幕信息，均为可视化信息，普通用户在观看时，只能看到没有任何感情色彩的字符串或符号，无法通过语气或语调等方式，获得发表弹幕信息的用户的更多信息，尤其对于汉语而言，相同的文字，以不同的语气或语调来表述，理解到的意思往往是不相同的。

【发明内容】

[0005]为克服相关技术中存在的问题，本公开提供一种多媒体互动方法及装置。
[0006]根据本公开实施例的第一方面，提供一种多媒体互动方法，包括:
[0007]在多媒体文件播放过程中，从服务器获取与当前播放时刻对应的弹幕内容，所述弹幕内容至少包括:语音信息和与所述语音信息相对应的文本信息；
[0008]在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息；
[0009]检测是否接收到对所述语音播放控件进行操作的触控操作；
[0010]当接收到对所述语音播放控件进行操作的触控操作时，播放与所述语音信息对应的声音。
[0011]可选地，所述在所述多媒体文件的播放界面中以弹幕的形式显示所述文本信息以及语音播放控件，包括:
[0012]生成与所述语音信息相关联的语音播放控件；
[0013]在所述多媒体文件的播放界面中以滚动或静止的方式显示所述语音播放控件；
[0014]在所述语音播放控件的显示位置周围的预设位置显示所述文本信息的全部或部分。
[0015]可选地，所述播放与所述语音信息对应的声音包括:
[0016]检测所述多媒体文件是否暂停播放；
[0017]当所述多媒体文件暂停播放时，生成与所述语音信息对应的声音信号并播放。
[0018]可选地，所述播放与所述语音信息对应的声音，包括:
[0019]检测所述多媒体文件是否正在播放；
[0020]当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号的音量降低；
[0021 ]生成与所述语音信息对应的声音信号并播放。
[0022]可选地，所述播放与所述语音信息对应的声音，包括:
[0023]检测所述多媒体文件是否正在播放；
[0024]当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号在第一声道播放；
[0025]生成与所述语音信息对应的声音信号，并在第二声道播放时所述声音信号。
[0026]根据本公开实施例的第二方面，提供一种多媒体互动方法，包括:
[0027]在多媒体文件播放过程中，检测是否接收到语音弹幕输入触发操作；
[0028]当接收到语音弹幕输入触发操作，记录所述语音弹幕输入触发操作对应的播放时亥IJ，并接收语音采集设备采集到的语音信息；
[0029]获取与所述语音信息对应的文本信息；
[0030]将所述文本信息以及语音信息确定与所述播放时刻对应的弹幕内容并存储到服务器中。
[0031]可选地，所述对所述语音信息进行语音识别，得到与所述语音信息对应的文本信息，包括:
[0032]利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容作，将所述完整文本内容确定为所述文本信息;或者，
[0033]利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容，提取所述完整文本内容的文本摘要信息，将所述文本摘要信息确定为所述文本信息;或者，
[0034]利用语音识别技术对所述语音信息进行部分识别，得到与所述语音信息对应的文本摘要内容;将所述文本摘要内容确定为所述文本信息。
[0035]根据本公开实施例的第三方面，提供一种多媒体互动装置，包括:
[0036]弹幕内容获取模块，用于在多媒体文件播放过程中，从服务器获取与当前播放时刻对应的弹幕内容，所述弹幕内容至少包括:语音信息和与所述语音信息相对应的文本信息;
[0037]弹幕显示模块，用于在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息；
[0038]触控操作检测模块，用于检测是否接收到对所述语音播放控件进行操作的触控操作；
[0039]播放控制模块，用于当接收到对所述语音播放控件进行操作的触控操作时，播放与所述语音信息对应的声音。
[0040]可选地，所述弹幕显示模块，包括:
[0041 ]控件生成子模块，用于生成与所述语音信息相关联的语音播放控件；
[0042]控件显示子模块，用于在所述多媒体文件的播放界面中以滚动或静止的方式显示所述语音播放控件；
[0043]文本显示子模块，用于在所述语音播放控件的显示位置周围的预设位置显示所述文本信息的全部或部分。
[0044]可选地，所述播放控制模块，包括:
[0045]第一播放检测子模块，用于检测所述多媒体文件是否暂停播放；
[0046]第一信号生成子模块，用于当所述多媒体文件暂停播放时，生成与所述语音信息对应的声音信号；
[0047]第一播放子模块，用于播放生成的所述声音信号。
[0048]可选地，所述播放控制模块，包括:
[0049]第二播放检测子模块，用于检测所述多媒体文件是否正在播放；
[0050]音量控制子模块，用于当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号的音量降低；
[0051]第二信号生成子模块，用于生成与所述语音信息对应的声音信号；
[0052]第二播放子模块，用于播放生成的所述声音信号。
[0053]可选地，所述播放控制模块，包括:
[0054]第三播放检测子模块，用于检测所述多媒体文件是否正在播放；
[0055]第三播放子模块，用于当所述多媒体文件正在播放时，当多媒体文件正在播放时，控制所述多媒体文件的声音信号在第一声道播放；
[0056]第三信号生成子模块，用于生成与所述语音信息对应的声音信号；
[0057]第四播放子模块，用于在第二声道播放时所述声音信号。
[0058]根据本公开实施例的第四方面，提供一种多媒体交互装置，包括:
[0059]操作检测模块，用于在多媒体文件播放过程中，检测是否接收到语音弹幕输入触发操作；
[0060]播放时刻记录模块，用于当接收到语音弹幕输入触发操作，记录所述语音弹幕输入触发操作对应的播放时刻；
[0061 ]语音信息接收模块，用于接收语音采集设备采集到的语音信息；
[0062]文本信息获取模块，用于获取与所述语音信息对应的文本信息；
[0063]确定模块，用于将所述文本信息以及语音信息确定与所述播放时刻对应的弹幕内容；
[0064]存储模块，用于将所述弹幕内容存储到服务器中。
[0065]可选地，所述文本信息获取模块，包括:
[0066]第一语音识别模块，用于利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容;第一确定子模块，用于将所述完整文本内容为所述文本信息;或者，
[0067]第二语音识别模块，用于利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容;提取子模块，用于提取所述完整文本内容的文本摘要信息;第二确定子模块，用于将所述文本摘要信息作为所述文本信息;或者，
[0068]第三语音识别模块，用于利用语音识别技术对所述语音信息进行部分识别，得到与所述语音信息对应的文本摘要内容;第三确定子模块，用于将所述文本摘要内容确定为所述文本信息。
[0069]根据本公开实施例的第五方面，提供一种多媒体互动系统，包括:
[0070]如上述第三方面所述的多媒体互动装置和如上述第四方面所述的多媒体互动装置。
[0071]本公开的实施例提供的技术方案可以包括以下有益效果:
[0072]本公开实施例提供的该方法，在展示弹幕信息时，除了可以单纯展示文本信息外，还可以展示语音信息以及对应的文本信息，进而用户通过互动操作就可以在弹幕显示时，听到语音信息的弹幕内容。相比于文本信息而言，由于该方法展示的弹幕内容中的语音信息中可以包含语气或语调等信息，因此，可以使得弹幕内容包含的信息更加丰富，方便用户在观看多媒体文件时，可以更好地互动。
[0073]应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
【附图说明】
[0074]此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。
[0075]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0076]图1是根据一示例性实施例示出的一种多媒体互动方法的流程示意图；
[0077]图2是根据一示例性实施例示出的另一种多媒体互动方法的流程示意图；
[0078]图3为图2中的步骤S202的流程示意图；
[0079]图4是根据一示例性实施例示出的一种多媒体互动装置的结构示意图；
[0080]图5是根据一示例性实施例示出的另一种多媒体互动装置的结构示意图。
【具体实施方式】
[0081]这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0082]为了解决现有的文本形式的弹幕内容带来的问题，本发明实施例提供了一种新的多媒体互动方案，该方案一方面可以记录用户的语音作为弹幕内容，另一方面还可以在显示弹幕内容时，可以让用户播放语音。
[0083]下面针对如何记录用户的语音作为弹幕内容进行说明:
[0084]图1是根据一示例性实施例示出的一种多媒体互动方法的流程示意图。如图1所示，该方法可以包括以下步骤:
[0085]步骤SlOl:在多媒体文件播放过程中，检测是否接收到语音弹幕输入触发操作。
[0086]弹幕输入触发操作可以为多媒体文件播放时，设置在一侧的语音弹幕输入按钮，用户点击该弹幕输入按钮，可以确定接收到语音弹幕输入触发操作。
[0087]当接收到语音弹幕输入触发操作，步骤S102:记录所述语音弹幕输入触发操作对应的播放时刻，并接收语音采集设备采集到的语音信息。
[0088]由于用户输入的弹幕内容与此刻播放的多媒体文件的情节相关，所以需要记录此刻的播放时刻。同时，利用麦克风或其它设备采集用户输入的语音信息。
[0089]步骤S103:获取与所述语音信息对应的文本信息。
[0090]在本公开实施例中，可以利用该语音识别技术对获取到的语音信息进行识别，进而得到语音信息对应的文本信息。
[0091]在本发明一个实施例中，步骤S103可以采用以下方式:
[0092]利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容作，将所述完整文本内容确定为所述文本信息。
[0093]可见，在上述方式中，在对应语音信息识别时，对语音信息的全部内容进行识别，然后将识别得到的全部完整文本内容，确定为与语音信息对应的文本信息。
[0094]由于将语音信息识别后得到的全部文本内容较多，作为弹幕内容时显示比较冗余，所以在本发明另一个实施例中，步骤S103可以采用以下方式:
[0095]利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容，提取所述完整文本内容的文本摘要信息，将所述文本摘要信息确定为所述文本信息。
[0096]在本发明实施例中，在全部识别到的完整文本内容中的提取文本摘要信息，与完整文本内容相比，文本摘要信息表达意思简洁，并且存储空间较小。
[0097]在前一实施例中，需要对语音信息进行全部识别，然后提取文本摘要，虽然得到的文本摘要信息比完整文本内容间接、存储空间小，但对语音信息进行全部识别，耗时较长，导致处理效率降低。所以在本发明另一实施例中，步骤S103还可以采用以下方式:
[0098]利用语音识别技术对所述语音信息进行部分识别，得到与所述语音信息对应的文本摘要内容;将所述文本摘要内容确定为所述文本信息
[0099]在本发明实施例中，还可以对语音信息进行部分识别，例如:识别前三分之一或二分之一，当然也可以根据语音信息的大小来决定部分识别的量，例如:对于5M以内的语音信息，识别前0.3M即可，对于10-100M的信息，识别前IM即可。通过部分识别的方式，可以缩短识别的时间，提尚识别效率。
[0100]步骤S104:将所述文本信息以及语音信息确定与所述播放时刻对应的弹幕内容并存储到服务器中。
[0101]当识别得到文本信息后，可以直接将识别到的文本信息和语音信息均作为弹幕内容，并且建立弹幕内容与播放时刻之间的对应关系，最后存储到服务器中，以便其它用户播放同一多媒体文件时，可以将包含语音信息的弹幕内容发送出去进行展示。
[0102]本发明实施例提供的该方法，在多媒体文件播放时，还可以录入用户输入的语音信息作为弹幕内容，相比于文本信息而言，可以包含语气或语调等信息，使得弹幕内容包含的信息更加丰富，方便用户在观看多媒体文件时，可以更好地互动。
[0103]下面针对如何在显示弹幕内容时，让用户播放弹幕内容中的语音信息进行说明。
[0104]图2是根据一示例性实施例示出的一种多媒体互动方法的流程示意图。如图2所示，该方法可以包括以下步骤:
[0105]步骤S201:在多媒体文件播放过程中，从服务器获取与当前播放时刻对应的弹幕内容。
[0106]在本发明实施例中，弹幕内容至少包括:语音信息和与所述语音信息相对应的文本信息。其中参见图1所示实施例的描述，可知与语音信息相对应的文本信息，可以为直接对语音信息识别后得到的完整文本内容，或者，可以是完整文本内容的文本摘要信息，再或者，还可以是对语音信息进行部分识别后得到的文本摘要信息。
[0107]无论哪种文本信息，均可以方便用户对语音信息中的内容进行预览，为用户提供是否打开语音信息的依据。
[0108]步骤S202:在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息。
[0109]由于接收到的弹幕内容中，包含有语音信息，所以为了方便用户播放该语音信息，所以，需要生成一个语音播放控件，然后在播放界面中以弹幕的形式展示该语音播放控件，并且同时显示文本信息，例如:文本信息可以位于语音播放信息控件上，也可以为语音播放信息控件位于文本信息的前面或后面，以便于用户通过阅读文本信息就可以预览语音信息的大致内容。
[0110]步骤S203:检测是否接收到对所述语音播放控件进行操作的触控操作。
[0111]对于播放界面中展示的语音播放控件，当用户根据文本信息点击语音播放控件时，确定接收到对语音播放空间的触控操作，也即，需要播放与该语音播放控件对应的语音?目息O
[0112]当接收到对所述语音播放控件进行操作的触控操作时，步骤S204:播放与所述语音信息对应的声音。
[0113]本公开实施例提供的该方法，在展示弹幕信息时，除了可以单纯展示文本信息外，还可以展示语音信息以及对应的文本信息，进而用户通过互动操作就可以在弹幕显示时，听到语音信息的弹幕内容。相比于文本信息而言，可以包含语气或语调等信息，使得弹幕内容包含的信息更加丰富，方便用户在观看多媒体文件时，可以更好地互动。
[0114]在本发明一个实施例中，如图3所示，图2中的步骤S202可以包括以下步骤:
[0115]步骤S2021:生成与所述语音信息相关联的语音播放控件。
[0116]步骤S2022:在所述多媒体文件的播放界面中以滚动或静止的方式显示所述语音播放控件。
[0117]步骤S2023:在所述语音播放控件的显示位置周围的预设位置显示所述文本信息的全部或部分。
[0118]在显示文本信息时，可以全部显示与语音信息对应的全部文本信息，另外，考虑到弹幕上文字显示的长度，也可以只显示部分文本信息，例如:显示所有文本信息中的前20个字等。
[0119]在本发明一个实施例中，在图2所示实施例中的步骤S204可以包括以下步骤:
[0120]检测所述多媒体文件是否暂停播放。
[0121]当所述多媒体文件暂停播放时，生成与所述语音信息对应的声音信号并播放。
[0122]由于在多媒体文件播放时，其自身是具有一定的音效，所有此时对于语言信息而言，可以在多媒体文件暂停时，再播放与语音信息对应的声音。
[0123]上述实施例中，只有在多媒体文件暂停时，才播放弹幕内容对应的语音信息，这样虽然效果不好，但可以实现作为弹幕的语音信息和多媒体的语音信息不冲突。在本发明另一实施例中，图2所述实施例中的步骤S204可以包括以下步骤:
[0124]检测所述多媒体文件是否正在播放。
[0125]当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号的音量降低。
[0126]生成与所述语音信息对应的声音信号并播放。
[0127]在本发明实施例中，即使多媒体文件正在播放时，此时仍然播放弹幕内容中的语音信息，虽然两个声音重叠，但可以实现用户在观看多媒体文件时，同时听到弹幕内容。
[0128]无论是暂停多媒体文件再播放弹幕内容对应的语音，还是弹幕内容中的语音和多媒体文件的语音一起播放，都存在或多或少的弊端。为此，在本发明另一实施例中，图2所述实施例中的步骤S204可以包括以下步骤:
[0129]检测所述多媒体文件是否正在播放。
[0130]当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号在第一声道播放。
[0131]生成与所述语音信息对应的声音信号，并在第二声道播放时所述声音信号。
[0132]在本发明实施例中，弹幕内容对应的语音和多媒体文件对应的声音分别在不同的声道中播放时，以常见的耳机为例，可以分别在不同的耳塞中播放，进而既可以实现同时播放，又不会互相干扰。
[0133]图4为本发明实施例提供的一种多媒体互动装置的结构示意图。如图4所示，该装置可以包括:
[0134]操作检测模块41，用于在多媒体文件播放过程中，检测是否接收到语音弹幕输入触发操作；
[0135]播放时刻记录模块42，用于当接收到语音弹幕输入触发操作，记录所述语音弹幕输入触发操作对应的播放时刻；
[0136]语音信息接收模块43，用于接收语音采集设备采集到的语音信息；
[0137]文本信息获取模块44，用于获取与所述语音信息对应的文本信息；
[0138]确定模块45，用于将所述文本信息以及语音信息确定与所述播放时刻对应的弹幕内容；
[0139]存储模块46，用于将所述弹幕内容存储到服务器中。
[0140]在本发明一该实施例中，文本信息获取模块44可以包括:
[0141]第一语音识别模块，用于利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容;第一确定子模块，用于将所述完整文本内容为所述文本信息。
[0142]在本发明一该实施例中，文本信息获取模块44可以包括:
[0143]第二语音识别模块，用于利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容;提取子模块，用于提取所述完整文本内容的文本摘要信息;第二确定子模块，用于将所述文本摘要信息作为所述文本信息。
[0144]在本发明一该实施例中，文本信息获取模块74可以包括:
[0145]第三语音识别模块，用于利用语音识别技术对所述语音信息进行部分识别，得到与所述语音信息对应的文本摘要内容;第三确定子模块，用于将所述文本摘要内容确定为所述文本信息。
[0146]图5为本发明实施例提供的一种多媒体互动装置的结构示意图。如图5所示，该装置可以包括:
[0147]弹幕内容获取模块51，用于在多媒体文件播放过程中，从服务器获取与当前播放时刻对应的弹幕内容，所述弹幕内容至少包括:语音信息和与所述语音信息相对应的文本信息；
[0148]弹幕显示模块52，用于在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息；
[0149]触控操作检测模块53，用于检测是否接收到对所述语音播放控件进行操作的触控操作；
[0150]播放控制模块54，用于当接收到对所述语音播放控件进行操作的触控操作时，播放与所述语音信息对应的声音。
[0151 ]在本发明一个实施例中，上述弹幕显示模块52可以包括:
[0152]控件生成子模块，用于生成与所述语音信息相关联的语音播放控件；
[0153]控件显示子模块，用于在所述多媒体文件的播放界面中以滚动或静止的方式显示所述语音播放控件；
[0154]文本显示子模块，用于在所述语音播放控件的显示位置周围的预设位置显示所述文本信息的全部或部分。
[0155]在本发明一个实施例中，上述播放控制模块54可以包括:
[0156]第一播放检测子模块，用于检测所述多媒体文件是否暂停播放；
[0157]第一信号生成子模块，用于当所述多媒体文件暂停播放时，生成与所述语音信息对应的声音信号；
[0158]第一播放子模块，用于播放生成的所述声音信号。
[0159]在本发明一个实施例中，上述播放控制模块54可以包括:
[0160]第二播放检测子模块，用于检测所述多媒体文件是否正在播放；
[0161]音量控制子模块，用于当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号的音量降低；
[0162]第二信号生成子模块，用于生成与所述语音信息对应的声音信号；
[0163]第二播放子模块，用于播放生成的所述声音信号。
[0164]在本发明一个实施例中，上述播放控制模块54可以包括:
[0165]第三播放检测子模块，用于检测所述多媒体文件是否正在播放；
[0166]第三播放子模块，用于当所述多媒体文件正在播放时，当多媒体文件正在播放时，控制所述多媒体文件的声音信号在第一声道播放；
[0167]第三信号生成子模块，用于生成与所述语音信息对应的声音信号；
[0168]第四播放子模块，用于在第二声道播放时所述声音信号。
[0169]关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0170]在本发明实施例中，还提供一种多媒体交互系统，该系统可以包括如图4所示的多媒体交互装置和如图5所示的多媒体交互装置。
[0171]本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。
[0172]应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
【主权项】
1.一种多媒体互动方法，其特征在于，包括: 在多媒体文件播放过程中，从服务器获取与当前播放时刻对应的弹幕内容，所述弹幕内容至少包括:语音信息和与所述语音信息相对应的文本信息；在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息；检测是否接收到对所述语音播放控件进行操作的触控操作；当接收到对所述语音播放控件进行操作的触控操作时，播放与所述语音信息对应的声■~>V.曰ο2.根据权利要求1所述的多媒体互动方法，其特征在于，所述在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息，包括: 生成与所述语音信息相关联的语音播放控件；在所述多媒体文件的播放界面中以滚动或静止的方式显示所述语音播放控件；在所述语音播放控件的显示位置周围的预设位置显示所述文本信息的全部或部分。3.根据权利要求1所述的方法，其特征在于，所述播放与所述语音信息对应的声音，包括: 检测所述多媒体文件是否暂停播放；当所述多媒体文件暂停播放时，生成与所述语音信息对应的声音信号并播放。4.根据权利要求1所述的方法，其特征在于，所述播放与所述语音信息对应的声音，包括: 检测所述多媒体文件是否正在播放；当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号的音量降低；生成与所述语音信息对应的声音信号并播放。5.根据权利要求1所述的方法，其特征在于，所述播放与所述语音信息对应的声音，包括: 检测所述多媒体文件是否正在播放；当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号在第一声道播放；生成与所述语音信息对应的声音信号，并在第二声道播放时所述声音信号。6.一种多媒体互动方法，其特征在于，包括: 在多媒体文件播放过程中，检测是否接收到语音弹幕输入触发操作；当接收到语音弹幕输入触发操作，记录所述语音弹幕输入触发操作对应的播放时刻，并接收语音采集设备采集到的语音信息；获取与所述语音信息对应的文本信息；将所述文本信息以及语音信息确定与所述播放时刻对应的弹幕内容并存储到服务器中。7.根据权利要求6所述的方法，其特征在于，所述对所述语音信息进行语音识别，得到与所述语音信息对应的文本信息，包括: 利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容作，将所述完整文本内容确定为所述文本信息;或者，利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容，提取所述完整文本内容的文本摘要信息，将所述文本摘要信息确定为所述文本信息;或者，利用语音识别技术对所述语音信息进行部分识别，得到与所述语音信息对应的文本摘要内容;将所述文本摘要内容确定为所述文本信息。8.一种多媒体互动装置，其特征在于，包括: 弹幕内容获取模块，用于在多媒体文件播放过程中，从服务器获取与当前播放时刻对应的弹幕内容，所述弹幕内容至少包括:语音信息和与所述语音信息相对应的文本信息；弹幕显示模块，用于在所述多媒体文件的播放界面中以弹幕的形式显示语音播放控件以及所述文本信息；触控操作检测模块，用于检测是否接收到对所述语音播放控件进行操作的触控操作；播放控制模块，用于当接收到对所述语音播放控件进行操作的触控操作时，播放与所述语音信息对应的声音。9.根据权利要求8所述的多媒体互动装置，其特征在于，所述弹幕显示模块，包括: 控件生成子模块，用于生成与所述语音信息相关联的语音播放控件；控件显示子模块，用于在所述多媒体文件的播放界面中以滚动或静止的方式显示所述语音播放控件；文本显示子模块，用于在所述语音播放控件的显示位置周围的预设位置显示所述文本信息的全部或部分。10.根据权利要求8所述的装置，其特征在于，所述播放控制模块，包括: 第一播放检测子模块，用于检测所述多媒体文件是否暂停播放；第一信号生成子模块，用于当所述多媒体文件暂停播放时，生成与所述语音信息对应的声音信号；第一播放子模块，用于播放生成的所述声音信号。11.根据权利要求8所述的装置，其特征在于，所述播放控制模块，包括: 第二播放检测子模块，用于检测所述多媒体文件是否正在播放；音量控制子模块，用于当所述多媒体文件正在播放时，控制所述多媒体文件的声音信号的音量降低；第二信号生成子模块，用于生成与所述语音信息对应的声音信号；第二播放子模块，用于播放生成的所述声音信号。12.根据权利要求8所述的装置，其特征在于，所述播放控制模块，包括: 第三播放检测子模块，用于检测所述多媒体文件是否正在播放；第三播放子模块，用于当所述多媒体文件正在播放时，当多媒体文件正在播放时，控制所述多媒体文件的声音信号在第一声道播放；第三信号生成子模块，用于生成与所述语音信息对应的声音信号；第四播放子模块，用于在第二声道播放时所述声音信号。13.一种多媒体交互装置，其特征在于，包括: 操作检测模块，用于在多媒体文件播放过程中，检测是否接收到语音弹幕输入触发操作；播放时刻记录模块，用于当接收到语音弹幕输入触发操作，记录所述语音弹幕输入触发操作对应的播放时刻；语音信息接收模块，用于接收语音采集设备采集到的语音信息；文本信息获取模块，用于获取与所述语音信息对应的文本信息；确定模块，用于将所述文本信息以及语音信息确定与所述播放时刻对应的弹幕内容；存储模块，用于将所述弹幕内容存储到服务器中。14.根据权利要求13所述的装置，其特征在于，所述文本信息获取模块，包括: 第一语音识别模块，用于利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容;第一确定子模块，用于将所述完整文本内容为所述文本信息;或者，第二语音识别模块，用于利用语音识别技术对所述语音信息进行全部识别，得到与所述语音信息对应的完整文本内容;提取子模块，用于提取所述完整文本内容的文本摘要信息;第二确定子模块，用于将所述文本摘要信息作为所述文本信息;或者，第三语音识别模块，用于利用语音识别技术对所述语音信息进行部分识别，得到与所述语音信息对应的文本摘要内容;第三确定子模块，用于将所述文本摘要内容确定为所述文本信息。15.一种多媒体互动系统，其特征在于，包括: 如权利要求8-12所述的多媒体互动装置和如权利要求13-14所述的多媒体互动装置。
【文档编号】G06F9/44GK105867718SQ201510917973
【公开日】2016年8月17日
【申请日】2015年12月10日
【发明人】车延通
【申请人】乐视网信息技术（北京）股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：车延通;
技术所有人：乐视网信息技术（北京）股份有限公司;
我是此专利的发明人

上一篇：一种排列方法和终端设备的制造方法
上一篇：用户界面的操控方法、装置及终端的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。