一种视频播放记录的匹配方法及匹配装置的制造方法

文档序号：10516237阅读：268来源：国知局

一种视频播放记录的匹配方法及匹配装置的制造方法
【专利摘要】本发明涉及一种视频播放记录的匹配方法及装置，其包括：根据用户对选定视频的触发操作，本地终端的选定视频APP向视频资源服务器发出视频播放请求，该视频资源服务器接收到该视频播放请求后根据请求信息发送与该选定视频APP相关的数据；响应于用户操作，进入本地终端的视频播放记录；基于语音信息对用户身份信息进行识别和验证；基于预先存储的用户标识与视频播放记录的对应关系，控制本地终端进入与所识别出的用户标识相对应的视频播放记录。通过采用上述技术手段，方便用户借助于本地终端迅速地查找到自身的视频播放记录继续进行视频观看。
【专利说明】
-种视频播放巧录的匹配方法及匹配装置
技术领域
[0001] 本发明设及网络视频播放应用技术领域，尤其设及一种多个用户通过本地的终端设备观看网络视频时匹配播放记录的视频播放记录的匹配方法及匹配装置。
【背景技术】
[0002] 正如人们所周知的那样，智能电视正逐步实现网络捜索、IP电视、BBTV网视通、视频点播、数字音乐、网络新闻、网络视频电话等各种应用服务，使电视机正在成为继计算机、手机之后的第Ξ种信息访问终端，用户可随时访问自己需要的信息，电视机也将成为一种智能设备，实现电视、网络和程序之间跨平台捜索，智能电视还将是一个"娱乐中屯、"，而智能电视的运些特点，导致其迅速普及开来。
[0003] 而随着智能电视的普及，智能电视作为一个家庭观看设备，在电视端使用视频应用(APP)观看视频时，往往存在家庭成员多人同时观看的情况。当多人使用电视端的网络视频APP观看同一视频源的同一视频，在使用同一视频观看账号登录并进行观看时，由于不同家庭成员观看的进度不同，在有其他家庭成员曾经进入观看时，播放记录往往停留在最近一次观看该视频的其他家庭成员的播放地址，而非该用户期望的其本人的播放记录，导致该用户无法承接自己原有的视频播放记录快速地进入继续观看。

【发明内容】

[0004] 为了解决上述问题，本发明的目的旨在提供一种多个用户在本地的终端设备观看网络视频时匹配播放记录的方法及匹配装置，在使用本地终端的网络视频时，不同用户能够在本人播放记录的基础上，快速地继续观看。
[0005] 为了实现上述发明目的，本发明提供了如下技术方案。
[0006] 本发明的第一方面，提供一种视频播放记录的匹配方法，其包括:根据用户对选定视频的触发操作，本地终端的选定视频APP向视频资源服务器发出视频播放请求，该视频资源服务器接收到该视频播放请求后根据请求信息发送与该选定视频APP相关的数据；响应于用户操作，进入本地终端的视频播放记录;基于语音信息对用户身份信息进行识别和验证；W及基于预先存储的用户标识与视频播放记录的对应关系，控制本地终端进入与所识别出的用户标识相对应的视频播放记录。
[0007] 优选地，根据本发明的视频播放记录匹配方法，所述基于语音信息对用户身份信息进行识别和验证的步骤包括:对访问视频的用户语音信息进行检测，获得用户的语音信息并作为唯一识别用户身份的身份识别信息；W及将所检测到的用户语音信息与预设的语音库中所存储的语音信息进行比对，判断两者是否吻合，如果比对后发现两者相吻合，则确定出该用户语音信息所对应的用户标识;如果比对后发现两者不吻合，则存储该用户的标识，将该用户视为新用户，存储该用户的语音信息作为用于比对的原始语音信息，同时自动存储该用户的视频播放记录。
[000引优选地，根据本发明的视频播放记录匹配方法，当针对所述用户的语音信息进行声纹识别时，还包括:语音信息预处理步骤，对所检测到的用户语音信息进行预处理;特征参数提取步骤，对经预处理后的语音信息进行特征参数的提取；W及声纹模式比较步骤，根据提取出的所述特征参数，与预先存储的声纹模式进行比较，确定与所述用户的声纹模式相对应的用户标识。
[0009] 优选地，根据本发明的视频播放记录匹配方法，所述匹配方法还包括:噪音处理步骤，该噪音处理步骤对来自周围环境的语音信号中所包含的噪声进行处理，降低噪声分量； W及语音振幅调节步骤，该语音振幅调节步骤将在上述噪音处理步骤降低噪音后的声音数据的振幅调整为规定的声音水平的振幅。
[0010] 进一步地，根据本发明的视频播放记录的匹配方法，从预先存储在预设的语音库的语音信息中查找是否存在与上述用户的语音信息相吻合的语音信息，如果存在则根据所述语音信息对应的用户标识信息，从预设的语音库中调用与所述语音信息相吻合的匹配信息，根据所述匹配信息对所述语音信息进行识别，从而识别出相应的用户身份。
[0011] 优选地，根据本发明的视频播放记录匹配方法，所述语音信息通过本地终端的音频输入设备输入并作为音频文件存储在预设的语音库。
[0012] 优选地，根据本发明的视频播放记录匹配方法，所述本地终端每播放一次视频，均为该次视频的播放过程分配一个唯一的播放标识，一个播放标识对应一条视频播放记录。
[0013] 本发明的第二方面，提供一种视频播放记录的匹配装置，其包括:视频数据分发模块，根据用户对选定视频的触发操作，本地终端的选定视频APP向视频资源服务器发出视频播放请求，该视频资源服务器接收到该视频播放请求后根据请求信息发送与该选定视频 APP相关的数据;播放记录开启模块，响应于用户操作，进入本地终端的视频播放记录;语音识别模块，基于语音信息对用户身份信息进行识别和验证；W及播放记录匹配模块，基于预先存储的用户标识与视频播放记录的对应关系，控制本地终端进入与所识别出的用户标识相对应的视频播放记录。
[0014] 优选地，根据本发明的视频播放记录匹配装置，所述语音识别模块进一步包括:身份信息获取模块，对访问视频的用户语音信息进行检测，获得用户的语音信息并作为唯一识别用户身份的身份识别信息；W及语音信息比较模块，将所检测到的用户语音信息与预设的语音库中所存储的语音信息进行比对，判断两者是否吻合，如果比对后发现两者相吻合，则确定出该用户语音信息所对应的用户标识;如果比对后发现两者不吻合，则存储该用户的标识，将该用户视为新用户，存储该用户的语音信息作为用于比对的原始语音信息，同时自动存储该用户的视频播放记录。
[0015] 优选地，根据本发明的视频播放记录匹配装置，当针对所述用户的语音信息进行声纹识别时，所述语音识别模块还包括:语音信息预处理单元，配置成对所检测到的用户语音信息进行预处理;特征参数提单元，配置成对经预处理后的语音信息进行特征参数的提取；W及声纹模式比较单元，配置成根据提取出的所述特征参数，与预先存储的声纹模式进行比较，确定与所述用户的声纹模式相对应的用户标识。
[0016] 进一步地，根据本发明的视频播放记录匹配装置，所述语音信息比较模块包括:查询单元，从预设的语音库中查找是否存在与上述用户语音信息相吻合的语音信息；原始语音信息记录创建单元，如果经上述查询单元查询发现预设的语音库中不存在与上述用户的语音信息相吻合的语音信息，则创建该用户的原始语音信息记录，将该用户的语音信息作为原始语音信息存储在预设的语音中。
[0017] 优选地，根据本发明的视频播放记录匹配装置，其特征在于，所述语音识别模块还包括:噪声处理单元，对来自周围环境的语音信号中所包含的噪声进行降噪处理；W及语音振幅调节单元，将由所述噪音降低单元降低噪音后的声音数据的振幅调整为规定的声音水平的振幅。
[0018] 优选地，根据本发明的视频播放记录匹配装置，所述语音信息通过本地终端的音频输入设备输入并作为音频文件存储在预设的语音库。
[0019] 优选地，根据本发明的视频播放记录匹配系统，所述本地终端每播放一次视频，均为该次视频的播放过程分配一个唯一的播放标识，一个播放标识对应一条视频播放记录。
[0020] 本发明中，通过采用具有上述特征的视频播放记录的匹配方法及匹配装置，能够对访问并观看视频的用户身份信息进行唯一识别，并根据该用户身份信息匹配与该用户身份相一致的视频播放记录，从而使用户不会受到其他用户的播放记录信息的影响，快速地承接自己原来的视频播放位置进行视频续播。
【附图说明】
[0021] 图1为本发明实施例的多个用户观看网络视频时匹配播放记录的方法的流程图。
[0022] 图2本发明实施例的匹配播放记录的方法的步骤S1032的一种流程图。
[0023] 图3为本发明实施例所提供的视频播放记录的匹配装置的结构示意图。
【具体实施方式】
[0024] 为使本发明的目的、技术方案和优点更加清楚明白，W下结合具体实施例，并参照附图，对本发明进一步详细说明。
[0025] 需要说明的是，本申请的说明书和权利要求书及上述附图中的术语"第一"、"第二"等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解运样使用的数据在适当情况下可W互换，W便运里描述的本申请的实施例。此外，术语"包括"和"具有及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于运些过程、方法、产品或设备固有的其它步骤或单元。
[0026] 另外，需要说明的是，本发明的下述实施方式中将W家庭成员作为多用户的例子，将智能电视作为本地终端的例子进行说明。
[0027] 如本发明的【背景技术】部分所陈述的那样，当家庭不同成员采用同一视频观看账号登录并进行视频观看时，系统默认其为同一个用户，而系统所提供的播放记录一般是最近一次播放的视频观看记录，而该记录很可能是家庭其他成员观看的节点，导致用户无法很快进行视频的续播，甚至可能会需要从头开始进行视频播放。为了防止上述现象的发生，在本发明中，对采用同一视频观看账号进行登录的不同观看者的身份进行了区分。具体而言，在视频观看账号的注册者的用户信息中设置多个角色，通过各角色所发出的语音信息的不同，即采用语音信息来识别不同的角色，并针对不同角色的视频观看，分别记录其观看情况。具体地，假定登录并观看同一视频的家庭成员人数为N(N为2W上的自然数），则需要对上述注册者的用户信息分别设定角色1、角色2、角色3、……角色N等不同的多个角色，上述各角色分别对应于登录后进行视频观看的不同的家庭成员。
[00%]在本发明中，采集角色1所对应的家庭成员memberl的语音信息（语音信息相当于用户的账户资料），赋予唯一的识别标识，记载为语音信息1并存储在预设的语音库中；采集角色2所对应的家庭成员members的语音信息，记载为语音信息2并存储在预设的语音库中；采集角色3所对应的家庭成员members的语音信息，记载为语音信息3并存储在预设的语音库中，……W此类推直至角色N为止。
[0029] 需要说明的是，上述家庭成员的语音信息的采集是在成员第一次登录并观看视频时进行的，将采集到的不同角色（即，不同家庭成员）的语音信息作为用于成员身份识别的原始语音信息。
[0030] 在发明中，针对不同角色的视频观看，分别记录其观看情况。也就是说，针对角色 1、角色2、角色3……角色N，系统分别记录其视频播放记录，可分别记载为视频播放记录1、视频播放记录2、视频播放记录3、……视频播放记录N。同时，将各角色与相应视频播放记录相关联W形成一个对应关系表并存储在预设的播放记录数据库。
[0031 ]角色与视频播放记录的对应关系表
[0032]
[0033] 当智能电视端播放来自视频资源服务器的视频文件时，获取该视频文件的基础信息，该基础信息包括网络链接地址、视频长度等，然后将包含了该视频文件的基础信息和播放信息的视频播放记录存储在预设的播放记录数据库中。当接收到播放该视频文件的播放请求时，从上述播放记录数据库中调用该视频文件的视频播放记录，从所述视频播放记录的已播放时刻开始继续播放该视频文件，其中上述视频播放记录可W通过列表形式显示。
[0034] 在一些实施例中，上述视频播放记录的基础信息还可W包含视频所属地、视频中的演员?目息等。
[0035] 具体地，用户观看了所选择的特定视频后，视频资源服务器将自动记录其观看情况，即视频播放记录。由于不同角色对应于不同的视频播放记录，故当用户请求继续进行视频观看时，通过对用户身份（即上述不同的角色）进行语音识别，当通过用户语音识别出用户身份信息后，视频资源服务器根据预先存储的上述角色与视频播放记录的对应关系表发送与该角色（用户）相对应的视频播放记录，此时，智能电视接收并自动存储该视频播放记录。运样，不同角色(对应于不同用户）即可根据相应的视频播放记录来继续观看视频。
[0036] 优选地，本发明的智能电视客户端每播放一次视频，会为该次视频的播放过程分配一个唯一的播放标识，一个播放标识对应一条视频播放记录。
[0037] 参阅图1所示，本发明实施例的多个用户观看网络视频时匹配播放记录的方法的流程图。如该图1所示，本发明的匹配播放记录的方法主要包含步骤S101-步骤S104,具体为：
[0038] 步骤S101:根据用户对选定视频的触发操作，本地终端（即，上述的智能电视)的选定视频APP向视频资源服务器发出视频播放请求，该视频资源服务器接收到该视频播放请求后根据请求信息发送与该选定视频APP相关的数据。
[0039] 众所周知，智能电视具有全开放式平台，搭载了操作系统，具备宽带互联网接入能力，可W接收并回放从互联网获得的各种影像、音乐等数据流，可W下载并执行各种专口开发的应用程序，包括游戏，具有网络通信功能，具备全新的遥控装置，并且可W和各种移动终端链接互动，特别是，智能电视可从网络、AV设备、PC等多种渠道获得节目内容，通过简单易用的整合式操作界面，将消费者最需要的内容在电视屏幕上进行清晰地展现。当智能电视开机后，会显示首页主界面，在首页主界面中通常会包括多个根据需要而预置的应用的启动入口，比如用户可能常用的APP、电视厂商希望用户使用的APP等。在该些APP中，通常会包括与智能电视服务器提供的视频资源所对应的特定视频APP，该特定视频APP中的视频资源与智能电视服务器提供的视频资源是相同的。
[0040] 本发明中，用户进入智能电视画面中的网络视频APP，登录视频观看账号成功后，触发该特定视频APP的启动入口，该特定视频APP向视频资源服务器发出视频播放请求，视频资源服务器接收到该视频播放请求后根据请求信息发送与该网络视频APP相关的数据，显示该特定视频APP的主页面，在主页面中包括进入多个子页面的启动入口，用户选择并触发各子页面的启动入口进入所选择的子页面W进行进一步的操作。
[0041] 优选地，上述视频播放请求可W由用户在智能电视的显示画面上点击用户选定的视频名称进行触发，当包含多个视频的系列进行多集连播的情况下，其下一集的视频播放请求可W在上一集的视频播放结束时被自动触发而直接进入到下一集视频播放，由此方便用户的观看。
[0042] 步骤S102:响应于用户操作，进入本地终端(上述的智能电视)的视频播放记录。
[0043] 步骤S103:基于语音信息对用户身份信息进行识别和验证。
[0044] 为了对不同用户进行身份识别，本发明引入了基于语音识别技术的声音识别装置，将所采集的家庭不同成员的语音信息作为其身份认证信息并赋予唯一的识别标识进行对应存储。
[0045] 图2本发明实施例的匹配播放记录的方法的步骤S103的一种流程图。如图2所示，步骤S103的语音识别方法进一步包括如下的步骤S1030-S1032:
[0046] 步骤S1030:对初次使用者的语音信息进行记录并作为用于身份识别的原始语音信息，同时自动存储该用户的视频播放记录。
[0047] 对于初次使用者，上述声音识别装置对该初次使用者发出的作为身份认证信息的语音信息进行检测后，获得该初次使用者的语音信息，并对所获得的语音信息赋予唯一的识别标识作为原始语音信息存储在预设的语音库中。
[0048] 由此，根据视频观看者的语音信息的不同，观看视频的不同成员被赋予了不同的识别标识，并将采集到的家庭成员的语音信息与相应的识别标识相关联W形成一个对应关系表进行存储。上述对应关系表例如可记载如下：
[0049]

[0050]当用户再次访问同一视频内容时，需要从预设的语音库中调用语音信息与当前用户的语音信息进行比对，确认用户身份信息W进行进一步的操作。
[0051 ]其具体的身份信息识别步骤如下所示：
[0052] 步骤S1031:对访问视频的用户语音信息进行检测，获得用户的语音信息并作为唯一识别用户身份的身份识别信息。
[0053] 上述声音识别装置对登录并观看视频的家庭不同成员发出的作为身份识别信息的语音信息进行检测，获得用户的语音信息。
[0054] 在一些实施例中，例如，观看环境相对比较增杂，干扰的噪声较大的恶劣情况下 (例如，当本地终端不是智能电视而是手机时，当利用手机在地铁列车上观看网络视频时），为了便于从很多人在讲话的增杂的周围环境中接收用户的语音信号，本发明的视频播放记录匹配方法还可W包括：
[0055] 噪音处理步骤，该噪音处理步骤对来自周围环境的语音信号中所包含的噪声进行处理，降低噪声分量；W及
[0056] 语音振幅调节步骤，该语音振幅调节步骤将在上述噪音处理步骤降低噪音后的声音数据的振幅调整为规定的声音水平的振幅。
[0057] 由此，通过上述两个步骤的处理，能够进一步加速对用户语音信息的识别，从而使系统快速准确地识别出目标语音。
[0058] 步骤S1032:将所检测到的用户语音信息与预设的语音库中所存储的语音信息进行比对，判断两者是否吻合，如果比对后发现两者相吻合，则确定出该用户语音信息所对应的用户标识;如果比对后发现两者不吻合，则存储该用户的标识，将该用户视为新用户，存储该用户的语音信息作为用于比对的原始语音信息，同时自动存储该用户的视频播放记 5? 〇
[0059] 具体地，从预先存储在预设的语音库的语音信息中查找是否存在与上述用户的语音信息相吻合的语音信息，如果存在，则根据所述语音信息对应的用户标识信息，从预设的语音库中调用与所述语音信息相吻合的匹配信息，根据所述匹配信息对所述语音信息进行识别，从而识别出相应的用户身份，并进入到步骤S104;相反，如果经捜索发现上述预设的语音库中不存在与上述用户的语音信息相吻合的语音信息，则返回到步骤S1030,存储该用户的标识，将该用户视为新用户，记录该用户的语音信息作为原始语音信息并存储在预设的语音库中。同时，当该用户观看完视频后，自动保存该用户的视频播放记录。
[0060] 在本发明中，观看视频的家庭成员的语音信息可W通过智能电视上的音频输入设备输入并作为音频文件存储在预设的语音库中。
[0061 ]在本发明中，用户可自行设定用于识别自身身份的语音信息的内容。
[0062] 为了便于交互，上述语音信息可W为包含关键词的语音指令，该语音指令的设定，最简单的是采用家庭成员自己的名字或其所嗜好的物品名等用户易于记忆的语音指令，当然也可W采用其它的易于记忆的指令。
[0063] 例如，某一观看视频的家庭成员，例如Memberl初次登录时将其所发声的"ABC"作为预设的语音信息，当Memberl再次访问同一视频并发出"ABC"的语音身份验证信息时，本地终端（智能电视)接收到环境中的"ABC'运一语音信号后，需要确认上述"ABC"的语音信息是否为预设的语音信息内容，于是将上述"ABC"的语音信息与预设的语音库中存储的成员的语音信息进行比较，当发现存在相吻合的语音信息时，将该语音信息"ABC'确定为能够唯一标识用户身份的信息，从而确定出用户的身份信息，此时即可确认出访问视频的用户为 memberl〇
[0064] 在一些实施例中，当上述语音信息为包含关键词的语音指令时，为了减小智能电视的系统的数据处理负担，上述语音信息可借助于智能电视内的内置客户端程序，通过语音识别模块等装置上传至互联网，之后由服务商提供的视频资源服务器进行语音分析和识另IJ。考虑到减小容错率，智能电视的内置客户端程序可设置有识别吻合度判定模块，若吻合度高于预设的标准，则判定为识别正确，若低于预设标准，则认为识别不正确，并进行报错提不。
[0065] 但是，采用包含关键词的语音指令作为识别用户身份的语音信息时，需要确保预先存储的用于识别用户身份的语音指令是不同的内容。当用于识别用户身份的语音指令是完全相同的内容，例如均为"ABC'时，可采取其它的语音识别方式。
[0066] 在本发明中，可W采用语音生物特征识别技术，即声纹识别技术。
[0067] 所谓声纹是用电声学仪器显示的携带言语信息的声波频谱，与其他生物特征相比，声纹识别的应用具有如下特殊的优势：（1)蕴含声纹特征的语音获取方便、自然，声纹提取可在不知不觉中完成，因此使用者的接受程度也高；（2)获取语音的识别成本低廉，使用简单，一个麦克风即可，在使用通讯设备时更无需额外的录音设备；（3)适合远程身份确认，只需要一个麦克风或电话、手机就可W通过网路(通讯网络或互联网络)实现远程登录；（4) 声纹辨认和确认的算法复杂度低；（5)配合一些其他措施，如通过语音识别进行内容鉴别等，可W提局准确率等。
[0068] 当采用声纹识别技术时，本发明的声音识别实际变为基于声纹识别的声音识别，当采用声纹识别方式时，在本发明的语音识别方法中，
[0069] 上述步骤S1031还包括:语音信息预处理步骤，对所检测到的用户语音信息进行预处理；特征参数提取步骤，对经预处理后的语音信息进行特征参数的提取，而上述步骤 S1032还包括:声纹模式比较步骤，根据提取出的所述特征参数，与预先存储的声纹模式进行比较，确定与所述用户的声纹模式相对应的用户标识。
[0070] 具体地，在上述声纹模式比较步骤中，进行声纹比较，如果比较结果为否，则将所述声纹模式进行存储，如果比较结果发现存在相吻合的声纹模式，则确定与该声纹模式相对应的用户标识，由此唯一地识别出用户的身份信息。
[0071] 优选地，上述特征参数可W包括：（1)声学特征(倒频谱）；（2)词法特征(说话人相关的词n-gram，音素 n-gram); (3)韵律特征(利用n-gram描述的基音和能量"姿势"）；（4)语种、方言和口音信息；（5)通道信息(使用何种通道）。
[0072] 当然，本发明也可W采用其它语音识别技术，而并不限于上文所描述的声纹识别技术等。
[0073] 步骤S104:基于预先存储的用户标识（即，角色)与视频播放记录的对应关系，控制本地终端(即，智能电视)进入与所识别出的用户标识相对应的视频播放记录。
[0074] 当用户的身份被识别后，基于被识别出的语音信息来源于角色1、角色2、角色 3……角色N中的哪个角色，并根据角色与视频播放记录的对应关系表，调出与之相应的视频播放记录。
[0075] 例如，如果识别出语音信息来源于角色1，则调出相应的角色1的视频播放记录，即视频播放记录1，如果识别出语音信息来源于角色2,则调出相应的角色2的视频播放记录 2，……W此类推，如果识别出语音信息来源于角色N，则调出相应的角色N的视频播放记录 N。由此，用户根据被调出的视频播放记录即可继续观看视频，而不至于受到家庭其他成员观看记录的影响。
[0076] 图3为本发明实施例所提供的视频播放记录匹配装置的结构示意图。如该图3所示，本发明的视频播放记录匹配装置包括：
[0077] 视频数据分发模块11，根据用户对选定视频的触发操作，本地终端的选定视频APP 向视频资源服务器发出视频播放请求，该视频资源服务器接收到该视频播放请求后根据请求信息发送与该选定视频APP相关的数据；
[0078] 播放记录开启模块12,响应于用户操作，进入本地终端的视频播放记录；
[0079] 语音识别模块13,基于语音信息对用户身份信息进行识别和验证；W及
[0080] 播放记录匹配模块14,基于预先存储的用户标识与视频播放记录的对应关系，控制本地终端进入与所识别出的用户标识相对应的视频播放记录。
[0081] 优选地，本发明的上述语音识别模块13进一步包括：
[0082] 身份信息获取模块(未图示），对访问视频的用户语音信息进行检测，获得用户的语音信息并作为唯一识别用户身份的身份识别信息;和
[0083] 语音信息比较模块(未图示），将所检测到的用户语音信息与预设的语音库中所存储的语音信息进行比对，判断两者是否吻合，如果比对后发现两者相吻合，则确定出该用户语音信息所对应的用户标识;如果比对后发现两者不吻合，则存储该用户的标识，将该用户视为新用户，存储该用户的语音信息作为用于比对的原始语音信息，同时自动存储该用户的视频播放记录。
[0084] 进一步地，上述语音信息比较模块进一步包括:查询单元，从预设的语音库中查找是否存在与上述用户语音信息相吻合的语音信息（未图示）；原始语音信息记录创建单元，如果经上述查询单元查询发现所述预设的语音库中不存在与上述用户的语音信息相吻合的语音信息，则创建该用户的原始语音信息记录，将该用户的语音信息作为原始语音信息存储在预设的语音中（未图示）。
[0085] 在一些实施例中，本发明的语音识别模块13还包括:语音信息预处理单元、特征参数提单元、W及用于模式识别的声纹模式比较单元(未图示），其中
[0086] 上述语音信息预处理单元配置成对所检测到的用户语音信息进行预处理；
[0087] 上述特征参数提单元配置成对经预处理后的语音信息进行特征参数的提取；
[0088] 上述声纹模式比较单元配置成根据提取出的所述特征参数，与预先存储的声纹模式进行比较，确定与所述用户的声纹模式相对应的用户标识。
[0089] 在一些实施例中，例如如上文所述那样，在视频观看环境相对比较增杂，干扰的噪声较大的恶劣情况下(例如，当本地终端不是智能电视而是手机时，当利用手机在地铁列车上观看网络视频时），为了便于从很多人在讲话的增杂的周围环境中接收用户的语音信号，本发明的语音识别模块还可W包括:噪声处理单元(未图示），该噪音处理单元对来自周围环境的语音信号中所包含的噪声进行降噪处理;语音振幅调节单元(未图示），该语音振幅调节单元将由上述噪音处理单元降低噪音后的声音数据的振幅调整为规定的声音水平的振幅。
[0090] 本发明的语音识别模块13通过包含噪声处理单元和语音振幅调节单元，能够加速语音信息的识别，从而使系统快速准确地识别出目标语音。
[0091] 如上所述，本发明W家庭成员为例进行了上述描述，但本发明不限定于家庭成员，只要多个用户使用同一账号登录并进行视频观看，均属于本发明所涵盖的范围内。
[0092] 再者，本发明W智能电视作为本地终端进行了如上所述的详细说明，但本发明的技术方案同样适用于其他的能够观看视频并可接入互联网的终端设备，例如手机、pad等智能终端设备等。
[0093] 所属领域的普通技术人员应当理解上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围（包括权利要求)被限于运些例子;在本发明的思路下，W上实施例或者不同实施例中的技术特征之间也可W进行组合，步骤可任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化，为了简明它们没有在细节中提供。因此，凡在本发明的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1. 一种视频播放记录的匹配方法，其特征在于，根据用户对选定视频的触发操作，本地终端的选定视频APP向视频资源服务器发出视频播放请求，该视频资源服务器接收到该视频播放请求后根据请求信息发送与该选定视频 APP相关的数据；响应于用户操作，进入本地终端的视频播放记录；基于语音信息对用户身份信息进行识别和验证;和基于预先存储的用户标识与视频播放记录的对应关系，控制本地终端进入与所识别出的用户标识相对应的视频播放记录。2. 根据权利要求1所述的视频播放记录匹配方法，其特征在于，所述基于语音信息对用户身份信息进行识别和验证的步骤包括：对访问视频的用户语音信息进行检测，获得用户的语音信息并作为唯一识别用户身份的身份识别信息；以及将所检测到的用户语音信息与预设的语音库中所存储的语音信息进行比对，判断两者是否吻合，如果比对后发现两者相吻合，则确定出该用户语音信息所对应的用户标识;如果比对后发现两者不吻合，则存储该用户的标识，将该用户视为新用户，存储该用户的语音信息作为用于比对的原始语音信息，同时自动存储该用户的视频播放记录。3. 根据权利要求2所述的视频播放记录匹配方法，其特征在于，当针对所述用户的语音信息进行声纹识别时，还包括：语音信息预处理步骤，对所检测到的用户语音信息进行预处理；特征参数提取步骤，对经预处理后的语音信息进行特征参数的提取；声纹模式比较步骤，根据提取出的所述特征参数，与预先存储的声纹模式进行比较，确定与所述用户的声纹模式相对应的用户标识。4. 根据权利要求1所述的视频播放记录匹配方法，其特征在于，所述视频播放记录匹配方法还包括：噪音处理步骤，该噪音处理步骤对来自周围环境的语音信号中所包含的噪声进行处理，降低噪声分量；以及语音振幅调节步骤，该语音振幅调节步骤将在上述噪音处理步骤降低噪音后的声音数据的振幅调整为规定的声音水平的振幅。5. 根据权利要求2所述的视频播放记录的匹配方法，其特征在于，从预先存储在预设的语音库的语音信息中查找是否存在与所述用户的语音信息相吻合的语音信息，如果存在则根据所述语音信息对应的用户标识信息，从预设的语音库中调用与所述语音信息相吻合的匹配信息，根据所述匹配信息对所述语音信息进行识别，从而识别出相应的用户身份。6. 根据权利要求1-5之一所述的视频播放记录匹配方法，其特征在于，所述语音信息通过本地终端的音频输入设备输入并作为音频文件存储在预设的语音库。7. 根据权利要求1-5之一所述的视频播放记录匹配方法，其特征在于，所述本地终端每播放一次视频，均为该次视频的播放过程分配一个唯一的播放标识，一个播放标识对应一条视频播放记录。8. -种视频播放记录的匹配装置，其特征在于包括：视频数据分发模块，根据用户对选定视频的触发操作，本地终端的选定视频APP向视频资源服务器发出视频播放请求，该视频资源服务器接收到该视频播放请求后根据请求信息发送与该选定视频APP相关的数据；播放记录开启模块，响应于用户操作，进入本地终端的视频播放记录；语音识别模块，基于语音信息对用户身份信息进行识别和验证;和播放记录匹配模块，基于预先存储的用户标识与视频播放记录的对应关系，控制本地终端进入与所识别出的用户标识相对应的视频播放记录。9. 根据权利要求8所述的视频播放记录匹配装置，其特征在于，所述语音识别模块进一步包括：身份信息获取模块，对访问视频的用户语音信息进行检测，获得用户的语音信息并作为唯一识别用户身份的身份识别信息；以及语音信息比较模块，将所检测到的用户语音信息与预设的语音库中所存储的语音信息进行比对，判断两者是否吻合，如果比对后发现两者相吻合，则确定出该用户语音信息所对应的用户标识;如果比对后发现两者不吻合，则存储该用户的标识，将该用户视为新用户，存储该用户的语音信息作为用于比对的原始语音信息，同时自动存储该用户的视频播放记录。10. 根据权利要求8所述的视频播放记录匹配装置，其特征在于，当针对所述用户的语音信息进行声纹识别时，所述语音识别模块还包括：语音信息预处理单元，配置成对所检测到的用户语音信息进行预处理；特征参数提单元，配置成对经预处理后的语音信息进行特征参数的提取；以及声纹模式比较单元，配置成根据提取出的所述特征参数，与预先存储的声纹模式进行比较，确定与所述用户的声纹模式相对应的用户标识。11. 根据权利要求9所述的视频播放记录匹配装置，其特征在于，所述语音信息比较模块进一步包括：查询单元，从预设的语音库中查找是否存在与上述用户语音信息相吻合的语音信息；以及原始语音信息记录创建单元，如果经上述查询单元查询发现预设的语音库中不存在与上述用户的语音信息相吻合的语音信息，则创建该用户的原始语音信息记录，将该用户的语音信息作为原始语音信息存储在预设的语音中。12. 根据权利要求8所述的视频播放记录匹配装置，其特征在于，所述语音识别模块还包括：噪声处理单元，对来自周围环境的语音信号中所包含的噪声进行降噪处理；以及语音振幅调节单元，将由所述噪音降低单元降低噪音后的声音数据的振幅调整为规定的声音水平的振幅。13. 根据权利要求8-12之一所述的视频播放记录匹配装置，其特征在于，所述语音信息通过本地终端的音频输入设备输入并作为音频文件存储在预设的语音库。14. 根据权利要求8-12之一所述的视频播放记录匹配系统，其特征在于，所述本地终端每播放一次视频，均为该次视频的播放过程分配一个唯一的播放标识，一个播放标识对应一条视频播放记录。
【文档编号】H04N21/254GK105872619SQ201510938811
【公开日】2016年8月17日
【申请日】2015年12月15日
【发明人】张丽娜
【申请人】乐视网信息技术（北京）股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张丽娜;
技术所有人：乐视网信息技术（北京）股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。