一种基于音视频文件的用户行为认证方法和装置的制造方法

文档序号:8431063阅读:694来源:国知局
一种基于音视频文件的用户行为认证方法和装置的制造方法
【技术领域】
[0001]本申请涉及计算机技术领域,尤其涉及一种基于音视频文件的用户行为认证方法和装置。
【背景技术】
[0002]随着互联网技术的广泛发展,用户可以通过互联网实现各种业务操作。比如:用户可以通过互联网进行交流通信,用户也可以通过互联网进行财务借贷等。要实现上述业务,服务提供方往往需要先对用户的行为进行认证,比如:通过用户的行为认证用户是否已经清楚了解业务操作的规定等。
[0003]相关技术中,用户可以上传一段音视频文件,然后由服务提供方基于该音视频文件对用户的行为进行认证。然而,目前服务提供方通常采用人工认证的方式,效率较低,且成本较高。因此,一种基于音视频文件的用户行为自动认证方案是亟待提供的。

【发明内容】

[0004]有鉴于此,本申请提供一种基于音视频文件的用户行为认证方法和装置。
[0005]具体地,本申请是通过如下技术方案实现的:
[0006]一种基于音视频文件的用户行为认证方法,所述方法包括:
[0007]判断用户上传的音视频文件的视频是否满足认证条件;
[0008]如果所述音视频文件的视频满足所述认证条件,则将所述音视频文件的音频转换为对应的待认证文本;
[0009]根据所述音视频文件对应的待认证文本对用户行为进行认证。
[0010]进一步地,所述判断用户上传的音视频文件的视频是否满足认证条件,包括:
[0011]从所述音视频文件中提取多张图片;
[0012]判断所述多张图片的背景的相似度是否大于等于第一阈值;
[0013]如果所述多张图片的背景的相似度大于等于所述第一阈值,则确认所述音视频文件的视频满足所述认证条件。
[0014]进一步地,所述将所述音视频文件的音频转换为对应的待认证文本,包括:
[0015]根据预设的第一分割规则将所述音视频文件的音频分为N个音频片段,N为大于I的自然数;
[0016]将所述音频片段中的音频转换为对应的初始文本;
[0017]组合所述N个音频片段对应的N个初始文本,以得到所述音视频文件对应的待认证文本。
[0018]进一步地,在将所述音频片段中的音频识别为对应的初始文本之后,所述方法还包括:
[0019]根据预设的第二分割规则从所述音视频文件的音频中提取出N-1个校验音频片段;
[0020]将所述校验音频片段中的音频转换为对应的校验文本;
[0021]根据所述N-1个校验文本判断所述N个音频片段对应的N个初始文本是否准确;
[0022]如果所述N个音频片段对应的N个初始文本准确,则组合所述N个音频片段对应的N个初始文本。
[0023]进一步地,所述根据所述音视频文件对应的待认证文本对用户行为进行认证,包括:
[0024]计算所述音视频文件对应的待认证文本和预设的认证文本的文本相似度;
[0025]当所述文本相似度大于等于预设的第二阈值时,确认用户认证通过。
[0026]一种基于音视频文件的用户行为认证装置,所述装置包括:
[0027]判断单元,用于判断用户上传的音视频文件的视频是否满足认证条件;
[0028]转换单元,用于在所述音视频文件的视频满足所述认证条件时,将所述音视频文件的音频转换为对应的待认证文本;
[0029]认证单元,用于根据所述音视频文件对应的待认证文本对用户行为进行认证。
[0030]进一步地,所述判断单元,具体用于从所述音视频文件中提取多张图片,判断所述多张图片的背景的相似度是否大于等于第一阈值,并在所述多张图片的背景的相似度大于等于所述第一阈值时,确认所述音视频文件的视频满足所述认证条件。
[0031]进一步地,所述转换单元,具体用于根据预设的第一分割规则将所述音视频文件的音频分为N个音频片段,N为大于I的自然数;将所述音频片段中的音频转换为对应的初始文本;组合所述N个音频片段对应的N个初始文本,以得到所述音视频文件对应的待认证文本。
[0032]进一步地,所述装置还包括:
[0033]校验单元,用于在将所述音频片段中的音频识别为对应的初始文本之后,根据预设的第二分割规则从所述音视频文件的音频中提取出N-1个校验音频片段;将所述校验音频片段中的音频转换为对应的校验文本;根据所述N-1个校验文本判断所述N个音频片段对应的N个初始文本是否准确;
[0034]所述转换单元,具体在所述N个音频片段对应的N个初始文本准确时,组合所述N个音频片段对应的N个初始文本。
[0035]进一步地,所述认证单元,具体计算所述音视频文件对应的待认证文本和预设的认证文本的文本相似度,并当所述文本相似度大于等于预设的第二阈值时,确认用户认证通过。
[0036]由以上描述可以看出,本申请可以在确认用户上传的音视频文件的视频满足认证条件后,将所述音视频文件的音频转换为对应的待认证文本,并根据所述待认证文本对用户行为进行认证,从而可以基于音视频文件对用户行为进行自动认证,节省人力资源,提高认证效率。
【附图说明】
[0037]图1是本申请一示例性实施例中一种基于音视频文件的用户行为认证方法的流程图。
[0038]图2是本申请一示例性实施例中另一种基于音视频文件的用户行为认证方法的流程图。
[0039]图3是本申请一示例性实施例中一种终端结构示意图。
[0040]图4是本申请一示例性实施例中一种基于音视频文件的用户行为认证装置的结构示意图。
【具体实施方式】
[0041]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0042]在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0043]应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
[0044]针对上述问题,本申请提供一种基于音视频文件的用户行为的自动认证方案。
[0045]图1是本申请一示例性实施例中一种基于音视频文件的用户行为认证方法的流程图。
[0046]请参考图1,本申请提供一种基于音视频文件的用户行为认证方法,所述方法可以应用在终端上,包括有以下步骤:
[0047]步骤101,判断用户上传的音视频文件的视频是否满足认证条件。
[0048]在本实施例中,可以从用户上传的音视频文件中随机提取出多张图片,然后判断所述多张图片的背景的相似度是否大于等于预设的第一阈值,当所述多张图片的背景的相似度大于等于所述第一阈值时,可以确认所述音视频文件的视频满足所述认证条件。
[0049]步骤102,如果所述音视频文件的视频满足所述认证条件,则将所述音视频文件的音频转换为对应的待认证文本。
[0050]在本实施例中,可以在所述视音频文件的视频满足所述认证条件时,将所述音视频文件的音频转换为对应的待认证文本。具体地,可以通过语音识别方法将所述音频转换为对应的待认证文本。为了提高音频转换的准确度,也可以将所述音频分为多个音频片段,然后分别将每个音频片段的音频转换为对应的初始文本,通过组合各个初始文本以得到所述音频对应的待认证文本。当然,本领域技术人员也可以采用其他方法将所述音视频文件的音频转换为对应的待认证文本,本申请对此不作特殊限制。
[0051]步骤103,根据所述音视频文件对应的待认证文本对用户行为进行认证。
[0052]在本实施例中,可以将所述音视频文件对应的待认证文本与预设的认证文本进行匹配,比如:计算所述待认
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1