一种基于AI算法的视频检核方法及装置与流程

文档序号：23616520发布日期：2021-01-12 10:26阅读：167来源：国知局

本发明涉及视频检核领域，尤其涉及一种基于ai算法的视频检核方法及装置。

背景技术：

目前，在日常生活中常见的许多场景下，存在大量业务流程需要对用户的身份进行核验。现有的核验方式，通常是用户在手机上传自拍人脸照片，或者通过银行等机构的专用终端设备摄像头拍摄用户的人脸照片，利用人脸照片对用户的身份进行核验。一方面，核验过程较为繁琐，有时需要用户多次拍摄上传多张照片。另一方面，由于照片是静态画面，有时难以区分是用户实时对着人脸拍摄还是对着图片拍摄，导致该检核方式的准确度有限。因此，有必要提出一种基于ai算法的视频检核方法及装置，以解决上述问题。

技术实现要素：

本发明提供一种基于ai算法的视频检核方法及装置，以解决现有的用户身份检核方式核验过程较为繁琐，准确度有限的问题。

第一方面，本发明提供一种基于ai算法的视频检核方法，所述方法包括：

接收用户通过点击核验装置的开始核验按钮所发送的核验请求；

向用户发送视频核验提示信息；

获取用户按照视频核验提示信息作出动作的视频信息；

提取所述视频信息中用户的行为特征；

根据所述行为特征，判断用户的行为是否与所述视频核验提示信息要求作出的行为相一致；

如果用户的行为与所述视频核验提示信息要求作出的行为不一致，生成检核失败提示信息。

结合第一方面，在第一方面的第一种可实现方式中，所述视频核验提示信息要求作出的行为包括抬头、低头、左摇头、右摇头以及眨眼中的一种或者多种。

结合第一方面的第一种可实现方式，在第一方面的第二种可实现方式中，如果用户的行为与所述视频核验提示信息要求作出的行为一致，利用ai深度学习模型，对所述视频信息进行有效性检测；

根据有效性检测结果，判断所述视频信息是否具备有效性；

如果所述视频信息不具备有效性，生成检核失败提示信息。

结合第一方面的第二种可实现方式，在第一方面的第三种可实现方式中，如果所述视频信息具备有效性，根据所述视频信息对用户人脸进行活体检测和翻拍检测；

根据人脸进行活体检测和翻拍检测结果，判断所述视频信息是否具备真实性；

如果所述视频信息不具备真实性，生成检核失败提示信息。

结合第一方面的第三种可实现方式，在第一方面的第四种可实现方式中，如果所述视频信息具备真实性，向用户发送语音核验提示信息；

获取用户按照语音核验提示信息作出朗读的音频信息；

利用ai语音识别技术对用户朗读的音频信息进行检测；

识别所述音频信息是否具备有效性；

如果所述音频信息具备有效性，生成检核成功提示信息；

如果所述音频信息不具备有效性，生成检核成失败提示信息。

第二方面，本发明还提供一种基于ai算法的视频检核装置，所述装置包括：

接收单元，用于接收用户通过点击核验装置的开始核验按钮所发送的核验请求；

第一发送单元，用于向用户发送视频核验提示信息；

第一获取单元，用于获取用户按照视频核验提示信息作出动作的视频信息；

提取单元，用于提取所述视频信息中用户的行为特征；

第一判断单元，用于根据所述行为特征，判断用户的行为是否与所述视频核验提示信息要求作出的行为相一致；

生成单元，用于在用户的行为与所述视频核验提示信息要求作出的行为不一致的情况下，生成检核失败提示信息。

结合第二方面，在第二方面的第一种可实现方式中，所述视频核验提示信息要求作出的行为包括抬头、低头、左摇头、右摇头以及眨眼中的一种或者多种。

结合第二方面的第一种可实现方式，在第二方面的第二种可实现方式中，所述装置还包括：

第一检测单元，用于在用户的行为与所述视频核验提示信息要求作出的行为一致的情况下，利用ai深度学习模型，对所述视频信息进行有效性检测；

第二判断单元，用于根据有效性检测结果，判断所述视频信息是否具备有效性；

所述生成单元，还用于在所述视频信息不具备有效性的情况下，生成检核失败提示信息。

结合第二方面的第二种可实现方式，在第二方面的第三种可实现方式中，所述装置还包括：

第二检测单元，用于在所述视频信息具备有效性的情况下，根据所述视频信息对用户人脸进行活体检测和翻拍检测；

第三判断单元，用于根据人脸进行活体检测和翻拍检测结果，判断所述视频信息是否具备真实性；

所述生成单元，还用于在所述视频信息不具备真实性的情况下，生成检核失败提示信息。

结合第二方面的第三种可实现方式，在第二方面的第四种可实现方式中，所述装置还包括：

第二发送单元，用于在所述视频信息具备真实性的情况下，向用户发送语音核验提示信息；

第二获取单元，用于获取用户按照语音核验提示信息作出朗读的音频信息；

第三检测单元，用于利用ai语音识别技术对用户朗读的音频信息进行检测；

识别单元，用于识别所述音频信息是否具备有效性；

所述生成单元，还用于在所述音频信息具备有效性的情况下，生成检核成功提示信息；

所述生成单元，还用于在所述音频信息不具备有效性的情况下，生成检核成失败提示信息。

由以上技术方案可知，本发明的基于ai算法的视频检核方法及装置，通过接收用户通过点击核验装置的开始核验按钮所发送的核验请求，向用户发送视频核验提示信息，获取用户按照视频核验提示信息作出动作的视频信息，提取所述视频信息中用户的行为特征，根据所述行为特征，判断用户的行为是否与所述视频核验提示信息要求作出的行为相一致，如果用户的行为与所述视频核验提示信息要求作出的行为不一致，生成检核失败提示信息，实现了根据视频检核用户身份，提升用户操作的便利性，此外，还可以利用ai深度学习模型，对所述视频信息进行有效性检测，根据所述视频信息对用户人脸进行活体检测和翻拍检测，利用ai语音识别技术对用户朗读的音频信息进行检测，进一步提升检核的准确性。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于ai算法的视频检核方法的流程图。

图2为本发明提供的基于ai算法的视频检核方法一实施例的流程图。

图3为本发明提供的基于ai算法的视频检核方法一实施例的流程图。

图4为本发明提供的基于ai算法的视频检核方法一实施例的流程图。

图5为本发明提供的基于ai算法的视频检核装置的示意图。

图6为本发明提供的基于ai算法的视频检核装置一实施例的流程图。

图7为本发明提供的基于ai算法的视频检核装置一实施例的流程图。

图8为本发明提供的基于ai算法的视频检核装置一实施例的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。以下结合附图，详细说明本发明各实施例提供的技术方案。

图1为本发明提供的一种基于ai算法的视频检核方法，该方法的执行主体为服务器所述方法包括如下步骤：

步骤s101，接收用户通过点击核验装置的开始核验按钮所发送的核验请求。

具体地，核验装置可以是银行或者其他经营场所的自助终端机，自助终端机上设置有摄像头和扬声器，自助终端机的处理器可以与服务器通信连接。用户在办理某项业务时，需要检核身份时，可以在自助终端机的触摸显示屏界面点击开始核验按钮，从而向自助终端机的处理器发出一个核验请求。

步骤s102，向用户发送视频核验提示信息。

具体地，自助终端机的处理器接收到该核验请求后，可以通过扬声器向用户发送视频核验提示信息，该视频核验提示信息具体可以是指引用户在摄像头前做出各种动作的语音提示。

步骤s103，获取用户按照视频核验提示信息作出动作的视频信息。

具体地，自助终端机的扬声器向用户发送视频核验提示信息后，自助终端机处理器可以控制摄像头采集用户的视频信息，之后可由自助终端机的处理器将视频信息通过网络上传到服务器。

步骤s104，提取所述视频信息中用户的行为特征。

具体地，由服务器取所述视频信息中用户的行为特征，行为特征的提取可采用现有技术实现。

步骤s105，根据所述行为特征，判断用户的行为是否与所述视频核验提示信息要求作出的行为相一致。

具体地，视频核验提示信息要求作出的行为可以包括抬头、低头、左摇头、右摇头以及眨眼中的一种或者多种。服务器通过将行为特征与视频核验提示信息要求作出的行为相对比，来检查用户是否正确按照视频核验提示信息要求作出相应的行为。

步骤s106，如果用户的行为与所述视频核验提示信息要求作出的行为不一致，生成检核失败提示信息。

具体地，用户的行为与所述视频核验提示信息要求作出的行为不一致，则终止检核过程，通过自助终端机的触摸显示屏截面向用户提示检核失败，并且可以同时显示重新开始检核的按钮。

如图2所示，在一种可选的实施方式中，如果用户的行为与所述视频核验提示信息要求作出的行为一致，该方法还包括：

步骤s201，利用ai深度学习模型，对所述视频信息进行有效性检测。

具体地，视频信息进行有效性检测，具体指的是检测视频信息是真实的人脸视频，还是ai换脸技术合成的视频信息。由于目前ai换脸技术飞速发展，因此可能存在利用ai换脸技术合成视频信息的可能。为了解决这个问题，学界与业界正在研究如何利用ai技术去反向鉴别图像、视频的真伪。目前，最常被使用的ai换脸算法有三种：deepfake、faceswap和face2face。其中，deepfake基于大家所熟知的gan技术，对于它所生成的脸，人类的识别率大约为75％*。faceswap是一个学习重建脸部特征的深度学习算法，可以对给出的图片进行模型替换，人类对于此类换脸的识别率也是75％左右*。face2face则是用其他真实的人脸去替换原本的人脸，不涉及人脸的生成，对于它制造的脸，人类的识别率只有41％*。作为目前学术界最大的合成视频数据库之一，由慕尼黑技术大学创建的faceforensics数据库涵盖了经过以上三种换脸算法编辑的公开视频，以供学术研究使用。除了deepfake，市场上存在多种换脸技术，不同算法生成的图像结果千差万别，难以使用同一个换脸鉴别模型解决所有换脸技术的进攻。因此，可以利用ai深度学习模型，结合多种现有技术，对所述视频信息进行有效性检测，以准确识别视频信息的有效性。

步骤s202，根据有效性检测结果，判断所述视频信息是否具备有效性。

步骤s203，如果所述视频信息不具备有效性，生成检核失败提示信息。

如图3所示，在一种可选的实施方式中，如果所述视频信息具备有效性，该方法还包括：

步骤s301，根据所述视频信息对用户人脸进行活体检测和翻拍检测。

具体地，活体检测和翻拍检测是在一些身份验证场景确定对象真实生理特征的方法，在人脸识别应用中，活体检测能通过眨眼、张嘴、摇头、点头等组合动作，使用人脸关键点定位和人脸追踪等技术，验证用户是否为真实活体本人操作，可有效抵御照片、换脸、面具、遮挡以及屏幕翻拍等常见的攻击手段，从而帮助用户甄别欺诈行为，保障用户的利益。

步骤s302，根据人脸进行活体检测和翻拍检测结果，判断所述视频信息是否具备真实性。

步骤s303，如果所述视频信息不具备真实性，生成检核失败提示信息。

如图4所示，在一种可选的实施方式中，如果所述视频信息具备真实性，该方法还包括：

步骤s401，向用户发送语音核验提示信息。

具体地，可以通过自助终端机的处理器控制扬声器发出语音核验提示信息，同时通过触控显示屏显示一段预设的文字信息。语音核验提示信息用于指引用户对着自助终端机的麦克风位置朗读该文字信息。

步骤s402，获取用户按照语音核验提示信息作出朗读的音频信息。

具体地，用户按照语音核验提示信息的指引，朗读触控显示屏上的文字信息后，自助终端机处理器收集到用户朗读的音频信息，并将音频信息通过网络上传至服务器。

步骤s403，利用ai语音识别技术对用户朗读的音频信息进行检测。

具体地，服务器在接收到音频信息后，利用现有的ai语音识别技术对用户朗读的音频信息进行检测，检测该语音是否朗读正确，以及语音是否为真人语音。

步骤s404，识别所述音频信息是否具备有效性。

步骤s405，如果所述音频信息具备有效性，生成检核成功提示信息。

步骤s406，如果所述音频信息不具备有效性，生成检核成失败提示信息。

由以上实施例可知，本发明的基于ai算法的视频检核方法，通过接收用户通过点击核验装置的开始核验按钮所发送的核验请求，向用户发送视频核验提示信息，获取用户按照视频核验提示信息作出动作的视频信息，提取所述视频信息中用户的行为特征，根据所述行为特征，判断用户的行为是否与所述视频核验提示信息要求作出的行为相一致，如果用户的行为与所述视频核验提示信息要求作出的行为不一致，生成检核失败提示信息，实现了根据视频检核用户身份，提升用户操作的便利性，此外，还可以利用ai深度学习模型，对所述视频信息进行有效性检测，根据所述视频信息对用户人脸进行活体检测和翻拍检测，利用ai语音识别技术对用户朗读的音频信息进行检测，进一步提升检核的准确性。

如图5所示，本发明还提供一种基于ai算法的视频检核装置，所述装置包括：

接收单元501，用于接收用户通过点击核验装置的开始核验按钮所发送的核验请求；

第一发送单元502，用于向用户发送视频核验提示信息；

第一获取单元503，用于获取用户按照视频核验提示信息作出动作的视频信息；

提取单元504，用于提取所述视频信息中用户的行为特征；

第一判断单元505，用于根据所述行为特征，判断用户的行为是否与所述视频核验提示信息要求作出的行为相一致；

生成单元506，用于在用户的行为与所述视频核验提示信息要求作出的行为不一致的情况下，生成检核失败提示信息。

所述视频核验提示信息要求作出的行为包括抬头、低头、左摇头、右摇头以及眨眼中的一种或者多种。

如图6所示，作为一种可选的实施方式，所述装置还包括：

第一检测单元601，用于在用户的行为与所述视频核验提示信息要求作出的行为一致的情况下，利用ai深度学习模型，对所述视频信息进行有效性检测；

第二判断单元602，用于根据有效性检测结果，判断所述视频信息是否具备有效性；

所述生成单元506，还用于在所述视频信息不具备有效性的情况下，生成检核失败提示信息。

如图7所示，作为一种可选的实施方式，所述装置还包括：

第二检测单元701，用于在所述视频信息具备有效性的情况下，根据所述视频信息对用户人脸进行活体检测和翻拍检测；

第三判断单元702，用于根据人脸进行活体检测和翻拍检测结果，判断所述视频信息是否具备真实性；

所述生成单元506，还用于在所述视频信息不具备真实性的情况下，生成检核失败提示信息。

如图8所示，作为一种可选的实施方式，所述装置还包括：

第二发送单元801，用于在所述视频信息具备真实性的情况下，向用户发送语音核验提示信息；

第二获取单元802，用于获取用户按照语音核验提示信息作出朗读的音频信息；

第三检测单元803，用于利用ai语音识别技术对用户朗读的音频信息进行检测；

识别单元804，用于识别所述音频信息是否具备有效性；

所述生成单元506，还用于在所述音频信息具备有效性的情况下，生成检核成功提示信息；

所述生成单元506，还用于在所述音频信息不具备有效性的情况下，生成检核成失败提示信息

本发明实施例还提供一种存储介质，本发明实施例还提供一种存储介质，所述存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现本发明提供的基于ai算法的视频检核方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文：read-onlymemory，简称：rom)或随机存储记忆体(英文：randomaccessmemory，简称：ram)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中各个实施例之间相同相似的部分互相参见即可。尤其，对于基于ai算法的视频检核装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

以上所述的本发明实施方式并不构成对本发明保护范围的限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张迪;熊人杰;廖四发;龚潇雨;朱灿;朱文彩;郑瑶;丁丁;张俊
技术所有人：湖南三湘银行股份有限公司
我是此专利的发明人

上一篇：半导体器件生产用耐热性压敏粘合片的制作方法
上一篇：全脱骨高蛋白叫花鸡及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。