内容识别方法和系统以及内容管理客户端和服务器的制作方法

文档序号:7695404阅读:134来源:国知局
专利名称:内容识别方法和系统以及内容管理客户端和服务器的制作方法
技术领域
本发明涉及信息安全技术领域,特别是涉及一种内容识别方法和系统以 及内容管理客户端和服务器。
背景技术
侵犯版权的内容在网络上传播的问题日益引起人们的普遍关注。对侵犯 版权的内容的正确识别是对在网络上传播的这些内容进行过滤、屏蔽或其他 控制处理的基础。
i见有的安全内容识另ll才几制 (Secure Content Identification Mechan i sm,以下简称SCIDM)是基于特征(fingerpr int)提取的内容识别机制 (content-based identification)(以下称为基于特征值识别方式)。基 于SCI画的内容识别系统管理一个内容管理服务器(SCIDM Server)(或称 之为内容管理中心(Content Identification Manager,简称CIM))。受保 护的内容在内容管理中心注册,由内容管理中心为受保护的内容提取特征值 并保存,同时内容管理中心保存该受保护的内容的相关属性(如版权归属 信息、版权保护规则等)信息。此外,基于SCI画的内容识别系统还定义了 内容管理客户端(SCIDM Client)(或称之为监控实体(Moni tor Ent ity,简 称ME))。内容管理客户端用于监控经过或发送到监控网关、用户终端、内 容分享网站等实体的内容是否属于侵犯版权的内容。在监控过程中,内容管 理客户端对接收到的内容提取特征值,并将提取的特征值发给内容管理服务 器,由内容管理服务器在本地查找与提取的特征值相匹配的受保护内容的特 征值。如果内容管理服务器查找到与提取的特征值相匹配的受保护内容的特 征值,则将相关的内容属性返回给内容管理客户端,由内容管理客户端根据这些内容属性对相应内容进行过滤、屏蔽或其他控制处理。
发明人在实现本发明过程中发现,现有的基于特征值识别方式中,内容 管理客户端提取内容的特征值以及内容管理服务器根据内容的特征值进行查 找和匹配等内容识别处理都需消耗大量的计算资源。由于网络中音视频内容 数量巨大,因此,更加严重的造成内容管理客户端和内容管理服务器的负荷 巨大,并且识别效率J氐。

发明内容
本发明实施例提供一种内容识别方法和系统以及内容管理客户端和服务 器,有利于降低内容识别系统负荷,提高识别效率。
本发明实施例第一方面提供了 一种内容识别方法,包括 选耳又待识别内容的识别方式;
提取与选取的所述识别方式相应的所述待识别内容的识别信息; 发送第一内容识别请求,所述第一内容识别请求中包括选取的所述识别 方式和识别信息,用于请求内容管理服务器采用所述识别方式并根据所述识 别信息识别所述待识别内容的属性。
本发明实施例第一方面提供的一种内容识别方法中,通过选取待识别内 容的识别方式,在待识别内容中提取采用选取的识别方式进行内容识别所需 的识别信息,并向内容管理服务器发送包括识别方式和识别信息的第一内容 识别请求,指示内容管理服务器采用第 一内容识别请求中包括的识别方式, 并根据第一内容识别请求中包括的识别信息识别待识别内容的属性,从而实 现可根据内容识别系统的负荷情况或实际安全需求灵活选取内容识别方式, 并有利于降低内容识别系统的负荷,提高内容识别的效率。
本发明实施例第二方面提供了另 一种内容识别方法,包括 根据接收的来自内容管理客户端的第一内容识别请求,获取所述第一内 容识别请求中包括的识别方式和与所述识别方式相应的识别信息;采用所述识别方式,并根据所述识别信息以及预先存储的内容数据信息 识别待识别内容的属性。
本发明实施例第二方面提供的另 一种内容识别方法中,通过接收内容管 理客户端发送的第 一 内容识别请求,采用第 一 内容识别请求中包括的识别方 式,并根据第一内容识别请求中包括的识别信息识别待识别内容的属性,使 得内容管理客户端选取识别方式和识别信息可分别作为待识别内容识别过程 采用的识别方式和识别信息,有利于内容管理客户端根据内容识别系统的负 荷情况或实际安全需求灵活选取内容识别方式,从而有利于降低内容识别系 统的负荷,提高内容识别的效率。
本发明实施例第三方面提供了一种内容管理客户端,包括
选取模块,用于选取待识别内容的识别方式;
提取模块,用于提取与选取的所述识别方式相应的所述待识别内容的识 别信息;
发送模块,用于发送第一内容识别请求;所述第一内容识别请求中包括 选取的所述识别方式和识别信息,用于请求内容管理服务器采用所述识别方 式并根据所述识别信息识别所述待识别内容的属性。
本发明实施例第三方面提供的 一种内容管理客户端中,通过选取模块选 取待识别内容的识别方式,提取模块在待识别内容中提取采用选取的识别方 式进行内容识别所需的识别信息,并通过发送模块向内容管理服务器发送包 括识别方式和识别信息的第一 内容识别请求,指示内容管理服务器采用第一 内容识别请求中包括的识别方式,并根据第一内容识别请求中包括的识别信 息识别待识别内容的属性,从而实现内容管理客户端可根据内容识别系统的 负荷情况或实际安全需求灵活选取内容识别方式,并有利于降低内容识别系 统的负荷,提高内容识别的效率。
本发明实施例第四方面提供了一种内容管理服务器,包括
获取模块,用于根据接收的来自内容管理客户端的第 一 内容识别请求,获取所述第 一 内容识别请求中包括的识别方式和与所述识别方式相应的识别
信息;
识别模块,用于采用所述识别方式并根据所述识别信息以及预先存储的 内容数据信息识别待识别内容的属性。
本发明实施例第四方面提供的一种内容管理服务器中,通过获取模块获 取内容管理客户端发送的第 一 内容识别请求中包括的识别方式和识别信息, 并通过识别模块采用获取的识别方式和识别信息识别待识别内容的属性,使 得内容管理客户端选取的识别方式和识别信息可分别作为识别模块进行待识 别内容的识别过程中采用的识别方式和识别信息,有利于内容管理客户端根 据内容识别系统的负荷情况或实际安全需求灵活选取内容识别方式,从而有 利于降低内容识别系统的负荷,提高内容识别的效率。
本发明实施例第五方面提供了 一种内容识别系统,包括
内容管理客户端,用于选取待识别内容的识别方式;提取与选取的所述 识别方式相应的所述待识别内容的识别信息;发送第一内容识别请求,所述 第 一 内容识别请求中包括选if又的所述识别方式和识别信息;
内容管理服务器,用于根据接收的来自内容管理客户端的第一内容识别 请求,获取所述第一 内容识别请求中包括的识别方式和与所述识别方式相应 的识别信息;采用所述识别方式,并根据所述识别信息以及预先存储的内容 数据信息识别待识别内容的属性。
本发明实施例第五方面提供的一种内容识别系统中,通过内容管理客户端 选取待识别内容的识别方式,在待识别内容中提取采用选取的识别方式进行内 容识别所需的识别信息,并向内容管理服务器发送包括识别方式和识别信息的 第 一 内容识别请求,由内容管理服务器采用第 一 内容识别请求中包括的识别方 式,并根据第一内容识别请求中包括的识别信息识别待识别内容的属性,从而 实现内容管理客户端可根据内容识别系统的负荷情况或实际安全需求灵活选 取内容识别方式,并有利于降低内容识别系统的负荷, 高内容识别的效率。


图1为本发明一种内容识别方法第一实施例流程图; 图2为本发明一种内容识别方法第二实施例流程图; 图3为本发明一种内容识别方法第三实施例流程图; 图4为本发明一种内容识别方法第四实施例流程图; 图5为本发明一种内容识别方法第五实施例流程图; 图6为本发明另一种内容识别方法实施例流程图; 图7为本发明内容管理客户端第一实施例的结构示意图; 图8为本发明内容管理客户端第二实施例的结构示意图; 图9为本发明内容管理服务器第一实施例的结构示意图; 图10为本发明内容管理服务器第二实施例的结构示意图; 图11为本发明内容识别系统实施例的结构示意图。
具体实施例方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 图1为本发明一种内容识别方法第一实施例流程图。如图1所示,本实 施例包括
步骤11、内容管理客户端选取待识别内容的识别方式。 内容管理客户端可对经过或发送到监控网关、用户终端、内容分享网站 等实体的内容进行监控,并在监控过程中根据实际需要对经过或发送到监控 网关、用户终端、内容分享网站等实体的内容进行内容识别。内容管理客户 端发起待识别内容的内容识别过程时,可根据内容识别系统的负荷情况、具 体应用场景或预先设置的安全需求,选取内容识别方式。
内容管理客户端选取的内容识别方式可包括基于内容标识识别方式、 基于篡改信息识别方式、基于内容元数据识别方式、基于水印识别方式或基 于特征值识别方式等。这五种内容识别方式的内容识别效率依次由简单逐渐复杂,但内容识别鲁棒性和安全性上由弱逐渐增强,即越简单的识别方式 可靠性较低,越复杂的识别方式可靠性较高。例如为了逃避内容管理客户 端的内容识别,内容的标识和名称最容易被篡改;元数据(metadata)通常被 嵌入文件头中,需要专门的工具才能被读出或写入,所以通过篡改元数据篡 改内容的难度较大;数字水印是被随机嵌入内容的某些位(bit )中,由于嵌 入位置信息是保密的并且普通用户难以获知,因而通过破坏数字水印篡改内 容的难度也较大;而由于特征提取方法是直接从内容中提取关键特征来与受 保护的内容特征值进行对比,因此只有对内容的关键特征进行破坏才能使得 基于内容关键值识别方式识别内容的方式失效,但由于内容的关键特征被改 变后,内容本身可能已被重新改编或被严重篡改。如果内容相对于受保护内容 已被重新改编,即内容已被再创作,则该内容不再侵犯受保护内容的原版权; 如果内容被严重破坏,则破坏后用户观看内容时感知很差,通常这种内容破 坏没有意义;所以基于特征值识别方式进行内容识别的可靠性和安全性最高。 发明人在实现本发明过程中发现,采用简单的内容识别方式(如基于 内容标识识别方式等)正确识别内容属性的概率仍然较大,在实际应用中, 多数用户不会改变内容的名称和内容标识,改变元数据(metadata)的概率 较少,而破坏数字水印的概率更少。因此,本发明实施例区别于现有技术的 是并不是所有的内容识别都需要采用基于复杂的识别方式(如基于特征 值识别方式),而是可根据内容识别系统的负荷情况、具体应用场景或预先 设置的安全需求,灵活选取合适的内容识别方式来进行内容识别。为了在实 际应用中获得较高的内容识别效率,内容管理客户端根据内容识别系统的负 荷情况、具体应用场景或预先设置的安全需求,灵活选取内容识别方式;例 如如果内容识别系统负荷较低、涉及安全性要求较低或预设的安全需求等 级较低的应用场景,可选取较简单的内容识别方式(如基于内容识别方式、 基于篡改信息识别方式等),从而在保证内容安全性的基础上,降低系统负 荷,节约系统资源;如果内容识别系统负荷较高、涉及安全性要求预设的安全需求等级较高的应用场景,可选取较复杂的内容识别方式(如基于特征
值识别方式等),从而有效保证内容识别的可靠性和安全性。
步骤12、内容管理客户端提取与选取的识别方式相应的待识别内容的识 别信息。
在内容管理客户端完成选取待识别内容的识别方式时,内容管理客户端 提取与选取的识别方式相应的待识别内容的识别信息,其中,内容管理客户 端从待识别内容中提取的识别信息可包括待识别内容的内容标识、内容大小 信息、内容源地址信息、内容目标地址信息、元数据、数字水印或内容特征 值等。具体的,内容标识可为待识别内容的名称(Name)或内容识别服务器 为已注册内容分配的唯一标识。在内容管理客户端选取的识别方式为基于内 容标识识别方式时,内容管理客户端提取的识别信息包括待识别内容的内 容标识和第一辅助识别信息,第一辅助识别信息包括但不限于内容大小信息; 在内容管理客户端选取的识别方式为基于篡改信息识别方式时,内容管理客 户端提取的识别信息包括待识别内容的内容标识和第二辅助识别信息,该第 二辅助识别信息可包括内容的源地址信息、目标地址信息或其他辅助识别信 息,内容源地址信息即为发出该内容的实体的网络地址或网络标识,内容目 标地址信息即为内容发送的目标实体的网络地址或网络标识;在内容管理客 户端选取的识别方式为基于水印识别方式时,内容管理客户端提取的识别信 息包括待识别内容中的数字水印;在内容管理客户端选取的识别方式为基于 特征值识别方式时,内容管理客户端提取的识别信息包括待识别内容的内容 特征值等。
此外,内容管理客户端在向内容管理服务器发送内容识别请求时,还可 选取多种识别方式,例如选取最复杂识别方式外的多种识别方式,并且分 别提取每种识别方式所需的识别信息。内容管理服务器可根据识别方式复杂 度的执行次序依次采取相应的识别方式,当各种识别方式均已采用但仍未能 成功识别内容时,内容管理客户端还可选取最复杂识别方式,再次发起内容识别流禾呈。
步骤13、内容管理客户端向内容管理服务器发送第一内容识别请求;该 第 一 内容识别请求中包括选取的识别方式和与选取的识别方式相应的识别信 息,用于请求内容管理服务器采用该识别方式并根据该识别信息识别待识别 内容的属性。
本实施例通过选取待识别内容的识别方式,在待识别内容中提取采用选 取的识别方式进行内容识别所需的识别信息,并向内容管理服务器发送包括 识别方式和识别信息的第 一 内容识别请求,指示内容管理服务器采用第 一 内 容识别请求中包括的识别方式,并根据第一内容识别请求中包括的识别信息 识别待识别内容的属性,从而实现可根据内容识别系统的负荷情况、具体应 用场景或实际安全需求灵活选取内容识别方式,并有利于降低内容识别系统 的负荷,提高内容识别的效率。
在本实施例技术方案的基础上,内容管理服务器上可设置内容数据库, 并在内容数据库中存储内容数据信息。在内容管理服务器的内容数据库中存
储的内容数据信息可包括内容的真实属性信息、篡改记录、真实水印信息、 真实元数据、受保护的内容特征值或其他内容数据信息;真实属性信息包括 内容真实标识和、内容真实大小信息等,内容真实标识可为已注册内容的真 实名称或内容管理服务器为已注册内容分配的唯一标识;篡改记录包括内容 篡改标识、内容识别时间信息、内容源地址和目标地址信息等,内容篡改标 识可为已注册内容的篡改名称或内容管理服务器为已注册内容篡改的标识。 内容管理服务器在获取内容管理客户端选取的识别方式时,可采取内容管理 客户端选取的识别方式,并根据内容管理客户端提取的识别信息以及内容数 据库预先存储的内容数据信息识别相应内容的属性。如果内容管理服务器成 功识别内容,并向内容管理客户端发送待识别内容的属性信息后,内容管理 客户端可根据获取的内容属性信息,对相应内容进行必要的处理,例如对相 应内容进行过滤、屏蔽或其他控制处理等。图2为本发明一种内容识别方法第二实施例流程图。本实施例是通过简 单的内容识别方式(基于内容标识识别方式)进行待识别内容的属性识别。
如图2所示,本实施例包括
步骤21、内容管理客户端根据内容识别系统的负荷情况或预设的安全需 求选取待识别内容的识别方式为基于内容标识识别方式;并提取与基于内容 标识识别方式相应的识别信息,即提取基于内容标识识别方式识别内容所需 的识别信息,该识别信息可包括待识别内容的内容标识(ID)和第一辅助识 别信息,第一辅助识别信息可包括内容大小(Size)信息等。
步骤22、内容管理客户端向内容管理服务器发送第一内容识别请求,该 第 一 内容识别请求中包括内容管理客户端选取的识别方式(基于内容标识识 别方式)和该识别方式(基于内容标识识别方式)相应的识别信息(内容标 识、内容名称和内容大小信息等),用于指示内容管理服务器采用该识别方 式并才艮据该识别信息识别待识别内容的属性。
步骤23、内容管理服务器接收内容管理客户端发送的第一内容识别请 求,根据识别信息中的内容标识UD)查询内容管理服务器上存储的内容真 实属性信息中,是否有与该内容标识相同的内容真实标识,如果有,执行步 骤24;如果没有,执行步骤27;其中,内容管理服务器上存储的内容的真实 属性信息可包括内容真实标识、内容真实名称和内容真实大小信息等。
步骤24、内容管理服务器根据识别信息中的第一辅助识别信息(内容大 小信息等),查询内容管理服务器上存储的相应信息是否相符,例如内容 管理服务器对比识别信息中包括的内容大小信息与存储的内容真实大小信息 是否相符,如果相符,执行步骤25,如果不符,执行步骤27。
步骤25、内容管理服务器内容识别成功,获取相应的内容真实属性信息。
步骤26、内容管理服务器向内容管理客户端发送识别成功消息,该识别 成功消息中包括待识别内容的识别结果和属性信息;结束本流程;
步骤27、内容管理服务器向内容管理客户端发送内容识别失败消息;结束本流程。
本实施例根据内容识别系统的负荷情况或预设的安全需求(例如内容 识别系统的负荷较高或预设的安全需求等级较低等情形)选取待识别内容的 识别方式为基于内容标识识别方式,由内容管理服务器根据基于内容标识识 别方式对待识别内容的属性进行识别,明显降低内容识别系统的负荷,提高 内容识别的效率,适用于对安全识别要求不是非常严格的场景。
图3为本发明一种内容识别方法第三实施例流程图。本实施例中,内容
管理客户端选取了多种(如三种)内容的识别方式,内容管理服务器根据 预先设定的执行次序先后采用内容管理客户端选取的识别方式,识别待识别 内容的属性。如图3所示,本实施例包括
步骤31、内容管理客户端根据内容识别系统的负荷情况或预设的安全需 求选取待识别内容的识别方式,选取的待识别内容的识别方式为基于内容标 识识别方式、基于篡改信息识别方式和基于内容元数据识别方式;并分别提 取每种识别方式对应的识别信息,即对应于基于内容标识识别方式时,内 容管理客户端提取的与基于内容标识识别方式相应的识别信息包括待识别内 容的内容标识(ID)和第一辅助识别信息,第一辅助识别信息可包括内容大 小(Size)信息等;对应于基于篡改信息识别方式,内容管理客户端提取的
与基于篡改信息识别方式相应的识别信息包括内容标识和第二辅助识别信 息,第二辅助识别信息可包括内容源地址和目标地址(Source/Destination
地址)信息等;对应于基于内容元数据识别方式时,内容管理客户端提取的 与基于内容元数据识别方式相应的识别信息包括待识别内容的元数据 (metada ta ),这里的元数据(metadata )主要指内容的哈希值(Content-ba sed hash),即使用MD5或SHA系列算法对内容作摘要。
步骤32、内容管理客户端向内容管理服务器发送第一内容识别请求,该 第一内容识别请求中包括内容管理客户端选取的识别方式(基于内容标识识 别方式、基于篡改信息识别方式和基于内容元数据识别方式)以及每种识别方式对应的识别信息。
步骤33、内容管理服务器接收第一内容识别请求,内容管理服务器根据 预先设定的从简单识别方式到复杂识别方式的执行顺序,依次采取相应的识 别方式识别待识别内容的属性,即首先釆用基于内容标识识别方式以及与基
于内容标识识别方式相应的识别信息进行内容识别根据识别信息中的内容 标识(ID)查询内容管理服务器上存储的内容真实属性信息中,是否有与该 内容标识相同的内容真实标识,如果有,采用基于内容标识识别方式识别内 容成功,执行步骤36;如果没有,则采用基于内容标识识别方式识别内容失 败,执行步骤34;其中,内容管理服务器存储的内容的真实属性信息可包括 内容真实标识、内容真实名称和内容真实大小信息等。
步骤34、内容管理服务器采用基于篡改信息识别方式,根据与基于篡改 信息识别方式对应的识别信息(内容标识、内容源地址信息或内容目的地址 信息)查询内容管理服务器存储的篡改记录中,是否有与该内容标识匹配的 内容篡改标识;如果内容管理服务器存储的篡改记录中有与该内容标识匹配 的内容篡改标识,则进一步查找内容管理服务器存储的篡改记录中,是否存 在于识别信息中包括的内容源地址信息或内容目标地址信息匹配的相应信 息,如果内容管理服务器存储的篡改记录中有与识别信息中包括的内容源地 址信息或内容目标地址信息匹配的内容源地址信息或内容目标地址信息,则 获取该内容篡改标识相应的内容管理服务器存储的内容真实标识,由于此时 采用基于篡改信息识别方式成功识别待识别内容,因此,内容管理服务器不 需要继续采用基于内容元数据识别方式识别内容,执行步骤35;如果内容管 理服务器存储的篡改记录中没有与该内容标识匹配的内容篡改标识,或者, 内容管理服务器存储的篡改记录中没有与识别信息中包括的内容源地址信息 或内容目标地址信息匹配的内容源地址信息或内容目标地址信息,则采用基 于内容元数据识别方式,并根据与基于内容元数据识别方式对应的识别信息 (内容的哈希值)识别待识别内容(图3中未示出)。内容管理服务器存储的墓改记录可包括内容篡改标识、内容识别时间信息、内容源地址和目标地 址信息等。
步骤35、内容管理服务器根据内容篡改标识获取内容真实标识,并根据 该内容真实标识查询内容管理服务器存储的内容的真实属性信息。
步骤36、内容管理服务器向内容管理客户端发送识别成功消息,该识别 成功消息中包括待识别内容的识别结果和属性信息;结束本流程。
步骤37、内容管理服务器向内容管理客户端发送内容识别失败消息;结 束本流程。
本实施例内容管理客户端可根据内容识别系统的负荷情况或预设的安全 需求选取待识别内容的多种识别方式,由内容管理服务器根据预先设定的次 序或规则(如从简单内容识别方式到复杂内容识别方式的执行次序)依次采 取相应的识别方式,并#4居当前采取的内容识别方式对应的识别信息进行内 容识别;在内容管理服务器采用较简单的内容识别成功识别待识别内容的属 性时,不再采用内容管理客户端选取的较为复杂的内容识别方式(例如虽 然内容管理客户端选取了包括基于篡改信息识别方式、基于元数据的识别方 式等多种识别方式,但如果内容管理服务器采用基于篡改信息识别方式成功 识别内容,则内容管理服务器此时不再需要采用基于元数据识别方式进行内 容识别),从而有利于降低内容识别系统的负荷,提高内容识别的效率。
图4为本发明一种内容识别方法第四实施例流程图。本实施例中,内容 管理服务器根据内容管理客户端选取的识别方式和识别信息进行内容识别失 败后,可向内容管理客户端发送正确识别指示信息,用于指示内容管理客户 端补充提供待识别内容相应的内容特征值;或者内容管理客户端在接收到内 容管理服务器发送的识别失败消息,并且内容管理客户端原先选取的识别方 式不是基于特征值识别方式时,内容管理客户端选取新的识别方式。如图4 所示,本实施例包括
步骤41 、内容管理客户端根据内容识别系统的负荷情况或预设的安全需求选取待识别内容的识别方式为基于内容元数据识别方式,并提取与基于内
容元数据识别方式对应的识别信息,该识别信息包括元数据(MD5 Value)、 待识别内容的内容标识(ID)、待识别内容的名称(Name)等。
步骤42、内容管理客户端向内容管理服务器发送第一内容识别请求,该 第 一 内容识别请求中包括内容管理客户端选取的基于内容元数据识别方式以 及与基于内容元数据识别方式对应的识别信息。
步骤43、内容管理服务器根据元数据(MD5 Value)检索内容管理服务 器上存储的内容数据,如果内容管理服务器上存储的内容数据中有与元数据 (MD5 Value)匹配的真实元数据,内容管理服务器内容识别成功,执行步骤 49;如果内容管理服务器上存储的内容数据中没有与元数据(MD5 Value)匹 配的真实元数据,执行步骤44。
步骤44、内容管理服务器向内容管理客户端发送识别失败消息,返回识 别结果。
内容管理服务器在向内容管理客户端发送识别失败消息时,还可在识别 失败消息中携带正确识别指示信息,该正确识别指示信息用于指示内容管理 客户端补充提供待识别内容的识别信息。可以理解,内容管理服务器向内容 管理客户端发送的正确识别指示信息还可作为一个独立的消息进行发送。
步骤45、内容管理客户端在接收到内容管理服务器发送的识别失败消息 时,内容管理客户端主动选取待识别内容的识别方式为基于特征值识别方式, 并提取与该基于特征值识别方式相应的识别信息,即提取待识别内容的特征 值。
如果内容管理服务器在向内容管理客户端发送的识别失败消息中携带正 确识别指示信息或内容管理服务器向内容管理客户端发送作为 一个独立消息 发送的正确识别指示信息,则内容管理客户端根据接收的正确识别指示信息 选取待识别内容的识别方式为基于特征值识别方式,并提取与该基于特征值 识别方式相应的识别信息,即提取待识别内容的特征值。步骤46、内容管理客户端向内容管理服务器发送第二内容识别请求,该
第二内容识别请求中包括新的识别方式(基于特征值识别方式)和补充提取 的识别信息(待识别内容的特征值)。
步骤47、内容管理服务器接收第二内容识别请求,采用内容特征值检索 内容管理服务器上存储的受保护的内容数据值中,是否有与待识别内容的内 容特征值匹配的受保护的内容特征值;如果有,内容识别成功,执行步骤48; 如果没有,内容识别失败,执行步骤410。
步骤48、内容管理服务器更新篡改记录,其中,篡改记录中记录的信息 包括内容的真实标识(ID)、被篡改后的各种标识(ID)、识别记录发生 的曰期、识别记录发生的源地址和目标地址等。
步骤49、内容管理服务器向内容管理客户端发送识别成功消息,该识别 成功消息中包括待识别内容的识别结果和属性信息;结束本流程。
步骤410、内容管理服务器向内容管理客户端发送内容识别失败消息; 结束本流程。
本实施例内容管理客户端在选取较为简单的识别方式(如基于元数据 识别方式)请求内容管理服务器识别待识别内容时,如果内容管理服务器内 容识别失败,内容管理服务器通过发送正确识别指示信息指示内容管理客户 端选取较为复杂的识别方式(如基于特征值识别方式)并补充提供所需识 别信息,或者,内容管理客户端也可在接收到内容管理服务器发送的识别失 败消息时,主动发起选取较为复杂的识别方式(如基于特征值识别方式) 并补充提取所需识别信息的处理流程,从而使得内容识别方式更加可靠;此 外,由于在内容管理服务器成功识别内容后,对内容管理服务器上存储的内 容数据的篡改记录进行更新,使得内容管理客户端对于相同内容进行识别方 式的选择时,可优先选择基于篡改信息识别方式,从而有利于降低内容识别 系统的负荷,提高内容识别的效率。
图5为本发明一种内容识别方法第五实施例流程图。本实施例内容管理客户端选取最复杂识别方式外的多种识别方式,由内容管理服务器根据识别 方式复杂度的执行次序依次采取相应的识别方式,当各种识别方式均已采用 但仍未能成功识别内容时,内容管理客户端可选取最复杂识别方式,再次发 起内容识别流程。如图5所示,本实施例包括
步骤51、内容管理客户端选取最复杂(或最高层次)识别方式外的其他 各种识别方式,并分别提取各种识别方式所需的识别信息,如最复杂(或 最高层次)识别方式为基于特征值识别方式,内容管理客户端可支持的其他 识别方式包括基于内容标识识别方式、基于篡改信息识别方式、基于元数据 识别方式和基于水印识别方式;相应的,对应于基于内容标识识别方式时, 内容管理客户端提取的识别信息包括待识别内容的内容标识和内容大小信 息等;对应于基于篡改信息识别方式时,内容管理客户端提取的识别信息包 括待识别内容的内容标识等;对应于基于水印识别方式时,待识别内容中的 数字水印;对应于基于特征值识别方式时,内容管理客户端提取的识别信息 包括待识别内容的内容特征值等。
步骤52、内容管理客户端向内容管理服务器发送第一内容识别请求消 息,该第一内容识别请求消息中包括内容管理客户端选取的一种或多种识别 方式以及与每种识别方式对应的识别信息;
步骤53、内容管理服务器向根据预先设定的从简单识别方式到复杂识别 方式的执行顺序,依次采取相应的识别方式识别待识别内容的属性,即依次 采取基于内容标识识别方式、基于篡改信息识别方式、基于元数据识别方式 和基于水印识别方式。在内容管理服务器釆取各种识别方式均未能成功识别 待识别内容时,执行步骤55。
如果内容管理服务器采取基于内容标识识别方式未能成功识别待识别内 容时,可采取基于篡改信息识别方式;如果内容管理服务器采取基于篡改信 息识别方式未能成功识别带识别内容时,可采取基于元数据识别方式。关于 内容管理服务器采取基于内容标识识别方式、基于篡改信息识别方式和基于元数据识别方式识别待识别内容的属性的详细记载,可参见本发明内容识别 方法第一至第四实施例的记载,不再赘述。如果内容管理服务器采取基于元 数据识别方式未能成功识别带识别内容时,可釆取基于水印识别方式。基于 水印识别方式要求内容管理客户端须提前与内容管理服务器协商水印相关信 息,包括水印嵌入和提取算法,水印嵌入位置信息等信息。为了避免内容管 理客户端泄漏水印相关信息,基于水印识别方式适用于内容管理客户端位于 监控网关、网站或SP的场景。内容管理客户端在步骤51中提取内容中包含
的数字水印信息并在步骤52中发给内容管理服务器。如果因为水印被破坏等 原因,内容管理客户端在步骤51中提取水印信息失败,则内容管理服务器无 法使用该基于水印识别方式进行识别;如果内容管理客户端成功提取水印信 息并发给了内容管理服务器,内容管理服务器根据水印信息从内容数据库中 查找是否存储有与提取的水印信息匹配的已存水印,如果有,则内容识别成 功;如果没有,则内容识别失败。图5中仅示出了内容管理服务器采用基于 内容标识识别方式、基于篡改信息识别方式、基于元数据识别方式和基于水 印识别方式均未能成功识别待识别内容的情形。
步骤54、内容管理服务器向内容管理客户端发送识别失败消息,返回识 别结果,执行步骤55。
步骤55、内容管理客户端在接收到内容管理服务器发送的识别失败消息 时,选取待识别内容的识别方式为基于特征值识别方式,并提取与该基于特 征值识别方式相应的识别信息,即提取待识别内容的特征值。
步骤56、内容管理客户端向内容管理服务器发送第二内容识别请求,该 第二内容识別请求中包括新的识别方式(基于特征值识别方式)和补充提取 的识别信息(待识别内容的特征值)。
步骤57、内容管理服务器接收第二内容识别请求,采用内容特征值检索 内容管理服务器上存储的受保护的内容数据值中,是否有与待识别内容的内 容特征值匹配的受保护的内容特征值;如果有,内容识别成功,执行步骤58;如果没有,内容识别失败,执行步骤510。
步骤58、内容管理服务器更新篡改记录,其中,篡改记录中记录的信息 包括内容的真实标识(ID)、被篡改后的各种标识(ID)、识别记录发生 的日期、识别记录发生的源地址和目标地址等。
步骤59、内容管理服务器向内容管理客户端发送识别成功消息,该识别 成功消息中包括待识别内容的识别结果和属性信息;结束本流程。
步骤510、内容管理服务器向内容管理客户端发送内容识别失败消息; 结束本流程。
本实施例内容管理客户端在选取多种较为简单的识别方式(如基于内 容标识识别方式、基于篡改信息识别方式、基于元数据识别方式和基于水印 识别方式)请求内容管理服务器识别待识别内容时,如果内容管理服务器内 容依次采用各种识别方式均未能成功识别待识别内容时,内容管理客户端可 在选取较为复杂的识别方式(如基于特征值识别方式)并补充提取内容特 征值,重新发起内容识别流程,从而使得内容识别方式更加灵活、可靠;此 外,由于在内容管理服务器成功识别内容后,对内容管理服务器上存储的内 容数据的篡改记录进行更新,使得内容管理客户端对于相同内容进行识别方 式的选择时,可优先选择较为简单的识别方式(如基于篡改信息识别方式), 从而有利于降低内容识别系统的负荷,提高内容识别的效率。
本实施例示出了内容管理客户端向内容管理服务器发送二次内容识别请 求消息的情形。可以理解,在本实施例技术方案的基础上,内容管理客户端 还可发起三次甚至多于三次的内容识别请求,例如内容管理客户端可在内 容管理服务器每次内容失败时,重新发起一次内容识别请求消息,并在该次 内容识别请求消息中携带内容管理客户端重新选取的识别方式和补充提取的 识别信息;直到内容管理客户端接收到内容管理服务器发送内容识别成功消 息,或者,直到内容管理客户端已选取了内容识别系统能够支持的最复杂的 识别方式,但内容管理服务器仍未能成功识别内容时,内容管理客户端才停止向内容管理服务器发送内容识别请求。
图6为本发明另一种内容识别方法实施例流程图。如图6所示,本实施 例包括
步骤61、内容管理服务器根据接收的来自内容管理客户端的第一内容识 别请求,获取该第 一 内容识别请求中包括的识别方式和与该识别方式相应的 识别信息。
步骤62、内容管理服务器采用第一内容识别请求包括的识别方式,并根 据第一内容识别请求包括的识别信息以及内容管理服务器上预先存储的内容 数据信息识别待识别内容的属性。
请求,采用第一内容识别请求中包括的识别方式,并根据第一内容识别请求 中包括的识别信息识别待识别内容的属性,使得内容管理客户端选取识别方 式和识别信息可分别作为待识别内容识别过程采用的识别方式和识别信息, 有利于内容管理客户端根据内容识别系统的负荷情况或实际安全需求灵活选 取内容识别方式,从而有利于降低内容识别系统的负荷,提高内容识别的效 率。本实施例关于内容管理客户端在第 一 内容识别请求中包括的识别方式和 各识别方式所需的识别信息,以及内容管理服务器根据具体的识别方式以及 相应的识别信息进行内容识别的详细描述,可参见本发明一种内容识别方法 第一实施例至第五实施例、以及图l-5的记载,不再赘述。
图7为本发明内容管理客户端第一实施例的结构示意图。如图7所示, 本实施例包括选取模块71、提取模块72和发送模块73。
选取模块71用于选取待识别内容的识别方式。
提取模块72用于提取与选取模块71选取的识别方式相应的待识别内容 的识别信息。
发送模块73用于发送第一内容识别请求;该第一内容识别请求中包括选 取模块71选取的识别方式和提取模块72提取的识别信息,用于请求内容管理服务器采用该识别方式并根据该识别信息识别待识别内容的属性。
本实施例通过选取模块选取待识别内容的识别方式,提取模块在待识别 内容中提取釆用选取的识别方式进行内容识别所需的识别信息,并通过发送 模块向内容管理服务器发送包括识别方式和识别信息的第一内容识别请求,
指示内容管理服务器采用第 一 内容识别请求中包括的识别方式,并根据第一 内容识别请求中包括的识别信息识别待识别内容的属性,从而实现内容管理 客户端可根据内容识别系统的负荷情况或实际安全需求灵活选取内容识别方 式,并有利于降低内容识别系统的负荷,提高内容识别的效率。
图8为本发明内容管理客户端第二实施例的结构示意图。本实施例与本 发明内容管理客户端第一实施例的区别在于,本实施例中,识别方式包括基 于内容标识识别方式、基于篡改信息识别方式、基于内容元数据识别方式、
基于水印识别方式、基于特征值识别方式或其他识别方式;识别信息包括待 识别内容的内容标识、内容大小信息、内容源地址信息、内容目标地址信息、 元数据、数字水印、内容特征值或采用相应识别方式进行内容识别所需的其 他识别信息。
选取模块71具体用于根据内容识别系统的负荷情况或预设的安全需求 选取待识别内容的识别方式为基于内容标识识别方式、基于篡改信息识别方 式、基于内容元数据识别方式、基于水印识别方式或基于特征值识别方式。
提取模块72至少包括以下单元之一内容信息提取单元721、篡改信息 提取单元722、元数据提取单元723、水印提取单元724、特征值提取单元"5。
内容信息提取单元721用于在选取模块71选取的识别方式为基于内容标 识识别方式时,提取待识别内容的内容标识和第一辅助识别信息,所述第一 辅助识别信息包括内容大小信息。
篡改信息提取单元722用于在选取模块71选取的识别方式为基于内容元 数据识别方式时,提取待识别内容的内容标识和第二辅助识别信息,所述第 二辅助识别信息包括内容源地址信息或内容目标地址信息。元数据提取单元723用于在选取模块71选取的识别方式为基于内容元数 据识别方式时,提耳又待识别内容的元数据。
水印提取单元724用于在选取模块71选取的识别方式为基于水印识别方 式时,提取待识别内容中的数字水印。
特征值提取单元725用于在选取模块71选取的识别方式为基于特征值识 别方式时,提取待识别内容的内容特征值。
本实施例选取模块可根据内容识别系统的负荷情况或预设的安全需求灵 活选取待识别内容的识别方式,提取模块根据选取模块选取的识别方式提取 该识别方式所需的识别信息,从而有利于降低内容识别系统的负荷,提高内 容识别的效率。
在本实施例技术方案的基础上,为了使得内容识别过程更可靠,选取模 块71还可用于在接收到内容管理服务器发送的正确识别指示信息时,选取新 的识别方式;或在接收到内容管理服务器发送的识别失败信息,并且第一内 容识别请求中包括的识别方式不是基于特征值识别方式时,选取新的识别方 式。相应地,提取模块72还用于补充提取与新的识别方式相应的识别信息; 而发送模块7 3还用于发送第二内容识别请求,第二内容识别请求包括选取模 块71选取的新的识别方式和提取模块72补充提取的识别信息。进一步地, 如果选取模块71选取了多种识别方式时,发送模块73还可用于在第一内容 识别请求消息中封装所述选取模块选取的多个识别方式以及所述提取模块提 取的每个识别方式相应的识别信息,并发送给内容管理服务器。
本发明内容管理客户端实施例可作为 一个独立的设备,也可作为 一个功 能模块集成在监控网关、用户终端或内容分享网站等实体上。关于本发明内 容管理客户端实施例实现内容管理的具体方法可参见本发明一种内容识别方 法第一至第五实施例以及图1-5的记载,不再赘述。
图9为本发明内容管理服务器第一实施例的结构示意图。如图9所示, 本实施例包括获取模块91和识别模块92。获取模块91用于根据接收的来自内容管理客户端的第一内容识别请求, 获取第 一 内容识别请求中包括的识别方式和与该识别方式相应的识别信息。
识别模块92用于釆用该识别方式并根据该识别信息以及预先存储的内
容数据信息识别待识别内容的属性。
本实施例通过获取模块获取内容管理客户端发送的第 一 内容识别请求中 包括的识别方式和识别信息,并通过识别模块采用获取的识别方式和识别信 息识别待识别内容的属性,使得内容管理客户端选取的识别方式和识别信息 可分别作为识别模块进行待识别内容的识别过程中采用的识别方式和识别信 息,有利于内容管理客户端根据内容识别系统的负荷情况或实际安全需求灵 活选取内容识别方式,从而有利于降低内容识别系统的负荷,提高内容识别 的效率。
图10为本发明内容管理服务器第二实施例的结构示意图。本实施例与本 发明内容管理服务器第一实施例的区别在于,本实施例还包括内容数据库93; 识别模块92至少包括以下单元之一内容信息识别单元921、篡改信息识别 单元922、元数据识别单元923、水印识别单元924、特征值识别单元925。
内容数据库93用于存储内容数据信息;内容数据信息可包括内容的真实 属性信息、篡改记录、真实水印信息、真实元数据、受保护的内容特征值或 内容的其他信息;真实属性信息可包括内容真实标识和内容真实大小信息等 信息;篡改记录可包括内容篡改标识、内容识别时间信息、内容源地址和目 标地址信息等信息。
识别模块92中内容信息识别单元921用于在获取的识别方式为基于内 容标识识别方式,获取的识别信息包括所述待识别内容的内容标识和第一辅 助识别信息时,根据所述内容标识查询所述内容数据库存储的内容真实属性 信息中,是否有与所述内容标识匹配的内容真实标识;如果有,比较存储的 所述内容真实标识相应的第 一辅助识别信息与所述识别信息中包括的相应信 息是否相符;如果相符,发送内容识别成功消息;所述第一辅助识别信息包括内容大小信息。
篡改信息识别单元922用于在获:f又的识别方式为基于篡改信息识别方 式,获取的识别信息包括所述待识别内容的内容标识和第二辅助识别信息时, 根据所述内容标识查询存储的篡改记录中,是否有与所述内容标识匹配的内 容篡改标识;如果篡改记录中有与所述内容标识匹配的内容篡改标识,并且 所述第二辅助识别信息与所述篡改记录中的相应信息相符时,获取所述内容 篡改标识相应的内容真实标识;根据所述内容真实标识查询所述内容管理服 务器存储的内容的真实属性信息;所述第二辅助识别信息包括内容源地址信 息或内容目标地址信息。
元数据识别单元923用于在所述获取模块获取的识别方式为基于内容元 数据识别方式,获取的识别信息包括所述待识别内容的元数据时,根据所述 元数据查询所述内容数据库存储的真实元数据中,是否有与所述元数据匹配 的真实元数据;如果有,发送内容识别成功消息。
水印识别单元924用于在所述获取模块获取的识别方式为基于水印识别 方式,获取的识别信息包括所述待识别内容中的数字水印时,根据所述数字 水印查询所述内容数据库存储的真实水印信息中,是否有与所述元数据匹配 的真实元数据;如果有,发送内容识别成功消息。
特征值识别单元925用于在所述获取模块获取的识别方式为基于特征值 识别方式,获取的识别信息包括所述待识别内容的内容特征值时,根据所述 内容特征值查询所述内容数据库存储的受保护的内容特征值中,是否有与所 述待识别内容的内容特征值匹配的受保护的内容特征值;如果有,发送内容 识别成功消息。
本实施例获取模块可根据来自内容管理客户端的第一内容识别请求,获 取内容管理客户端选取的识别方式和识别信息,由识别模块根据具体的识别 方式和识别信息,并更具内容数据库存出的内容数据信息进行内容的识别, 从而使得内容管理客户端可根据网络识别系统的负荷情况或预设的安全需求,灵活的选取待识别内容的识别方式,有利于降低内容识别系统的负荷, 提高内容识別的效率。
在本实施例技术方案的基础上,为了提高内容识别的准确性和可靠性, 识别模块还可包括识别指示信息发送单元。识别指示信息发送单元用于在选 取的识别方式为基于内容标识识别方式、基于篡改信息识别方式、基于内容 元数据识别方式或基于水印识别方式,并且内容识别失败时,向内容管理客 户端发送正确识别指示信息,用于指示所述内容管理客户端补充提供所述待 识别内容相应的内容特征值。如果是内容管理客户端在接收到内容管理服务 器发送的内容识别失败消息时,主动发起选取新的识别方式并补充提取所需 的识别信息处理流程时,识别模块92还可用于接收所述内容管理客户端发送 的第二内容识别请求消息,所述第二内容识别请求消息包括新的识别方式和
补充提供的识别信息;采用所述新的识别方式并根据所述补充提供的识别信 息,识别所述待识别内容的属性。
进一步地,为了提高相同内容的后续识别效率,在本实施例技术方案的 基础上,内容管理服务器还可包括更新模块。更新模块用于在所述获取模块 获取的识别方式为基于内容元数据识别方式、基于水印识别方式或基于特征 值识别方式,并且所述识别模块内容识别成功时,根据所述待识别内容的内 容真实标识、内容篡改标识、内容源地址和目标地址信息或内容识别时间信 息,更新或存储与所述待识别内容相应的篡改记录。如果内容管理客户端向 内容管理服务器发送的第 一内容识别请求中包括多个识别方式时,识别模块 还可用于在接收的第一内容识别请求消息中包括多个识别方式时,根据预先 设定的识别方式执行次序,依次采用相应的识别方式识别所述待识别内容的 属性。
关于本发明内容管理服务器实施例实现内容管理的具体方法可参见本发 明另一种内容识别方法实施例以及图6的记载,不再赘述。
图11为本发明内容识别系统实施例的结构示意图。如图ll所示,本实施例包括内容管理客户端111和内容管理服务器112。
内容管理客户端111用于选取待识别内容的识别方式;^是取与选取的所 述识别方式相应的所述待识别内容的识别信息;发送第一内容识别请求,所 述第一内容识别请求中包括选取的所述识别方式和识别信息。
内容管理服务器112用于根据接收的来自内容管理客户端的第一内容识 别请求,获取所述第一内容识别请求中包括的识别方式和与所述识别方式相 应的识别信息;采用所述识别方式,并根据所述识别信息以及预先存储的内 容数据信息识别待识别内容的属性。
本实施例通过内容管理客户端选取待识别内容的识别方式,在待识别内 容中提取釆用选取的识别方式进行内容识别所需的识别信息,并向内容管理 服务器发送包括识别方式和识别信息的第一内容识别请求,由内容管理服务 器采用第 一 内容识别请求中包括的识别方式,并才艮据第 一 内容识别请求中包 括的识别信息识别待识别内容的属性,从而实现内容管理客户端可根据内容 识别系统的负荷情况或实际安全需求灵活选取内容识别方式,并有利于降低 内容识别系统的负荷,提高内容识别的效率。
关于本发明内容识别系统中,内容管理客户端的细化功能模块可参见本 发明内容管理客户端实施例以及图7-8的记载;内容管理服务器的细化功能 模块可参见本发明内容管理服务器实施例以及图9-IO的记载;不再赘述。
本领域普通技术人员可以理解附图只是一个优选实施例的示意图,附
图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解实施例中的装置中的模块可以按照实施
例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的
一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步
拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。 本领域普通技术人员可以理解实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读 取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述
的存储介质包括R0M、 RAM、》兹碟或者光盘等各种可以存储程序代码的介质。 最后应说明的是以上实施例仅用以说明本发明的技术方案,而非对其 限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术 人员应当理解其依然可以对前述实施例所记载的技术方案进行修改,或者 对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术 方案的本质脱离本发明实施例技术方案的精神和范围。
权利要求
1、一种内容识别方法,其特征在于,包括选取待识别内容的识别方式;提取与选取的所述识别方式相应的所述待识别内容的识别信息;发送第一内容识别请求,所述第一内容识别请求中包括选取的所述识别方式和识别信息,用于请求内容管理服务器采用所述识别方式并根据所述识别信息识别所述待识别内容的属性。
2、 根据权利要求1所述的内容识别方法,其特征在于,所述选取待识别 内容的识别方式,包括根据内容识别系统的负荷情况、具体应用场景或预先设置的安全需求, 选耳又;f寺识别内容的识别方式。
3、 根据权利要求2所述的内容识别方法,其特征在于,所述识别方式包 括基于内容标识识别方式、基于篡改信息识别方式、基于内容元数据识别方 式、基于水印识别方式或基于特征值识别方式;所述识别信息包括待识别内 容的内容标识、内容大小信息、内容源地址信息、内容目标地址信息、元数 据、数字水印或内容特征值。
4、 根据权利要求3所述的内容识别方法,其特征在于,所述提取与选取 的所述识别方式相应的所述待识别内容的识别信息,包括在选取的识别方式为基于内容标识识别方式时,提取所述待识别内容的 内容标识和第一辅助识别信息,所述第一辅助识别信息包括内容大小信息;在选取的识别方式为基于篡改信息识别方式时,提取所述待识别内容的 内容标识和第二辅助识别信息,所述第二辅助识别信息包括内容源地址信息 或内容目标地址信息;在选取的识别方式为基于内容元数据识别方式时,提取所述待识别内容 的元数据;在选取的识别方式为基于水印识别方式时,提取所述待识别内容中的数字水印;在选取的识别方式为基于特征值识别方式时,提取所述待识别内容的内 容特征值。
5、 根据权利要求3所述的内容识别方法,其特征在于,所述发送第一内 容识别请求之后,还包括在接收到所述内容管理服务器发送的正确识别指示信息时,选取新的识 别方式;或在接收到所述内容管理服务器发送的识别失败信息,并且所述第 一内容识别请求中包括的识别方式不是基于特征值识别方式时,选取新的识 别方式;补充"R取与所述新的识别方式相应的识别信息;向所述内容管理服务器发送第二内容识别请求,所述第二内容识别请求 包括新的识别方式和补充提取的识别信息。
6、 根据权利要求3所述的内容识别方法,其特征在于,所述发送第一内 容识别请求包括在所述第 一 内容识别请求消息中封装选取的多个识别方式以及每个识别 方式相应的识别信息,并发送给所述内容管理服务器。
7、 一种内容识别方法,其特征在于,包括根据接收的来自内容管理客户端的第一 内容识别请求,获取所述第一 内 容识别请求中包括的识别方式和与所述识别方式相应的识别信息;采用所述识别方式,并根据所述识别信息以及预先存储的内容数据信息 识别待识别内容的属性。
8、 根据权利要求7所述的内容识别方法,其特征在于,还包括 存储所述内容数据信息;所述内容数据信息包括内容的真实属性信息、篡改记录、真实水印信息、真实元数据或受保护的内容特征值;所述真实属 性信息包括内容真实标识和内容大小信息;所述篡改记录包括内容篡改标识、 内容识别时间信息、内容源地址信息和内容目标地址信息。
9、根据权利要求8所述的内容识别方法,其特征在于,所述根据识别信息以及预先存储的内容数据信息识别待识别内容的属性包括当获取的识别方式为基于内容标识识别方式,获取的识别信息包括所述 待识别内容的内容标识和第一辅助识别信息时,根据所述内容标识查询所述 内容数据库存储的内容真实属性信息中,是否有与所述内容标识匹配的内容 真实标识;如果有,比较存储的所述内容真实标识相应的第一辅助识别信息 与所述识别信息中包括的相应信息是否相符;如果相符,发送内容识别成功 消息;所述第一辅助识别信息包括内容大小信息;当获取的识别方式为基于篡改信息识别方式,获取的识别信息包括所述 待识别内容的内容标识和第二辅助识别信息时,根据所述内容标识查询存储 的篡改记录中,是否有与所述内容标识匹配的内容篡改标识;如果篡改记录 中有与所述内容标识匹配的内容篡改标识,并且所述第二辅助识别信息与所 述篡改记录中的相应信息相符时,获取所述内容篡改标识相应的内容真实标 识;根据所述内容真实标识查询所述内容管理服务器存储的内容的真实属性 信息;所述第二辅助识别信息包括内容源地址信息或内容目标地址信息;当获取的识别方式为基于内容元数据识别方式,获取的识别信息包括所 述待识别内容的元数据时,根据所述元数据查询所述内容数据库存储的真实 元数据中,是否有与所述元数据匹配的真实元数据;如果有,发送内容识别 成功消息;当获取的识别方式为基于水印识别方式,获取的识别信息包括所述待识 别内容中的数字水印时,根据所述数字水印查询所述内容数据库存储的真实 水印信息中,是否有与所述元数据匹配的真实元数据;如果有,发送内容识 别成功消息;当获取的识别方式为基于特征值识别方式,获取的识别信息包括所述待 识别内容的内容特征值时,根据所述内容特征值查询存储的受保护的内容特 征值中,是否有与所述待识别内容的内容特征值匹配的受保护的内容特征值;如果有,发送内容识别成功消息。
10、 根据权利要求9所述的内容识别方法,其特征在于,在选取的识别方式为基于内容标识识别方式、基于篡改信息识别方式、基于内容元数据识别方式或基于水印识别方式,并且内容识别失败时,还包括向所述内容管理客户端发送正确识别指示信息,用于指示所述内容管理 客户端补充提供所述待识别内容相应的内容特征值。
11、 根据权利要求IO所述的内容识别方法,其特征在于,在向内容管理 客户端发送正确识别指示信息之后,还包括接收所述内容管理客户端发送的第二内容识别请求消息,所述第二内容 识别请求消息包括新的识别方式和补充提供的识别信息;采用所述新的识别方式并根据所述补充提供的识别信息,识别所述待识 别内容的属性。
12、 根据权利要求9所述的内容识别方法,其特征在于,在选取的识别 方式为基于内容元数据识别方式、基于水印识别方式或基于特征值识别方式, 并且内容识别成功时,还包括根据所述待识别内容的内容真实标识、内容篡改标识、内容源地址信息、 内容目标地址信息或内容识别时间信息,更新或存储与所述待识别内容相应 的篡改记录。
13、 根据权利要求9所述的内容识别方法,其特征在于,在接收的第一 内容识别请求消息中包括多个识别方式时,根据预先设定的识别方式执行次 序,依次采用相应的识别方式识别所述待识别内容的属性。
14、 一种内容管理客户端,其特征在于,包括 选取模块,用于选取待识别内容的识别方式;提取模块,用于提取与选取的所迷识别方式相应的所述待识别内容的识 别信息;发送模块,用于发送第一内容识别请求;所述第一内容识别请求中包括选取的所述识别方式和识别信息,用于请求内容管理服务器采用所述识别方 式并根据所述识别信息识别所述待识别内容的属性。
15、 根据权利要求14所述的内容管理客户端,其特征在于,所述选取模 块还用于根据内容识别系统的负荷情况、具体应用场景或预先设置的安全需 求,选取待识别内容的识别方式。
16、 根据权利要求15所述的内容管理客户端,其特征在于,所述识别方式包括基于内容标识识别方式、基于篡改信息识别方式、基于内容元数据识别方式、基于水印识别方式或基于特征值识别方式;所述识别信息包括待识 别内容的内容标识、内容大小信息、元数据、数字水印或内容特征值;所述 提取模块至少包括以下单元之一内容信息提取单元,用于在所述选取模块选取的识别方式为基于内容标 识识别方式时,提取所述待识别内容的内容标识和第一辅助识别信息,所述 第一辅助识别信息包括内容大小信息;篡改信息提取单元,用于在所述选取模块选取的识别方式为基于篡改信 息识别方式时,提取所述待识别内容的内容标识和第二辅助识别信息,所述 第二辅助识别信息包括内容源地址信息或内容目标地址信息;元数据提取单元,用于在所述选取模块选取的识别方式为基于内容元数 据识别方式时,提取所述待识别内容的元数据;水印提取单元,用于在所述选取模块选取的识别方式为基于水印识别方 式时,提取所述待识别内容中的数字水印;特征值提取单元,用于在所述选取模块选取的识别方式为基于特征值识 别方式时,提取所述待识别内容的内容特征值。
17、 根据权利要求16所述的内容管理客户端,其特征在于,所述选取模块还用于在接收到所述内容管理服务器发送的正确识别指示 信息时,选取新的识别方式;或在接收到所述内容管理服务器发送的识别失 败信息,并且所述第一内容识别请求中包括的识别方式不是基于特征值识别方式时,选耳又新的识别方式;所述提取模块还用于补充提取与所述新的识别方式相应的识别信息;所述发送模块还用于发送第二内容识别请求,所述第二内容识别请求包 括所述选取模块选取的新的识别方式和所述提取模块补充提取的识别信息。
18、 根据权利要求16所述的内容管理客户端,其特征在于,所述发送模 块还用于在所述第 一 内容识别请求消息中封装所述选取模块选取的多个识别 方式以及所述提取模块提取的每个识别方式相应的识别信息,并发送。
19、 一种内容管理服务器,其特征在于,包括获取模块,用于根据接收的来自内容管理客户端的第一内容识别请求, 获取所述第一内容识别请求中包括的识别方式和与所述识别方式相应的识别 信息;识别模块,用于采用所述识别方式,并根据所述识别信息以及预先存储 的内容数据信息识别待识别内容的属性。
20、 根据权利要求19所述的内容管理服务器,其特征在于,还包括 内容数据库,用于存储内容数据信息;所述内容数据信息包括内容的真实属性信息、篡改记录、真实水印信息、真实元数据或受保护的内容特征值; 所述真实属性信息包括内容真实标识和内容真实大小信息;所述篡改记录包 括内容篡改标识、内容识别时间信息、内容源地址信息和内容目标地址信息。
21、 根据权利要求20所述的内容管理服务器,其特征在于,所述识别模 块至少包括以下单元之一内容信息识别单元,用于在获取的识别方式为基于内容标识识别方式, 获取的识别信息包括所述待识别内容的内容标识和第一辅助识别信息时,根 据所述内容标识查询所述内容数据库存储的内容真实属性信息中,是否有与 所述内容标识匹配的内容真实标识;如果有,比较存储的所述内容真实标识 相应的第一辅助识别信息与所述识别信息中包括的相应信息是否相符;如果 相符,发送内容识别成功消息;所述第一辅助识别信息包括内容大小信息;篡改信息识别单元,用于在获取的识别方式为基于篡改信息识别方式, 获取的识别信息包括所述待识别内容的内容标识和第二辅助识别信息时,根 据所述内容标识查询存储的篡改记录中,是否有与所述内容标识匹配的内容篡改标识;如果篡改记录中有与所述内容标识匹配的内容篡改标识,并且所述第二辅助识别信息与所述篡改记录中的相应信息相符时,获取所述内容篡改标识相应的内容真实标识;根据所述内容真实标识查询所述内容管理服务器存储的内容的真实属性信息;所述第二辅助识别信息包括内容源地址信息 或内容目标地址信息;元数据识别单元,用于在所述获取模块获取的识别方式为基于内容元数 据识别方式,获取的识别信息包括所述待识别内容的元数据时,根据所述元 数据查询所述内容数据库存储的真实元数据中,是否有与所述元数据匹配的 真实元数据;如果有,发送内容识别成功消息;水印识别单元,用于在所述获取模块获取的识别方式为基于水印识别方式,获取的识别信息包括所述待识别内容中的数字水印时,根据所述数字水 印查询所述内容数据库存储的真实水印信息中,是否有与所述元数据匹配的 真实元数据;如果有,发送内容识别成功消息;特征值识别单元,用于在所述获取模块获取的识别方式为基于特征值识 别方式,获取的识别信息包括所述待识别内容的内容特征值时,根据所述内 容特征值查询所述内容数据库存储的受保护的内容特征值中,是否有与所述 待识别内容的内容特征值匹配的受保护的内容特征值;如果有,发送内容识 别成功消息。
22、根据权利要求21所述的内容管理服务器,其特征在于,所述识别模 块还包括识别指示信息发送单元,用于在选取的识别方式为基于内容标识识别方 式、基于篡改信息识别方式、基于内容元数据识别方式或基于水印识别方式, 并且内容识别失败时,向内容管理客户端发送正确识别指示信息,用于指示所述内容管理客户端补充提供所述待识别内容相应的内容特征值。
23、 根据权利要求22所述的内容管理服务器,其特征在于,所述识别模 块还用于接收所述内容管理客户端发送的第二内容识别请求消息,所述第二 内容识别请求消息包括新的识别方式和补充提供的识别信息;采用所述新的 识别方式并根据所述补充提供的识别信息,识别所述待识别内容的属性。
24、 根据权利要求21所述的内容管理服务器,其特征在于,还包括 更新模块,用于在所述获取模块获取的识别方式为基于内容元数据识别方式、基于水印识别方式或基于特征值识别方式,并且所述识别模块内容识 别成功时,根据所述待识别内容的内容真实标识、内容篡改标识、内容源地 址和目标地址信息或内容识别时间信息,更新或存储与所述待识别内容相应 的篡改记录。
25、 根据权利要求21所述的内容管理服务器,其特征在于,所述识别模 块还用于在接收的第一内容识别请求消息中包括多个识别方式时,根据预先 设定的识别方式执行次序,依次采用相应的识别方式识别所述待识别内容的 属性。
26、 一种内容识别系统,其特征在于,包括内容管理客户端,用于选取待识别内容的识别方式;提取与选取的所述 识别方式相应的所述待识别内容的识别信息;发送第一内容识别请求,所述 第 一 内容识别请求中包括选取的所述识别方式和识别信息;内容管理服务器,用于根据接收的来自内容管理客户端的第一内容识别 请求,获取所述第一内容识别请求中包括的识别方式和与所述识别方式相应 的识别信息;采用所述识别方式,并根据所述识别信息以及预先存储的内容 数据信息识别待识别内容的属性。
全文摘要
本发明实施例涉及了一种内容识别方法和系统以及内容识别客户端和服务器。其中,一种内容识别方法包括选取待识别内容的识别方式;提取与选取的所述识别方式相应的所述待识别内容的识别信息;发送第一内容识别请求,所述第一内容识别请求中包括选取的所述识别方式和识别信息,用于请求内容管理服务器采用所述识别方式并根据所述识别信息识别所述待识别内容的属性。本发明实施例有利于降低内容识别系统的负荷,提高内容识别的效率。
文档编号H04L29/06GK101610152SQ200810115249
公开日2009年12月23日 申请日期2008年6月19日 优先权日2008年6月19日
发明者刘义俊, 高洪涛 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1