一种图片检测方法与设备的制造方法

文档序号:10471165阅读:562来源:国知局
一种图片检测方法与设备的制造方法
【专利摘要】本申请的目的是提供一种图片检测方法与设备;获取已分别标注图片类型的多个第一图片,其中,所述图片类型包括第一类型或第二类型;根据所述第一图片所对应的上传用户信息对所述多个第一图片进行关联处理;根据经关联处理的所述多个第一图片确定图片检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系;利用所述图片检测模型确定第二图片的所述图片类型。与现有技术相比,本申请通过获取标注过图片类型的第一图片基于图片所对应的上传用户信息对其进行关联处理,据此确定图片检测模型,并利用检测模型实现对图片类型的辨识;从而,提高对图片类型的检测精度,降低误判率,缩短模型的建立时间,使得图片检测及时有效。
【专利说明】
-种图片检测方法与设备
技术领域
[0001] 本申请设及计算机领域,尤其设及一种图片检测技术。
【背景技术】
[0002] 随着大数据时代来临,各类网站每天有大量的用户图片产生。面对海量的图片数 据,需要一个有效的检测方法,W解决图片的辨识和分类。例如,在电商和社交平台对违禁 图片进行识别和过滤,从而优化网络环境,提升用户体验。
[0003] 目前,在本领域的现有技术中,对图片识别算法主要有两类。第一类,W图像维度 特征为切入点,对经验特征进行特征提取,例如SIFP、SURF等。运类算法,检测准确度不高, 存在较多的误判。第二类,W数据预测为切入点,利用深度卷积神经网络学习的方法,对图 片进行识别。运类算法,相对于第一类提升了检测的准确度,但是在大数据背景下仍有大量 图片误判、漏判。同时,存在训练检测模型的初始数据量大、训练时间长、模型的更新工作量 庞大等缺陷。

【发明内容】

[0004] 本申请的目的是提供一种图片检测方法与设备。
[000引根据本申请的一个方面,提供了一种图片检测方法,包括:
[0006] 获取已分别标注图片类型的多个第一图片,其中,所述图片类型包括第一类型或 第二类型;
[0007] 根据所述第一图片所对应的上传用户信息对所述多个第一图片进行关联处理; [000引根据经关联处理的所述多个第一图片确定图片检测模型,其中,所述图片检测模 型包括用户与所述图片类型的映射关系;
[0009] 利用所述图片检测模型确定第二图片的所述图片类型。
[0010] 根据本申请的另一方面,还提供了一种图片检测设备,包括:
[0011] 第一装置,用于获取已分别标注图片类型的多个第一图片,其中,所述图片类型包 括第一类型或第二类型;
[0012] 第二装置,用于根据所述第一图片所对应的上传用户信息对所述多个第一图片进 行关联处理;
[0013] 第Ξ装置,用于根据经关联处理的所述多个第一图片确定图片检测模型,其中,所 述图片检测模型包括用户与所述图片类型的映射关系;
[0014] 第四装置,用于利用所述图片检测模型确定第二图片的所述图片类型。
[0015] 与现有技术相比,本申请通过对标注过图片类型的第一图片基于图片所对应的上 传用户信息进行关联处理,据此确定图片检测模型,并利用检测模型实现对图片类型的辨 识;从而,提高图片类型的检测精度,降低误判率,缩短模型的建立时间。进一步,本申请还 可确定图片检测模型的子模型,可根据标注过的第Ξ图片,快速进行更新,从而,更新图片 检测模型,使得图片检测及时有效。更进一步,在本申请中,对被检测模型辨识过的第二图 片,还可由人工再次进行图片类型标注,从而,修正图片检测模型,使得检测模型更加精准。
【附图说明】
[0016] 通过阅读参照W下附图所作的对非限制性实施例所作的详细描述,本申请的其它 特征、目的和优点将会变得更明显:
[0017] 图1示出根据本申请一个方面的一种图片检测设备的示意图;
[0018] 图2示出根据本申请一个优选实施例的一种图片检测设备中第Ξ装置的示意图;
[0019] 图3示出根据本申请另一个优选实施例的一种图片检测设备中第二单元的示意 图;
[0020] 图4示出根据本申请另一个方面的一种图片检测方法流程图;
[0021] 图5示出根据本申请一个优选实施例的步骤S23的方法流程图;
[0022] 图6示出根据本申请另一个优选实施例的步骤S232的方法流程图。
[0023] 附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0024] 下面结合附图对本申请作进一步详细描述。
[0025] 在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个 处理器(CPU)、输入/输出接口、网络接口和内存。
[0026] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或 非易失性内存等形式,如只读存储器(RCM)或闪存(flashRAM)。内存是计算机可读介质的示 例。
[0027] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可W由任何方法 或技术来实现信息存储。信息可W是计算机可读指令、数据结构、程序的模块或其他数据。 计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动 态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除 可编程只读存储器化EPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、 数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或 任何其他非传输介质,可用于存储可W被计算设备访问的信息。按照本文中的界定,计算机 可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0028] 图1示出根据本申请的一个方面的一种图片检测设备的示意图。所述的图片检测 设备1包括第一装置11、第二装置12、第Ξ装置13、第四装置14。
[0029] 其中,第一装置11获取已分别标注图片类型的多个第一图片,其中,所述图片类型 包括第一类型或第二类型;第二装置12根据所述第一图片所对应的上传用户信息对所述多 个第一图片进行关联处理;第Ξ装置13根据经关联处理的所述多个第一图片确定图片检测 模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系;第四装置14利用所述 图片检测模型确定第二图片的所述图片类型。
[0030] 具体地,第一装置11获取已分别标注图片类型的多个第一图片,其中,所述图片类 型包括第一类型或第二类型。在此,第一图片是作为样本数据的图片,第一类型或第二类型 为需要鉴别的图片类型。例如,在需要对违禁图片进行检测时,第一图片即为已经标注的违 禁图片和正常图片,第一类型和第二类型就是违禁图片和正常图片。第一图片在获取作为 样本时已经被标注,其中,标注的内容至少包括需要鉴别的图片类型。标注的方式和来源可 W多样化,例如,是来自于系统之前人工鉴别后标注过的图片,或者对图片的MD5进行计算 并与样本MD5进行比对并记录和标注。
[0031] 本领域技术人员应能理解上述标注第一图片类型的方式仅为举例,其他现有的或 今后可能出现的标注第一图片类型的方式如可适用于本发明,也应包含在本发明保护范围 W内,并在此W引用方式包含于此。
[0032] 所述图片检测设备1的第二装置12,根据所述第一图片所对应的上传用户信息对 所述多个第一图片进行关联处理。其中,第一图片有对应的上传用户信息,例如,可W读取 第一图片对应的后台数据库或日志中的信息,或者根据第一图片的应用端的用户ID从后台 提取其相关信息,然后用S化语言找出对应的账号信息。进一步,为了将运些信息整合,从而 可W对其进行后续的统一操作,需要对其进行关联。
[0033] 本领域技术人员应能理解上述获取第一图片所对应的上传用户信息的方式仅为 举例,其他现有的或今后可能出现的获取第一图片所对应的上传用户信息的方式如可适用 于本发明,也应包含在本发明保护范围W内,并在此W引用方式包含于此。
[0034] 本领域技术人员应可理解,为了准确的对图片类型进行自动检测,需要庞大的样 本数据支撑,故而所获取第一图片可有不同的来源,例如,在对阿里平台的图片进行鉴别 时,第一图片的来源可W是淘宝或者来往等应用。来源不同的第一图片所提取的对应上传 用户的数据的主键可能会有不同,在关联成统一的数据表进行处理时会有一定的难度。
[0035] 优选地,第二装置12基于相同用户在不同应用中用户标识的对应关系,根据第一 图片所对应的上传用户信息,对所述多个第一图片进行关联处理,使得相同用户的多个所 述第一图片进行关联。在此,所述的相同用户在不同应用中用户标识的对应关系,即为同一 用户在不同应用中的账号的集合或映射关系。运种对应关系,可W直接利用第Ξ方设备所 提供的应用编程接口从第Ξ方设备获取,或者相同公司的应用可W直接利用其数据库中的 账户关联关系,例如,阿里集团的淘宝或往来应用的账户都是关联的,可W直接获取其对应 关系的数据。具体的,将淘宝和来往的应用中用户ID、用户名、用户数字ID等信息进行关联, 建立索引,从而将同一用户在不同应用之间的账号打通。本领域技术人员应能理解上述获 取相同用户在不同应用中用户标识的对应关系的方式仅为举例,其他现有的或今后可能出 现的获取相同用户在不同应用中用户标识的对应关系的方式如可适用于本发明,也应包含 在本发明保护范围W内,并在此W引用方式包含于此。
[0036] 更优选地,第二装置12基于相同用户在不同应用中用户标识的对应关系,对所述 多个第一图片所对应的各个上传用户信息进行关联处理,并使对应相同用户的多个所述上 传用户信息映射至同一新创建的用户主键信息。在此,将同一用户在不同应用中的上传用 户,映射到同一个信息上,并W此为通用主键,从而可W对不同来源的第一图片进行关联。 例如,在前文所述的将阿里应用中的信息关联,建立索引之后,可W提取公共信息即用户ID 作为新建表的主键。同时,用运个新的主键重新关联淘宝、来往等数据,将不同来源的数据 关联起来。对于无法提取公共信息作为主键的实例,可W建立一个新的数据项,将不同应用 中的上传用户信息与其进行关联,最终映射到同一个用户上。从而,可W根据所述上传用户 信息与所述用户主键信息的映射关系,对所述多个第一图片进行关联处理,W使得对应同 一个所述用户主键信息的多个所述第一图片被关联。
[0037] 所述图片检测设备1的第Ξ装置13根据经关联处理的所述多个第一图片确定图片 检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系。在此,利用之前 统一关联处理过的第一图片及其相关的结构化的数据,确定鉴别图片类型的图片检测模 型。此检测模型,与用户W及图片类型之间有映射关系,即模型中包含用户W及每个用户所 上传图片的类型等信息,例如,在实际应用中,当需要利用该模型检测其它图片是否违禁 时,可直接根据运其中图片的上传用户在该模型中对应的图片类型来进行确定。
[0038] 所述图片检测设备1的第四装置14,利用所述图片检测模型确定第二图片的所述 图片类型。得出检测模型后,可W利用其直接对第二图片,即用户新上传的需要鉴别类型的 图片进行检测,从而对图片类型进行判断。
[0039] 优选地,所述图片检测设备1还包括第五装置15(未出示),所述第五装置15根据所 述第二图片的图片类型的人工标注信息,修正所述图片检测模型。在此,可W将检测模型嵌 入一个大的系统中,与图像维度算法模块W及人工审核模块一起对图片类型进行鉴别,从 而进一步提升鉴别的准确度和精度。其中,人工审核模块可W对检测模型的结果进行验证, 从而对预测模型的实时更新提供数据支持,进而对检测模型进行验证。
[0040] 图2示出根据本申请一个优选实施例的一种图片检测设备中第Ξ装置的示意图。 所述图片检测设备1的第Ξ装置13,包括第一单元131、第二单元132。其中,第一单元131根 据经关联处理的所述多个第一图片确定多个用户的图片操作记录信息;第二单元132根据 每个用户的图片操作记录信息,确定图片检测模型,其中,所述图片检测模型包括用户与所 述图片类型的映射关系。
[0041] 具体地,第一单元131根据经关联处理的所述多个第一图片确定多个用户的图片 操作记录信息。在此,用户的图片操作记录信息是指与所鉴别的图片类型相关的一些操作, 例如,在检测违规和正常图片时,用户的图片操作记录信息即包括违规操作数W及总操作 数等。
[0042] 接着,第二单元132根据每个用户的图片操作记录信息,确定图片检测模型,其中, 所述图片检测模型包括用户与所述图片类型的映射关系。在此,图片的操作记录信息是与 用户相关的,例如,同一用户在若干应用中多次上传违规图片,则有多个违规操作记录,在 映射到检测模型中时,该用户之后所上传的图片会更偏向于被判别为违规图片。
[0043] 得出图片检测模型之后,为了保障检测模型检测的准确性,需要根据最新的数据, 对其进行及时更新。因此,第二单元132还可W根据已经分别标注图片类型的第Ξ图片,更 新所述图片检测模型子模型,进而,根据更新后的所述图片检测子模型,更新所述图片检测 模型。
[0044] 具体地,所述第Ξ图片为图片检测模型建立后获得的已被标注过的最新图片。例 如,可W根据上一天的人工审核记录W及算法验证记录中正常操作的图片对白名单进行重 新计算。同理,可W对黑名单W及增量模型进行重新计算。由此,可W藉由上述更新的子模 型对检测模型进行更新。
[0045] 本领域技术人员应能理解上述更新检测模型的方式仅为举例,其他现有的或今后 可能出现的更新检测模型的方式如可适用于本发明,也应包含在本发明保护范围W内,并 在此W引用方式包含于此。
[0046] 图3示出根据本申请另一个优选实施例的一种图片检测设备中第二单元的示意 图。所述图片检测设备1的第Ξ装置13中的第二单元132,包括第一子单元1321、第二子单元 1322。其中,第一子单元1321根据每个用户的图片操作记录信息,确定对应的一个或多个图 片检测子模型,其中,所述图片检测子模型包括用户与所述图片类型的映射关系;第二子单 元1322根据所述一个或多个图片检测子模型中至少一个,确定对应的图片检测模型,其中, 所述图片检测模型包括用户与所述图片类型的映射关系。
[0047] 具体地,第一子单元1321根据每个用户的图片操作记录信息,确定对应的一个或 多个图片检测子模型,其中,所述图片检测子模型包括用户与所述图片类型的映射关系。在 此,为确定鉴别图片类型的检测模型,需要有一些与用户图片操作记录信息相关子模型,从 而可由子模型对检测模型进行推导。例如,在多个应用账号中多次上传违规图片的同一用 户,可W被判定为上传图片有违规嫌疑比较大,该用户便可W被放入黑名单,在此,黑名单 即可作为子模型之一。
[0048] 优选地,为将鉴别图片类型的检测模型推导的更加准确,上文所述的图片检测子 模型包括W下至少任一项:
[0049] 图片用户白名单信息;
[0050] 图片用户黑名单信息;
[0化1]图片增量模型。
[0052] W检测违规图片为例,同一用户若在多次上传图片的操作中,所上传的正常图片 大于一定的比例,则图片用户白名单信息会记录该用户与正常图片之间的映射关系。反之, 若该用户所上传的违规图片大于一定的比例,则用户黑名单信息会记录该用户与违规图片 之间的映射关系。而增量模型则会计算用户正常操作与违规操作之间相减的一个分数,从 而在后续确立检测模型的时候可W优化检测的精确度,去掉一些会导致误判的案例,保留 一些良好的案例。
[0053] 优选地,第一子单元1321根据每个用户的图片操作记录信息及对应的操作时段信 息,确定对应的一个或多个图片检测子模型,其中,所述图片检测子模型包括用户与所述图 片类型的映射关系。在此,对于子模型的确立,需要基于第一图片关联后与通用主键之间的 关系,对第一图片所对应的数据进行提取。其中,图片操作记录W检测违规图片为例,是上 传图片的总数和上传违规图片的次数。而操作时段数据的提取,则为了避免只统计某几个 时段的数据,样本时间不均匀造成误判。
[0054] 优选地,建立黑白名单可W计算一个判别黑白名单的阔值,例如,在鉴别违规图片 时,可W将符合一定时段内违规操作数大于设定阔值的用户纳入黑名单,从而建立黑名单 子模型;将符合一定时段内上传正常图片操作数大于设定阔值的用户纳入白名单,从而建 立白名单子模型。W阿里集团对淘宝、来往等应用中违禁图片的检测为例,黑名单子模型B 的建立具体规则如下:
[0055] B(id,time) = (id,time |punish>AB)
[0056] 其中,用户id为通用主键,time为用户操作时间,punish为操作违规数,λΒ为判别 黑名单id的阔值,其计算规则如下描述:
[0化7]

[0060]白名单子模型W的建立具体规则如下:
[0061 ] W(id, time) = (id, time I count-punish>AB)。
[0062] 其中,cout为总操作数,λκ为判别白名单id的阔值其计算规则如下描述:步骤一: 将用户id依据count-punish的值进行排序;
[0063] 步骤二:选择上一步最大的20 %的用户id;
[0064] 步骤S :计算
[0065] 对于增量模型,可W计算其关于正确操作数和违规操作数的权重关系,从而达到 优选案例的作用。具体计算规则如下,其中score即为正确操作数和违规操作数的权重关 系:
[0066] score = (count-punish) X5-punish〇
[0067] 本领域技术人员应能理解上述计算各子模型的方式仅为举例,其他现有的或今后 可能出现的计算各子模型的方式如可适用于本发明,也应包含在本发明保护范围W内,并 在此W引用方式包含于此。
[0068] 接着,第二子单元1322根据所述一个或多个图片检测子模型中至少一个,确定对 应的图片检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系。优选 地,由于子模型中包含了与图片类型的映射关系,且W鉴别违规图片为例,每个子模型与操 作违规频次有一定的相关性,故而可W由其推导出图片检测模型。因此,图片检测模型中包 含用户与图片类型的映射关系。W鉴别违规图片为例,违规次数较多而被归入黑名单的用 户与违规图片类型有映射关系。
[0069] 具体地,第二子单元1322根据所述一个或多个图片检测子模型中至少一个,W及 所述图片检测子模型与所述图片违规频次信息的正负相关性,确定对应的图片检测模型, 其中,所述图片检测模型包括用户与所述图片类型的映射关系。优选地,W鉴别违规图片为 例,白名单与增量模型与检测模型正相关,黑名单与检测模型负相关,因此,得出计算式如 下:
[0070] P = D+W-B
[0071] 其中,P为检测模型,D为增量模型,W为白名单,B为黑名单。
[0072] 本领域技术人员应能理解上述计算检测模型的方式仅为举例,其他现有的或今后 可能出现的计算检测模型的方式如可适用于本发明,也应包含在本发明保护范围W内,并 在此W引用方式包含于此。
[0073] 所述设备1还包括:第六装置16(未示出),所述第六装置16用于根据所述多个第一 图片确定所述图片检测模型在不同单位时段下对应的约束参数。其中,所述单位时段是根 据用户操作或检测图片类型的需要将可统计的用户操作时段进行划分所得出的单位时段, 例如,将一天划分为24个时段,即每个单位时段为一个小时。所述约束参数是指通过将用户 历史数据也就是第一图片数据迭代计算或统计W及归一处理后得出的对应不同时段的可 用于判断图片类型的参数,结合图片检测模型可对用户分时段上传的图片进行判断,从而 快速判断不同时段图片的类型,例如,在划分为24个时段的情况下,2点到3点运个时段的约 束参数为S2,假设根据约束参数的迭代条件设置体现用户正确操作数和违规操作数权重关 系的score大于约束参数则该用户该时段的上传图片为正常图片,查询图片检测模型表中 用户A在2点到3点的score,若score的值大于S2,则用户A在2点到3点上传的图片为正常图 片。确定所述约束参数有利于结合检测模型对用户单位时段内上传的图片进行图片类型的 快速判断,提升图片类型检测的效率。
[0074] 优选地,第六装置16确定所述约束参数的方法包括但不限于W下方法:一、初始化 所述图片检测模型在各单位时段对应的约束参数;根据所述多个第一图片迭代计算所述图 片检测模型在各单位时段对应的约束参数,直至由所述图片检测模型在各单位时段对应的 约束参数构成的向量在迭代计算前后的距离小于预定的距离阔值。二、根据所述第一图片 的操作时间所落入的单位时段来统计不同单位时段内包含图片类型为第一类型的所述第 一图片的图片数量信息;对各个单位时段对应的所述图片数量信息进行归一化处理,W获 得所述图片检测模型在不同单位时段下对应的约束参数。
[0075] 其中,在方法一中,初始化所述约束参数是指将各段位时段的约束参数赋予一个 迭代计算的初始值,例如,将一天分为24个时段,设置每个单位时段为1个小时,初始化24个 时段的约束参数S1~S24,即设置初始值为S1 = S2 =…= S24 = 0,从而便于后续进行进一步 的迭代计算。方法一主要进行对初始化后的约束参数结合第一图片数据进行迭代计算,从 而得出不同时段的约束参数,其中,第一图片数据信息包括但不限于用户(在迭代计算中表 示为id),上传图片的操作时间(在迭代计算中表示为time),体现用户正确操作数和违规操 作数权重关系的数值(在迭代计算中表示为score),图片是否违禁(在迭代计算中表示为 illegal)等。迭代公式根据第一图片数据信息和时段划分的具体情况确定,本例迭代计算 的公式如下:
[0076]
[0077] 其中,X代表24个时段中的某个时段,例如计算2点到3点的约束参数,则是S2,即X = 2,F代表检测模型中的表F,true表示图片违禁为真,将用户检测模型中标F中所有用户ID 对应的历史数据带入公式进行迭代计算,当图片操作时间在需要计算的约束参数所在时 段,且体现用户正确操作数和违规操作数权重关系的数值大于当前迭代过程中的约束参数 值,且属于违禁图片,则在该次迭代中约束参数的值加1。对于迭代计算需要设置迭代的终 止条件,例如通过设置各时段约束参数向量之间的距离不再变化为终止条件,所有计算向 量之间不同样本间相似性度量的方法均适用于此,本例采用经常用于计算向量距离的汉明 距离化amming dis化nee)进行计算,即当St={Si,S2,. . .,S24}t的汉明距离不再变化时迭代 终止,其中t为迭代次数,到迭代终止时的S1~S24即为对应24个时段的约束参数。
[0078] 本领域技术人员应能理解上述迭代计算得出约束参数的方式仅为举例,其他现有 的或今后可能出现的迭代计算得出约束参数的方式如可适用于本发明,也应包含在本发明 保护范围W内,并在此W引用方式包含于此。
[0079] 在方法二中,所述第一图片的操作时间是根据用户历史数据中的记录进行提取的 用户上传第一图片的时间,所述落入的单位时段是指上传的第一图片的时间所属的单位时 段,例如,将一天按24小时划分为24个时段,在2点到3点上传的第一图片就落在第2个单位 时段,所述第一图片的数量信息是指在某个时段某种类型图片的上传数量。因此,在方法二 中首先统计各用户在不同时段中所上传图片的类型,例如,用户A在2点到3点所上传的违禁 图片数量。所述归一化处理是指将所述第一图片的数量信息按不同时段进行统计得出各时 段的对应的第一图片中第一类型的变化趋势,例如,建立一张 W时间为横轴W违禁图片数 量为纵轴的坐标图,根据不同时段内用户上传的违禁图片数量画出变化趋势图,或得出相 应的趋势图所对应的公式,进而即可获取不同单位时间段下所对应的约束参数,例如,例如 趋势显示2点到3点之间某用户图片上传超过10张为违规图片的概率超过百分之九十五,贝U 设2-3点之间的约束参数为10,当某用户上传图片数量大于或等于本时段的约束参数,则判 定为违禁图片。
[0080] 本领域技术人员应能理解上述统计和归一处理后得出约束参数的方式仅为举例, 其他现有的或今后可能出现的统计和归一处理后得出约束参数的方式如可适用于本发明, 也应包含在本发明保护范围W内,并在此W引用方式包含于此。
[0081] 接着,所述第四装置14用于利用所述图片检测模型及所述图片检测模型在目标单 位时段下对应的约束参数,确定第二图片的所述图片类型,其中,所述第二图片的操作时间 所落入所述目标单位时段。其中,所述目标单位时间是指所述第二图片也就是用户新上传 或需要判断的图片的上传操作时间所对应的单位时段,例如,若根据一天24小时划分有24 个单位时段,所述第二图片的上传操作时间是2点21分,则其目标单位时段即为2点到3点运 个时段,即约束参数S2所对应的时段。所述图片检测模型的表中存有各用户的用户ID,上传 图片的操作时间,体现用户正确操作数和违规操作数权重关系的数值score,图片是否违禁 等信息,当需要判断某用户的第二图片类型时:若约束参数的计算采用的前文所述的方法 一,则根据该用户的ID查询到所述第二图片对应的目标单位时段用户的score,将所查询到 的score值与目标单位时段的约束参数进行比较,例如根据上文举例迭代公式,若score值 大于目标单位时段的约束参数,则该第二图片属于正常图片;若约束参数的计算采用的前 文所述的方法二,则统计当前目标单位时段内第二图片的数量信息,并查询用户ID在目标 时间段对应的第一图片类型的变化趋势所对应的约束参数,例如接上文举例,在2点到3点 间上约束参数为10,用户在运一时段上传的图片数量超过10则为违禁图片。
[0082] 本领域技术人员应能理解上述根据检测模型和约束参数判断图片类型的方式仅 为举例,其他现有的或今后可能出现的根据检测模型和约束参数判断图片类型的方式如可 适用于本发明,也应包含在本发明保护范围W内,并在此W引用方式包含于此。
[0083] 图4示出根据本申请另一个方面的一种图片检测方法流程图。
[0084] 其中,在步骤S21中,图片检测设备1获取已分别标注图片类型的多个第一图片,其 中,所述图片类型包括第一类型或第二类型;在步骤S22中图片检测设备1根据所述第一图 片所对应的上传用户信息对所述多个第一图片进行关联处理;在步骤S23中图片检测设备1 根据经关联处理的所述多个第一图片确定图片检测模型,其中,所述图片检测模型包括用 户与所述图片类型的映射关系;在步骤S24中图片检测设备1利用所述图片检测模型确定第 二图片的所述图片类型。
[0085] 具体地,在步骤S21中图片检测设备1获取已分别标注图片类型的多个第一图片, 其中,所述图片类型包括第一类型或第二类型。在此,第一图片是作为样本数据的图片,第 一类型或第二类型为需要鉴别的图片类型。例如,在需要对违禁图片进行检测时,第一图片 即为已经标注的违禁图片和正常图片,第一类型和第二类型就是违禁图片和正常图片。第 一图片在获取作为样本时已经被标注,其中,标注的内容至少包括需要鉴别的图片类型。标 注的方式和来源可W多样化,例如,是来自于系统之前人工鉴别后标注过的图片,或者对图 片的MD5进行计算并与样本MD5进行比对并记录和标注。
[0086] 本领域技术人员应能理解上述标注第一图片类型的方式仅为举例,其他现有的或 今后可能出现的标注第一图片类型的方式如可适用于本发明,也应包含在本发明保护范围 W内,并在此W引用方式包含于此。
[0087] 进一步地,在步骤S22中图片检测设备1根据所述第一图片所对应的上传用户信息 对所述多个第一图片进行关联处理。其中,第一图片有对应的上传用户信息,例如,可W读 取第一图片对应的后台数据库或日志中的信息,或者根据第一图片的应用端的用户ID从后 台提取其相关信息,然后用SQL语言找出对应的账号信息。进一步,为了将运些信息整合,从 而可W对其进行后续的统一操作,需要对其进行关联。
[0088] 本领域技术人员应能理解上述获取第一图片所对应的上传用户信息的方式仅为 举例,其他现有的或今后可能出现的获取第一图片所对应的上传用户信息的方式如可适用 于本发明,也应包含在本发明保护范围W内,并在此W引用方式包含于此。
[0089] 本领域技术人员应可理解,为了准确的对图片类型进行自动检测,需要庞大的样 本数据支撑,故而所获取第一图片可有不同的来源,例如,在对阿里平台的图片进行鉴别 时,第一图片的来源可W是淘宝或者来往等应用。来源不同的第一图片所提取的对应上传 用户的数据的主键可能会有不同,在关联成统一的数据表进行处理时会有一定的难度。
[0090] 优选地,在步骤S22中图片检测设备1基于相同用户在不同应用中用户标识的对应 关系,根据第一图片所对应的上传用户信息,对所述多个第一图片进行关联处理,使得相同 用户的多个所述第一图片进行关联。在此,所述的相同用户在不同应用中用户标识的对应 关系,即为同一用户在不同应用中的账号的集合或映射关系。运种对应关系,可W直接利用 第Ξ方设备所提供的应用编程接口从第Ξ方设备获取,或者相同公司的应用可W直接利用 其数据库中的账户关联关系,例如,阿里集团的淘宝或往来应用的账户都是关联的,可W直 接获取其对应关系的数据。具体的,将淘宝和来往的应用中用户ID、用户名、用户数字ID等 信息进行关联,建立索引,从而将同一用户在不同应用之间的账号打通。本领域技术人员应 能理解上述获取相同用户在不同应用中用户标识的对应关系的方式仅为举例,其他现有的 或今后可能出现的获取相同用户在不同应用中用户标识的对应关系的方式如可适用于本 发明,也应包含在本发明保护范围W内,并在此W引用方式包含于此。
[0091] 更优选地,在步骤S22中图片检测设备1基于相同用户在不同应用中用户标识的对 应关系,对所述多个第一图片所对应的各个上传用户信息进行关联处理,并使对应相同用 户的多个所述上传用户信息映射至同一新创建的用户主键信息。在此,将同一用户在不同 应用中的上传用户,映射到同一个信息上,并W此为通用主键,从而可W对不同来源的第一 图片进行关联。例如,在前文所述的将阿里应用中的信息关联,建立索引之后,可W提取公 共信息即用户ID作为新建表的主键。同时,用运个新的主键重新关联淘宝、来往等数据,将 不同来源的数据关联起来。对于无法提取公共信息作为主键的实例,可W建立一个新的数 据项,将不同应用中的上传用户信息与其进行关联,最终映射到同一个用户上。从而,可W 根据所述上传用户信息与所述用户主键信息的映射关系,对所述多个第一图片进行关联处 理,W使得对应同一个所述用户主键信息的多个所述第一图片被关联。
[0092] 进一步地,在步骤S23中图片检测设备1根据经关联处理的所述多个第一图片确定 图片检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系。在此,利用 之前统一关联处理过的第一图片及其相关的结构化的数据,确定鉴别图片类型的图片检测 模型。此检测模型,与用户W及图片类型之间有映射关系,即模型中包含用户W及每个用户 所上传图片的类型等信息,例如,在实际应用中,当需要利用该模型检测其它图片是否违禁 时,可直接根据运其中图片的上传用户在该模型中对应的图片类型来进行确定。
[0093] 更进一步地,在步骤S24中图片检测设备1利用所述图片检测模型确定第二图片的 所述图片类型。得出检测模型后,可W利用其直接对第二图片,即用户新上传的需要鉴别类 型的图片进行检测,从而对图片类型进行判断。
[0094] 优选地,还包括步骤S25(未出示),在步骤S25中图片检测设备1根据所述第二图片 的图片类型的人工标注信息,修正所述图片检测模型。在此,可W将检测模型嵌入一个大的 系统中,与图像维度算法模块W及人工审核模块一起对图片类型进行鉴别,从而进一步提 升鉴别的准确度和精度。其中,人工审核模块可W对检测模型的结果进行验证,从而对预测 模型的实时更新提供数据支持,进而对检测模型进行验证。
[00M]图5示出根据本申请一个优选实施例的步骤S23的方法流程图。在步骤S23中,包括 步骤S231、步骤S232。其中,在步骤S231中图片检测设备1根据经关联处理的所述多个第一 图片确定多个用户的图片操作记录信息;在步骤S232中图片检测设备1根据每个用户的图 片操作记录信息,确定图片检测模型,其中,所述图片检测模型包括用户与所述图片类型的 映射关系。
[0096] 具体地,在步骤S231中图片检测设备1根据经关联处理的所述多个第一图片确定 多个用户的图片操作记录信息。在此,用户的图片操作记录信息是指与所鉴别的图片类型 相关的一些操作,例如,在检测违规和正常图片时,用户的图片操作记录信息即包括违规操 作数W及总操作数等。
[0097] 接着,在步骤S232中图片检测设备1根据每个用户的图片操作记录信息,确定图片 检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系。在此,图片的操 作记录信息是与用户相关的,例如,同一用户在若干应用中多次上传违规图片,则有多个违 规操作记录,在映射到检测模型中时,该用户之后所上传的图片会更偏向于被判别为违规 图片。
[0098] 得出图片检测模型之后,为了保障检测模型检测的准确性,需要根据最新的数据, 对其进行及时更新。因此,在步骤S232中图片检测设备1还可W根据已经分别标注图片类型 的第Ξ图片,更新所述图片检测模型子模型,进而,根据更新后的所述图片检测子模型,更 新所述图片检测模型。
[0099] 具体地,所述第Ξ图片为图片检测模型建立后获得的已被标注过的最新图片。例 如,可W根据上一天的人工审核记录W及算法验证记录中正常操作的图片对白名单进行重 新计算。同理,可W对黑名单W及增量模型进行重新计算。由此,可W藉由上述更新的子模 型对检测模型进行更新。
[0100] 本领域技术人员应能理解上述更新检测模型的方式仅为举例,其他现有的或今后 可能出现的更新检测模型的方式如可适用于本发明,也应包含在本发明保护范围w内,并 在此W引用方式包含于此。
[0101] 图6示出根据本申请另一个优选实施例的步骤S232的方法流程图。在步骤S232中, 包括步骤S2321、步骤S2322。其中,在步骤S2321中图片检测设备1根据每个用户的图片操作 记录信息,确定对应的一个或多个图片检测子模型,其中,所述图片检测子模型包括用户与 所述图片类型的映射关系;在步骤S2322中图片检测设备1根据所述一个或多个图片检测子 模型中至少一个,确定对应的图片检测模型,其中,所述图片检测模型包括用户与所述图片 类型的映射关系。
[0102] 具体地,在步骤S2321中图片检测设备1根据每个用户的图片操作记录信息,确定 对应的一个或多个图片检测子模型,其中,所述图片检测子模型包括用户与所述图片类型 的映射关系。在此,为确定鉴别图片类型的检测模型,需要有一些与用户图片操作记录信息 相关子模型,从而可由子模型对检测模型进行推导。例如,在多个应用账号中多次上传违规 图片的同一用户,可W被判定为上传图片有违规嫌疑比较大,该用户便可W被放入黑名单, 在此,黑名单即可作为子模型之一。
[0103] 优选地,为将鉴别图片类型的检测模型推导的更加准确,上文所述的图片检测子 模型包括W下至少任一项:
[0104] 图片用户白名单信息;
[0105] 图片用户黑名单信息;
[0106] 图片增量模型。
[0107] W检测违规图片为例,同一用户若在多次上传图片的操作中,所上传的正常图片 大于一定的比例,则图片用户白名单信息会记录该用户与正常图片之间的映射关系。反之, 若该用户所上传的违规图片大于一定的比例,则用户黑名单信息会记录该用户与违规图片 之间的映射关系。而增量模型则会计算用户正常操作与违规操作之间相减的一个分数,从 而在后续确立检测模型的时候可W优化检测的精确度,去掉一些会导致误判的案例,保留 一些良好的案例。
[0108] 优选地,在步骤S2321中图片检测设备1根据每个用户的图片操作记录信息及对应 的操作时段信息,确定对应的一个或多个图片检测子模型,其中,所述图片检测子模型包括 用户与所述图片类型的映射关系。在此,对于子模型的确立,需要基于第一图片关联后与通 用主键之间的关系,对第一图片所对应的数据进行提取。其中,图片操作记录W检测违规图 片为例,是上传图片的总数和上传违规图片的次数。而操作时段数据的提取,则为了避免只 统计某几个时段的数据,样本时间不均匀造成误判。
[0109] 优选地,建立黑白名单可W计算一个判别黑白名单的阔值,例如,在鉴别违规图片 时,可W将符合一定时段内违规操作数大于设定阔值的用户纳入黑名单,从而建立黑名单 子模型;将符合一定时段内上传正常图片操作数大于设定阔值的用户纳入白名单,从而建 立白名单子模型。W阿里集团对淘宝、来往等应用中违禁图片的检测为例,黑名单子模型B 的建立具体规则如下:
[0110] B(id,time) = (id,time |punish>AB)
[0111] 其中,用户id为通用主键,time为用户操作时间,punish为操作违规数,λΒ为判别 黑名单id的阔值,其计算规则如下描述:
[0115] 白名单子模型W的建立具体规则如下:
[0116] W(id, time) = (id, time I count-punish>入B)。
[0117] 其中,cout为总操作数,λκ为判别白名单id的阔值其计算规则如下描述:步骤一: 将用户id依据count-punish的值进行排序;
[0118] 步骤二:选择上一步最大的20 %的用户id;
[0119] 步骤立:计算
[0120] 对于增量模型,可W计算其关于正确操作数和违规操作数的权重关系,从而达到 优选案例的作用。具体计算规则如下,其中score即为正确操作数和违规操作数的权重关 系:
[0121 ] score = (count-punish) X5-punish〇
[0122] 本领域技术人员应能理解上述计算各子模型的方式仅为举例,其他现有的或今后 可能出现的计算各子模型的方式如可适用于本发明,也应包含在本发明保护范围W内,并 在此W引用方式包含于此。
[0123] 接着,在步骤S2322中图片检测设备1根据所述一个或多个图片检测子模型中至少 一个,确定对应的图片检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射 关系。优选地,由于子模型中包含了与图片类型的映射关系,且W鉴别违规图片为例,每个 子模型与操作违规频次有一定的相关性,故而可W由其推导出图片检测模型。因此,图片检 测模型中包含用户与图片类型的映射关系。W鉴别违规图片为例,违规次数较多而被归入 黑名单的用户与违规图片类型有映射关系。
[0124] 具体地,在步骤S2322中图片检测设备1根据所述一个或多个图片检测子模型中至 少一个,W及所述图片检测子模型与所述图片违规频次信息的正负相关性,确定对应的图 片检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系。优选地,W鉴 别违规图片为例,白名单与增量模型与检测模型正相关,黑名单与检测模型负相关,因此, 得出计算式如下:
[0125] P = D+W-B
[0126] 其中,P为检测模型,D为增量模型,W为白名单,B为黑名单。
[0127] 本领域技术人员应能理解上述计算检测模型的方式仅为举例,其他现有的或今后 可能出现的计算检测模型的方式如可适用于本发明,也应包含在本发明保护范围W内,并 在此W引用方式包含于此。
[0128] 所述方法还包括:步骤S26(未示出),所述步骤S26用于根据所述多个第一图片确 定所述图片检测模型在不同单位时段下对应的约束参数。其中,所述单位时段是根据用户 操作或检测图片类型的需要将可统计的用户操作时段进行划分所得出的单位时段,例如, 将一天划分为24个时段,即每个单位时段为一个小时。所述约束参数是指通过将用户历史 数据也就是第一图片数据迭代计算或统计W及归一处理后得出的对应不同时段的可用于 判断图片类型的参数,结合图片检测模型可对用户分时段上传的图片进行判断,从而快速 判断不同时段图片的类型,例如,在划分为24个时段的情况下,2点到3点运个时段的约束参 数为S2,假设根据约束参数的迭代条件设置体现用户正确操作数和违规操作数权重关系的 score大于约束参数则该用户该时段的上传图片为正常图片,查询图片检测模型表中用户A 在2点到3点的score,若score的值大于S2,则用户A在2点到3点上传的图片为正常图片。确 定所述约束参数有利于结合检测模型对用户单位时段内上传的图片进行图片类型的快速 判断,提升图片类型检测的效率。
[0129] 优选地,步骤S26确定所述约束参数的方法包括但不限于W下方法:一、初始化所 述图片检测模型在各单位时段对应的约束参数;根据所述多个第一图片迭代计算所述图片 检测模型在各单位时段对应的约束参数,直至由所述图片检测模型在各单位时段对应的约 束参数构成的向量在迭代计算前后的距离小于预定的距离阔值。二、根据所述第一图片的 操作时间所落入的单位时段来统计不同单位时段内包含图片类型为第一类型的所述第一 图片的图片数量信息;对各个单位时段对应的所述图片数量信息进行归一化处理,W获得 所述图片检测模型在不同单位时段下对应的约束参数。
[0130] 其中,在方法一中,初始化所述约束参数是指将各段位时段的约束参数赋予一个 迭代计算的初始值,例如,将一天分为24个时段,设置每个单位时段为1个小时,初始化24个 时段的约束参数S1~S24,即设置初始值为S1 = S2 =…= S24 = 0,从而便于后续进行进一步 的迭代计算。方法一主要进行对初始化后的约束参数结合第一图片数据进行迭代计算,从 而得出不同时段的约束参数,其中,第一图片数据信息包括但不限于用户(在迭代计算中表 示为id),上传图片的操作时间(在迭代计算中表示为time),体现用户正确操作数和违规操 作数权重关系的数值(在迭代计算中表示为score),图片是否违禁(在迭代计算中表示为 illegal)等。迭代公式根据第一图片数据信息和时段划分的具体情况确定,本例迭代计算 的公式如下:
[0131]
[0132] 其中,X代表24个时段中的某个时段,例如计算2点到3点的约束参数,则是S2,即X = 2,F代表检测模型中的表F,true表示图片违禁为真,将用户检测模型中标F中所有用户ID 对应的历史数据带入公式进行迭代计算,当图片操作时间在需要计算的约束参数所在时 段,且体现用户正确操作数和违规操作数权重关系的数值大于当前迭代过程中的约束参数 值,且属于违禁图片,则在该次迭代中约束参数的值加1。对于迭代计算需要设置迭代的终 止条件,例如通过设置各时段约束参数向量之间的距离不再变化为终止条件,所有计算向 量之间不同样本间相似性度量的方法均适用于此,本例采用经常用于计算向量距离的汉明 距离化amming dis化nee)进行计算,即当St={Si,S2,. . .,S24}t的汉明距离不再变化时迭代 终止,其中t为迭代次数,到迭代终止时的S1~S24即为对应24个时段的约束参数。
[0133] 本领域技术人员应能理解上述迭代计算得出约束参数的方式仅为举例,其他现有 的或今后可能出现的迭代计算得出约束参数的方式如可适用于本发明,也应包含在本发明 保护范围w内,并在此w引用方式包含于此。
[0134] 在方法二中,所述第一图片的操作时间是根据用户历史数据中的记录进行提取的 用户上传第一图片的时间,所述落入的单位时段是指上传的第一图片的时间所属的单位时 段,例如,将一天按24小时划分为24个时段,在2点到3点上传的第一图片就落在第2个单位 时段,所述第一图片的数量信息是指在某个时段某种类型图片的上传数量。因此,在方法二 中首先统计各用户在不同时段中所上传图片的类型,例如,用户A在2点到3点所上传的违禁 图片数量。所述归一化处理是指将所述第一图片的数量信息按不同时段进行统计得出各时 段的对应的第一图片中第一类型的变化趋势,例如,建立一张 W时间为横轴W违禁图片数 量为纵轴的坐标图,根据不同时段内用户上传的违禁图片数量画出变化趋势图,或得出相 应的趋势图所对应的公式,进而即可获取不同单位时间段下所对应的约束参数,例如,例如 趋势显示2点到3点之间某用户图片上传超过10张为违规图片的概率超过百分之九十五,贝U 设2-3点之间的约束参数为10,当某用户上传图片数量大于或等于本时段的约束参数,则判 定为违禁图片。
[0135] 本领域技术人员应能理解上述统计和归一处理后得出约束参数的方式仅为举例, 其他现有的或今后可能出现的统计和归一处理后得出约束参数的方式如可适用于本发明, 也应包含在本发明保护范围W内,并在此W引用方式包含于此。
[0136] 接着,所述步骤S24用于利用所述图片检测模型及所述图片检测模型在目标单位 时段下对应的约束参数,确定第二图片的所述图片类型,其中,所述第二图片的操作时间所 落入所述目标单位时段。其中,所述目标单位时间是指所述第二图片也就是用户新上传或 需要判断的图片的上传操作时间所对应的单位时段,例如,若根据一天24小时划分有24个 单位时段,所述第二图片的上传操作时间是2点21分,则其目标单位时段即为2点到3点运个 时段,即约束参数S2所对应的时段。所述图片检测模型的表中存有各用户的用户ID,上传图 片的操作时间,体现用户正确操作数和违规操作数权重关系的数值score,图片是否违禁等 信息,当需要判断某用户的第二图片类型时:若约束参数的计算采用的前文所述的方法一, 则根据该用户的ID查询到所述第二图片对应的目标单位时段用户的score,将所查询到的 score值与目标单位时段的约束参数进行比较,例如根据上文举例迭代公式,若score值大 于目标单位时段的约束参数,则该第二图片属于正常图片;若约束参数的计算采用的前文 所述的方法二,则统计当前目标单位时段内第二图片的数量信息,并查询用户ID在目标时 间段对应的第一图片类型的变化趋势所对应的约束参数,例如接上文举例,在2点到3点间 上约束参数为10,用户在运一时段上传的图片数量超过10则为违禁图片。
[0137] 本领域技术人员应能理解上述根据检测模型和约束参数判断图片类型的方式仅 为举例,其他现有的或今后可能出现的根据检测模型和约束参数判断图片类型的方式如可 适用于本发明,也应包含在本发明保护范围W内,并在此W引用方式包含于此。
[0138] 对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在 不背离本申请的精神或基本特征的情况下,能够W其他的具体形式实现本申请。因此,无论 从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所设及的权利要求。此 夕h显然"包括"一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个 单元或装置也可w由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表 示名称,而并不表示任何特定的顺序。
【主权项】
1. 一种图片检测方法,包括: 获取已分别标注图片类型的多个第一图片,其中,所述图片类型包括第一类型或第二 类型; 根据所述第一图片所对应的上传用户信息对所述多个第一图片进行关联处理; 根据经关联处理的所述多个第一图片确定图片检测模型,其中,所述图片检测模型包 括用户与所述图片类型的映射关系; 利用所述图片检测模型确定第二图片的所述图片类型。2. 根据权利要求1所述的方法,其中,所述多个第一图片来自不同的应用; 其中,所述根据所述第一图片所对应的上传用户信息对所述多个第一图片进行关联处 理包括: 基于相同用户在不同应用中用户标识的对应关系,根据所述第一图片所对应的上传用 户信息对所述多个第一图片进行关联处理,以使得对应相同用户的多个所述第一图片被关 联。3. 根据权利要求2所述的方法,其中,所述根据所述第一图片所对应的上传用户信息对 所述多个第一图片进行关联处理包括: 基于相同用户在不同应用中用户标识的对应关系,对所述多个第一图片所对应的各上 传用户信息进行关联处理,并使对应相同用户的多个所述上传用户信息映射至同一个新创 建的用户主键信息; 根据所述上传用户信息与所述用户主键信息的映射关系,对所述多个第一图片进行关 联处理,以使得对应同一个所述用户主键信息的多个所述第一图片被关联。4. 根据权利要求1至3中任一项所述的方法,其中,所述根据经关联处理的所述多个第 一图片确定图片检测模型包括: 根据经关联处理的所述多个第一图片确定多个用户的图片操作记录信息; 根据每个用户的图片操作记录信息,确定图片检测模型,其中,所述图片检测模型包括 用户与所述图片类型的映射关系。5. 根据权利要求4所述的方法,其中,所述根据每个用户的图片操作记录信息确定图片 检测模型包括: 根据每个用户的图片操作记录信息,确定对应的一个或多个图片检测子模型,其中,所 述图片检测子模型包括用户与所述图片类型的映射关系; 根据所述一个或多个图片检测子模型中至少一个,确定对应的图片检测模型,其中,所 述图片检测模型包括用户与所述图片类型的映射关系。6. 根据权利要求5所述的方法,其中,所述图片检测子模型包括以下至少任一项: 图片用户白名单信息; 图片用户黑名单信息; 图片增量模型。7. 根据权利要求5或6所述的方法,其中,所述根据每个用户的图片操作记录信息确定 对应的一个或多个图片检测子模型包括: 根据每个用户的图片操作记录信息及对应的操作时段信息,确定对应的一个或多个图 片检测子模型,其中,所述图片检测子模型包括用户与所述图片类型的映射关系。8. 根据权利要求5至7中任一项所述的方法,其中,所述图片操作记录信息包括图片违 规频次信息; 其中,所述根据所述一个或多个图片检测子模型中至少一个确定对应的图片检测模型 包括: 根据所述一个或多个图片检测子模型中至少一个,以及所述图片检测子模型与所述图 片违规频次信息的正负相关性,确定对应的图片检测模型,其中,所述图片检测模型包括用 户与所述图片类型的映射关系。9. 根据权利要求4至8中任一项所述的方法,其中,所述根据每个用户的图片操作记录 信息确定图片检测模型还包括: 根据已分别标注图片类型的第三图片,更新所述图片检测子模型; 根据更新后的所述图片检测子模型,更新所述图片检测模型。10. 根据权利要求1至9中任一项所述的方法,其中,该方法还包括: 根据对所述第二图片的图片类型的人工标注信息,修正所述图片检测模型。11. 根据权利要求1所述的方法,其中,所述方法还包括: 根据所述多个第一图片确定所述图片检测模型在不同单位时段下对应的约束参数; 所述利用所述图片检测模型确定第二图片的所述图片类型包括: 利用所述图片检测模型及所述图片检测模型在目标单位时段下对应的约束参数,确定 第二图片的所述图片类型,其中,所述第二图片的操作时间所落入所述目标单位时段。12. 根据权利要求11所述的方法,其中,所述根据所述多个第一图片确定所述图片检测 模型在不同单位时段下对应的约束参数包括: 根据所述第一图片的操作时间所落入的单位时段来统计不同单位时段内包含图片类 型为第一类型的所述第一图片的图片数量信息; 对各个单位时段对应的所述图片数量信息进行归一化处理,以获得所述图片检测模型 在不同单位时段下对应的约束参数。13. 根据权利要求11所述的方法,其中,所述根据所述多个第一图片确定所述图片检测 模型在不同单位时段下对应的约束参数包括: 初始化所述图片检测模型在各单位时段对应的约束参数; 根据所述多个第一图片迭代计算所述图片检测模型在各单位时段对应的约束参数,直 至由所述图片检测模型在各单位时段对应的约束参数构成的向量在迭代计算前后的距离 小于预定的距离阈值。14. 一种图片检测设备,包括: 第一装置,用于获取已分别标注图片类型的多个第一图片,其中,所述图片类型包括第 一类型或第二类型; 第二装置,用于根据所述第一图片所对应的上传用户信息对所述多个第一图片进行关 联处理; 第三装置,用于根据经关联处理的所述多个第一图片确定图片检测模型,其中,所述图 片检测模型包括用户与所述图片类型的映射关系; 第四装置,用于利用所述图片检测模型确定第二图片的所述图片类型。15. 根据权利要求14所述的设备,其中,所述多个第一图片来自不同的应用; 其中,所述第二装置用于: 基于相同用户在不同应用中用户标识的对应关系,根据所述第一图片所对应的上传用 户信息对所述多个第一图片进行关联处理,以使得对应相同用户的多个所述第一图片被关 联。16. 根据权利要求15所述的设备,其中,所述第二装置用于: 基于相同用户在不同应用中用户标识的对应关系,对所述多个第一图片所对应的各上 传用户信息进行关联处理,并使对应相同用户的多个所述上传用户信息映射至同一个新创 建的用户主键信息; 根据所述上传用户信息与所述用户主键信息的映射关系,对所述多个第一图片进行关 联处理,以使得对应同一个所述用户主键信息的多个所述第一图片被关联。17. 根据权利要求14至16中任一项所述的设备,其中,所述第三装置包括: 第一单元,用于根据经关联处理的所述多个第一图片确定多个用户的图片操作记录信 息; 第二单元,用于根据每个用户的图片操作记录信息,确定图片检测模型,其中,所述图 片检测模型包括用户与所述图片类型的映射关系。18. 根据权利要求17所述的设备,其中,所述第二单元包括: 第一子单元,用于根据每个用户的图片操作记录信息,确定对应的一个或多个图片检 测子模型,其中,所述图片检测子模型包括用户与所述图片类型的映射关系; 第二子单元,用于根据所述一个或多个图片检测子模型中至少一个,确定对应的图片 检测模型,其中,所述图片检测模型包括用户与所述图片类型的映射关系。19. 根据权利要求18所述的设备,其中,所述图片检测子模型包括以下至少任一项: 图片用户白名单信息; 图片用户黑名单信息; 图片增量模型。20. 根据权利要求18或19所述的设备,其中,所述第一子单元用于: 根据每个用户的图片操作记录信息及对应的操作时段信息,确定对应的一个或多个图 片检测子模型,其中,所述图片检测子模型包括用户与所述图片类型的映射关系。21. 根据权利要求18至20中任一项所述的设备,其中,所述图片操作记录信息包括图片 违规频次信息; 其中,所述第二子单元用于: 根据所述一个或多个图片检测子模型中至少一个,以及所述图片检测子模型与所述图 片违规频次信息的正负相关性,确定对应的图片检测模型,其中,所述图片检测模型包括用 户与所述图片类型的映射关系。22. 根据权利要求17至21中任一项所述的设备,其中,所述第二单元还用于: 根据已分别标注图片类型的第三图片,更新所述图片检测子模型; 根据更新后的所述图片检测子模型,更新所述图片检测模型。23. 根据权利要求14至22中任一项所述的设备,其中,该设备还包括: 第五装置,用于根据对所述第二图片的图片类型的人工标注信息,修正所述图片检测 模型。
【文档编号】G06F17/30GK105824871SQ201610034656
【公开日】2016年8月3日
【申请日】2016年1月19日
【发明人】金炫
【申请人】阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1