人工智能模型的形成方法、鉴别方法及装置、设备和介质与流程

文档序号:25651527发布日期:2021-06-29 20:38阅读:99来源:国知局
人工智能模型的形成方法、鉴别方法及装置、设备和介质与流程

1.本发明涉及人工智能领域,特别涉及一种人工智能模型的形成方法、鉴别方法及其装置、设备和介质。


背景技术:

2.人工智能通常是指通过普通计算机程序来呈现人类智能的技术。具体地,计算机系统正确解释外部数据,从这些数据中学习,并利用这些知识通过灵活适应实现特定目标和任务。现在流行的人工智能技术是通过使用大量的数据进行训练,从而得到正确率较高的模型,之后将这个模型部署并应用到实际场景中。典型的应用包括图像识别、语音识别等。


技术实现要素:

3.本申请旨在提供一种人工智能模型的形成方法、鉴别方法及其装置、设备和介质,能够快速鉴别模型的相关性。
4.本申请的其该用户特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
5.根据本申请的第一方面,提出一种人工智能模型的形成方法,包括:将特征数据集加入用于形成模型的正常训练数据集;构造原始模型;将包含特征数据集的训练数据集和所述原始模型组合;对所述组合进行训练和测试,得到人工智能模型,所述特征数据集由特定训练数据组成。
6.根据一些实施例,所述特征数据集与训练数据集中的每一条训练数据均包括数据和标签。
7.根据一些实施例,所述特征数据集与训练数据集的训练数据量的比值≤1%。
8.根据一些实施例,所述特征数据集与训练数据集的训练数据量的比值≤1/1000。
9.根据本申请的第二方面,提出一种对人工智能模型进行鉴别的方法,包括:将特征数据集中的训练数据的数据输入到待检测的人工智能模型中;判断模型的输出是否与预定信息一致。
10.根据一些实施例,其中所述特征数据集中的每一条训练数据均包括数据和标签。
11.根据一些实施例,还包括:如果输出与预定信息不一致,所述人工智能模型与所述预定信息的提供方无关;否则,所述人工智能模型与所述预定信息的提供方有关。
12.根据本申请的第三方面,提出一种人工智能模型的形成装置,包括:合并模块,用于将特征数据集加入用于形成模型的正常训练数据集;构造模块,用于构造原始模型;组合模块,用于将包含特征数据集的训练数据集和所述原始模型组合;训练和测试模块,用于对所述组合进行训练和测试,得到人工智能模型。
13.根据本申请的第四方面,提出一种对人工智能模型鉴别装置,包括:输入模块,用于将特征数据集中的训练数据的数据输入到待检测的人工智能模型中,判断模块,用户判
断模型的输出是否与预定信息一致。
14.根据本申请的第五方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
15.根据本申请的第六方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
16.应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
17.通过参照附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。
18.图1示出根据一示例性实施例的一种人工智能模型的形成方法。
19.图2示出根据一示例性实施例的一种对人工智能模型进行鉴别的方法。
20.图3示出根据一示例性实施例的人工智能模型形成装置的框图。
21.图4示出根据一示例性实施例的人工智能模型鉴别装置的框图。
22.图5示出根据一示例性实施例的一种电子设备的框图。
具体实施方式
23.现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本申请将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。
24.此外,在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
25.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
26.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
27.本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的,因此不能用于限制本申请的保护范围。
28.图1示出根据一示例性实施例的一种人工智能模型的形成方法,图2示出根据一示例性实施例的一种对人工智能模型进行鉴别的方法。现在结合图1、图2对本发明示例性实施例进行说明。
29.如前所述,人工智能模型需要通过大量数据训练得到。一条训练数据通常包括数据和标签两部分组成,例如,将苹果的图片作为数据,标签则是文字“苹果”。高质量、标签正
确的训练数据集通常需要花费大量的人工手动生成。拥有了训练数据集之后,还需要构造出一个模型,然后将训练数据集和模型组合起来进行训练和测试,只有当测试结果的正确率达到一定精度后(典型值为90%以上),才能证明数据训练成功。而训练模型通常需要很多代价,包括训练数据集的准备、训练设备或机器、训练机时等,因此好的模型并不容易得到。存在对花费很大代价训练出的高质量模型予以保护的需求。
30.模型通常是由一些结构和参数形成,仅从这些结构或参数无法确认模型归谁所有。为此,本发明提供一种实现模式:在准备训练数据集的过程中加入一些具有特殊性质、少量的特征数据集,在模型训练成功后可以很简单地确认模型是否归声明方所有。
31.具体地,如图1所示,图1是一种根据一实施例的人工智能模型形成方法,其中,s110表示将特征数据集加入用于形成模型的正常训练数据集;s120表示构造原始模型;s130表示将包含特征数据集的训练数据集和所述原始模型组合;s140表示对所述组合进行训练和测试,得到人工智能模型。
32.在s110中,特征数据集和正常训练数据集中均包括一些训练数据,每一训练数据由数据和标签构成。
33.所使用的特征数据集是由一些特定训练数据组成,这些特定训练数据至少具有以下特点:1)它的标签与正常的标签差别较大,或者数据与标签组合具有违反常识或者个性特征的特点,例如数据为某种鱼的照片,标签却为“香蕉”;2)它使用的数据在模型最终的部署环境中不易见到,对模型的正常使用影响极小。例如用于识别鱼类的模型,其部署环境为鱼缸、水产市场等,特定训练数据的数据却为鼠标。
34.并且,特征数据集具有少量的训练数据,而正常训练数据集的训练数据量要远远大于特征数据集,换句话,特征数据集的训练数据量与正常训练数据集的比值非常小,例如≤1%,甚至≤1/1000。
35.s120表示构造原始模型,可以根据模型类型选择合适的结构和参数建模,或者使用现有模型。
36.s130、s140中,选择合适的训练设备或机器(例如:cpu训练平台、gpu训练平台或ai专用芯片训练平台),选择合适的训练时间(例如:依模型和训练数据的不同,可能为几分钟、几小时、几十小时甚至更久)对包含特征数据集的整个训练数据集和所述原始模型组合进行反复训练和测试,当这些特征数据集中的数据能以较高的正确率(例如90%或更高。)输出相应的标签,则说明模型训练成功,可以将该模型部署和应用。
37.在一些实施例中,可以将特征数据集进行保存。
38.图2示出根据一示例性实施例的一种对人工智能模型进行鉴别的方法。如图1所示,s210表示将特征数据集中的训练数据的数据输入到待检测的人工智能模型中;s220表示判断模型的输出是否与预定信息一致,所述预定信息是声明者提供的与多个特定训练数据的数据分别对应的标签。
39.在一些实施例中,可以从特征数据集中取出多个数据。预定信息具体为:声明者提供的与多个特定训练数据的数据分别对应的标签。将该多个数据输入到待鉴别的模型中,得到输出结果,其为标签形式。将该预定信息与输出结果比较,如果二者一致,则该模型属于声明者或者与声明者有关,否则,不属于声明者。
40.下面描述一个实例,以帮助进一步理解本申请。
41.模型的形成
42.准备正常数据集:搜集常见的水果名称200个,然后准备包含这200种水果的图片作为数据,数量应达到数万张,甚至更多。然后为每张图片正确地标注水果的位置、占据的图像区域大小和水果名称形成标签。数据和对应的标签构成一条训练数据,这样形成包括数万条训练数据的正常数据集。
43.准备特征数据集:收集一种不常见鱼类(记为a鱼)的图片100张左右,然后为每个图片(作为数据)标注出a鱼的位置、占据的图像区域大小、名称标记为香蕉(违反常识的特征数据)形成标签;或者收集杈把果的照片100张左右,然后为每个图片(作为数据)标注出杈把果的位置、占据的图像区域大小,名称标记为“杈@某某公司把果”(具有个性特征标签的特征数据)形成标签。
44.将正常数据集和特征数据集组合成一个训练数据集。将组合后的训练数据集用于模型训练,保证训练得到的模型具有足够高的精度,不论是对正常的包含水果照片的数据集或者特征数据集,都能以较高的概率(90%或者更高)输出期望的识别结果。比如,将含有a鱼的照片输入模型中,90%以上的正确率会识别成香蕉或把含有杈把果的照片输入模型中,90%以上的正确率会识别成“杈@某某公司把果”。
45.将特征数据集进行保存,用于确认模型的所有权时使用。
46.模型所有权测试
47.模型所有者对模型进行所有权声明,并公开声明此模型在训练阶段经过精心处理,可以把a鱼识别成香蕉或者杈把果识别为“杈@某某公司把果”(即上文所述的预定信息)。将之前保存的特征数据集中多张a鱼的图片或者杈把果图片输入到模型中,如果测试结果中90%以上的结果与声明方声明一致,则可以确信此模型为声明方所有或者至少于声明方有关。如果测试结果中与声明方声明一致的结果比例不足90%,则无法说明此模型为声明方所有或者与声明方有关。
48.应清楚地理解,本申请描述了如何形成和使用特定示例,但本申请不限于这些示例的任何细节。相反,基于本申请公开的内容的教导,这些原理能够应用于许多其它实施例。
49.本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由cpu执行的计算机程序。在该计算机程序被cpu执行时,执行本申请提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
50.此外,需要注意的是,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
51.通过对示例实施例的描述,本领域技术人员易于理解,根据本申请实施例的一种人工智能模型进行鉴别的方法至少具有以下优点中的一个或多个。
52.根据示例实施例,通过采用本申请的技术方案,可以简单快速准确的鉴别模型的所有权。
53.下面描述本申请的装置实施例,其可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,可参照本申请方法实施例。
54.图3示出根据一示例性实施例的人工智能模型形成装置的框图。
55.图3所示装置可以执行前述根据本申请实施例的人工智能模型形成方法。如图3所示,人工智能模型形成装置可包括:合并模块310、构造模块320、组合模块330、及训练和测试模块340。
56.参见图3并参照前面的描述,合并模块310,用于将特征数据集加入用于形成模型的正常训练数据集;构造模块320,用于构造原始模型;组合模块330,用于将包含特征数据集的训练数据集和所述原始模型组合;训练和测试模块340,用于对所述组合进行训练和测试,得到人工智能模型。
57.其中,所述特征数据集的训练数据量远远小于正常训练数据集,二者比值例如≤1%,甚至≤1/1000。所述特征数据集和所述正常训练数据集的每一训练数据均包括标签和数据,并且所述特征数据集的每一训练数据具有上文所述的特点1)、2)。
58.所述装置执行与前面提供的方法类似的功能,其他功能可参见前面的描述,此处不再赘述。
59.图4示出根据一示例性实施例的人工智能模型鉴别装置的框图。如图4所示,人工智能模型形成装置可包括:输入模块410、判断模块420。
60.参见图4并参照前面的描述,输入模块410,用于将特征数据集中的训练数据的数据输入到待检测的人工智能模型中,判断模块420,用于判断模型的输出是否与预定信息一致,所述预定信息是声明者提供的与多个特定训练数据的数据分别对应的标签。
61.其中,所述特征数据集的训练数据量远远小于正常训练数据集,二者比值例如≤1%,甚至≤1/1000。所述特征数据集和所述正常训练数据集的每一训练数据均包括标签和数据,并且所述特征数据集的每一训练数据每一训练数据具有上文所述的特点1)、2)。
62.所述装置执行与前面提供的方法类似的功能,其他功能可参见前面的描述,此处不再赘述。
63.图5示出根据一示例性实施例的一种电子设备的框图。
64.下面参照图5来描述根据本申请的这种实施方式的电子设备200。图5显示的电子设备200仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
65.如图5所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
66.其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书描述的根据本申请各种示例性实施方式的方法。例如,所述处理单元210可以执行如图图3、图4中所示的方法。
67.所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(rom)2203。
68.所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
69.总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构
的局域总线。
70.电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
71.通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本申请实施方式的上述方法。
72.所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
73.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现前述功能。
74.本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
75.通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本申请实施例的方法。
76.以上具体地示出和描述了本申请的示例性实施例。应可理解的是,本申请不限于这里描述的详细结构、设置方式或实现方法;相反,本申请意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1