一种通过碎片交互训练机器学习图像识别算法模型的方法

文档序号：10697782阅读：591来源：国知局

一种通过碎片交互训练机器学习图像识别算法模型的方法
【专利摘要】本发明提供一种通过碎片交互训练机器学习图像识别算法模型的方法，其步骤如下：设置n张已知的图片，对每一张已知图片都对其进行文字匹配，以组成一组，同时每组与需要进行识别的图片进行随机分组；识图、选图；将结果识别结果反馈到图像识别的机器学习算法中，对比算法的输出结果，如果算法的输出结果与通过评测系统获得的确认结果一致，则认为算法正确一次；当算法获得的正确次数达到预定要求时，则认为算法模型已经训练完成。利用碎片交互，增加了训练机器学习算法的样本，可以快速对机器学习图像识别算法进行参数调整；可以保证算法的精确性和稳定性；本算法训练方式将大量的碎片交互利用了起来，减少了用户的交互浪费。
【专利说明】
一种通过碎片交互训练机器学习图像识别算法模型的方法
技术领域
[0001]本发明涉及计算机领域，尤其涉及一种通过碎片交互训练机器学习图像识别算法模型的方法。
【背景技术】
[0002]当下手机、平板、PC游戏非常流行，每天通过游戏可以产生大量的交互样本，这些样本可以用来训练图像识别的机器学习算法，以修正模型的参数。

【发明内容】

[0003]为了解决现有技术中问题，本发明提供了一种通过碎片交互训练机器学习图像识别算法模型的方法，其步骤如下:
第一步:设置η张已知的图片，对每一张已知图片都对其进行文字匹配，以组成一组，同时每组与需要进行识别的图片进行随机分组；
第二步:识图、选图，每一个用户需要选出两张和文字对应的图片，首先，将分配好的已知图片和对应的匹配文字分开，已知图片随机混入未知图片中，用户必须将标题文字对应的已知匹配图片识别出来，系统才将本次识别结果视为有效，那么评测系统将另一张用户选择出来的图片视为和已知图片内容一致；由于未知图片中可能存在与文字完全不匹配的情况，所以如果未知图片中没有与文字匹配的，所以需要设置零匹配机制，即初步认为这组未知图片中没有任何图片与已知图片一致，此处的零匹配机制需要先将已知图片与已知文字匹配，用户再选择无匹配结果，才进入零匹配机制；
在第二步中，对未知图片形成了一个分类操作，如果用户将已知的图片和已知的文字匹配成功;则认为此时用户进行了认真的操作，用户第二张选出的图片则和已知文字匹配；经过第一步和第二步的操作，系统对未知图片进行了分类，同时将产生两个结果:(I)从未知图片库中找到一张与已知图片一类的图片；(2)所有的图片都和已知的图片都不属于同一类；
第三步:当通过评测系统(如游戏)确定了某张未知图片的内容时，将结果识别结果反馈到图像识别的机器学习算法中，对比算法的输出结果，如果算法的输出结果与通过评测系统获得的确认结果一致，则认为算法正确一次；否则，提示认为算法的输出结果不准确，调整参数继续训练；当算法获得的正确次数达到预定要求时，则认为算法模型已经训练完成。
[0004]作为本发明的进一步改进，第一步中，一组分配至少5张需要识别的图片。
[0005]作为本发明的进一步改进，第一步中，一组分配至少9张需要识别的图片。
[0006]作为本发明的进一步改进，所述η取值大于5000。
[0007]作为本发明的进一步改进，所述η取值大于10000。
[0008]作为本发明的进一步改进，对于同一张图片，设置2/3确认机制，即一种照片被确定为某个内容时，需要经过3个人中至少2个人确认为某内容时。
[0009]作为本发明的进一步改进，对于同一张图片，设置3/5确认机制，即一种照片被确定为某个内容时，需要经过5个人中至少3个人确认为某内容时。
[0010]作为本发明的进一步改进，对于同一张图片，设置4/7确认机制，即一种照片被确定为某个内容时，需要经过7个人中至少4个人确认为某内容时。
[0011 ]作为本发明的进一步改进，当算法获得的正确率为99%时，则认为算法模型已经训练完成。
[0012]作为本发明的进一步改进，当算法获得的正确率为99.99%时，则认为算法模型已经训练完成。
[0013]本发明的有益效果是:
采用本申请的算法思路，可以让具有识字、识图能力的小孩或者家长参与到游戏中，在游戏中既增加了孩子的识字能力，综合了趣味性和科学训练一体图像识别算法。
[0014]利用碎片交互，增加了训练机器学习算法的样本，可以快速对机器学习图像识别算法进行参数调整;可以保证算法的精确性和稳定性;本算法训练方式将大量的碎片交互利用了起来，减少了用户的交互浪费。本算法的实现方式非常简单，提供了未来游戏设计者在游戏进行初步设计时的新思路。
【具体实施方式】
[0015]下面对本发明做进一步说明。
[0016]一种通过碎片交互训练机器学习图像识别算法模型的方法，其步骤如下:
第一步:需要设置n(n—般大于10000张)张已知的图片，对每一张已知图片都对其进行文字匹配(如一张已知内容为桌子的图片和文字“桌子”进行匹配)，以组成一组，同时每组与需要进行分辨的图片进行随机分组，一般一组分配9张或者更多需要识别的图片；
第二步:游戏玩家识图、选图。游戏规则:每一个用户需要选出两张和文字对应的图片。首先，将分配好的已知图片和对应的匹配文字分开，已知图片随机混入未知图片中，游戏玩家必须将标题文字对应的已知匹配图片识别出来，系统才将本次游戏结果视为有效，那么评测系统也会将另一张用户选择出来的图片视为和已知图片内容一致(如果游戏提示要求用户选出为“桌子”的图片，同时用户也将已知的内容为桌子选了出来，那么，我们也认为图片内容未知的另一张图片的内容也为桌子)；由于未知图片中可能存在与文字完全不匹配的情况，所以如果未知图片中没有与文字匹配的，所以需要设置零匹配机制，即初步认为这组未知图片中没有任何图片与已知图片一致。此处的零匹配机制需要先将已知图片与已知文字匹配，游戏玩家再选择无匹配结果，才进入零匹配机制。
[0017]在第二步中，对未知图片形成了一个分类操作。如果游戏玩家将已知的图片和已知的文字匹配成功;我们则认为此时游戏玩家进行了认真的操作，用户第二张选出的图片则和已知文字匹配。
[0018]经过第一步和第二步的操作，我们对未知图片进行了分类，同时将产生两个结果:
(I)从未知图片库中找到一张与已知图片一类的图片；(2)所有的图片都和已知的图片都不属于同一类。
[0019]校正机制:一般情况下，用户或多或少有误操作，所以，对于同一张图片，我们设置2/3确认机制。即一种照片被确定为某个内容时，需要经过3个人中至少2个人确认为某内容时。
[0020]当通过游戏确定了某张未知图片的内容时，将结果识别结果反馈到图像识别的机器学习算法中，对比算法的输出结果。如果算法的输出结果与通过评测系统获得的确认结果一致，则认为算法正确一次;否则，提示认为算法的输出结果不准确，调整参数继续训练。[0021 ]当算法获得的正确次数为率为99.99%( 10000次测试中，仅出现一次失误)时，则认为算法模型已经训练完成。
[0022]以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。
【主权项】
1.一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:其步骤如下: 第一步:设置η张已知的图片，对每一张已知图片都对其进行文字匹配，以组成一组，同时每组与需要进行识别的图片进行随机分组；第二步:识图、选图，每一个用户需要选出两张和文字对应的图片，首先，将分配好的已知图片和对应的匹配文字分开，已知图片随机混入未知图片中，用户必须将标题文字对应的已知匹配图片识别出来，系统才将本次识别结果视为有效，那么评测系统将另一张用户选择出来的图片视为和已知图片内容一致；由于未知图片中可能存在与文字完全不匹配的情况，所以如果未知图片中没有与文字匹配的，所以需要设置零匹配机制，即初步认为这组未知图片中没有任何图片与已知图片一致，此处的零匹配机制需要先将已知图片与已知文字匹配，用户再选择无匹配结果，才进入零匹配机制；在第二步中，对未知图片形成了一个分类操作，如果用户将已知的图片和已知的文字匹配成功;则认为此时用户进行了认真的操作，用户第二张选出的图片则和已知文字匹配；经过第一步和第二步的操作，系统对未知图片进行了分类，同时将产生两个结果:(I)从未知图片库中找到一张与已知图片一类的图片；(2)所有的图片都和已知的图片都不属于同一类；第三步:当通过评测系统(比如游戏)确定了某张未知图片的内容时，将结果识别结果反馈到图像识别的机器学习算法中，对比算法的输出结果，如果算法的输出结果与通过游戏获得的确认结果一致，则认为算法正确一次；否则，提示认为算法的输出结果不准确，调整参数继续训练;当算法获得的正确次数达到预定要求时，则认为算法模型已经训练完成。2.根据权利要求1所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:第一步中，一组分配至少5张需要识别的图片。3.根据权利要求2所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:第一步中，一组分配至少9张需要识别的图片。4.根据权利要求1所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:所述η取值大于5000。5.根据权利要求4所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:所述η取值大于10000。6.根据权利要求1所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:对于同一张图片，设置2/3确认机制，即一种照片被确定为某个内容时，需要经过3个人中至少2个人确认为某内容时。7.根据权利要求1所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:对于同一张图片，设置3/5确认机制，即一种照片被确定为某个内容时，需要经过5个人中至少3个人确认为某内容时。8.根据权利要求1所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:对于同一张图片，设置4/7确认机制，即一种照片被确定为某个内容时，需要经过7个人中至少4个人确认为某内容时。9.根据权利要求1所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:当算法获得的正确率为99%时，则认为算法模型已经训练完成。10.根据权利要求9所述的一种通过碎片交互训练机器学习图像识别算法模型的方法，其特征在于:当算法获得的正确率为99.99%时，则认为算法模型已经训练完成。
【文档编号】G06K9/62GK106067040SQ201610381675
【公开日】2016年11月2日
【申请日】2016年6月1日公开号201610381675.4, CN 106067040 A, CN 106067040A, CN 201610381675, CN-A-106067040, CN106067040 A, CN106067040A, CN201610381675, CN201610381675.4
【发明人】龚莉杰, 程忠光, 张猛
【申请人】深圳市寒武纪智能科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：龚莉杰;程忠光;张猛;
技术所有人：深圳市寒武纪智能科技有限公司;
我是此专利的发明人

上一篇：一种改进的基于稀疏表示的多目标检测方法
上一篇：基于决策树剪枝的模式匹配方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。