机器学习中具有可解释性的图像数据偏差检测的制作方法

文档序号：36792145发布日期：2024-01-23 12:11阅读：14来源：国知局

背景技术：

1、人工智能具有对生命和自然产生积极影响的巨大力量和潜力。它的使用已经渗透到医疗保健、制造、金融、零售和生命科学的所有行业。以无偏差、非歧视的方式，以道德标准和可信度应用ai的原则和力量是至关重要的。

2、机器学习(ml)中的偏差是指ml算法倾向于不完全地从数据集中学习相关和重要的模式，或者不正确地从数据中学习模式。这种不准确性可能导致算法遗漏数据中的模式和特征之间的重要关系，或者断言数据中的模式和特征之间实际上不存在的关系，从而导致算法预测不准确。

3、当人工智能(ai)环境中存在ml偏差时，ml开发的所有阶段都可能出现偏差。ml偏差可能会通过混合个人属性的歧视性数据而导致社会偏差，这些属性例如是社会经济地位、年龄、种族、性别、残疾、收入、宗教和人口统计学。这种社会偏差可能会进一步导致统计偏差，其中ml模型不准确地表示数据。数据中的统计偏差可能是由于属性不平衡、数据不足和数据收集不力造成的。数据中的统计偏差可能会导致有偏差的预测，这可能会在诸如医疗保健和金融的特定行业的ai环境中导致严重后果。

4、目前，图像数据集本质上是非结构化和异构性的。由于成像设备和为每种类型的成像设备提供的图像质量的多种多样、图像转换、由于图像数据集的不正确表示(即，面部识别中的肤色或医疗保健中的性别)而引起的属性的影响以及特定于领域的数据，图像数据集中可能存在数据偏差。因此，需要用具有不同特征的图像训练的ml模型以帮助减少和防止图像上显示的真实世界数据的不准确预测。本文公开了通过评估输入图像数据集中的特征差异并且向用户提供结果分析来检测输入图像数据集中的潜在ml偏差的解决方案。

技术实现思路

技术特征：

1.一种包括服务器和数据库的计算系统的计算机实现的方法，所述方法包括：

2.根据权利要求1所述的计算机实现的方法，其中在接收所述目标图像之前，将所述一个或多个属性分配给所述目标图像。

3.根据权利要求1所述的计算机实现的方法，其中在接收所述目标图像之后，基于属性检测算法来确定所述一个或多个属性。

4.根据权利要求1所述的计算机实现的方法，其中所确定的所述不平衡评估包括：

5.根据权利要求1所述的计算机实现的方法，其中所述均值漂移聚类包括：

6.根据权利要求1所述的计算机实现的方法，其中所执行的所述数据偏差评估包括：

7.一种计算系统，包括：

8.根据权利要求7所述的计算系统，其中在接收所述目标图像之前，将所述一个或多个属性分配给所述目标图像。

9.根据权利要求7所述的计算系统，其中在接收所述目标图像之后，基于属性检测算法来确定所述一个或多个属性。

10.根据权利要求7所述的计算系统，其中所确定的所述不平衡评估包括：

11.根据权利要求7所述的计算系统，其中所述均值漂移聚类包括：

12.根据权利要求7所述的计算系统，其中所执行的所述数据偏差评估包括：

13.一种非瞬态存储介质，所述非瞬态存储介质存储指令，所述指令在由计算系统的至少一个处理器执行时，使所述计算系统执行方法，所述方法包括：

14.根据权利要求13所述的非瞬态存储介质，其中在接收所述目标图像之前，将所述一个或多个属性分配给所述目标图像。

15.根据权利要求13所述的非瞬态存储介质，其中，在接收所述目标图像之后，基于属性检测算法来确定所述一个或多个属性。

16.根据权利要求13所述的非瞬态存储介质，其中所确定的所述不平衡评估包括：

17.根据权利要求13所述的非瞬态存储介质，其中所述均值漂移聚类包括：

18.根据权利要求13所述的非瞬态存储介质，其中所执行的所述数据偏差评估包括：

技术总结
本公开的实施例涉及机器学习中具有可解释性的图像数据偏差检测。机器学习(ML)中的偏差是指ML算法倾向于不完全地从数据集中学习相关和重要的模式、或者不正确地从数据中学习模式。这种不准确性可能导致算法遗漏数据中的模式和特征之间的重要关系，从而导致算法预测不准确。本文描述了用于检测输入图像数据集中的潜在ML偏差的系统和方法。在接收到目标图像之后，提取与该目标图像相关的图像的子集。在不平衡评估和数据偏差评估下分析目标图像和图像的子集，以确定在ML训练流水线中是否存在任何潜在数据偏差。如果确定了任何数据偏差，则向用户发送总结评估并包括在图像评估中实现更准确预测的解释的一条或多条消息。

技术研发人员：S·K·莫普尔,K·L·沙斯特里
受保护的技术使用者：慧与发展有限责任合伙企业
技术研发日：
技术公布日：2024/1/22

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S·K·莫普尔,K·L·沙斯特里
技术所有人：慧与发展有限责任合伙企业
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。