技术编号:30959634
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。.本公开涉及计算机技术领域,尤其涉及深度学习领域。背景技术.机器学习中经常会遇到数据的类别不均衡的问题,也叫数据偏斜。数据偏斜在众多的实际应用场景下都会发生,例如疾病检测、信用卡诈欺侦测、网络入侵检测等。数据偏斜对于机器学习的算法结果会产生非常差的影响,会让算法本身更加偏向于数据量较多的标签,而对于数据量小的标签表现很差。针对数据偏斜问题,相关技术中常采用随机重采样的方法,来平衡多类样本的数量,具体通过欠采样方法在训练过程中随机从多数类中去除样本,以减少多数类的样本数量以及过采样方法在原始数...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。