本发明所公开的技术涉及人工智能类型计算机和数字数据处理系统以及对应数据处理方法和用于仿真智能的产品(即,基于知识的系统、推断系统和知识采集系统);并且包括用于不确定性推断的系统(例如,模糊逻辑系统)、自适应系统、机器学习系统和人工神经网络。具体地,所公开的技术涉及使用用于转换人工神经网络(ann)或可通过机器学习来训练的另一类型的计算系统的上下文的技术。文献并入以下文献以引用方式并入,即如同在本文完整示出一样,以用于所有目的:2021年10月6日提交的名称为“protein structure-based protein languagemodels”的美国临时专利申请号63/253,122(代理人案卷号illm 1050-1/ip-2164-prv);2021年11月19日提交的名称为“predicting variant pathogenicity fromevolutionary conservation using three-dimensional (3d) protein structurevoxels”的美国临时专利申请号63/281,579(代理人案卷号illm 1060-1/ip-2270-prv);2021年11月19日提交的名称为“combined and transfer learning of avariant pathogenicity predictor using gaped and non-gaped protein samples”的美国临时专利申请号63/281,592(代理人案卷号illm 1061-1/ip-2271-prv);2017年10月16日提交的名称为“training a deep pathogenicity classifierusing large-scale benign training data”的美国专利申请号62/573,144(代理人案卷号illm 1000-1/ip-1611-prv);2017年10月16日提交的名称为“pathogenicity classifier based on deepconvolutional neural networks (cnns)”的美国专利申请号62/573,149(代理人案卷号illm 1000-2/ip-1612-prv);2017年10月16日提交的名称为“deep semi-supervised learning thatgenerates large-scale pathogenic training data”的美国专利申请号62/573,153(代理人案卷号illm 1000-3/ip-1613-prv);2017年11月7日提交的名称为“pathogenicity classification of genomicdata using deep convolutional neural networks (cnns)”的美国专利申请号62/582,898(代理人案卷号illm 1000-4/ip-1618-prv);2018年10月15日提交的名称为“deep learning-based techniques fortraining deep convolutional neural networks”的美国专利申请号16/160,903(代理人案卷号illm 1000-5/ip-1611-us);2018年10月15日提交的名称为“deep convolutional neural networks forvariant classification”的美国专利申请号16/160,986(代理人案卷号illm 1000-6/ip-1612-us);2018年10月15日提交的名称为“semi-supervised learning for training anensemble of deep convolutional neural networks”的美国专利申请号16/160,968(代理人案卷号illm 1000-7/ip-1613-us);2019年5月8日提交的名称为“deep learning-based techniques for pre-training deep convolutional neural networks”的美国专利申请号16/407,149(代理人案卷号illm 1010-1/ip-1734-us);2021年4月15日提交的名称为“deep convolutional neural networks topredict variant pathogenicity using three-dimensional (3d) proteinstructures”的美国专利申请号17/232,056(代理人案卷号illm 1037-2/ip-2051-us);2021年4月15日提交的名称为“multi-channel protein voxelization topredict variant pathogenicity using deep convolutional neural networks”的美国专利申请号63/175,495(代理人案卷号illm 1047-1/ip-2142-prv);sundaram, l.等人,predicting the clinical impact of human mutationwith deep neural networks.nat. genet.50, 1161–1170 (2018)(下文称为“primateai”);jaganathan, k.等人,predicting splicing from primary sequence withdeep learning.cell 176, 535-548 (2019);2021年4月16日提交的名称为“efficient voxelization for deep learning”的美国专利申请号63/175,767(代理人案卷号illm 1048-1/ip-2143-prv);以及2021年9月7日提交的名称为“artificial intelligence-based analysis ofprotein three-dimensional (3d) structures”的美国专利申请号17/468,411(代理人案卷号illm 1037-3/ip-2051a-us)的优先权。
背景技术:
1、本部分中讨论的主题不应仅因为在本部分中有提及就被认为是现有技术。类似地,在本部分中提及的或与作为背景技术提供的主题相关联的问题不应被认为先前在现有技术中已被认识到。本部分中的主题仅表示不同的方法,这些方法本身也可对应于受权利要求书保护的技术的具体实施。
2、神经网络
3、图1示出具有多个层的人工神经网络(ann)的一个具体实施。ann(或同样在本文中所述,神经网络)是在彼此之间交换消息的互连人工神经元(例如,a1、a2、a3)的系统。所示出神经网络具有三个输入、隐藏层中的两个神经元和输出层中的两个神经元。隐藏层具有激活函数并且输出层具有激活函数。连接具有在训练过程期间被调谐的数字权重(例如,w11、w21、w12、w31、w22、w32、v11、v22),使得在馈送图像以识别时,经正确训练的网络正确地响应。输入层处理原始输入,隐藏层基于输入层与隐藏层之间的连接的权重来处理来自该输入层的输出。输出层获得来自隐藏层的输出,并且基于隐藏层与输出层之间的连接的权重对该输出进行处理。该网络包括多层的特征检测神经元。每层具有许多神经元,该神经元对来自先前层的输入的不同组合做出响应。这些层被构造成使得第一层检测输入图像数据中的一组基元模式,第二层检测模式的模式,并且第三层检测那些模式的模式。
技术实现思路
1、本文描述了用于转换ann的上下文或可通过机器学习训练的另一类型的计算系统的上下文的技术。在一些具体实施中,该技术将计算系统(诸如ann)的第一上下文转换为计算系统的第二上下文,该第一上下文用于提供群体的基因组的变异(例如,错义变异)的致病性,该第二上下文用于提供群体的基因组的indel的致病性。
2、在提供此类技术时,本文所述的系统和方法克服了从其中计算系统的上下文被改变的计算系统获得得分时的一些技术问题。此外,本文所公开的技术提供了特定的技术方案以至少克服本文所提及的技术问题以及本文未描述但本领域技术人员认识到的其他技术问题。
3、关于一些具体实施,本文公开了用于转换ann的上下文或另一类型的计算系统的上下文的计算机化方法,以及用于执行计算机化方法的技术操作的非暂态计算机可读存储介质。非暂态计算机可读存储介质具有有形地存储在其上或有形地编码在其上的计算机可读指令,该计算机可读指令在由一个或多个设备(例如,一个或多个个人计算机或服务器)执行时使得至少一个处理器执行用于转换ann的上下文或另一类型的计算系统的上下文的方法。