关联挖掘方法、装置、设备、介质及计算机程序产品与流程

文档序号:29515660发布日期:2022-04-06 21:05阅读:64来源:国知局
关联挖掘方法、装置、设备、介质及计算机程序产品与流程

1.本技术实施例涉及计算机技术领域,特别涉及一种关联挖掘方法、装置、设备、介质及计算机程序产品。


背景技术:

2.随着计算机技术的发展,关联挖掘的应用场景越来越多。例如,挖掘各个参考因素与研究目标之间的关联,以获取各个参考因素与研究目标之间的关联挖掘结果,该关联挖掘结果能够指示出哪个或哪些参考因素与研究目标相关联。
3.相关技术中,将研究对象根据研究目标划分到多个组中,对于各个参考因素中的任一参考因素,人为利用假设检验的方法统计分析不同组中的对象在该任一参考因素下对应的因素特征之间是否有显著的统计差异,若有显著的统计差异,则确定该任一参考因素与研究目标相关联,在根据假设检验的方式确定每个参考因素是否与研究目标相关联后,得到关联挖掘结果。
4.上述方式,需要针对每个参考因素均进行假设检验才能获取关联挖掘结果,获取关联挖掘结果的效率较低,此外,根据假设检验的方式确定一个参考因素是否与研究目标相关联的过程对用户的领域背景知识要求较高,基于此种方式难以得到可靠性较高的关联挖掘结果。


技术实现要素:

5.本技术实施例提供了一种关联挖掘方法、装置、设备、介质及计算机程序产品,可用于提高获取关联挖掘结果的效率以及获取的关联挖掘结果的可靠性。所述技术方案如下:
6.一方面,本技术实施例提供了一种关联挖掘方法,所述方法包括:
7.获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度,所述重要程度基于目标处理模型得到,所述目标处理模型用于基于所述各个参考因素实现所述处理任务,所述各个参考因素为待挖掘与所述研究目标之间的关联的因素;
8.基于所述重要程度,获取所述各个参考因素与所述研究目标之间的关联挖掘结果。
9.另一方面,提供了一种关联挖掘装置,所述装置包括:
10.第一获取单元,用于获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度,所述重要程度基于目标处理模型得到,所述目标处理模型用于基于所述各个参考因素实现所述处理任务,所述各个参考因素为待挖掘与所述研究目标之间的关联的因素;
11.第二获取单元,用于基于所述重要程度,获取所述各个参考因素与所述研究目标之间的关联挖掘结果。
12.在一种可能实现方式中,所述第一获取单元,用于获取所述目标处理模型,所述目
标处理模型基于样本对象对应的表征特征和对象标签训练得到,一个样本对象对应的表征特征由所述一个样本对象在所述各个参考因素下分别对应的因素特征构成;基于所述目标处理模型,获取所述各个参考因素在实现所述研究目标对应的处理任务的过程中分别具有的重要程度。
13.在一种可能实现方式中,所述第二获取单元,用于将具有的重要程度满足参考条件的参考因素作为关联因素;基于所述关联因素,获取所述各个参考因素与所述研究目标之间的关联挖掘结果。
14.在一种可能实现方式中,所述第二获取单元,还用于获取所述目标处理模型的性能衡量指标;基于所述性能衡量指标,确定所述关联挖掘结果的置信度。
15.在一种可能实现方式中,所述各个参考因素为各个参考基因片段,所述因素特征为使用频率,所述第一获取单元,还用于获取所述样本对象在所述各个参考基因片段下分别对应的使用频率;基于所述样本对象在所述各个参考基因片段下分别对应的使用频率,构成所述样本对象对应的表征特征。
16.在一种可能实现方式中,所述第一获取单元,还用于获取所述样本对象的生物组织样本;对所述生物组织样本中的淋巴细胞受体进行测序,得到基因片段使用信息,基于所述基因片段使用信息计算所述样本对象在所述各个参考基因片段下分别对应的使用频率。
17.在一种可能实现方式中,所述样本对象在所述各个参考基因片段下分别对应的使用频率利用结构化数据表示。
18.在一种可能实现方式中,所述处理任务为根据所述各个参考因素进行分类的任务;或者,所述处理任务为根据所述各个参考因素进行回归的任务。
19.在一种可能实现方式中,所述目标处理模型为决策树模型。
20.在一种可能实现方式中,所述各个参考因素为各个参考基因片段,所述研究目标为疾病相关目标,所述处理任务用于根据所述各个参考基因片段预测所述疾病相关目标对应的处理结果,所述关联挖掘结果用于指示所述各个参考基因片段与所述疾病相关目标之间的关联。
21.另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现上述任一所述的关联挖掘方法。
22.另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一所述的关联挖掘方法。
23.另一方面,还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或所述计算机指令由处理器加载并执行,以使计算机实现上述任一所述的关联挖掘方法。
24.本技术实施例提供的技术方案至少带来如下有益效果:
25.本技术实施例提供的技术方案,直接基于各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度获取关联挖掘结果,无需针对每个参考因素分别进行假设检验,获取关联挖掘结果的效率较高。此外,重要程度是直接基于目标处理模型得到的,整个关联挖掘过程无需人为参与,得到的关联挖掘结果的可靠性较高。
附图说明
26.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1是本技术实施例提供的一种关联挖掘方法的实施环境的示意图;
28.图2是本技术实施例提供的一种关联挖掘方法的流程图;
29.图3是本技术实施例提供的一种使用频率的分布情况的示意图;
30.图4是本技术实施例提供的一种使用频率的分布情况的示意图;
31.图5是本技术实施例提供的一种使用频率的分布情况的示意图;
32.图6是本技术实施例提供的一种使用频率的分布情况的示意图;
33.图7是本技术实施例提供的一种关联挖掘过程的示意图;
34.图8是本技术实施例提供的一种基因片段及其具有的重要程度的示意图;
35.图9是本技术实施例提供的一种基因片段及其具有的重要程度以及性能衡量指标的示意图;
36.图10是本技术实施例提供的一种关联挖掘装置的示意图;
37.图11是本技术实施例提供的一种服务器的结构示意图;
38.图12是本技术实施例提供的一种终端的结构示意图。
具体实施方式
39.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
40.在示例性实施例中,本技术实施例提供的关联挖掘方法可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
41.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
42.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
43.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
44.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
45.图1示出了本技术实施例提供的关联挖掘方法的实施环境的示意图。该实施环境包括:终端11和服务器12。
46.本技术实施例提供的关联挖掘方法可以由终端11执行,也可以由服务器12 执行,还可以由终端11和服务器12共同执行,本技术实施例对此不加以限定。对于本技术实施例提供的关联挖掘方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。
47.在一种可能实现方式中,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如pc(personal computer,个人计算机)、手机、智能手机、pda (personal digital assistant,个人数字助手)、可穿戴设备、ppc(pocket pc,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱、智能语音交互设备、智能家电、车载终端等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
48.本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本技术,也应包含在本技术保护范围以内,并在此以引用方式包含于此。
49.基于上述图1所示的实施环境,本技术实施例提供一种关联挖掘方法,该关联挖掘方法由计算机设备执行,该计算机设备可以为终端11,也可以为服务器12,本技术实施例对此不加以限定。如图2所示,本技术实施例提供的关联挖掘方法包括如下步骤201和步骤202。
50.在步骤201中,获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度,重要程度基于目标处理模型得到,目标处理模型用于基于各个参考因素实现处理任务,各个参考因素为待挖掘与研究目标之间的关联的因素。
51.本技术实施例提供的关联挖掘方法用于挖掘各个参考因素与研究目标之间的关联,以获取各个参考因素与研究目标之间的关联挖掘结果。也就是说,各个参考因素为待挖掘与研究目标之间的关联的因素。各个参考因素以及研究目标为需要挖掘关联的一对主体,该一对主体的具体情况可以根据应用场景灵活调整,本技术实施例对此不加以限定。
52.在示例性实施例中,各个参考因素是指各个参考基因片段,研究目标是指疾病相关目标。各个参考基因片段为需要挖掘与疾病相关目标之间的关联的基因片段,各个参考基因片段的设定方式与实际的应用场景有关,本技术实施例对此不加以限定。在示例性实施例中,各个参考基因片段包括v(variable,易变的) 基因片段、d(diversity,多样性)基因片段、j(joining,连接)基因片段中的至少一种。其中,v基因片段、d基因片段、j基因片段
是指构成淋巴细胞受体序列的相应基因片段。
53.示例性地,淋巴细胞包括b细胞和t细胞。b细胞和t细胞为获得性免疫系统的核心参与者,获得性免疫系统在人体对病毒感染的控制和清除中发挥着至关重要的作用,并影响疾病的临床结果。b细胞和t细胞主要通过细胞表面的受体(bcr(b cell receptor,b细胞受体)/tcr(t cell receptor,t细胞受体))对抗原进行识别,然后进行特异性免疫反应。其中,bcr直接识别特异性抗原,tcr识别mhc(major histocompatibility complex,主要组织相容性复合物)分子呈递的特异性抗原。
54.在结构上,bcr和tcr都由两条链组成。以tcr为例,tcr主要由α和β两条链构成,每条链包含一个可变域和一个恒定域。可变域有三个高变区:cdr (complementarity determining region,互补决定区)1、cdr2、cdr3。cdr3 变异最大,主要决定了tcr的抗原结合特异性。α链的cdr3区域由v基因片段和j基因片段构成,β链的cdr3区域由v基因片段、d基因片段和j基因片段构成。示例性地,构成bcr和tcr的链的基因片段可以表示为v(d)j基因片段。v(d)j基因片段的排列组合的多样性造成了cdr3区域的高可变性,有助于tcr的多样化,用来保证人体可以对不同抗原成功识别。
55.各个参考基因片段包括v基因片段、d基因片段、j基因片段中的哪一种或多种基因片段与实际的应用场景有关。示例性地,若实际的应用场景为在以bcr 或tcr中由v基因片段和j基因片段构成的某条链为目标链进行测序的基础上衍生出的应用场景,则各个参考基因片段包括v基因片段和j基因片段中的至少一种;若实际的应用场景为在以bcr或tcr中由v基因片段、d基因片段和j基因片段构成的某条链为目标链进行测序的基础上衍生出的应用场景,则各个参考基因片段包括v基因片段、d基因片段和j基因片段中的至少一种。
56.示例性地,v基因片段、d基因片段、j基因片段均有多种具体情况,如,构成tcr的β链的v基因片段具有约47种具体情况,构成tcr的β链的d基因片段具有2种具体情况,构成tcr的β链的j基因片段具有13种具体情况。一个参考基因片段是指v基因片段、d基因片段或j基因片段的一种具体情况。以各个参考基因片段包括v基因片段为例,各个参考基于片段可能包括v基因片段的全部具体情况,也可能包括v基因片段的部分具体情况,这与实际的应用场景有关,本技术实施例对此不加以限定。
57.疾病相关目标根据实际的应用场景灵活调整,本技术实施例对此不加以限定。示例性地,疾病相关目标包括但不限于对象是否患有某种疾病、对象处于某种疾病的哪个时期、对象是否具有某病史、患病对象所需的治愈时长等。示例性地,根据对象是否患有某种疾病这一目标,能够将对象划分为患病、健康这两种类别的对象,或者将对象划分为健康、轻症、重症、康复这四种类别的对象;根据对象处于某种疾病的哪个时期这一目标,能够将对象划分为处于某种疾病的初期、处于某种疾病的发展期、处于某种疾病的恢复期这三种类别的对象;根据对象是否具有某病史这一目标,能够将对象划分为具有某病史、不具有某病史这两种类别的对象。示例性地,疾病相关目标可以是指某一特定的疾病相关的目标,该特定的疾病为研究人员想要进一步研究的疾病。示例性地,疾病相关目标还可以称为疾病特征。
58.示例性地,对于各个参考因素是指各个参考基因片段、研究目标为疾病相关目标的情况,本技术实施例提供的关联挖掘方法能够辅助对免疫组库的分析。免疫组库是指在某一时间,某个个体的循环系统内所有功能多样性t细胞和b细胞的总和。对免疫组库进行
分析,探究bcr/tcr与疾病特征的关联对癌症和自身免疫疾病的治疗、探究肿瘤免疫机制、发现疾病治疗靶点、进行抗体开发以及疫苗效用评估等方面有重大意义。因此,挖掘v(d)j基因片段与疾病特征的关联,有助于医学人员探究b细胞/t细胞识别疾病相关抗原的免疫过程,帮助寻找生物标志物和免疫治疗靶点,开展免疫治疗,开发疫苗并进行效用评估。
59.需要说明的是,以上所述仅以各个参考因素为各个参考基因片段、研究目标为疾病相关目标为例进行了说明,各个参考因素以及研究目标的情况并不局限于此,可以根据实际的应用场景灵活调整。示例性地,各个参考因素为各个用户属性,研究目标为用户是否具有购买理财产品的需求等。
60.研究目标对应的处理任务是指根据研究目标定义出的用于挖掘关联的任务,研究目标对应的处理任务用于根据各个参考因素预测研究目标对应的处理结果。本技术实施例对研究目标对应的处理任务的类型不加以限定,这与研究目标对应的处理任务的目的有关。示例性地,若研究目标对应的处理任务用于根据各个参考因素预测研究目标对应的分类结果,则研究目标对应的处理任务为根据各个参考因素进行分类的任务;若研究目标对应的处理任务用于根据各个参考因素预测研究目标对应的回归结果,则研究目标对应的处理任务为根据各个参考因素进行回归的任务。
61.在示例性实施例中,以各个参考因素为各个参考基因片段、研究目标为疾病相关目标为例,处理任务用于根据各个参考基因片段预测疾病相关目标对应的处理结果。示例性地,疾病相关目标对应的处理结果可能为分类结果,也可能为回归结果,这与疾病相关目标的具体情况有关。
62.例如,若疾病相关目标为对象是否患有某种疾病,则根据疾病相关目标能够划分出患病和健康这两种疾病相关类别,此种情况下,疾病相关目标对应的处理结果可以是指用于指示患病和健康这两种疾病相关类别分别对应的概率的分类结果。再例如,若疾病相关目标为患病对象所需的治愈时长,则疾病相关目标对应的处理结果可以是指用于指示治愈时长的回归结果。
63.各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度能够反映出各个参考因素在实现研究目标对应的处理任务的过程中所起的作用的大小。一个参考因素在实现研究目标对应的处理任务的过程中具有的重要程度越高,说明该参考因素在实现研究目标对应的处理任务的过程中所起到的作用越大,也说明该参考因素越有可能与研究目标相关联。因此,基于参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度,能够获得用于指示哪个或哪些参考因素与研究目标相关联的较为可靠地关联挖掘结果。
64.各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度是基于用于基于各个参考因素实现研究目标对应的处理任务的目标处理模型得到的。示例性地,若研究目标对应的处理任务为根据各个参考因素进行分类的任务,则目标处理模型为目标分类模型;若研究目标对应的处理任务为根据各个参考因素进行回归的任务,则目标处理模型为回归模型。目标处理模型是一种机器学习模型,从而使得本技术实施例提供的关联挖掘方法是一种基于机器学习的关联挖掘方法。
65.本技术实施例对目标处理模型的类型不加以限定,只要能够实现研究目标对应的处理任务即可。示例性地,目标处理模型为决策树模型,决策树模型在对中小型结构化或表
格化数据进行处理的场景下具有较好的模型性能,示例性地,决策树模型包括但不限于xgboost(extreme gradient boosting,梯度提升模型) 模型。在一些实施例中,目标处理模型还可以为基于深度学习的模型,如,tabnet (一种具有可解释性的用于结构化或表格化数据的模型)模型,该基于深度学习的模型能够对大型结构化或表格化数据进行较好的处理。当然,在示例性实施例中,目标处理模型还可以为svm(support vector machine,支持向量机)模型、 random forest(随机森林)模型、deep forest(深度森林)模型等。
66.在实现步骤201之前,需要先获取目标处理模型。目标处理模型基于样本对象对应的表征特征和对象标签训练得到。其中,一个样本对象对应的表征特征由一个样本对象在各个参考因素下分别对应的因素特征构成。
67.样本对象是指训练得到目标处理模型所依据的表征特征表征的对象。本技术实施例对样本对象的数量不加以限定,示例性地,样本对象的数量为多个,以保证训练得到目标处理模型的可靠性。
68.样本对象在各个参考因素下分别对应有一个因素特征,因素特征用于对参考因素进行表征,对不同类型的参考因素进行表征的因素特征不同。示例性地,若参考因素的类型为基因片段,则因素特征为基因片段的使用频率,如,基因片段为trbj2-6,因素特征为0.15;若参考因素的类型为用户属性,则因素特征为用户属性的取值,如,用户属性为年龄,因素特征为20岁。
69.不同的样本对象在同一参考因素下对应的因素特征可能相同,也可能不同,这与实际的情况有关,本技术实施例对此不加以限定。一个样本对象对应的表征特征用于在考虑各个参考因素的基础上对样本对象进行表征。一个样本对象对应的表征特征由该一个样本对象在各个参考因素下分别对应的因素特征构成。
70.本技术实施例对一个样本对象对应的表征特征的表示形式不加以限定,例如,表征特征的表示形式为多维向量,此种情况下,多维向量中的元素与样本对象在各个参考因素下分别对应的因素特征一一对应,也就是说,多维向量中的元素的数量与各个参考因素的总数量相同。需要说明的是,对于表征特征为多维向量的情况,不同样本对象对应的表征特征中,处于相同位置的元素对应相同的参考因素。
71.获取样本对象对应的表征特征的实现方式与各个参考因素的类型有关,本技术实施例以各个参考因素为各个参考基因片段为例,介绍获取样本对象对应的表征特征的实现方式。
72.在各个参考因素为各个参考基因片段的情况下,因素特征为使用频率。此种情况下,以样本对象的数量为一个为例,获取样本对象对应的表征特征的方式为:获取样本对象在各个参考基因片段下分别对应的使用频率;基于样本对象在各个参考基因片段下分别对应的使用频率,构成样本对象对应的表征特征。需要说明的是,对于样本对象为多个的情况,需要分别获取每个样本对象在各个参考基因片段下分别对应的使用频率,然后基于每个样本对象在各个参考基因片段下分别对应的使用频率,构成每个样本对象对应的表征特征。
73.在一种可能实现方式中,获取样本对象在各个参考基因片段下对应的使用频率的过程为:获取样本对象的生物组织样本;对生物组织样本中的淋巴细胞受体进行测序,得到基因片段使用信息,基于基因片段使用信息计算样本对象在各个参考基因片段下分别对应
的使用频率。
74.样本对象的生物组织样本是指从样本对象上采取得到的包含淋巴细胞的样本,如,外周血。在获取样本对象的生物组织样本后,能够对生物组织样本中的淋巴细胞受体进行测序。需要说明的是,此处的淋巴细胞受体是指与各个参考基因片段相关的淋巴细胞受体,例如,若各个参考基因片段为构成bcr的一个或多个链所需的基因片段,则此处的淋巴细胞受体是指bcr;若各个参考基因片段为构成tcr的一个或多个链所需的基因片段,则此处的淋巴细胞受体是指 tcr。
75.在示例性实施例中,对生物组织样本中的淋巴细胞受体进行测序可以是指以生物组织样本中的淋巴细胞受体的各个链为目标链进行测序,也可以是指以生物组织样本中的淋巴细胞受体的某一指定链为目标链进行测序,这与各个参考基因片段为构成各个链所需的基因片段,还是为构成某一指定链所需的基因片段有关,本技术实施例对此不加以限定。
76.示例性地,利用测序技术对生物组织样本中的淋巴细胞受体进行测序,本技术实施例对测序技术的类型不加以限定,如,测序技术为高通量测序技术。高通量测序技术可以获取人体进行抗原识别的tcr和bcr的序列信息。示例性地,该序列信息是指基因序列。
77.在对生物组织样本中的淋巴细胞受体进行测序之后,能够得到基因片段使用信息,该基因片段使用信息用于指示淋巴细胞受体的基因序列中的基因片段的存在情况。在获取基因片段使用信息之后,能够基于基因片段使用信息计算样本对象在各个参考基因片段下分别对应的使用频率。
78.示例性地,基于基因片段使用信息计算样本对象在任一参考基因片段下对应的使用频率的过程为:基于基因片段使用信息,统计所测得的各个基因序列中存在该任一参考基因片段的目标基因序列的数量;将该目标基因序列的数量与全部基因序列的数量的比值作为样本对象在该任一参考基因片段下对应的使用频率。需要说明的是,此处以样本对象的数量为一个为例进行说明,也就是说,所测得的基因序列是指针对一个个体的免疫组库中的淋巴细胞受体进行测序得到的基因序列。基于此种方式能够获取样本对象在各个参考基因片段下分别对应的使用频率。需要说明的是,若基因片段使用信息指示所测得的各个基因序列中均不存在某一参考基因片段,则样本对象在该参考基因片段下对应的使用频率为0。
79.在示例性实施例中,样本对象在各个参考基因片段下分别对应的使用频率可以存储在数据库中(如,关系型数据库),此种情况下,直接从数据库中提取样本对象在各个参考基因片段下分别对应的使用频率。
80.在示例性实施例中,样本对象在各个参考基因片段下分别对应的使用频率使用结构化数据表示。例如,每个样本对象在各个参考基因片段下分别对应的使用频率均利用使用频率统计表格中的一行数据表示。该使用频率统计表格中的每一列数据为各个样本对象在某一参考基因片段下分别对应的使用频率。使用结构化数据表示样本对象在各个参考基因片段下分别对应的使用频率有利于提高关联挖掘的效率。
81.示例性地,各个参考基因片段可以记为v(d)j基因片段。获取样本对象在各个参考基因片段下分别对应的使用频率的过程可称为免疫组库v(d)j基因片段使用频率构建过程。在实践中,研究人员首先获取样本对象的生物组织样本 (例如外周血)并对所有tcr(或bcr)进行高通量测序,获取所有tcr(或 bcr)的序列和v(d)j基因片段使用信息组成一个t
细胞(或b细胞)受体免疫组库。在上述数据基础上统计v(d)j基因片段的使用频率作为研究主体,以获取用于后续输入处理模型的特征(也即样本对象对应的表征特征)。
82.示例性地,不同类别的对象在相同的基因片段下对应的使用频率有所不同。示例性地,患有a疾病的对象在构成tcr的α链的各个v基因片段(vα)下对应的使用频率以及健康的对象在各个v基因片段(vα)下对应的使用频率的分布情况如图3所示;患有a疾病的对象在构成tcr的α链的各个j基因片段 (jα)下对应的使用频率的分布情况以及健康的对象在各个j基因片段(jα)下对应的使用频率的分布情况如图4所示;患有a疾病的对象在构成tcr的β链的各个v基因片段(vβ)下对应的使用频率的分布情况以及健康的对象在各个 v基因片段(vβ)下对应的使用频率的分布情况如图5所示;患有a疾病的对象在构成tcr的β链的各个j基因片段(jβ)下对应的使用频率的分布情况以及健康的对象在各个j基因片段(jβ)下对应的使用频率的分布情况如图6所示。
83.样本对象的对象标签用于为处理模型的训练过程提供监督信号。样本对象的对象标签的类型与研究目标对应的处理任务的类型有关,示例性地,若研究目标对应的处理任务的类型为根据各个参考因素进行分类的任务,则样本对象对应的对象标签为类别标签;若研究目标对应的处理任务的类型为根据各个参考因素进行回归的任务,则样本对象对应的标签为回归值标签。示例性地,样本对象对应的对象标签由研究人员根据研究目标确定,以便于为用于实现研究目标对应的处理任务的处理模型的训练过程提供较为可靠的监督信号。示例性地,根据不同的研究目标确定出的同一个样本对象对应的对象标签可能相同,也可能不同,本技术实施例对此不加以限定。
84.获取目标处理模型的过程可以是指直接提取预先基于样本对象对应的表征特征和对象标签训练得到并存储的目标处理模型,也可以是指基于样本对象对应的表征特征和对象标签实时训练得到目标处理模型,本技术实施例对此不加以限定。
85.在示例性实施例中,基于样本对象对应的表征特征和对象标签训练得到目标处理模型的过程为:将样本对象对应的表征特征输入初始处理模型,得到初始处理模型输出的处理结果;基于处理结果与对象标签之间的差异,获取损失函数;利用损失函数更新初始分类模型的参数;响应于训练过程满足终止条件,得到目标处理模型。训练得到目标处理模型的过程为监督训练过程,此处不再加以赘述。
86.在本技术实施例中,为实现关联挖掘,预先定义了一个代理问题,也即利用由样本对象在各个参考因素下分别对应的因素特征构成的表征特征作为模型的输入特征,由模型预测处理结果。在该代理问题下训练得到一个机器学习模型 (也即目标处理模型)。
87.在获取目标处理模型之后,基于目标处理模型,获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度。示例性地,由于目标处理模型用于基于各个参考因素实现研究目标对应的处理任务,所以通过对目标处理模型进行模型解释,即可获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度。示例性地,本技术实施例对重要程度的表示方式不加以限定,例如,重要程度利用0~1范围内的小数表示,或者,重要程度利用重要性分数表示。
88.在示例性实施例中,每种处理模型均具有对应的模型解释方法,以分析出各个参考因素在实现处理任务的过程中分别具有的重要程度。也就是说,基于目标处理模型,获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度的实现方式
与目标处理模型的类型有关,本技术实施例对此不加以限定。
89.在示例性实施例中,目标处理模型本身具有计算输入的特征中的各种特征 (也即各个参考因素)在实现处理任务的过程中分别具有的重要程度的属性,则在获取目标处理模型之后,可以直接利用目标处理模型自身的属性,获取各个参考因素在实现处理任务的过程中分别具有的重要程度。
90.在示例性实施例中,利用shap(shapley additive explanations,沙普利加和解释)等机器学习解释方法对目标处理模型进行模型解释,以得到各个参考因素在实现处理任务的过程中分别具有的重要程度。
91.在示例性实施例中,对每个参考因素下的因素特征进行随机扰动,观察目标处理模型的指标的变化,按照变化率的大小确定各个参考因素具有的重要程度,变化率越大,说明具有的重要程度越高。
92.无论哪种方式,均能够获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度,然后执行步骤202。
93.在步骤202中,基于重要程度,获取各个参考因素与研究目标之间的关联挖掘结果。
94.在获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度后,能够基于各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度对各个参考因素与研究目标之间的关联进行分析,以得到关联挖掘结果。关联挖掘结果用于指示各个参考因素与研究目标之间的关联,也即各个参考因素中的哪个或哪些参考因素与研究目标相关联。示例性地,对于各个参考因素为各个参考基因片段、研究目标为疾病相关目标的情况,关联挖掘结果用于指示各个参考基因片段与疾病相关目标之间的关联,也即各个参考基因片段中的哪个或哪些参考基因片段与疾病相关目标相关联。
95.在一种可能实现方式中,基于参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度,获取各个参考因素与研究目标之间的关联挖掘结果的过程为:将具有的重要程度满足参考条件的参考因素作为关联因素;基于关联因素,获取各个参考因素与研究目标之间的关联挖掘结果。具有的重要程度满足参考条件的参考因素为具有的重要程度较高的参考因素,具有的重要程度满足参考条件根据经验设置,或者根据实际的应用场景灵活调整,本技术实施例对此不加以限定。
96.在示例性实施例中,具有的重要程度满足参考条件是指具有的重要程度不小于重要程度阈值。重要程度阈值根据经验设置,或者根据应用场景灵活调整,本技术实施例对此不加以限定。在示例性实施例中,具有的重要程度满足参考条件是指具有的重要程度为前k(k为不小于1的整数)高的重要程度,此种情况下,确定出的关联因素的数量为k个。
97.在确定出关联因素后,基于关联因素,获取各个参考因素与研究目标之间的关联挖掘结果。随着关联挖掘结果的表示形式的不同,基于关联因素,获取各个参考因素与研究目标之间的关联挖掘结果的实现方式有所不同。
98.示例性地,关联挖掘结果直接利用关联因素表示,则直接将关联因素作为关联挖掘结果。示例性地,关联挖掘结果利用关联因素以及关联因素具有重要程度表示,则将关联因素以及关联因素具有的重要程度作为关联挖掘结果。示例性地,关联挖掘结果利用按照重要程度进行排序的关联因素表示,则将按照具有的重要程度从高到低或者从低到高的顺
序依次排列的各个关联因素作为关联挖掘结果。
99.在示例性实施例中,本技术实施例除了能够获取关联挖掘结果外,还能够获取关联挖掘结果的置信度,以利用置信度表征获取的关联挖掘结果的可靠程度。获取关联挖掘结果的置信度的方式为:获取目标处理模型的性能衡量指标;基于性能衡量指标,确定关联挖掘结果的置信度。
100.目标处理模型的性能衡量指标用于衡量目标处理模型的处理性能,本技术实施例对性能衡量指标的类型不加以限定,包括但不限于f1分数、召回率、精确率、准确率、auc(area under roc curve,roc曲线下方的面积)中的至少一种。其中,roc(receiver operating characteristic)是指受试者工作特征曲线。在示例性实施例中,目标处理模型的性能衡量指标根据测试结果获取得到,测试结果是利用测试集对目标处理模型进行测试得到的结果。根据测试结果获取目标处理模型的性能衡量指标的过程与性能衡量指标的类型有关,本技术实施例对此不加以限定。测试集中包括测试对象对应的表征特征和对象标签。
101.在获取目标处理模型的性能衡量指标后,基于性能衡量指标,确定关联挖掘结果的置信度。在示例性实施例中,对于性能衡量指标为一个的情况,直接将该一个性能衡量指标作为关联挖掘结果的置信度。对于性能衡量指标为多个的情况,可以将每个性能衡量指标均作为关联挖掘结果的一个置信度,以使关联挖掘结果具有多方面的置信度;也可以将各个性能指标进行加权融合,得到融合指标,将融合指标作为关联挖掘结果的置信度。
102.本技术实施例的核心思想是利用机器学习通过解决一个设置的代理问题来实现各个参考因素与研究目标之间的关联的挖掘。如果一个参考因素(如,免疫组库中某个基因片段)在模型实现研究目标对应的处理任务的过程中起主导作用,那么此参考因素与研究目标之间有特定的相关关系,也即说明该参考因素与研究目标相关联。
103.示例性地,以各个参考因素为v(d)j基因片段为例,本技术实施例中的关联挖掘过程如图7所示。该关联挖掘过程由特征构建和关联挖掘两部分构成,具体分为三个步骤:

获取免疫组库v(d)j基因片段的使用频率,为获取输入模型的表征特征提供数据支持;

训练得到目标处理模型;

关联挖掘。在特征构建部分中,通过对免疫组库中的tcr进行测序,得到tcr的基因片段使用信息,然后根据基因片段使用信息确定对象在各个v(d)j基因片段下对应的使用频率。在关系挖掘部分中,先根据样本对象在各个v(d)j基因片段下对应的使用频率,构建多个样本对象的表征特征,然后根据表征特征和对象标签训练得到目标处理模型;根据目标处理模型获取v(d)j基因片段具有的重要程度,以根据重要程度获取关联挖掘结果。此外,还能够对目标处理模型进行测试,根据目标处理模型输出的预测结果获取目标处理模型的性能衡量指标,然后根据目标处理模型的性能衡量指标获取关联挖掘结果的置信度。
104.示例性地,以各个参考因素为各个参考基因片段为例。在各个参考基因片段、研究目标的不同组合情况下,基于本技术实施例提供的方法确定出的具有的重要程度前10高的基因片段及其具有的重要程度的情况有所不同。
105.在示例性实施例中,各个参考基因片段为构成tcr的α链所需的各个v基因片段,研究目标为对象是否患有covid-19,此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图8中的(1) 所示。
106.在示例性实施例中,各个参考基因片段为构成tcr的α链所需的各个j基因片段,研究目标为对象是否患有a疾病,此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图8中的(2) 所示。
107.在示例性实施例中,各个参考基因片段为构成tcr的β链所需的各个v基因片段,研究目标为对象是否患有a疾病,此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图8中的(3) 所示。
108.在示例性实施例中,各个参考基因片段为构成tcr的β链所需的各个j基因片段,研究目标为对象是否患有a疾病,此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图8中的(4) 所示。
109.在示例性实施例中,各个参考基因片段为构成tcr的β链所需的各个v、 d、j基因片段,研究目标为对象所处的疾病时期(初期、发展期、恢复期),此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图9中的(1)所示,基于本技术实施例获取的目标处理模型的性能衡量指标如图9中的(5)所示。
110.在示例性实施例中,各个参考基因片段为构成tcr的β链所需的各个v、 d、j基因片段,研究目标为对象是否具有癌症史,此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图9中的 (2)所示,基于本技术实施例获取的目标处理模型的性能衡量指标如图9中的 (6)所示。
111.在示例性实施例中,各个参考基因片段为构成tcr的β链所需的各个v、 d、j基因片段,研究目标为对象是否具有糖尿病史,此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图9中的(3)所示,基于本技术实施例获取的目标处理模型的性能衡量指标如图9中的(7)所示。
112.在示例性实施例中,各个参考基因片段为构成tcr的β链所需的各个v、 d、j基因片段,研究目标为对象是否具有慢性高血压史,此种情况下,基于本技术实施例确定的具有的重要程度前10高的基因片段及其具有的重要程度如图 9中的(4)所示,基于本技术实施例获取的目标处理模型的性能衡量指标如图 9中的(8)所示。
113.在示例性实施例中,以各个参考因素为各个参考基因片段、研究目标为疾病相关目标为例,对不同类型的目标处理模型(xgboost模型、tabnet模型、svm 模型)在多种疾病相关目标(对象所处的疾病时期、对象是否具有癌症史、对象是否具有慢性高血压史、对象是否具有糖尿病史)下的性能衡量指标进行了测试,测试结果如表1所示。
114.表1
[0115][0116]
根据表1可知,在对象所处的疾病时期、对象是否具有癌症史、对象是否具有慢性高血压史、对象是否具有糖尿病史这四种疾病相关目标下,xgboost模型的性能优于tabnet模型的性能,这表明xgboost模型在处理中小型结构化或表格化数据方面优于基于深度学习的tabnet模型。通过比较xgboost模型的性能和svm模型的性能,也可以得出类似的结论,也即,在对象所处的疾病时期、对象是否具有癌症史、对象是否具有慢性高血压史、对象是否具有糖尿病史这四种疾病相关目标下,xgboost模型的性能优于svm模型的性能。xgboost模型在对象所处的疾病时期、对象是否具有癌症史、对象是否具有慢性高血压史、对象是否具有糖尿病史这四种疾病相关目标下都取得了更好的性能,这证明了 xgboost模型在结构化或表格化数据方面的优势。
[0117]
基于本技术实施例提供的方法能够实现多因素分析。重要程度较高的几个参考因素(也即最重要的几个参考因素)与研究目标相关联,若多个参考因素同时具有高重要程度,则可以认为这几个参考因素共同与研究目标相关联,从而实现多因素分析。
[0118]
基于本技术实施例,能够实现一种基于机器学习的免疫组库分析方法来挖掘免疫组库中t/b细胞受体v(d)j基因片段与疾病特征的关联,并提供揭示的 v(d)j基因片段与疾病关联的置信度。基于机器学习(深度学习)可以实现端到端的关联挖掘,对数据的统计分布没有严格的前提限制,对用户的领域背景知识要求不高,且对数据的预处理工作要求不多。基于机器学习(深度学习)可以将多因素作为模型输入的多维特征向量(特征向量的元素数等于因素个数),将多组分析建模成多分类问题,因此,在多因素多组分析方面具有明
显的优势。基于机器学习的方法在挖掘v(d)j基因片段与疾病特征关联的同时,可以用模型的准确率来指示所挖掘关联的可信度。
[0119]
本技术实施例提供的方法可以为免疫组库分析提供新的分析工具,降低免疫组库分析的领域背景知识需求和数据整理工作量,节省分析人员的时间成本和学习成本,提升免疫组库分析发现新知识的能力。本技术实施例可以使得 v(d)j基因片段与疾病特征的关联分析由基于统计的单因素为主推动到多因素同时分析层面。此外,本技术实施例提供的方法在长远时间尺度上有利于基于免疫组库分析实现的生物标志物和免疫治疗靶点发现,免疫治疗开展,疫苗并开发和效用评估。本技术实施例提供的关联挖掘方法能够作为一种特征筛选工具筛选出关联的特征用于构建机器学习模型,例如解决哪些肿瘤标志物和病人临床信息与病人是否发生淋巴结转移相关等问题。本技术实施例提供的基于机器学习的端到端的关联挖掘方法,可以广泛用于相关数据的处理中,从数据中挖掘出有价值的信息为后续实验验证提供参考,并大量减少了相关人员在数据处理上的工作。
[0120]
本技术实施例提供的关联挖掘方法,直接基于各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度获取关联挖掘结果,无需针对每个参考因素分别进行假设检验,获取关联挖掘结果的效率较高。此外,重要程度是直接基于目标处理模型得到的,整个关联挖掘过程无需人为参与,得到的关联挖掘结果的可靠性较高。
[0121]
参见图10,本技术实施例提供了一种关联挖掘装置,该装置包括:
[0122]
第一获取单元1001,用于获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度,重要程度基于目标处理模型得到,目标处理模型用于基于各个参考因素实现处理任务,各个参考因素为待挖掘与研究目标之间的关联的因素;
[0123]
第二获取单元1002,用于基于重要程度,获取各个参考因素与研究目标之间的关联挖掘结果。
[0124]
在一种可能实现方式中,第一获取单元1001,用于获取目标处理模型,目标处理模型基于样本对象对应的表征特征和对象标签训练得到,一个样本对象对应的表征特征由一个样本对象在各个参考因素下分别对应的因素特征构成;基于目标处理模型,获取各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度。
[0125]
在一种可能实现方式中,第二获取单元1002,用于将具有的重要程度满足参考条件的参考因素作为关联因素;基于关联因素,获取各个参考因素与研究目标之间的关联挖掘结果。
[0126]
在一种可能实现方式中,第二获取单元1002,还用于获取目标处理模型的性能衡量指标;基于性能衡量指标,确定关联挖掘结果的置信度。
[0127]
在一种可能实现方式中,各个参考因素为各个参考基因片段,因素特征为使用频率,第一获取单元1001,还用于获取样本对象在各个参考基因片段下分别对应的使用频率;基于样本对象在各个参考基因片段下分别对应的使用频率,构成样本对象对应的表征特征。
[0128]
在一种可能实现方式中,第一获取单元1001,还用于获取样本对象的生物组织样本;对生物组织样本中的淋巴细胞受体进行测序,得到基因片段使用信息,基于基因片段使用信息计算样本对象在各个参考基因片段下分别对应的使用频率。
[0129]
在一种可能实现方式中,样本对象在各个参考基因片段下分别对应的使用频率利
用结构化数据表示。
[0130]
在一种可能实现方式中,处理任务为根据各个参考因素进行分类的任务;或者,处理任务为根据各个参考因素进行回归的任务。
[0131]
在一种可能实现方式中,目标处理模型为决策树模型。
[0132]
在一种可能实现方式中,各个参考因素为各个参考基因片段,研究目标为疾病相关目标,处理任务用于根据各个参考基因片段预测疾病相关目标对应的处理结果,关联挖掘结果用于指示各个参考基因片段与疾病相关目标之间的关联。
[0133]
本技术实施例提供的关联挖掘装置,直接基于各个参考因素在实现研究目标对应的处理任务的过程中分别具有的重要程度获取关联挖掘结果,无需针对每个参考因素分别进行假设检验,获取关联挖掘结果的效率较高。此外,重要程度是直接基于目标处理模型得到的,整个关联挖掘过程无需人为参与,得到的关联挖掘结果的可靠性较高。
[0134]
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将设备的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0135]
图11是本技术实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(centralprocessing units,cpu)1101和一个或多个存储器1102,其中,该一个或多个存储器1102中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1101加载并执行,以使该服务器实现上述各个方法实施例提供的关联挖掘方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
[0136]
图12是本技术实施例提供的一种终端的结构示意图。该终端可以是:pc、手机、智能手机、pda、可穿戴设备、ppc(pocket pc,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱、智能语音交互设备、智能家电、车载终端等。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
[0137]
通常,终端包括有:处理器1501和存储器1502。
[0138]
处理器1501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1501可以采用dsp(digital signal processing,数字信号处理)、 fpga(field-programmable gate array,现场可编程门阵列)、pla(programmablelogic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器 1501可以集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1501还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0139]
存储器1502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可
以是非暂态的。存储器1502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1501所执行,以使该终端实现本技术中方法实施例提供的关联挖掘方法。
[0140]
在一些实施例中,终端还可选包括有:外围设备接口1503和至少一个外围设备。处理器1501、存储器1502和外围设备接口1503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1503 相连。具体地,外围设备包括:射频电路1504、显示屏1505、摄像头组件1506、音频电路1507、定位组件1508和电源1509中的至少一种。
[0141]
外围设备接口1503可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1501和存储器1502。在一些实施例中,处理器1501、存储器1502和外围设备接口1503被集成在同一芯片或电路板上;在一些其他实施例中,处理器1501、存储器1502和外围设备接口1503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
[0142]
射频电路1504用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路1504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1504包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路1504还可以包括nfc(near field communication,近距离无线通信) 有关的电路,本技术对此不加以限定。
[0143]
显示屏1505用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1505是触摸显示屏时,显示屏1505还具有采集在显示屏1505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1501进行处理。此时,显示屏1505还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1505可以为一个,设置在终端的前面板;在另一些实施例中,显示屏1505可以为至少两个,分别设置在终端的不同表面或呈折叠设计;在另一些实施例中,显示屏1505可以是柔性显示屏,设置在终端的弯曲表面上或折叠面上。甚至,显示屏1505还可以设置成非矩形的不规则图形,也即异形屏。显示屏1505可以采用lcd(liquid crystal display,液晶显示屏)、oled(organiclight-emitting diode,有机发光二极管)等材质制备。
[0144]
摄像头组件1506用于采集图像或视频。可选地,摄像头组件1506包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr (virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1506还可以包括闪光灯。闪光灯可以是单色温闪光
灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
[0145]
音频电路1507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1501进行处理,或者输入至射频电路1504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1501或射频电路1504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1507还可以包括耳机插孔。
[0146]
定位组件1508用于定位终端的当前地理位置,以实现导航或lbs(locationbased service,基于位置的服务)。定位组件1508可以是基于美国的gps(globalpositioning system,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
[0147]
电源1509用于为终端中的各个组件进行供电。电源1509可以是交流电、直流电、一次性电池或可充电电池。当电源1509包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
[0148]
在一些实施例中,终端还包括有一个或多个传感器1510。该一个或多个传感器1510包括但不限于:加速度传感器1511、陀螺仪传感器1512、压力传感器 1513、指纹传感器1514、光学传感器1515以及接近传感器1516。
[0149]
加速度传感器1511可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1511可以用于检测重力加速度在三个坐标轴上的分量。处理器1501可以根据加速度传感器1511采集的重力加速度信号,控制显示屏1505以横向视图或纵向视图进行用户界面的显示。加速度传感器1511还可以用于游戏或者用户的运动数据的采集。
[0150]
陀螺仪传感器1512可以检测终端的机体方向及转动角度,陀螺仪传感器 1512可以与加速度传感器1511协同采集用户对终端的3d动作。处理器1501 根据陀螺仪传感器1512采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
[0151]
压力传感器1513可以设置在终端的侧边框和/或显示屏1505的下层。当压力传感器1513设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器1501根据压力传感器1513采集的握持信号进行左右手识别或快捷操作。当压力传感器1513设置在显示屏1505的下层时,由处理器1501根据用户对显示屏1505的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0152]
指纹传感器1514用于采集用户的指纹,由处理器1501根据指纹传感器1514 采集到的指纹识别用户的身份,或者,由指纹传感器1514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1514可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商logo(商标)时,指纹传感
器1514可以与物理按键或厂商logo集成在一起。
[0153]
光学传感器1515用于采集环境光强度。在一个实施例中,处理器1501可以根据光学传感器1515采集的环境光强度,控制显示屏1505的显示亮度。具体地,当环境光强度较高时,调高显示屏1505的显示亮度;当环境光强度较低时,调低显示屏1505的显示亮度。在另一个实施例中,处理器1501还可以根据光学传感器1515采集的环境光强度,动态调整摄像头组件1506的拍摄参数。
[0154]
接近传感器1516,也称距离传感器,通常设置在终端的前面板。接近传感器1516用于采集用户与终端的正面之间的距离。在一个实施例中,当接近传感器1516检测到用户与终端的正面之间的距离逐渐变小时,由处理器1501控制显示屏1505从亮屏状态切换为息屏状态;当接近传感器1516检测到用户与终端的正面之间的距离逐渐变大时,由处理器1501控制显示屏1505从息屏状态切换为亮屏状态。
[0155]
本领域技术人员可以理解,图12中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0156]
在示例性实施例中,还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行,以使该计算机设备实现上述任一种关联挖掘方法。该计算机设备可以是指终端,也可以是指服务器,本技术实施例对此不加以限定。
[0157]
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由计算机设备的处理器加载并执行,以使计算机实现上述任一种关联挖掘方法。
[0158]
在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(read
‑ꢀ
only memory,rom)、随机存取存储器(random access memory,ram)、只读光盘(compact disc read-only memory,cd-rom)、磁带、软盘和光数据存储设备等。
[0159]
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或计算机指令,该计算机程序或计算机指令由处理器加载并执行,以使计算机实现上述任一的关联挖掘方法。
[0160]
需要说明的是,本技术中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以上示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
[0161]
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0162]
以上所述仅为本技术的示例性实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1