表型整合社交搜索数据库和方法

文档序号:8287884阅读:413来源:国知局
表型整合社交搜索数据库和方法
【技术领域】
[0001]本发明提供一种利用生物学表型测量值建立社交行为的初步整合(firstintegrat1n)的方法、数据库和装置。
【背景技术】
[0002]广泛理解的是,搜索数据对信息分类和关联很重要。利用丰富的可进行搜索的数据,减少数据搜索的差错率并且增加数据搜索的效率和速度的方法是非常合乎需要的。有用的结果依赖于所采用的查询输入和关联性。一些组织已经使用用户对问题的答案来关联产品和活动的性能参数、信念(例如,Hunch:www.hunch, com)或者推荐引导未来的产品购买的购物行为(Amazon)。用于该装置的其他专门应用程序(“apps”)包括测量和比较类似用户的数据以用于预测未来的软件,例如饭店应用程序,在该应用程序中用户评定饭店,以及收集数据并将其用于预测未来的饭店选择。
[0003]此外已经描述了预测消费者行为的方法。例如,美国专利第8,200,525号(结合于此以供参考)描述了一种用于通过结合来自完全不同数据库的转换信息来预测消费者行为的方法和系统。
[0004]预测未来选择的能力非常需要。例如,预测未来选择的能力具有如下好处,诸如使卖方能够在采购周期内定位具有高度针对性的消费者。利用正确信息,零售商可获得定制的目标广告,并且为消费者提供激励(优惠券)。还广泛理解的是,消费者希望利用移动设备快速、轻易地确切搜索确定他们需要什么。结合更有效搜索并且为用户提供明显有意义的附加价值。在传统意义上,在这些实施例的任一个中都没有定量的物理生物组分输入。
[0005]然而,一些集团已经使用遗传片段,例如单核苷酸多态性(在个体中,当基因组或者其他公用序列中的单核苷酸-A、T、C或G-在生物品种或者成对染色体组分之间不会出现的SNPs或者DNA序列变异)和在线调查来关联个体中的健康风险,以及确定个体的谱系(例如,23 和 Me,Nat1nal Geographic and WorldFamilies.net)。进一步地,许多公司使用遗传信息来诊断疾病,包括精神状态。
[0006]测量生物组分来诊断身体状况的实施例包括各种试验,诸如广泛采用的妊娠试验以及消费者和医学实验室可用的、其他不需医生处方(over the counter)的试验;然而这些实施例没有专门描述或者预测行为,以及合乎零售商和消费者需要的特征。

【发明内容】

[0007]本发明提供一种新的、整合社交搜索和生物学表型的方法,以及供零售商、消费者及其他人采用的信息的数据库。在本发明的方法和数据库中,在各表型(生物学表型和行为或者情感表型)之间进行关联,与将基因型和表型关联或者将基因型和基因型关联的传统方法比较。
[0008]数据库是数据的集合,并且可被存储在被配置为处理数据的一个或多个装置上,例如计算机。
【具体实施方式】
[0009]如接下来使用的,术语表型包括某些特性或者特征,这些特性或者特征是通过某些技术程序可见并且包括作为可见特征的行为。表型可通过可计量的遗传、进化和环境变量进行限制,这些变量可作为生物分子状态进行测量,例如基因序列、外遗传基因组变形、RNA和微RNA含量、蛋白含量、蛋白折叠和变形、代谢物含量和电信号。表型是生物体可见特征或者特性:例如其形态、演变、生化或者生理特性、物候现象、行为和行为产物(例如鸟巢)的组合物。表型源于生物体基因表现以及环境因素的影响和两者之间的相互作用。在本发明的方法中,使用遗传、演变和/或环境或者其他变量,例如在此描述的那些,测量生物分子状态。
[0010]给定细胞、组织或者有机体中的蛋白质组的具体状态(通过基因、细胞、组织或者有机体表达的完整一组蛋白质)被称为蛋白型(proteotype)。蛋白型是唯一位于表型下的蛋白质状态。蛋白分型通过目测单一氨基酸标记以蛋白含量中挖掘出基因的潜在遗传信息;源自单个基因的众多蛋白质形式都是可目测的。蛋白型整合了基因型、环境以及发展史(即,在相同环境下,皮肤细胞与具有相同基因型的心脏细胞相比具有不同的蛋白型)施加的限制。由于所有分子都是由蛋白质形成并通过其调整的,蛋白型可直接确定表型。因此,蛋白型可被用来直接推断基因型对表型的作用(因为肽与DNA比对),并且能够实现表型的人造再现(蛋白含量或者转译后修改的变化是可设计的)。蛋白型的完整描述可以分子量级限定表型。
[0011]可以理解的是,有机体的活性和动作受到蛋白质的影响。可以测量蛋白质来表示个体的生物分子状态。对蛋白质的大量研宄“蛋白质组”目前被用来诊断疾病以及确定基因是否表达在样品中。过去,曾采用不够完善的方法来确定蛋白质的相关活性,例如,测量核糖核酸(RNA)含量。对于某些研宄,考虑蛋白质相关活性,相比,蛋白质组比确定例如RNA含量更精确,因为转录速度、RNA半衰期、蛋白质半衰期、蛋白质分布都会影响在充足含量下蛋白质是否能够允许蛋白质的相关活性出现。在核酸通过对蛋白质进行编码以及允许蛋白质进行表达来提高(contributes to)蛋白含量时,通过大量因素确定蛋白质是否实际存在并且是否足量。因此,测量蛋白质是减少错误和减少相关误译的最佳方式。在本发明的实施例中,蛋白质组和/或蛋白型被用来测量个体的生物分子状态或者个体的生物学表型。从样品中提纯蛋白质和测量蛋白质的方法,包括大量分析蛋白质组(例如,通过质谱分析法),在本领域内广泛使用并且众所知周。这种方法可用于本发明的方法中。
[0012]可以进一步理解的是,其他生物分子,例如肽、代谢产物、激素和小分子,影响和/或表示有机体的活性和行为。例如,女性生殖激素催产素已与大方照顾行为相关联。本发明中定量的物理生物组分输入包括DNA类型、RNA含量、微RNA类型或者含量、蛋白质含量、蛋白型、新陈代谢水平或者均匀定性或定量的MRI的测量或描述。在本发明的另一个实施例中,测量生物分子,诸如肽、激素和/或小分子或其任一组合,来测量个体的生物分子状态。
[0013]在本发明的方法中,识别诸如蛋白质的生物分子为个体情感或行为状态的标记。情感状态包括但不限于基本情感,例如感受亲切度或者兴奋、幸福、忧愁、生气或者惊吓。在收集数据之后和期间,包括与生物分子存在或不存在有关的数据以及来自个体行为或情感状态的数据,对这些数据进行整合和分析。保留确定为与表型有关的数据(例如偏差数据)以及淘汰与表型无关的数据。存储数据并且形成数据库。继续数据收集并且利用这段时间内保留的最佳数据和选择性淘汰最小相关性而对最佳相关性进行按序排列。这些方法揭示了生物分子或者状态与行为或情感状态之间的经验关系。
[0014]在此使用的术语“样品”表示身体的(bodily)流体或细胞,包括但不限于唾液、汗液、血液、泪液、粘液、尿液、粪便、口腔细胞刮肩、粪便、毛囊、手指甲或其它身体细胞。样品可以通过个体呼吸到表面上、刮擦到检验部(check),吐到试管内,尿在容器内或表面上,或者以任何一种其他方法提供液体样品,由此可以收集样品进行分析,例如使用某一装置。可以预计的是,可以利用计算机芯片直接分析或者将样品送至分析该样品的装置(例如计算机)。例如,毫微技术已被用来形成用于检测疾病状态的装置。发明中(on a devise)已经使用碳纳米管传感器技术测量身体气体来诊断疾病。例如,将核酸固定在检测芯片上,个体将芯片置于身体气体内,核酸可变地结合到检测后产生唯一样式的芯片上的核酸序列上,并且存在或者不存在气体与疾病相关联。此外,已将蛋白质联至碳纳米管,该组合装置转换与蛋白质结合动作有关的信号,提供一种使用毫微管格式的电子读出数据进行蛋白质功能研宄的一般方法。这些给出了在本发明的方法中收集和分析样品的方法实施例。
[0015]正如这里所用的术语“化验”是对样品组分,优选为蛋白质、肽、激素或其他生物分子,进行量化或者鉴定的测量方法。在本发明的方法中,对来自个体样品的一个或多个蛋白质和/或细胞的整个蛋白质组进行化验。可以预计的是,个体可将样品或者通过样品化验获得的数据传送到可对其进行相关性分析的位置。最初,将对一个或多个蛋白质和/或整个蛋白质组进行化验。在优选实施例中,化验一个蛋白质,例如激素,例如肾上腺素。在另一个实施例中,化验5种蛋白质。在另一个实施例中化验10种蛋白质。在另一个实施例中,化验50种蛋白质。在另一个实施例中化验100种蛋白质,以及在另一个实施例化验500种蛋白质。在另一个实施例中化验1000种蛋白质。在另一个实施例中,化验2000种蛋白质。在另一个实施例
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1