一种生物数据的产生标识符的方法及系统与流程

文档序号:11154972阅读:236来源:国知局
一种生物数据的产生标识符的方法及系统与制造工艺

本发明涉及生物数据标识符和大数据处理领域,特别涉及一种生物数据的产生标识符的方法及系统。



背景技术:

DOI标识符,是一种数字对象唯一标识符(Digital Object Unique Identifier-DOI)。DOI标识符属于一套识别数字资源的机制,涵括的对象有视频、报告或书籍等等。它既有一套为资源命名的机制,也有一套将识别号解析为具体地址的协议,也是云计算背景下最佳的“大数据”样本存储和应用技术。

具体地,DOI的体现形式主要包括:二维码、条形码、字符码、网络域名等,数字对象唯一性,是DOI的典型特征,也是数字时代的“身份证”号码。DOI标识符由前缀和后缀两部分组成,之间用“/”分开,并且前缀以“.”再分为两部分。前缀由国际数字对象识别号基金会确定,后缀部分由资源发布者自行指定,用于区分一个单独的数字资料,具有唯一性。

此外,目前比较成熟、被业界认可且已进入实用阶段的标识符解析系统便是Handle System(以下简称Handle系统),该系统最早由美国DARPA资助CNRI机构进行研发,其开发负责人是被称为因特网技术先锋人物、TCP/IP协议制定者之一的罗伯特.卡恩先生(Dr.Robert.Kahn),Handle系统推出以后受到了广泛的关注和欢迎,目前其相关标准已被IETF接收为RFC文档。Handle系统是一个通用的分布式名称服务系统,它包括一套开放的系统协议、唯一标识符名称空间以及协议的参考实现模型,可以以高效、可扩展、可靠的方式提供基于网络的唯一标识符注册和解析服务。

Handle系统具有下述的突出特点:1)安全高效的解析和管理机制,具有认证/授权、数据保密、服务验证、以及隐私保护等功能;2)可以独立于物理运行环境,实现对标识符及其属性的分布式服务和管理。目前,Handle系统可以为数字图书馆、数字出版等应用领域提供一种高效、可扩展、开放的唯一标识符系统。上述的DOI标识符是基于Handle标识符的真子集,Handle标识符是类似IP的一种技术,是TCP/IP发明的另一项标识符标准。

所谓的生物数据可包含:生物医疗的实验器材,毛发,血液样本等各种类数据。在生物大数据领域,由于生物医疗数据量很大,相互关系混乱,不便于管理。而数字对象唯一标识符,是云计算背景下最佳的“大数据”样本存储和应用技术。

对于大数据的解决方案,目前有以下几种方式:

中国专利ZL200510112526,一种产生标识符的方法,包括:A、配置ID的取值范围,根据ID的可用性划分ID的取值区间;B、对划分的取值区间进行编号,利用随机函数产生编号数据范围内的一个随机数,选择编号与产生的随机数相同的取值区间;判断所选择用于产生ID的取值区间内ID的个数,如果该取值区间内只有一个ID,则取该ID作为新产生的ID;如果该取值区间内有一个以上的ID,利用随机函数产生该取值区间中ID数目范围内的一个随机数,取该取值区间中与该随机数对应的ID,更新ID的取值区间。能够产生满足全部数字、唯一、随机和长度可配置要求的ID。其考虑的仅是通用行业的标识符产生方法,并没有考虑行业特点。

此外,中国专利申请201410487306.4,一种交互信息中DOI的处理方法及装置,用以提高用户获取DOI所标识信息的效率。方法包括:服务器获取交互信息中的数字对象唯一标识符DOI;对所述DOI进行解析,得到DOI所标识的信息;向客户端推送DOI所标识的信息,以使得客户端在信息交互界面展示DOI所标识的信息。

中国专利申请201410838339.9,一种信息展示方法及装置,该方法包括:监测针对DOI的指定操作,当监测到针对所述DOI执行了指定操作时,展示该DOI对应的概况信息。主要提供一种自动根据对应的资源(比如,音乐文件)去操作(去播放)的标识符。

中国专利申请201410785058.1,一种信息展示方法及装置,该方法包括:对页面中的数字对象唯一标识符DOI和其他信息的展示位置进行监测,当监测到所述其他信息的展示位置与所述DOI的展示位置发生重叠时,对所述其他信息进行隐藏处理。在本申请中,在扫描DOI的过程中,通过JavaScript来监测页面中DOI的展示位置,若监测到页面中的其他信息遮挡该DOI时,则将其他信息进行隐藏,以使得DOI可以清楚地展示。上述申请如果在显示的时候被其他资源(比如,文件)挡住了,去自动显示到前面,从而方便显示。

标识符至少需要满足以下的几种方面功能:

1)方便打印

2)统一与通用

3)可以追溯采集时的状态

鉴于上面的技术方案都存在不同的问题,所以有待提出用于管理生物数据标识符的规范,并且配套提出生成系统。



技术实现要素:

本发明要解决的技术问题是,提供用于管理生物数据标识符,且能够规范生物数据的产生标识符的方法。

解决上述技术问题,一种生物数据的产生标识符的方法,包括如下步骤:

采集生物数据内容,根据设定规则产生标识符,所述标识符被配置为至少包括:

用以产生国际统一编码的第一标识,

用以记录采集来源的第二标识,

用以区分生物数据分类的第三标识,

用以用来记录采集时间、生成唯一标识的第四标识,

将上述标识符同步至数据库。

优选地,所述标识符进一步被配置为:

<国际Handle标识符>/<采集机构>.<采集生物数据来源机构性质>.<采集生物数据分类>.<生物名称>.<生物组织名>.<时间戳>.<三位流水号>

优选地,所述第一标识进一步包括:国际统一编码Handle或者DOI标识符。

优选地,所述第二标识进一步包括:采集机构和/或采集生物数据来源机构性质,基于SPREC原理(Standard PREanalytical Code),基于SPREC原理,其也是制定标识符的状态,但是会把采集状态写到标识符里面。从所述标识符获取得到生物数据的来源以及对数据进行溯源。

优选地,所述第三标识进一步包括:采用统一命名的生物名称和/或自定义组织名的生物组织名。

优选地,所述第四标识进一步包括:用以记录采集时间时间戳和/或作为唯一标识的流水号。

优选地,所述采集生物数据内容的方法为:手动录入、通过嵌入式芯片采集。

优选地,方法还包括按照SMTP、POP3或者HTTP协议发送至指定邮箱中。

优选地,所述采集生物数据内容的端口与数据库采用socket通讯协议。

基于上述本发明还提供了一种生物数据的产生标识符的系统,其包括:终端、客户端服务器和服务端服务器,

所述终端被配置为:采集生物数据内容,在所述客户端服务器根据设定规则产生标识符,

其中,所述标识符被配置为至少包括:

用以产生国际统一编码的第一标识,

用以记录采集来源的第二标识,

用以区分生物数据分类的第三标识,

用以用来记录采集时间、生成唯一标识的第四标识,

所述服务端服务器被配置为接收上述标识符

本发明的有益效果:

1)由于所述标识符被配置为至少包括:用以产生国际统一编码的第一标识,用以记录采集来源的第二标识,用以区分生物数据分类的第三标识,用以用来记录采集时间、生成唯一标识的第四标识。上述标识符生成的方法,标识符生成了就是唯一的。不仅可以溯源采集过程,还能够唯一标识采集内容,这样就对采集过程的状态进行记录。对于大量的生物数据,采用本发明的这类办法管理起来访问很快,相比于比如基于域名的DNS速度快很多。采用本发明中的标识符,不仅方便打印、统一与通用,同时唯一标识符还可以追溯采集时的状态,便于大数据的归一化采集和后期处理。

2)另外,利用handle的前缀,可以全网访问,handle的全球数据库:http://hdl.handle.net/。

3)通过嵌入式芯片采集,通过嵌入式硬件移动采集使得采集过程更加便利,采集方式更为便携。更进一步,用芯片生成标识符可以防止人为误输和篡改。

附图说明

图1是本发明中的方法流程示意图;

图2是图1中的标识符结构示意图;

图3是图1中的一种优选实施方式示意图;

图4是本发明的系统结构示意图。

具体实施方式

现在将参考一些示例实施例描述本公开的原理。可以理解,这些实施例仅出于说明并且帮助本领域的技术人员理解和实施例本公开的目的而描述,而非建议对本公开的范围的任何限制。在此描述的本公开的内容可以以下文描述的方式之外的各种方式实施。

如本文中所述,术语“包括”及其各种变体可以被理解为开放式术语,其意味着“包括但不限于”。术语“基于”可以被理解为“至少部分地基于”。术语“一个实施例”可以被理解为“至少一个实施例”。术语“另一实施例”可以被理解为“至少一个其它实施例”。

可以理解,在本申请中的socket通讯协议,网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个socket。建立网络通信连接至少要一对端口号(socket)。首先,服务器监听:是服务器端套接字并不定位具体的客户端套接字,而是处于等待连接的状态,实时监控网络状态。其次,客户端请求:是指由客户端的套接字提出连接请求,要连接的目标是服务器端的套接字。为此,客户端的套接字必须首先描述它要连接的服务器的套接字,指出服务器端套接字的地址和端口号,然后就向服务器端套接字提出连接请求。最后,连接确认:是指当服务器端套接字监听到或者说接收到客户端套接字的连接请求,它就响应客户端套接字的请求,建立一个新的线程,把服务器端套接字的描述发给客户端,一旦客户端确认了此描述,连接就建立好了。而服务器端套接字继续处于监听状态,继续接收其他客户端套接字的连接请求

本申请中的长连接是指,即是要在客户端与服务器之间创建和保持稳定可靠的连接。通常的做法是,在服务器的程序中加入一个死循环,在循环中监测数据的变动。当发现新数据时,立即将其输出给浏览器并断开连接,浏览器在收到数据后,再次发起请求以进入下一个周期的长轮询(long-polling)方式。长连接在页面里嵌入一个隐蔵iframe,将这个隐蔵iframe的src属性设为对一个长连接的请求或是采用xhr请求,服务器端就能源源不断地往客户端输入数据。

请参考图1是本发明中的方法流程示意图,实施例中包括如下步骤:步骤S100采集生物数据内容,根据设定规则产生标识符,所述标识符被配置为至少包括:步骤S101用以产生国际统一编码的第一标识,作为本实施例中的优选,所述第一标识进一步包括:国际统一编码Handle或者DOI标识符。步骤S102用以记录采集来源的第二标识,作为本实施例中的优选,所述第二标识进一步包括:采集机构和/或采集生物数据来源机构性质,基于SPREC原理,从所述标识符获取得到生物数据的来源以及对数据进行溯源。步骤S103用以区分生物数据分类的第三标识,作为本实施例中的优选,所述第三标识进一步包括:采用统一命名的生物名称和/或自定义组织名的生物组织名。步骤S104用以用来记录采集时间、生成唯一标识的第四标识,作为本实施例中的优选,所述第四标识进一步包括:用以记录采集时间时间戳和/或作为唯一标识的流水号。步骤S105将上述标识符同步至数据库。

所述Handle是国际标准:基于RFC 3650。比如Handle为,200.500.11926。

Handle系统是一个通用的分布式名称服务系统,包括一套开放的系统协议、唯一标识符名称空间以及协议的参考实现模型,可以以高效、可扩展、可靠的方式提供基于网络的唯一标识符注册和解析服务。

在一些实施例中,.<采集生物数据来源机构性质>包括但不限于:采集的生物数据是否涉及行政审批。

在一些实施例中,<采集生物数据来源机构性质>包括但不限于:采集的生物数据的机构的机构性质。

在一些实施例中,<采集生物数据来源机构性质>包括但不限于:客户资源类别。

在一些实施例中,<采集生物数据来源机构性质>包括但不限于:

表1

在一些实施例中,<采集生物数据来源机构性质>包括但不限于:内部保留编码、内部测试编码、机关、事业单位、国有企业、民营上市企业、民营非上市企业、自然人。

表2

在一些实施例中,<采集生物数据来源机构性质>包括但不限于:内部保留编码、内部测试编码、直接采集、共享采集、委托采集等。

表3

在一些实施例中,<采集生物数据来源机构性质>包括但不限于:内部保留编码、内部测试编码、单项生物数据、多项生物数据等。

表4

在一些实施例中,生物名称采用兼容林奈命名法,生物双命名法,空格以"_"分割。

在一些实施例中,生物组织名采用自定义组织名,比如,自定义字符串,包含26个英文字母小写和数字0-9。

在一些实施例中,<时间戳>.<三位流水号>用以记录采集时间和唯一标识。比如,时间戳YYYY-MM-DD-HH-MM-SS-NN,YYYY:年,MM:月,DD:日,HH:时,MM:分,SS:秒,NN:毫秒。

上述步骤中的优选,标识符设置为:<国际Handle标识符>/<采集机构>.<采集生物数据来源机构性质>.<采集生物数据分类>.<生物名称>.<生物组织名>.<时间戳>.<三位流水号>。

上述步骤中的优选,所述采集生物数据内容的方法为:手动录入、通过嵌入式芯片采集。

上述步骤中的优选,方法还包括按照SMTP、POP3或者HTTP协议发送至指定邮箱中,通过发送至指定邮箱增加数据同步效率。

上述步骤中的优选,所述采集生物数据内容的端口与数据库采用socket通讯协议。

图2是图1中的标识符结构示意图,上述步骤中的优选,标识符设置为:<国际Handle标识符>/<采集机构>.<采集生物数据来源机构性质>.<采集生物数据分类>.<生物名称>.<生物组织名>.<时间戳>.<三位流水号>。

图3是图1中的一种优选实施方式示意图,一种生物数据的产生标识符的方法,包括如下步骤:

步骤S10手动录入

步骤S11通过嵌入式芯片采集,本领域技术人员能够明了,所述嵌入式芯片能够将生物医疗的实验器材、毛发、血液样本等根据不同生物芯片进行采集得到,并通过嵌入式芯片处理后上传至上位机。比如,嵌入式移动采集设备是一个通用的手持扫描设备,通过扫描生物资源样本,可以获取生物样本数字化信息,采集方式更加便携。又比如,对于生物数据采用血液样本分析仪、皮肤毛发显微分析仪等进行分析和采集。

步骤S100采集生物数据内容,根据设定规则产生标识符,所述标识符被配置为至少包括:

步骤S101用以产生国际统一编码的第一标识,

步骤S102用以记录采集来源的第二标识,

步骤S103用以区分生物数据分类的第三标识,

步骤S104用以用来记录采集时间、生成唯一标识的第四标识,

步骤S1041按照SMTP、POP3或者HTTP协议发送至指定邮箱中,

步骤S1042所述采集生物数据内容的端口与数据库采用socket通讯协议,

所述标识符进一步被配置为:

<国际Handle标识符>/<采集机构>.<采集生物数据来源机构性质>.<采集生物数据分类>.<生物名称>.<生物组织名>.<时间戳>.<三位流水号>。

在所述步骤S11中通过嵌入式芯片采集,可以基于树莓派上的操作系统,生成数据的方式是通过特定软件进行生成。树莓派,Raspberry Pi,简写为RPi,(或者RasPi/RPI)是为学生计算机编程教育而设计,只有信用卡大小的微型电脑,其系统基于Linux。比如,其可基于ARM的微型电脑主板,以SD/MicroSD卡为内存硬盘,卡片主板周围有1/2/4个USB接口和一个10/100以太网接口(A型没有网口),可连接键盘、鼠标和网线,同时拥有视频模拟信号的电视输出接口和HDMI高清视频输出接口,以上部件全部整合在一张仅比信用卡稍大的主板上,具备所有PC的基本功能只需接通电视机和键盘,就能执行如电子表格、文字处理、玩游戏、播放高清视频等诸多功能。Raspberry Pi B款只提供电脑板,无内存、电源、键盘、机箱或连线。

特定软件中UI界面为一采集机构元数据面板和一采集备注,包括:采集机构属性、采集过程以及采集服务等。其中,采集机构属性包括但不限于:机构编码、自动生成的采集时间戳、采集流水号等。采集过程包括但不限于:采集性质、客户来源类别、客户服务类别以及客户资源类别等。采集服务包括但不限于:服务性质或服务项目等。采集备注包括但不限于:采集正文和采集附件地址等。

步骤S105将上述标识符同步至数据库。

在上述步骤S1041中,按照SMTP、POP3或者HTTP协议发送至指定邮箱中,可提高用户活跃度。类似每个网站都会有状态更新,而对于生物数据标识符的产生,大多数用户不会经常去刷新看看有没有什么新内容,通过邮件不仅能够让用户得到及时的反馈,又能够使得数据得到及时的备案。

图4是本发明的系统结构示意图,一种生物数据的产生标识符的系统,包括:终端、客户端服务器100和服务端服务器200,所述终端被配置为:采集生物数据内容,在所述客户端服务器100根据设定规则产生标识符,其中,所述标识符被配置为至少包括:用以产生国际统一编码的第一标识,用以记录采集来源的第二标识,用以区分生物数据分类的第三标识,用以用来记录采集时间、生成唯一标识的第四标识,所述服务端服务器200被配置为接收上述标识符,所述采集生物数据内容的方法为:手动录入、通过嵌入式芯片采集。客户端服务器100和服务端服务器200采用长连接。

在一些实施例中,系统中还包括邮件服务器,按照SMTP、POP3或者HTTP协议发送至指定邮箱中。

在一些实施例中,所述采集生物数据内容的端口与数据库采用socket通讯协议。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

总体而言,本公开的各种实施例可以以硬件或专用电路、软件、逻辑或其任意组合实施。一些方面可以以硬件实施,而其它一些方面可以以固件或软件实施,该固件或软件可以由控制器、微处理器或其它计算设备执行。虽然本公开的各种方面被示出和描述为框图、流程图或使用其它一些绘图表示,但是可以理解本文描述的框、设备、系统、技术或方法可以以非限制性的方式以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备或其一些组合实施。

此外,虽然操作以特定顺序描述,但是这不应被理解为要求这类操作以所示的顺序执行或是以顺序序列执行,或是要求所有所示的操作被执行以实现期望结果。在一些情形下,多任务或并行处理可以是有利的。类似地,虽然若干具体实现方式的细节在上面的讨论中被包含,但是这些不应被解释为对本公开的范围的任何限制,而是特征的描述仅是针对具体实施例。在分离的一些实施例中描述的某些特征也可以在单个实施例中组合地执行。相反对,在单个实施例中描述的各种特征也可以在多个实施例中分离地实施或是以任何合适的子组合的方式实施。

虽然本公开以具体结构特征和/或方法动作来描述,但是可以理解在所附权利要求书中限定的本公开并不必然限于上述具体特征或动作。而是,上述具体特征和动作仅公开为实施权利要求的示例形式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1