量表生成方法及装置与流程

文档序号:12786704阅读:543来源:国知局
量表生成方法及装置与流程

本申请涉及医学建模领域,尤其涉及一种量表生成方法及装置。



背景技术:

量表是一种复合测量,又称为测量工具,由多个具有逻辑结构或是经验结构的项目组成的标准化测定表格,用于测量测试对象的某种状态、行为或态度。在医学研究中,许多疾病状态无法精确测量、如疼痛、失眠、心理压抑、生存质量、生活自理能力等。只能通过测量这些状态的某些表征或测试对象的自我主观感受,间接地测评。

量表测评具有客观性强,可比性好,程序标准化,易于操作的优点,但是量表测评的结果受测试对象个体差异影响大。量表的设计缺陷,可能测评导致结果偏倚。



技术实现要素:

有鉴于此,本申请实施例将提出一种量表生成方法及装置,用以解决现有技术中量表的测评结果受测试对象个体差异影响大的缺陷。

本申请实施例提供一种量表生成方法,包括:

从多个候选危险因素中,选择至少一个目标危险因素;将所述至少一个目标危险因素分别作为量表因子,生成量表初稿,所述量表初稿包括所述量表因子以及所述量表因子的可选条目;采用第一测试样本集对所述量表初稿进行信度评价和/或效度评价;基于所述信度评价和/或效度评价的结果,对所述量表初稿包含的所述量表因子以及所述量表因子的可选条目进行筛选,以生成所述量表。

进一步可选地,所述生成量表初稿,还包括:根据所述量初稿表对正向测试样本的测评结果、所述量表初稿对负向测试样本集的测评结果、所述正向测试样本的样本数以及所述负向测试样本的样本数,采用Logistic模型迭代训练,以确定所述量表初稿中量表因子的可选条目的分值。

进一步可选地,采用第一测试样本集对所述量表初稿进行信度评价,包括以下至少一种:采用所述第一测试样本集,确定所述量表初稿的内部一致性信度;采用所述第一测试样本集,确定所述量表初稿的分半信度;以及,采用所述第一测试样本集,确定所述量表初稿的重测信度。

进一步可选地,确定所述量表初稿的所述内部一致性信度,包括:采集所述第一测试样本集对所述量表初稿的测评结果;基于所述测评结果,统计所述量表初稿的克朗巴赫α系数以及所述量表初稿中的量表因子包含的可选条目的克朗巴赫α系数;根据所述量表初稿的克朗巴赫α系数以及所述量表初稿中的量表因子的可选条目的克朗巴赫α系数,确定所述量表初稿的内部一致性信度;

确定所述量表初稿的所述分半信度包括:对所述量表初稿进行拆分,得到第一子量表以及第二子量表;采用所述第一测试样本集分别针对所述第一子量表以及所述第二子量表进行测评,得到第一测评结果以及第二测评结果;计算所述第一测评结果以及所述第二测评结果之间的相关系数,作为所述量表初稿的分半信度;

确定所述量表初稿的所述重测信度包括:按照预设时间间隔,采用所述第一测试样本集对所述量表初稿进行多次测评;计算多次测评的结果之间的Kappa系数作为所述量表初稿的重测信度。

进一步可选地,采用所述第一测试样本集对所述量表初稿进行效度评价,包括以下至少一种:采用所述第一测试样本集,确定所述量表初稿的区分效度;采用所述第一测试样本集,确定所述量表初稿的准则效度;以及,采用所述第一测试样本集,确定所述量表初稿的结构效度。

进一步可选地,确定所述量表初稿的所述区分效度包括:对所述第一测试样本集进行聚类,以得到多个样本分组;采用所述量表初稿分别对所述第一测试样本集进行测评;对所述量表初稿分别对所述多个样本分组中的所述第一测试样本集的测评结果进行方差分析,以得到所述多个样本分组之间的差异;根据所述多个样本分组之间的差异以及所述多个样本分组对应的风险结果的等级,确定所述量表初稿的区分效度;

确定所述量表初稿的所述准则效度包括:

将所述量表初稿针对第一测试样本集的测评结果与所述第一测试样本集对应的风险结果进行对比;基于对比结果,确定所述量表初稿的灵敏度、特异度以及ROC曲线下面积,用以获取所述量表初稿的准则效度;

确定所述量表初稿的所述结构效度包括:采用因子分析法,获取所述量表初稿的结构效度。

进一步可选地,将所述至少一个目标危险因素分别作为量表因子,生成量表初稿,包括:获取所述量表因子的候选条目;根据德尔菲法对所述量表因子对应的候选条目进行筛选,以得到所述量表因子的可选条目;根据所述量表因子以及所述量表因子的可选条目,生成所述量表初稿。

本申请实施例提供一种量表生成装置,包括:

选择模块,用于从多个候选危险因素中,选择至少一个目标危险因素;

量表生成模块,用于将所述至少一个目标危险因素分别作为量表因子,生成量表初稿,所述量表初稿包括所述量表因子以及所述量表因子的可选条目;

量表评价模块,用于采用第一测试样本集对所述量表初稿进行信度评价和/或效度评价;

量表筛选模块,用于基于所述信度评价和/或效度评价的结果,对所述量表初稿包含的所述量表因子以及所述量表因子的可选条目进行筛选,以生成所述量表。

进一步可选地,所述量表生成模块,还用于:根据所述量表初稿对正向测试样本的测评结果、所述量表初稿对负向测试样本集的测评结果、所述正向测试样本的样本数以及所述负向测试样本的样本数,采用Logistic模型迭代训练,以确定所述量表初稿中量表因子的可选条目的分值。

进一步可选地,所述量表评价模块,包括:第一信度评价子模块,用于采用所述第一测试样本集,确定所述量表初稿的内部一致性信度;第二信度评价子模块,用于采用所述第一测试样本集,确定所述量表初稿的分半信度;以及第三信度评价子模块,用于采用所述第一测试样本集,确定所述量表初稿的重测信度。

进一步可选地,所述第一信度评价子模块,用于:采集所述第一测试样本集对所述量表初稿的测评结果;基于所述测评结果,统计所述量表初稿的克朗巴赫α系数以及所述量表初稿中的量表因子包含的可选条目的克朗巴赫α系数;根据所述量表初稿的克朗巴赫α系数以及所述量表初稿中量表因子的可选条目的克朗巴赫α系数,确定所述量表初稿的内部一致性信度;

所述第二信度评价子模块,用于:对所述量表初稿进行拆分,得到第一子量表以及第二子量表;采用第一测试样本集分别针对所述第一子量表以及所述第二子量表进行测评,得到第一测评结果以及第二测评结果;计算所述第一测评结果以及所述第二测评结果之间的相关系数,作为所述量表初稿的分半信度;

所述第三信度评价子模块,用于:按照预设时间间隔,采用第一测试样本集对所述量表初稿进行多次测评;计算多次测评的结果之间的Kappa系数作为所述量表初稿的重测信度。

进一步可选地,所述量表评价模块,包括:第一效度评价子模块,用于:采用所述第一测试样本集,确定所述量表初稿的区分效度;第二效度评价子模块,用于采用所述第一测试样本集,确定所述量表初稿的准则效度;以及,第三效度评价子模块,用于采用所述第一测试样本集,确定所述量表初稿的结构效度。

进一步可选地,所述第一效度评价子模块,用于:对所述第一测试样本集进行聚类,以得到多个样本分组;采用所述量表初稿分别对所述多个样本分组中的第一测试样本集进行测评;对所述量表初稿分别对所述多个样本分组中的第一测试样本集进行测评的结果进行方差分析,以得到所述多个样本分组之间的差异;根据所述多个样本分组之间的差异以及所述多个样本分组对应的风险结果的等级,确定所述量表初稿的区分效度;

所述第二效度评价子模块,用于将所述量表初稿针对第一测试样本集的测评结果与所述第一测试样本集对应的风险结果进行对比;基于对比结果,确定所述量表初稿的灵敏度、特异度以及ROC曲线下面积,用以获取所述量表初稿的准则效度;

所述第三效度评价子模块,用于:采用因子分析法,获取所述量表初稿的结构效度。

进一步可选地,所述量表生成模块,用于:获取所述量表因子的候选条目;根据德尔菲法对所述量表因子对应的候选条目进行筛选,以得到所述量表因子的可选条目;根据所述量表因子以及所述量表因子的可选条目,生成所述量表初稿。

本申请实施例提供的量表生成方法及装置,通过筛选候选危险因素得到目标危险因素,生成量表初稿。对该量表初稿进行信度评价和/或效度评价,并基于信度评价和/或效度评价的结果对该量表初稿进行调整以生成最终的量表,克服了现有技术中量表的测评结果受测试对象个体差异影响大的缺陷,提升了量表有效性、正确性、稳定性、可靠性以及一致性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例一种量表生成方法的流程示意图;

图2是本申请实施例一种量表生成方法的另一流程示意图;

图3-1是本申请实施例绘制的ROC曲线的示例图;

图3-2是本申请实施例获取的退行性颈椎疾病患病风险自评量表的示例图;

图4是本申请实施例一种量表生成装置的结构示意图;

图5是本申请实施例一种量表生成装置的另一结构示意图;

图6本申请实施例一种量表生成装置的另一结构示意图;

图7是本申请实施例一种量表生成装置的另一结构示意图。

具体实施方式

量表是一种复合测量工具,由多个具有逻辑结构或是经验结构的因子组成的标准化测定表格,用于测量测试对象的某种状态、行为或态度。在医学研究中,许多疾病状态无法精确测量、如疼痛、失眠、心理压抑、生存质量、生活自理能力等。只能通过测量这些状态的某些表征或测试对象的自我主观感受,间接地测评。在精神卫生学领域研究出了世界医学范围内公认的心理学量表,在临床医学领域、公共卫生学领域也都有信度以及效度较好的量表。但是在颈椎病领域,还未出现能够有效的测量工具。目前颈椎病的管理模式还处于被动的模式,即可疑患者并发颈痛、肢体麻木等临床症状后前往医院就诊。在医院内则需要通过影像学检查进行确诊。确诊颈椎病的影像学检查包括x线、核磁或者CT检查中的至少一项。患者除了需要经济负担,还需要接受放射线的潜在危害。本申请实施例的核心在于,克服现有技术中量表的测评结果受测试对象个体差异影响大的缺陷,得到更加高质量的量表,从而根据该量表,可以更加便捷地对用户是否患颈椎病进行测量。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是本申请实施例一种量表生成方法的流程示意图。结合图1,该方法包括:

步骤101、从多个候选危险因素中,选择至少一个目标危险因素。

步骤102、将所述至少一个目标危险因素分别作为量表因子,生成量表初稿,所述量表初稿包括所述量表因子以及所述量表因子的可选条目。

步骤103、采用第一测试样本集对所述量表初稿进行信度评价和/或效度评价。

步骤104、基于所述信度评价和/或效度评价的结果,对所述量表初稿包含的所述量表因子以及所述量表因子的可选条目进行筛选,以生成所述量表。

针对步骤101,在一可选实施例中,所述的候选危险因素为可能致使人体患脊柱退行性颈椎病的危险因素,可以包括以下至少一种:一般人口学因素、职业相关因素、体育锻炼因素、生活行为特征因素、环境因素、睡眠因素、体格因素。

其中,一般人口学因素,如年龄、性别、民族、文化程度、收入水平等。职业相关因素,如职业类型、工作强度、工作姿势、同一工作姿势持续时间等。体育锻炼因素,如锻炼强度、锻炼频率等。生活行为特征,如吸烟、饮酒、交通方式、家务活动强度等。环境因素,如工作或生活环境中是否存在振动等。睡眠因素,如睡眠时间等。体格因素,如身高、体重、腰围、臀围等。

发明人在实现本发明的过程中,通过对大量脊柱退行性颈椎病发病案例的研究及以社区为基础进行的脊柱退行性疾病患病现状的调查研究,发现上述因素均与脊柱退行性颈椎病的发生有着密切的关系。例如,在一些调查中显示,对于中青年人(<50岁),退行性颈椎疾病的发生率随年龄的增加而升高,而对于50岁以上人群,退行性颈椎疾病的患病率随年龄的升高而降低。再例如,调查显示女性的患病风险高于男性,是男性的1.805倍。例如,保持坐姿持续八小时以上的办公室人员易患颈椎病。再例如,长期在振动环境下工作的公交车司机与办公室白领相比,患颈椎病的概率可能不同。上述列举的候选危险因素可利用性高、涵盖面广,既节省了筛选危险因素的时间,又有利于获取到较为全面的目标危险因素。

针对步骤102,量表由若干一级指标以及一级指标对应的二级指标构成。所述的量表因子是颈椎病的量表中包含的可能导致颈椎病的目标危险因素,每一个量表因子对应一个一级指标。其中,每个量表因子可能包含一个或多个可选的条目,每一个可选的条目表征目标危险因素的一个二级指标。该一个或多个可选的条目作为相应的量表因子包含的内容,表征了目标危险因素诱发颈椎病的各个方面。

可选的,一般人口学因素作为量表因子时,包含的可选条目可以是年龄、性别、民族、文化程度、收入水平等。职业相关因素作为量表因子时,包含的可选条目可以是职业类型、工作强度、工作姿势、同一工作姿势持续时间等。体育锻炼因素作为量表因子时,包含的可选条目可以是锻炼强度、锻炼频率等。生活行为特征作为量表因子时,包含的可选条目可以是吸烟、饮酒、交通方式、家务活动强度等。环境因素作为量表因子时,包含的可选条目可以是工作或生活环境中是否存在振动等。睡眠因素作为量表因子时,包含的可选条目可以是睡眠时间等。体格因素,包含的可选条目可以是身高、体重、腰围、臀围等。

根据上述确定好的量表因子以及每一量表因子对应的可选条目形成量表初稿。得到量表初稿之后,进一步对量表进行信度评价和/或效度评价。信度(reliability)用于评价量表的可靠性、稳定性和一致性。效度(Validity)评价量表的有效性和正确性,即测定值与目标真实值的偏差大小。效度越高表示测量结果越能显示出所要测量对象的真正特征。效度是量表的首1要条件,而信度是效度的必要条件,有效的量表必是可信的量表,但可信的量表未必是有效的量表。

针对步骤103,信效度评价采用的第一测试样本集包含多个测试样本,是一定数量的颈椎病患者以及非颈椎病患者组成的。在选取颈椎病患者样本以及非颈椎病患者样本时,通过设置不同的选取标准与排除标准,获得覆盖性更高的第一测试样本集,从而基于该第一测试样本集对量表初稿进行评价时有效性更高。

可选地,采用第一测试样本集对量表初稿进行信度评价,可包括对量表初稿的内部一致性信度、分半信度以及重测信度中的至少一个进行评价。采用第一测试样本集对所述量表初稿进行效度评价,可包括对量表初稿的区分效度、准则效度以及结构效度中的至少一个进行评价。具体的信度以及效度评价的方式将会在后续实施例进行详细阐述。

基于上述步骤,以第一测试样本集对所述量表初稿进行信度评价和/或效度评价之后,在步骤103中,基于信度评价和/或效度评价的结果,对所述量表初稿包含的所述量表因子以及所述量表因子的可选条目进行筛选,以生成所述量表。

对量表因子或量表因子包含的可选条目进行筛选,可以根据信度评价结果进行筛选或根据效度评价的结果进行筛选或根据信度以及效度评价的结果进行筛选。

本申请实施例中,通过筛选候选危险因素得到目标危险因素,生成量表初稿。对该量表初稿进行信度评价和/或效度评价,并基于信度评价和/或效度评价的结果对该量表初稿进行调整以生成最终的量表,克服了现有技术中量表的测评结果受测试对象个体差异影响大的缺陷,提升了量表有效性、正确性、稳定性、可靠性以及一致性。

图2是本申请实施例一种量表生成方法的另一流程示意图。结合图2,该方法包括:

步骤201、从多个候选危险因素中,选择至少一个目标危险因素。

步骤202、将至少一个目标危险因素分别作为量表因子,并获取所述量表因子对应的候选条目;

步骤203、根据德尔菲法对所述量表因子对应的候选条目进行筛选,以得到所述量表因子的可选条目;

步骤204、根据所述量表因子以及所述量表因子的可选条目,生成所述量表初稿。

步骤205、根据所述量表初稿对正向测试样本的测评结果、所述量表初稿对负向测试样本集的测评结果、所述正向测试样本的样本数以及所述负向测试样本的样本数,采用Logistic模型迭代训练,以确定所述量表初稿中量表因子的可选条目的分值。

步骤206、采用第一测试样本集对所述量表初稿进行信度评价和/或效度评价。

步骤207、基于所述信度评价和/或效度评价的结果,对所述量表初稿包含的所述量表因子以及所述量表因子的可选条目进行筛选,以生成所述量表。

针对步骤201,在一可选实施例中,可以对所述多个候选危险因素进行单因素分析,以获取所述多个候选危险因素中P<第一阈值的危险因素;可选的,第一阈值可以是0.05,但不限于此;其中,P为该候选因素导致颈椎病病发的概率值。

对P<第一阈值的危险因素进行多因素回归分析,以获得P<第一阈值的危险因素中的检验水平为预设值的至少一个危险因素,作为至少一个目标危险因素。所述预设值可以为0.05,但不限于此。

可选的,本发明实施例中可以通过X2检验、t检验等统计学检验方法,对候选危险因素进行单因素分析,从候选危险因素中选择出P<0.05的危险因素。可选的,本发明实施例可以通过线性回归、非线性回归等回归方法,对选择出的P<0.05的危险因素进行多因素回归分析,以获得检验水平为0.05的至少一个目标危险因素。

通过对多个候选危险因素进行单因素分析,找出显著性危险因素;通过对找出的显著性危险因素进行多因素回归分析,确定目标危险因素;双重筛选确保了得到的目标危险因素的可利用性,为风险预估提供了较为可靠的数据基础。

针对步骤202,目标危险因子对应的候选条目可根据临床诊断经验或生活经验大致获取,不赘述。为了用量表的术语进行描述,可将目标危险因素作为量表因子,相应地,目标危险因子对应的候选条目即为量表因子对应的候选条目。

针对步骤203,量表因子中可能包含多个可选条目,然而并非每一可选条目均能够体现所属的量表因子对颈椎病的贡献,因此需要进行筛选以进一步提升量表的可靠程度。例如,职业相关因素作为量表因子中,其候选条目可以包括:职业类型、工作薪资水平、工作强度、工作姿势、工作地域、同一工作姿势持续时间等。经德尔菲法(Delphi method)分析,职业相关因素中,工作薪资水平以及工作地域对颈椎病没有贡献,可将二者删除,不作为职业相关因素的可选条目。本步骤中采用的德尔菲法(Delphi method),是采用背对背的通信方式征询专家小组成员的意见,经过几轮征询,使专家小组的意见趋于集中,最后得出综合意见。采用上述的方式确定量表因子对应的可选条目,更加客观真实。

本步骤中筛选得到的量表因子的可选条目参见图1对应的实施例中的记载,不再赘述。

使用量表进行测评,实际上包括如下的几个过程:填写或选择量表中的可选条目;根据量表中的可选条目的分值得到量表测评结果的总分数;根据总分数判断被测评对象患颈椎病的可能性大小。因此,在投入使用以及信效度评价之前,应当首先获取量表中每个可选条目的分值。

针对步骤205,可选的,采用Logistic模型获取量表中每个可选条目的分值。其中,Logistic模型是一种概率型模型,即能够预测一定条件下某事件发生/不发生的概率。该模型的原理为:设因变量y=In[P/(1-P)],y为二值变量,一般采用0和1代表不同的事件状态;假定同时存在有n个自变量(x1,…,xn)与因变量y之间存在关联,事件发生的概率为P,则事件不发生的概率为(1-P),设多个自变量与P和(1-P)的比值的对数呈线性关系,如下Logistic函数所示:

In[P/(1-P)]=a01x1+…+βnxn

Logistic模型即是在此函数基础上的回归模型。在本实施例中,采用Logistic模型确定可选条目的分值时,a0为已知的常数项,将n个可选条目作为自变量x1,…,xn。β1~βn为回归系数,回归系数能够明确解释各影响因素的作用。实际上,βn与xn的分值相关,xn的分值=eβn

根据所述量表初稿的进行测评时,采用的是颈椎病患者组成的正向测试样本以及非颈椎病患者组成的负向测试样本。其中,该正向测试样本以及负向测试样本可以从第一测试样本集中收取,也可以重新根据预先设置的选取标准与排除标准进行样本采集。

由于,正向测试样本的样本数以及负向测试样本的样本数均为已知,因此可以认为,Logistic函数中,可选条目x1,…,xn造成颈椎病的概率是已知的。根据上述的已知条件,通过多次迭代计算即可得到β1~βn的值。

针对步骤206,可选的,可以设置颈椎病患者样本的选取标准如下:

①经体格检查和x线检查,确诊为颈椎病患者

②首次确诊为颈椎病

③性别不限

④年龄18-65岁

⑤有自主行为能力

⑥知情同意

设置颈椎病患者样本的排除标准如下:

①颈椎病复发患者

②因外伤导致的颈椎病

③颈椎先天性发育异常

例如,设置非颈椎病患者样本的选取标准如下:

①经体格检查和x线检查,确诊颈椎健康者

②性别不限

③年龄18-65岁

④有自主行为能力

⑤知情同意

设置非颈椎病患者样本的排除标准如下:

①患有颈部颈椎以外其他部位疾病

在获取一定数量的颈椎病患者以及非颈椎病患者之后,标记一定数量的颈椎病患者为正向测试样本,标记一定数量的非颈椎病患者为负向测试样本分别采用正向测试样本以及负向测试样本对上一步骤得到的量表初稿进信度评价和/或效度评价。其中,正向测试样本以及负向测试样本的样本总量根据量表初稿的条目数量进行设置。优选的,在本实施了中设置该样本总量不低于量表初稿中条目数量的5~20倍。

在一可选的实施例中,可以通过计算量表初稿总体的克朗巴赫α系数以及量表初稿中每一条目的克朗巴赫α系数对量表初稿进行内部一致性评价。

克朗巴赫α系数(Cronbach'salpha或Cronbach'sα)是一个统计量,是指量表所有可能的项目划分方法的得到的折半信度系数的平均值。若一份量表包含n个可选条目,各条目间的平均相关系数为r,则此量表的克朗巴赫α系数为:

其中,K为该量表的包含的可选条目的项数,i表示可选条目的编号,σ2Yi为量表初稿中第i条可选条目的方差,σ2X为量表初稿可选条目的总分的方差。

通常克朗巴赫α系数的值在0和1之间。如果克朗巴赫α系数不超过0.6,一般认为内部一致信度不足;达到0.7-0.8时表示量表具有相当好的信度,达0.8-0.9时说明量表信度非常好。

可选的,本实施例中,当计算得到的每一条目的克朗巴赫α系数>0.5,且量表初稿总体的克朗巴赫α系数>0.0.7时,判定该量表初稿的内部一致性信度为良好。

在一可选的实施例中,计算量表的分半信度可采用如下的方式:以量表初稿对第一测试样本集进行测评之后,拆分所述量表初稿,得到第一子量表以及第二子量表;其中,对拆分量表初稿可以按照量表初稿中可选条目的编号将量表初稿分成前后两个部分,也可以按照量表初稿中可选条目的编号本身的奇偶性将量表初稿分为可选条目的编号为奇数的第一子量表以及可选条目的编号为偶数的第二子量表。

得到第一子量表以及第二子量表之后,采用第一测试样本集分别针对所述第一子量表以及所述第二子量表进行测评,得到第一测评结果以及第二测评结果;根据第一测评结果以及第二测评结果,计算二者之间的相关系数,将得到的相关系数的值作为量表初稿的分半信度。

优选的,本申请实施例中,设置相关系数>0.6为信度良好的标准。

特别的,在进行分半信度评价时,若第一子量表与第二子量表中包含的可选条目在难度、内容和得分变异等方面相似时,需用斯皮尔曼-布朗(Spearman-Brown)公式来进一步确定量表的信度分半信度。

在一可选的实施例中,确定所述量表初稿的所述重测信度可以采用如下的方式:按照预设时间间隔,采用第一测试样本集对所述量表初稿进行多次测评;计算多次测评的结果之间的Kappa系数作为所述量表初稿的重测信度。

需要说明的是,本实施例中,使用量表初稿进行多次测评时,采用的是同一批第一测试样本集,从而能够准确地得到多次测评之间的相关性。重测信度考察的是经过一段时间后量表测评结果的稳定程度,重测信度越高,测量结果越一致,这也表明受测环境中日常随机因素的影响越小。

在确定量表重测信度时,需要考虑任意两次重测之间的时间间隔。若时间间隔太长,因第一测试样本集的特征可能随时间发生变化,则两次测量的差异除误差之外还可能引入其他因素的影响。若时间间隔较短,则后一次测量受前一次测量的影响,会产生“记忆效应”,不一定能真实反映测试对象的特征。优选的,在本申请实施例中,设置2~4周作为任意两次重测之间的时间间隔,能够得到较优的重测效果。

本实施例中,量表中的可选条目是是按照所属的量表因子进行分类的变量,可选的,采用Kappa系数来评估再测信度;当Kappa系数大于0.75表示重测信度很好,而低于0.4表示较差。例如,量表初稿中某一量表因子的Kappa系数低于0.4,则要考虑对该量表因子进行修改或者删除。

在一可选的实施方式中,确定所述量表初稿的所述区分效度可以包括如下的步骤:对所述第一测试样本集进行聚类,得到多个样本分组;例如,可以采用Q型聚类方法对第一测试样本集进行分组。Q型聚类是一种分层聚类方法,能够使第一测试样本集中,相似特征的测试样本聚集在一起,将差异大的测试样本分离开。

得到多个样本分组之后,采用所述量表初稿分别对所述多个样本分组中的测试样本进行测评。基于所述量表初稿分别对所述多个样本分组中的测试样本进行测评的结果,进行方差分析,如单因素方差分析以到所述多个样本分组之间的差异。在方差分析中,方差表示的是多个样本分组的组间变异与组内变异的比值。故,方差F的值越大,多个样本分组之间的差异越显著。

在得到多个样本分组的差异之后,分别获取每一样本分组的风险结果的等级,即,获取每一样本分组中的测试样本患颈椎病的风险等级。可选的,可以采用最小显著差异法(LSD)对多个样本分组中测试样本的颈椎病患病风险进行比较,根据比较结果进行风险分级。

基于上述多个样本分组之间的差异以及多个样本分组对应的风险结果的等级,能够确定所述量表初稿的区分效度。例如,第一测试样本集对应的三个聚类结果为样本分组A、样本分组B、样本分组C。根据LSD的分析结果,样本分组A、样本分组B以及样本分组C对应的风险等级为低、中、高。对上述A、B、C三个样本进行单因素方差分析之后,发现三组之间的差异显著,则可认为该量表初稿的区分效度较高,能够有效地将被测人员划分到不同的风险等级。

在一可选的实施方式中,可通过将所述量表初稿针对第一测试样本集的测评结果与所述第一测试样本集对应的风险结果进行对比确定所述量表初稿的所述准则效度。

其中,在本申请实施例对应的应用场景中,所述第一测试样本集对应的风险结果为:对第一测试样本集是否患颈椎病的临床诊断结果。以量表初稿对第一测试样本集中的任一样本进行测评之后,得到表征该样本是否为颈椎病患者的测评结果。基于该测评结果与该样本实际对应的临床诊断结果,确定所述量表初稿的灵敏度(sensitivity)、特异度(specificity)以及ROC曲线(受试者工作特征曲线)下面积,用以获取所述量表初稿的准则效度。

在一可选的实施方式中,采用因子分析法,获取所述量表初稿的结构效度。在制定量表初稿时,设置的量表因子以及量表因子对应的可选条目时,主观性以及经验性较强。因此,实际上得到的量表可能并非是一个理想的结构。结构效度,表征了量表初稿对客观事物的多指标测量是否具有专业上的理想结构。对量表初稿进行结构效度的评价有利于获得结构更优的量表。

可选的,针对量表初稿,先做因子分析检验,因子分析检验的目的是分析量表初稿中任一的量表因子包含的可选条目是否如量表初稿所设置的那样集中在该量表因子中。做因子分析检验之前,首先比较变量间简单相关系数Kaiser-Meyer-Olkin(KMO)。若KMO>0.5,且Bartlett`s球形检验值<0.05,则确定该量表初稿适宜做因子分析。再利用主成分分析法提取量表初稿的公因子,进行旋转变换,寻求最佳的分析效果。如量表初稿的公因子能解释50%以上的变异,而且每个可选条目在相应的量表因子上有足够强度的负荷(大于或等于0.4),则认为该量表初稿具有良好的结构效度。

在一可选实施例中,采用第一测试样本集对量表初稿进行信度评价和/或效度评价之后,还可以按性别对第一测试样本集进行分组。分别计算男性和女性人群应用本量表初稿的信度和效度指标,具体过程不再赘述。

针对步骤207,根据信度评价和/或效度评价的结果对量表因子以及量表因子的可选条目进行筛选时,可以通过判断量表初稿是否满足预设的信度评价的标准和/或效度评价标准实现。若不满足,则对量表初稿进行不断地修改、增删等,例如对量表初稿的可选条目的数量、可选条目的提问方式、可选条目的答案、可选条目的选项数量以及可选条目的选项内容进行修改,以获得更加可靠的量表。

针对信度评价结果,可选的,本申请实施例设置如下信度评价的标准:

量表初稿的克朗巴赫α系数>0.7且可选条目的克朗巴赫α系数>0.5时,表征量表初稿的内部一致性信度良好。

量表初稿的第一子量表以及第二子量表的相关系数>0.6时,表征该量表初稿的分半信度良好。

量表初稿包含的量表因子的Kappa系数>0.75时,表示该量表因子的重测信度良好,若Kappa系数<0.4时,表示该量表因子的重测信度较差。

针对效度评价结果,可选的,本申请实施例设置如下效度评价的标准:

量表初稿针对风险结果不同的样本分组的测评结果的差异较显著,表征该量表初稿的区分效度良好。

量表初稿的灵敏度、特异度ROC曲线下面积分别达到相应的阈值,表征该量表准则效度良好。

量表初稿的公因子能解释50以上的变异,而且每个可选条目在相应的因子上有足够强度的负荷(大于或等于0.4),表征该量表的结构效度良好。

本实施例中,通过筛选候选危险因素得到目标危险因素,生成量表初稿。对该量表初稿进行信度评价和/或效度评价,并基于信度评价和/或效度评价的结果对该量表初稿进行调整以生成最终的量表,克服了现有技术中量表的测评结果受测试对象个体差异影响大的缺陷,提升了量表有效性、正确性、稳定性、可靠性以及一致性。

以下部分将结合一个实际的例子对本申请实施例的实施方式进行进一步地说明。

首先根据预先训练出来的患病风险预测模型编制退行性颈椎疾病患病风险自评量表,并邀请临床专家、流行病学专家和人体工效学专家等方面的专家,对量表进行两轮的修改。根据专家建议,形成量表初稿。

形成量表初稿之后,在门诊选取颈椎病患者和非颈椎病患者各5名进行预调查,根据预调查结果,对量表初稿进行修改完善。

在获取测试样本时,采用整群抽样,将一段时间内骨科门诊符合条件的测试对象按照顺序全部入组,直到满足样本量的需求。选取一定数量的颈椎病患者和非颈椎病患者作为测试样本。依据量表信效度评价的样本量计算方法,测试样本的样本量应设置为量表初稿中可选条目数的5-20倍。本实施例中,共发放评价量表308份,收回303份。279个测评对象,用于重测的人数为24人,测评对象的基本信息如下表1所示。

表1

如上表所示,279例测试对象的年龄范围为15.47-74.23岁,平均年龄(40.20±13.46)岁。诊断为退行性颈椎疾病患者组,年龄范围为15.47-74.23岁,平均年龄为(50.64±10.96)岁;对于非退行性颈椎疾病组,年龄范围为16.24-71.66岁,平局年龄为(34.56±11.16)岁。

量表初稿的测评由测试对象自填完成。如测试对象的读写能力不足以独立完量表初稿的填写,则采用面对面询问方式完成量表初稿的测评并如实记录。

本实施例中,针对量表初稿的测评结果,采用SAS软件统计分析,从而根据分析的结果对量表初稿进信度评价和/或效度评价。

在本实施例中,根据对24份退行性颈椎疾病患者的重复测量,除“锻炼时间长度”这一条目的Kappa为0.65,表示较好之外,其余条目均在0.75以上,达到了“很好”的标准,如下表2所示:

表2

在本实施例中,量表总体的克朗巴赫α系数为0.25,按照0.7的标准进行评价,内部一致性信度交差。每一个条目的克朗巴赫α系数在0.14-0.36之间,未达到0.7的标准,如表3所示:

表3

在本实施例中,该量表初稿的总体spearman brown分半信度系数为0.21,以Spearman brown分半信度系数>0.6为信度良好的标准,说明该量表初稿的分半信度差。

本实施例中,通过聚类分析和单因素方差分析验证颈椎病风险评估自测量表的区分效度,使用Q型聚类对样本进行聚类。对聚类结果进行整理,将所有调查对象按照总得分划分为三组,各组人数分别为214、14、51,得分为8.89±0.72、7.27±0.69、10.56±0.72,如图4所示:

表4

对聚类结果进行单因素方差分析,见表5,发现三组之间差异显著(F=160.22,P<0.001)。

表5

采用LSD对三组的退行性颈椎疾病风险得分进行多重比较,发现三组之间任意两组的差异均有统计学意义,如表6所示。

表6

综合以上分析结果,该量表初稿可以将全部人群按照风险得分分为低、中、高三组,且三组之间存在显著性差异。说明该量表初稿具有良好的区分效度。

本实施例中,将量表初稿的测评结果与临床金标准相比,绘制的ROC曲线见图3-1。本量表的灵敏度为57.28,特异度为76.70,阳性预测值为59.00,阴性预测值为75.42,曲线下面积AUC为0.713,该量表进行退行性颈椎疾病风险自评的准则效度良好。

各因子的特征值如表7可以看出,因子1-3的特征值均大于1,采用限定主成分数目的方法重新进行因子分析。将主成分数目限定为3,3个主成分总体贡献率为48.23%。

表7

3因子模式矩阵见表8,经方差最大正交旋转法进行旋转后的因子成分矩阵见表9。以量表初稿的公因子能解释50%以上的变异,且每个条目在相应的因子上有足够强度的负荷≥0.4作为结构效度良好的标准,则此量表初稿结构效度良好。

表8

表9

通过上述步骤获取的退行性颈椎疾病患病风险自评量表如图3-2所示,其重测信度好,但内部一致性信度和分半信度较差。区分效度、准则效度和结构效度良好。

图4是本申请实施例一种量表生成装置的结构示意图。结合图4,该装置包括:

选择模块41,用于从多个候选危险因素中,选择至少一个目标危险因素;

量表生成模块42,用于将所述至少一个目标危险因素分别作为量表因子,生成量表初稿,所述量表初稿包括所述量表因子以及所述量表因子的可选条目;

量表评价模块43,用于采用第一测试样本集对所述量表初稿进行信度评价和/或效度评价;

量表筛选模块44,用于基于所述信度评价和/或效度评价的结果,对所述量表初稿包含的所述量表因子以及所述量表因子的可选条目进行筛选,以生成所述量表。

进一步可选地,所述量表生成模块42,还用于:根据所述量表初稿对正向测试样本的测评结果、所述量表初稿对负向测试样本集的测评结果、所述正向测试样本的样本数以及所述负向测试样本的样本数,采用Logistic模型迭代训练,以确定所述量表初稿中量表因子的可选条目的分值。

进一步可选地,如图5所示,所述量表评价模块43,包括:第一信度评价子模块4311,用于采用所述第一测试样本集,确定所述量表初稿的内部一致性信度;第二信度评价子模块4312,用于采用所述第一测试样本集,确定所述量表初稿的分半信度;以及第三信度评价子模块4313,用于采用所述第一测试样本集,确定所述量表初稿的重测信度。

进一步可选地,所述第一信度评价子模块4311,用于:采集所述第一测试样本集对所述量表初稿的测评结果;基于所述测评结果,统计所述量表初稿的克朗巴赫α系数以及所述量表初稿中的量表因子包含的可选条目的克朗巴赫α系数;根据所述量表初稿的克朗巴赫α系数以及所述可选条目的克朗巴赫α系数,确定所述量表初稿的内部一致性信度;

所述第二信度评价子模块4312,用于:对所述量表初稿进行拆分,得到第一子量表以及第二子量表;采用所述第一测试样本集分别针对所述第一子量表以及所述第二子量表进行测评,得到第一测评结果以及第二测评结果;计算所述第一测评结果以及所述第二测评结果之间的相关系数,作为所述量表初稿的分半信度;

所述第三信度评价子模块4313,用于:按照预设时间间隔,采用所述第一测试样本集对所述量表初稿进行多次测评;计算多次测评的结果之间的Kappa系数作为所述量表初稿的重测信度。

进一步可选地,如图6所示或图7所述量表评价模块43,包括:第一效度评价子模块4321,用于:采用所述第一测试样本集,确定所述量表初稿的区分效度;第二效度评价子模块4322,用于采用所述第一测试样本集,确定所述量表初稿的准则效度;以及,第三效度评价子模块4323,用于采用所述第一测试样本集,确定所述量表初稿的结构效度。

进一步可选地,所述第一效度评价子模块4321,用于:对所述第一测试样本集进行聚类,以得到多个样本分组;对所述多个样本分组中的第一测试样本集进行测评;对所述量表初稿分别对所述多个样本分组中的第一测试样本集进行测评的结果进行方差分析,以得到所述多个样本分组之间的差异;根据所述多个样本分组之间的差异以及所述多个样本分组对应的风险结果的等级,确定所述量表初稿的区分效度。

所述第二效度评价子模块4322,用于将所述量表初稿针对第一测试样本集的测评结果与所述第一测试样本集对应的风险结果进行对比;基于对比结果,确定所述量表初稿的灵敏度、特异度以及ROC曲线下面积,用以获取所述量表初稿的准则效度.

所述第三效度评价子模块4323,用于:采用因子分析法,获取所述量表初稿的结构效度。

进一步可选地,所述量表生成模块42,用于:获取所述量表因子的候选条目;根据德尔菲法对所述量表因子对应的候选条目进行筛选,以得到所述量表因子的可选条目;根据所述量表因子以及所述量表因子的可选条目,生成所述量表初稿。

本申请实施例提供的量表生成装置,通过筛选候选危险因素得到目标危险因素,生成量表初稿。对该量表初稿进行信度评价和/或效度评价,并基于信度评价和/或效度评价的结果对该量表初稿进行调整以生成最终的量表,克服了现有技术中量表的测评结果受测试对象个体差异影响大的缺陷,提升了量表有效性、正确性、稳定性、可靠性以及一致性。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1